Не рычите на собаку! Книга о дрессировке людей, животных и самого себя
Введение
Эта книга совершила настоящий переворот в биологии и психологии в 1980-х. Карен Прайор не просто выдвинула, но и успешно доказала гипотезу о том, что дрессировать можно любое живое существо, от примитивного морского гребешка до высокоинтеллектуального академика с IQ, как у Эйнштейна. В книге предлагаются несложные принципы обучения с подкреплением. Они доказали свою эффективность на спортивных тренировках, репетициях театральных трупп, в общеобразовательных школах и в семейном воспитании. Принципы обучения с подкреплением полезны и в самообразовании.
Автор отмечает, что обучение с подкреплением — не панацея от всех жизненных неприятностей. Оно не решает медицинские, генетические и глубокие психологические проблемы. Но помогает эффективно формировать нужные навыки, отучать от вредных привычек и налаживать отношения с окружающими.
Карен Прайор убеждена, что человек, который умеет дрессировать животных, прекрасно справится и с детьми. У всех ее знакомых дрессировщиков дельфинов очень милые и воспитанные дети.
1. Подкрепление
Подкрепление бывает двух типов: положительное и отрицательное. Положительное подкрепление — это то, что субъект дрессировки хочет получить: еда, одобрение и ласка. А отрицательное подкрепление — это то, чего он хотел бы избежать: неприятный звук (например, если вы забыли пристегнуть ремень в машине), шлепки и грозное выражение лица.
1.1. Положительное подкрепление
Положительное подкрепление — это то, что совпадает по времени с определенным действием и ведет к повышению вероятности повторного совершения этого действия. Поведение, которое встречается время от времени, можно усилить и отрегулировать с помощью положительного подкрепления.
Вы зовете кошку. Она подходит, и вы ее гладите. Чем чаще это происходит, тем больше шанс, что животное снова придет на зов, чтобы получить приятные ощущения.
В отношениях с людьми положительное подкрепление действует так же.
Ваш взрослый сын звонит вам раз в неделю. Вы хотите, чтобы он звонил вам хотя бы через день. Если вы будете выражать радость по поводу каждого звонка, он, скорее всего, будет звонить чаще. Но если вы будете жаловаться и ворчать, что сын вас не любит и не уважает, сработает отрицательное подкрепление. Он будет звонить как можно реже, чтобы не испытывать отрицательных эмоций.
Любое подкрепление относительно.
Пища не будет положительным подкреплением, если вы сыты. Улыбки и похвалы бесполезны, если субъект хочет вывести вас из себя, разозлить или расстроить.
В качестве подкрепления надо выбирать то, что нужно субъекту в данный момент. Для любой тренировочной ситуации полезно предусмотреть несколько подкреплений.
Дельфинов можно подкреплять разными способами: рыбой, поглаживанием или почесыванием, вниманием окружающих и игрушками. Животное не знает, какое поведение будет подкреплено в следующий раз и каким будет подкрепление. Поэтому представления в океанариумах могут проходить без подкреплений рыбой.
Положительное подкрепление приносит пользу и в человеческих отношениях. На нем основано искусство делать подарки: нужно угадать, что вызовет радость у получателя подарка. Правильный выбор становится подкреплением как для одаряемого, так и для дарителя.
1.2. Отрицательное подкрепление
Отрицательные подкрепления могут быть разными по интенсивности: от легкого сквозняка, исходящего от кондиционера в кафе, который вызывает ощущение дискомфорта и заставляет переместиться за другой столик, до таких крайностей, как удар электрическим током или хлыстом. Наказание случается после определенного поведения. Поэтому вы не можете его избежать, изменив свое поведение.
Школьник, которого отругали за двойку, может потом учиться лучше или хуже, но не может изменить ту оценку, за которую был наказан.
А отрицательное подкрепление нежелательного поступка можно остановить, если изменить поведение.
Дети бегают по дому, шумят и опрокидывают стулья. Но они замечают хмурый взгляд отца и останавливаются. Он перестает хмуриться и ободряюще улыбается. И тем самым положительно подкрепляет спокойное поведение детей.
1.3. Правила подкрепления
Положительное и отрицательное подкрепление подчиняются одинаковым правилам. Они должны быть:
Своевременными.
Подкрепление — это информация. Оно говорит субъекту, что именно вам нравится или не нравится.
Восклицания тренера «Да!» или «Хорошо!» дают спортсмену информацию о правильности выполнения определенного движения. А вот «разбор полетов» в раздевалке после тренировки не слишком эффективен.
Родители часто подкрепляют детей слишком рано, стараясь их подбодрить: «Молодец, ты уже почти правильно все сделал». Жалобы детей вроде «Я не могу, у меня не получается» — признак того, что родители подкрепляли попытки, а не поведение, которое дает результат. Поэтому дети не стремятся к положительному результату, а будут продолжать совершать попытки, чтобы выпросить новые подкрепления.
Минимальными.
Чем меньше подкрепление, тем лучше. Маленькое подкрепление не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться.
Цыпленка эффективно подкрепляют одно-два зернышка, а слона — половинка яблока. Любимой пищи можно давать еще меньше: например, чайную ложку зерна для лошади.
Несмотря на то, что минимальные подкрепления наиболее эффективны, время от времени субъекту полезно давать большой куш — награду, которая в несколько раз больше обычного подкрепления и дается неожиданно. Куш способен развеселить, взбодрить и повысить мотивацию субъекта.
Неожиданные вечеринки без повода, которые 1–2 раза в год устраиваются в рабочее время в офисе, способствуют поднятию боевого духа.
Получение всего одного куша может улучшить поведение непокорного, испуганного или сопротивляющегося субъекта, который прежде не демонстрировал нужного поведения.
Автор вспоминает, что в 15 лет она была ужасно грубой с отцом и мачехой. Однажды вечером родители сказали ей, что устали от ее ужасного поведения, поэтому решили ее наградить. И подарили ей билет на 10 уроков верховой езды, о которой она мечтала. Незаслуженный куш изменил поведение Карен, потому что она перестала считать себя обиженной.
1.4. Условное подкрепление
Часто бывает так, что подкрепление невозможно дать в тот самый момент, когда субъект выполняет желаемое действие.
Когда дельфин учится прыгать, поощрить его высокий или качественный прыжок в момент его выполнения не получится. Если дать ему рыбу после завершения прыжка, он, возможно, решит, что подкрепление можно получить, если прыгать чаще. Как же объяснить дельфину, на какую высоту и с каким прогибом прыгать?
В этом случае используют условное подкрепление — какой-либо сигнал, изначально не связанный с действием (звук, свет, движение), но который умышленно с ним связывают.
Тренеры дельфинов используют полицейский свисток: руки свободны, а звук слышен даже под водой. С собаками и лошадьми эффективно работают слова «хорошая лошадка (собака)». Школьные учителя говорят «очень хорошо» или «молодец» — и дети трудятся ради этих слов.
Условное подкрепление вырабатывается еще до того, как вы начинаете формировать поведение. Условное подкрепление сочетают с истинным, например, с едой или поглаживанием. После того как условное подкрепление выработано, оно становится ценным само по себе, без первичного подкрепления.
Лошади и собаки могут отработать все выступление только на условном подкреплении. И люди уже давно не работают за еду. А деньги — не что иное, как условное подкрепление, обозначающее вещи, которые можно купить.
Условное отрицательное подкрепление — действенное воспитательное средство.
Кошку можно научить реагировать на слово «нет», если сочетать его с громкими звуками. Животное царапает мебель? Уроните на пол металлический поднос и громко скажите: «Нет».
1.5. Вариабельное подкрепление
Постоянное подкрепление требуется только во время обучения. Через некоторое время в нем уже нет необходимости.
Когда вы учите ребенка кататься на велосипеде, вы постоянно что-то говорите: «Держи руль ровно!» или «Молодец!» После того как навык закрепился, эти слова уже не нужны.
Чтобы поддерживать сформированное поведение, лучше перестать его регулярно подкреплять, а использовать подкрепления эпизодически. Такой режим подкрепления называют вариабельным.
Если поощрять каждый пры��ок дельфина, он начнет прыгать кое-как. Если совсем не давать рыбу, он перестанет прыгать. Но если подкрепить первый прыжок, а затем выборочно некоторые прыжки, дельфин будет выступать на более высоком уровне, пытаясь заслужить рыбу. Такой режим позволяет подкреплять наиболее сильные прыжки и таким образом оттачивать мастерство питомца.
Вариабельное подкрепление не работает только в одном случае: если оно связано с решением тестов или головоломок.
Когда мы отгадываем кроссворды или складываем пазлы, мы получаем подкрепления за правильные слова и детали, так как они единственно верные.
1.6. Случайное подкрепление
Подкрепления происходят в нашей жизни постоянно. И чаще всего они возникают случайно.
Биолог, изучавший поведение ястребов, заметил: если ястреб поймал под каким-либо кустом мышь, он будет постоянно под него заглядывать в течение нескольких дней.
Случайные подкрепления влияют на наше поведение, но не всегда приносят пользу. Иногда человек ведет себя определенным образом, потому что верит, что его поведение принесет тот или иной результат. Это называется суеверным поведением.
Некоторые люди уверены: если они будут грызть карандаш, их посетят умные мысли.
1.7. Подкрепление своего поведения
Иногда мы слишком строго к себе относимся, намного строже, чем к другим людям. В результате работаем без выходных, в многозадачном режиме и считаем, что так и должно быть. Мы не думаем о том, что себя нужно подкреплять, хвалить и поощрять. Как следствие, страдаем от неврозов и депрессии.
Изменение привычки или освоение полезного навыка можно подкреплять разными способами: походом в кино или театр, прогулкой, встречей с друзьями или хорошей книгой. Но не стоит прибегать к нездоровым способам подкрепления: сигаретам, алкоголю, вредной еде.
2. Выработка нужного поведения
Подкрепить поведение, которое и так происходит время от времени, несложно. Но как заставить животное или человека делать то, что он никогда прежде не делал? Как лев поймет, что ему нужно прыгнуть через горящий обруч? Выработка заключается в том, чтобы использовать незначительные изменения поведения субъекта и постепенно двигаться к поставленной цели.
2.1. 10 правил выработки
Процесс выработки подчиняется десяти правилам. Первые четыре появились в результате лабораторных экспериментов, остальные — в процессе практической деятельности.
• Повышайте критерий постепенно, чтобы у субъекта всегда была возможность выполнить требуемое и получить подкрепление.
Если лошадь берет барьер в 60 сантиметров, его можно увеличить до 70–75 сантиметров. Но, подняв планку до метра, вы провоцируете появление у лошади вредной привычки. Она начнет либо резко останавливаться перед барьером, либо его ломать.
• В определенный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать два навыка одновременно.
Можно работать над многими различными типами поведения на одном занятии, чтобы избежать монотонности и скуки. Работая над определенным типом поведения, необходимо пользоваться в каждый отрезок времени только одним неизменным критерием.
Если, обучая дельфина делать фонтан брызг, вы сначала не дадите ему подкрепление, потому что фонтан недостаточно велик, а в другой раз — потому что он бьет не в том направлении, дельфин не поймет, что от него требуется. Одно подкрепление должно содержать один тип информации. Сначала нужно отрегулировать высоту фонтана, а потом формировать его направление. И только когда оба критерия установлены, можно требовать от дельфина соблюдения обоих.
• Прежде чем повысить планку, вариативно подкрепляйте исполнение данного действия.
Хорошая выработка — это серия едва заметных переходов между непрерывным (когда навык или новый уровень только формируется) и вариативным подкреплением (когда навык уже закрепился и нужно избирательно подкреплять лучшие действия).
Вы дрессируете собаку прыгать через барьер. Сначала вы поощряете каждый прыжок. Затем, когда навык сформирован и собака прыгает без ошибок, вы поощряете лишь некоторые прыжки. И только потом можно поднимать планку барьера и вновь переходить к непрерывным подкреплениям.
• Вводя новый критерий, временно ослабьте старые.
В новых обстоятельствах или под воздействием новых требований субъект может «забыть» то, что умел и знал раньше.
Когда вы перемещаете дельфина в другой бассейн, ему нужно время, чтобы привыкнуть к новой обстановке. В этот период нельзя ругать дельфинов за ошибки, и они скоро пройдут сами по себе.
• Планируйте свою программу выработки полностью. В случае быстрого успеха обучаемого вы должны знать, что делать дальше.
Традиционная школа рассчитана на среднего ребенка, и остальные дети не могут учиться в своем собственном темпе. Медлительные школьники не успевают усвоить материал в отведенное время, а способных и быстрых учеников никак не подкрепляют, и они скучают на уроках. В результате и медленные, и быстрые дети не любят школу. Порой улица становится для них более привлекательным местом.
• Не меняйте тренеров во время программы.
Если сменить учителя в момент, когда навык еще не сформирован, скорее всего, вы будете наблюдать регресс в обучении. Поменять учителя стоит, только если обучение зашло в тупик.
• Если одна процедура выработки не приносит успеха, найдите другую.
Помните: нужного поведения можно добиться разными способами.
Обучение детей плаванию начинается с того, что их учат не бояться воды. Одни тренеры просят детей пускать пузыри в воду, другие — опускать в воду лицо, третьи — приседать в воде так, чтобы вода накрывала их с головой. Хороший тренер сменит метод, если увидит, что ребенок боится.
• Не заканчивайте тренировку без положительного подкрепления. Его отсутствие будет восприниматься субъектом как наказание.
Учитель должен уделять внимание детям, а дрессировщик — животным до конца урока или тренировки. Если он отвлекается на что-то, например, разговаривает по телефону, контакт нарушается, и субъекты не получают подкрепления. Это может в дальнейшем привести к ухудшению уже выработанного поведения.
Вежливые и послушные дети могут начать баловаться и шуметь, если увидят, что учитель не обращает на них внимания, а занимается своими делами.
• Если навык начал ухудшаться, вернитесь к началу и быстро повторите весь цикл выработки с подкреплениями.
Каждый из нас сталкивался с ситуацией, когда тот или иной навык кажется утерянным: после 20-летнего перерыва трудно ездить на велосипеде или общаться на иностранном языке. В этом случае полезно начать с нуля: например, поездить на велосипеде с полной, а потом — с частичной поддержкой.
• Заканчивайте каждую тренировку на пике успеха. Последнее действие закрепляется в сознании субъекта, поэтому это должно быть успешное действие.
Часто бывает так: мы получаем три-четыре успешных действия — собака находит и приносит палку, прыгун в воду впервые выполняет сложный прыжок в полтора оборота, музыкант правильно исполняет трудное произведение. И мы так счастливы, что хотим, чтобы это повторялось снова и снова. Но скоро субъект устает и начинает совершать ошибки. Мы его подбадриваем и уговариваем, а потом злимся и заканчиваем тренировку.
Очень важно вовремя остановить тренировку: когда субъект еще не слишком устал.
Кошки устают примерно через 5 минут или 12 подкреплений, лошади и собаки — немного позже. У ребенка в зависимости от возраста активное внимание длится от 10 до 30 минут. Взрослый может выдержать час, если занятие интересное.
Если вы научитесь останавливаться на правильном действии, субъект его запомнит и успешно начнет следующую тренировку.
2.2. Управление с помощью стимулов
Когда поведение сформировано, им можно управлять с помощью стимулов. Стимул — это то, что вызывает поведенческую реакцию. Некоторые стимулы вызывают реакцию без тренировки: мы вздрагиваем от громкого звука или щуримся от яркого света. Такие сигналы называются безусловными стимулами.
Другие стимулы строятся на ассоциациях. Сами по себе они не имеют смысла, но после тренировки становятся сигналами для определенного поведения, например, зеленый сигнал светофора заставляет нас переходить дорогу. Такие сигналы называются условными стимулами.
Для того чтобы управлять поведением с помощью сигналов, надо сформировать нужное поведение, а потом сделать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала.
Полный контроль с помощью стимулов определяется четырьмя условиями.
• Поведение всегда осуществляется сразу после подачи условного стимула.
Собака садится, когда ей приказывают.
• Поведение никогда не возникает в отсутствие стимула.
Во время занятий или работы собака никогда не садится спонтанно.
• Поведение никогда не наблюдается в ответ на другие стимулы.
Если вы говорите «Лежать!», собака не должна садиться.
• Никакое другое поведение не возникает в ответ на данный стимул.
Когда вы говорите «Сидеть!», собака не должна ложиться или прыгать.
3. Отучение. Восемь методов избавления от нежелательного поведения
Подкрепление можно использовать не только для того, чтобы сформировать нужное поведение, но и для того, чтобы избавиться от нежелательного поведения. Каждый день мы сталкиваемся с нежелательным поведением: дети кричат и не дают работать, собака грызет обувь, муж разбрасывает носки по квартире. Вот восемь методов, которые помогут справиться с подобным поведением. Первые четыре метода — отрицательные, остальные — положительные:
Метод 1. «Убить зверя»
Этот метод самый радикальный. Он физически не дает субъекту продолжать совершать нежелательные действия.
Существует много вариаций метода 1: отправить ребенка в его комнату, когда он вмешивается в разговор взрослых; привязать собаку, чтобы она не бросалась на людей; посадить человека в тюрьму.
У метода 1 есть один большой минус: он не учит правильному поведению.
Ребенок, которого заперли, научится обижаться и бояться, но так и не сможет нормально общаться. Собака продолжит бросаться на людей, когда ее отпустят. А вор, скорее всего, снова что-то украдет и попадет в тюрьму.
Метод 1 хорош в качестве временного решения: когда нет возможности применить другие методы.
Ребенка сажают в манеж, если мать с ним одна дома и ей надо заниматься домашними делами. А щенков запирают на ночь в клетке, чтобы они не оставляли лужи на ковре.
Метод 2. Наказание
Это очень популярный метод.
Назначить штраф, отшлепать ребенка, накричать на подчиненного, объявить войну…
Метод 2, как и метод 1, не учит, как изменить поведение.
Наказание не покажет ребенку, как получить более высокие оценки. Возможно, у ребенка изменится мотивация, и он изменит поведение, чтобы избежать наказания в будущем. А животные не способны анализировать ситуацию. После наказания они будут продолжать вести себя, как прежде.
Метод 3. Отрицательное подкрепление
Это любое неприятное событие или стимул, действие которого можно прекратить, изменив поведение.
Мы изменяем положение тела, когда нам неудобно сидеть или стоять. Мы стремимся скорее оказаться в помещении, когда начинается дождь.
Отрицательное подкрепление, в отличие от наказания, происходит во время поведения, а не после него, то есть напрямую с ним связано.
Люди часто используют отрицательное подкрепление: строгий взгляд, неодобрительное замечание. Слишком частое применение отрицательного подкрепления приводит к появлению у субъекта изменений в характере: от приступов ярости до повышенной тревожности и неуверенности в себе. Очень важно научиться прекращать отрицательное подкрепление, если поведение субъекта немного улучшилось.
Трехлетний ребенок бьет маму и говорит, что ненавидит ее. Негативное подкрепление со стороны матери — это прекращение общения. Когда малыш успокоится, мать обнимет его и начнет разговаривать с ним о чем-то другом.
Метод 4. Затухание
Этот метод состоит в том, что при отсутствии подкрепления поведение становится менее активным, а затем исчезает.
Чтобы научить крысу нажимать на кнопку, дрессировщик использовал пищу. Сначала крыса часто повторяла трюк, чтобы получить еду. Затем, когда ей перестали давать подкрепление, она стала делать это реже, и в конце концов совсем перестала.
Но поведение человека не всегда затухает без подкрепления. В реальной жизни, в отличие от лаборатории, есть стимулы, которые поддерживают нежелательное поведение.
В человеческих взаимоотношениях затухание наиболее эффективно в речевом поведении. Ели не обращать внимания ворчание, нытье и угрозы, они, как правило, прекращаются.
Метод 5. Выработка несовместимого поведения
Суть метода состоит в том, чтобы обучить субъекта другому поведению, которое несовместимо с нежелательным.
Собака выпрашивает еду на кухне? Можно ее запирать на время завтрака, обеда и ужина, используя метод 1. Но лучше научить ее лежать на пороге кухни, когда люди едят. Научите ее выполнять команду «Иди ляг!». Одновременно лежать на пороге и выпрашивать еду у стола невозможно.
Этот метод активно применяется на теннисных тренировках: неправильно поставленные удары постепенно заменяются правильными, так как невозможно выполнять и те, и другие сразу.
Метод 6. Ассоциирование поведения с сигналом
Сначала субъекта учат выполнять действие, от которого хочется избавиться, строго по сигналу. А потом перестают давать этот сигнал.
Автор применяла этот метод, когда нужно было успокоить детей в машине. Она им говорила: «Давайте попробуем шуметь как можно громче!» Сначала всем весело, все кричат, но это быстро надоедает. После двух-трех повторов тишина в машине обеспечена надолго.
Метод 7. Формирование отсутствия
Этот метод подойдет, если у вас нет цели получить от субъекта конкретное поведение или результат, а вы просто хотите, чтобы он прекратил поведение, которое вам неприятно.
Мать Карен много лет провела в больнице. Дочь не могла навещать ее каждый день, но подолгу разговаривала с матерью по телефону. Эти разговоры были мучительны: мать жаловалась на болезни и одиночество, плакала и винила Карен во всех своих бедах. После долгих лет такого общения Карен применила метод 4 (затухание) и метод 7 (формирование отсутствия). На жалобы она отвечала «Хм» и «Да», но с энтузиазмом реагировала на вопросы о детях, друзьях и работе. За два месяца мать Карен превратилась в себя прежнюю, какой она была до болезни. Она стала позитивной и остроумной.
Метод 8. Смена мотивации
Это основной и самый эффективный метод избавления от нежелательного поведения. Мотивацию нежелательного поведения не всегда просто определить. Нужно внимательно наблюдать за тем, что влияет на изменение поведения, а что нет. Самые распространенные причины нежелательного поведения — это голод, болезнь, одиночество или страх.
Многие дети сосут палец. Это признак беспокойства. Запреты и наказания не действуют. Но как только малыш перестает бояться и обретает уверенность в себе, привычка исчезает.
Заключение
Дрессировке поддаются все живые существа. Особенно эффективно обучение с подкреплением определенных действий. Положительное подкрепление — это то, что субъект дрессировки мечтает получить, а негативное подкрепление — то, чего он избегает.
Для того чтобы эффективно дрессировать животное и человека, нужно давать подкрепления без задержки и в небольших количествах. Но время от времени, для повышения мотивации, полезно давать субъекту большой куш — награду, размер которой в несколько раз больше обычного подкрепления.
Если подкрепление по какой-то причине невозможно дать в нужный момент, его заменяют условным подкреплением — звуком или словами, которые ассоциируются с реальным подкреплением. Когда навык сформирован, постоянное подкрепление сменяется вариабельным, которое дается время от времени.
Выработать новое поведение можно, замечая незначительные изменения в поведении и направляя их к поставленной цели. Когда поведение сформировано, им можно управлять при помощи условных стимулов — сигналов, которые ассоциируются с конкретной поведенческой реакцией.
Подкрепление дает возможность не только сформировать новое поведение, но и навсегда или временно прекратить нежелательное поведение. Тренер сам выбирает, какие методы применять, отрицательные («убить зверя», наказание, негативное подкрепление или затухание) или положительные (выработку несовместимого поведения, ассоциирование поведения с сигналом, формирование отсутствия или смену мотивации).