Оперантное обусловливание Б.Ф. Скиннера
//РОМЕК В.Г. Поведенческая психотерапия. – Ростов-на-Дону, 2001. – с. 41-54.
В основании теории оперантного обусловливания лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий – стимулов. Довольно часто (по мнению Скиннера, в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы. В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее – получала желаемое.
Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса такого воздействия не наблюдается.
Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение.
Но сама по себе исследовательская активность ничего не дает – она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий – от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл «подкреплением». Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи. Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу – зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома.
Эту закономерность Скиннер назвал «законом выгоды (приобретения)», иногда его еще называют первым законом оперантного научения.
Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого «целевого» поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь.
Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.
Логичным кажется и другой способ модификации поведения. Многие предполагают, что поведение, которое наказывается, штрафуется, т.е. ведет к последствиям, для индивида неприятным, должно исчезнуть. Этому выводу, однако, Скиннер не нашел подтверждения.
С его точки зрения, наказание – довольно спорный способ отучить от нежелательного поведения, поскольку поведение, за которым следуют неприятные последствия, никуда не исчезает, оно лишь видоизменяется самым неожиданным образом. Человек в случае штрафа вынужден искать иные формы поведения, чтобы избежать штрафа.
Часто оказывается так, что эти новые формы бывают еще менее желательными, чем те, которые вызвали наказание. Конечно, человек (или любое другое живое существо) склонен избегать неприятных событий. Это – факт. Однако предсказать, к чему приведут его поиски альтернативных форм поведения – практически невозможно, если только не оказывать ему помощь – не продемонстрировать в явной форме образцы поведения, которые позволят наказания избежать.
И здесь Скиннер еще раз напоминал о том, что предотвращение негативных последствий само вызывает позитивные последствия, т.е. само является подкреплением. И эту форму подкрепления, конечно, можно использовать.
Прекращение или предотвращение неприятных для человека последствий Скиннер называл негативным подкреплением и отмечал некоторые существенные отличия негативного и позитивного подкрепления.