Что можно и чего нельзя достичь поощрением
Фред Скиннер считал, что поведением животных можно полностью управлять, нужно лишь подобрать соответствующую цепочку подкреплений. Он разработал методику свободного оперантного поведения, то есть спонтанного поведения, совершаемого животным без какого-либо очевидного стимула. В отличие от других методов, здесь животное принимало активное участие в обучении, искало, какое его действие приведет к положительному результату. Животное было свободно совершать различные действия, а экспериментатор старался управлять последствиями этих действий – подкрепляя то или иное поведение. Так, например, можно поощрять голубя в тот момент, когда он дотрагивается клювом до перьев. Через несколько совпадений голодный голубь будет делать это специально. Так как движения не бывают абсолютно одинаковыми, можно начать поощрять только самые интенсивные движения, затем только те движения, которые длятся определенное количество секунд. Так постепенно можно научить голубя чиститься по сигналу. Это постепенное изменение поведения называется “shaping” или «формирование поведения», а сам тип научения – оперантным.
В 1958 году Скиннер описывает такой случай: «голубя тренировали пускать деревянный шар по миниатюрному желобу в направлении расставленных игрушечных кеглей, толкая его резким боковым движением клюва. Результат поразил нас… Это зрелище произвело такое впечатление на Бреленда, что он отказался от многообещающей карьеры в области психологии и стал платным дрессировщиком». Однако именно Бреленду и его супруге по иронии судьбы пришлось усомниться в том, что возможности оперантного обучения безграничны. Некоторые животные ни за что не хотели обучаться некоторым трюкам. Так, например, им не удалось научить свинью вкладывать «монету» в специальную копилку. Вместо того, чтобы бросить туда деревянную монету, свинья каждый раз начинала ронять ее, толкать пятачком, подбрасывать и так снова и снова. В природе дикие свиньи подобными движениями выкапывают желуди. Там где инстинктивное поведение сталкивалось с научением, первое неизменно брало верх. Это противоречило утверждению Скиннера, что животные стремятся получить вознаграждение самым быстрым и самым удобным способом – на многократное подбрасывание монеты у свиньи уходило значительно больше энергии и времени, чем на то, чтобы положить ее в копилку, и она в результате совсем не получала поощрение.
На поощрение накладывается и другое, еще более любопытное ограничение. В экспериментах Б. Мура в 1973 году голуби обучались клевать «ключ» (кнопка или просто значок на стене на уровне головы птицы) за зерно и за воду. Те голуби, которых поощряли зерном, резко ударяли по «ключу» открытым клювом. Те, что ожидали воду за правильное действие, нажимали на «ключ» закрытым клювом, дольше прикасались к нему и даже делали глотательные движения. Подробнее о поведении и истории исследований вы можете прочитать в книге Д. Мак-Фарленда «Поведение животных», переведенной на русский язык.