Карен Прайор Не рычите на собаку. О дрессировке животных и людей
Скачать 0.91 Mb.
|
Что может быть сигналом? Условным стимулом – выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского – короче говоря, безразлично, какой сигнал вы используете Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения. 54 Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов, руки, но я знаю одного слепого дельфина, который выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку, покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону. У рыб можно выработать условный рефлекс на звуки или свет – мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно. В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду «Каш!», даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег. И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах «Спокойно, крошка!», не имеет ни малейшего значения. Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде «Вперед!». Тренер конюшни смотрел на это с отвращением и наконец сказал: «Так ничего не выйдет – лошади не понимают „Вперед!“, надо цокать». Потом взял веревку у меня из рук, сказал: «Тцо-тцо» и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед. «Понятно?» – сказал он, считая свои слова доказанными. Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов! Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только 55 какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: «Тихо!», или встать и, подняв руку, жестом призвать к молчанию. А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов. Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул – допустим, команду, поданную голосом, – как всегда, и новую команду – скажем, сигнал, поданный рукой, – и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано «Выполняй это действие» и «Выполняй это действие по команде», то легче выработать «Выполняй это действие также по другой команде». Интенсивность сигнала и стирание стимулов Не существует определенных требований к интенсивности и величине условного сигнала, вызывающего ответ. Первичные, или безусловные, стимулы, дают градуальный ответ в зависимости от интенсивности: реакция на резкий, колющий удар сильнее, чем на булавочный укол, и чем громче внезапный шум, тем сильнее мы вздрогнем. Однако условному стимулу достаточно быть узнану, чтобы вызвать полный ответ. Вы видите красный свет и останавливаете машину; быстрее или медленнее вы это делаете не зависит от размера светофора. До тех пор, пока вы распознаете сигнал, вы знаете, что делать. Поэтому, как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но попрежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется «стирание» стимулов. Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом («Дик, нельзя сыпать песок на головы другим детям», – говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови иди погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть 56 заметное движение руки дрессировщика. Представьте себе возможности этого трюка: «Педро, что ты думаешь о шляпе этого человека?» – «Ха-ха-ха!». Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу. Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время – время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера «Воскрешение», как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: «Вступайте мягче», изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест – скажем, – поднятие ладони кверху для обозначения «Громче» – с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела – однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови. Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого – Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь «отвечала» на 57 вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта. Условные стимулы, вызывающие отвращение Единственным случаем, где сила условного стимула, по-видимому, имеет значение, является обычно дрессировка домашних животных – рывок за поводья или привязь, легкий удар по бокам лошади – все это размытый вариант первоначального безусловного стимула, резкого рывка или толчка, сильного удара рукой, которые вызывают ответ, не требующий обучения. Поэтому, если слабый стимул не действует, создается впечатление, что ответ возрастает, если вы усилите стимул. Однако попытки осуществить это на практике встречают большие затруднения. Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону. Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным «освежить память», как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога. Имея в запасе эти первичные стимулы, можно быстро получить 58 хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям. Время отставления Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления. Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается. Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно. Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор. Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение. Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось. Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается. В 1960 г. в океанариуме «Жизнь моря» одним из наиболее эффектных 59 номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала. В результате дельфины располагались вокруг подводного источника звука навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, – по-видимому психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока. В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание – временное «окно», в течение которого должно осуществляться поведение, которое будет подкреплено, – очень короткое. Предвосхищение Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал. Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге – опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель. На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых 60 бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала. Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов. Другой чрезвычайно распространенный случай предвосхищения – офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают. С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите, всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными. Стимулы в качестве подкрепления: поведенческие цепи Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: «Вы свободны, идите и играйте». А кроме того, он воспринимается как подкрепление – дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс. Условный стимул – предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие – это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде – она этому научается и выполняет это. Теперь, если я буду говорить: «Ко мне» и вознаграждать ее за реакцию всякий раз как увижу ее – на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: «Ко мне». Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой «Ко мне». Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину… |