Карен Прайор Не рычите на собаку. О дрессировке животных и людей
Скачать 0.91 Mb.
|
Я выработала цепное поведение. Поведенческие цепи – очень распространенное явление. В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами – работа плотника или уборка квартиры – неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: «Подойди», «Сядь», «Ляг», «Следуй за мной» и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи. Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается невыученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т. д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца – вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что – является неподкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным. Поведенческие цепи – это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, – то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите «помочь» украсить его глазурью. 62 Пример цепного поведения: обучение собаки игре в фризби (пчелку) Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в «пчелку». Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в «пчелку» прекрасный способ тренировки собаки в городе. По сравнению с простым мячом «пчелка» летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в «пчелку» позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать. Люди жалуются, что, когда они бросают «пчелку», собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить «пчелку», когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за «пчелкой». Второй состоит в том, что данная игра – цепное поведение: сначала собака гонится за «пчелкой», затем ловит «пчелку», наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым. Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали. Когда по команде собака будет приносить предметы, обучите ее ловить «пчелку». Сначала заставьте собаку как можно сильнее заинтересоваться «пчелкой», двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в «пчелку». Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за «пчелкой» и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить «пчелку» на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать 63 «пчелку» на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения. Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, – тоже доставляют собаке радость. Тем не менее, поймав «пчелку», собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить «пчелку», медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться – вы оба уже взяли от игры все. Генерализованное управление с помощью Стимулов. С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать – это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги. У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: «Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть… великолепно! Она ее вынула. Молодец, Дорин!». Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова «Класс свободен!»). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает 64 возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли. Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим «дисциплинщиком». Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем. Провалы преднаучения и вспышки раздражения Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал «провалом преднаучения». Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали. Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует. Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было. Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т. е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально – вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами. На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее 65 внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него «возникнет картина». С этого момента он «знает», что означает сигнал, и отвечает на него правильно и уверенно. Я понимаю, что говорю по этому поводу много таких слов, как «отдает себе отчет», «знает» в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы. Для субъекта провал преднаучения – время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример – математические понятия), зная только то, что по-настоящему их не понимаем. Часто субъект бывает настолько расстроен, что проявляет гнев и агрессивность. Дети разражаются слезами и тычут в учебник математики карандашом. Дельфины многократно выпрыгивают из воды и шлепаются о ее поверхность со страшным шумом. Лошади размахивают хвостом и норовят лягнуть. Собаки рычат. Доктор Уолкер обнаружил, что если при выработке распознавания стимула он допускает, что его подопытные тунцы и совершают ошибки и не получают подкрепления более сорока пяти секунд, они настолько расстраиваются, что выпрыгивают из бассейна. Я пришла к тому, что стала называть эти проявления преднаучения вспышками раздражения. Мне кажется, что вспышки раздражения возникают потому, что субъект, считавший себя всегда правым, вдруг обнаруживает, что он ошибается (раз за разом), а причина этого неясна… пока. У людей вспышки раздражения в период преднаучения, по-видимому, часто происходят в моменты, когда бросается вызов привычным представлениям, которых длительно придерживались, а где-то в глубине души субъект знает (!), что в новой информации кроется некая правда. Именно распознание того, что выученное ранее не совсем верно, по-видимому, и приводит к неистовым возражениям, чрезмерным ответам, которые намного превышают степень несогласия, спорам, скандалам, которые могут казаться по наитию наиболее подходящими и вероятными к случаю. Иногда, рассказывая о подкреплении 66 в научных кругах, я вызывала, большую, чем предполагала, враждебность со стороны представителей других дисциплин, начиная от психологов, занимающихся познавательными процессами, кончая нейрологами и представителем высшего духовенства. Я часто подозреваю, что гневные слова являются симптомом преднаучения. Я всегда сожалею, когда вижу приступы плохого настроения, связанного с преднаучением, даже у тунцов, потому что при определенных навыках можно провести субъекта по пути обучения, не вызывая столь большого раздражения. Однако я пришла к убеждению, что вспышки раздражения в период преднаучения являются четким индикатором того, что вот-вот произойдет истинное обучение. Если вы отойдете в сторонку и дадите ему отшуметь как ливню, то вслед за этим может появиться радуга. Применение управления с помощью сигналов Никому не нужно постоянно управлять или быть управляемым с помощью условных стимулов или выученных сигналов, живые существа – это не машины. В действительности реакция на выученный сигнал представляет собой усилие, причем такое усилие, которое не только не должно, но и не может поддерживаться постоянно. Большую часть времени у начальника нет надобности держать подчиненных радом. Если дети бездельничают, а вы не очень спешите, то вы можете сами расслабиться. Служащим, которые и так уже работают с полной отдачей, не нужны приказы и инструкции. Ни нас самих, ни других людей не должны опутывать ненужные правила и регламентации: они вызывают только сопротивление. Совершенно очевидно, что управление с помощью стимулов используется, чтобы дети стали воспитанными, домашние животные слушались, персонал был надежным и т. д. Очень своеобразное управление с помощью стимулов необходимо также для многих видов коллективной деятельности, таких, как марширующие колонны, танцевальные ансамбли, спортивные команды. Отвечать на выработанную систему выученных сигналов доставляет определенное удовольствие, даже животным, по-видимому, это нравится. Я думаю, эте происходит оттого, что стимулы становятся подкреплениями, как в поведенческой цепи, так что, когда овладеваешь всеми типами поведения и сигналами, осуществление ответов имеет сильное подкрепляющее действие. Словом, это интересно. Отсюда то удовольствие от участия в управляемой стимулами групповой деятельности, как, например, согласованный танец, игра в футбол, хоровое пение и игра в оркестре. Когда мы видим какой-либо пример прекрасно управляемого сигналом поведения, начиная с фигур высшего пилотажа, исполняемых группой истребителей, до класса хорошо умеющих вести себя детей, то, желая 67 похвалить их, используем понятие дисциплины. «Они поистине хорошо дисциплинированы» или "Этот учитель знает, как поддерживать дисциплину". Однако понятие о дисциплине включает применение наказания, которое, как мы видели, совершенно не нужно при установлении управления с помощью стимулов. В обиходе сторонниками дисциплины считаются инструктор, родитель, тренер, которые требуют совершенного исполнения и наказывают за любое отклонение, а совсем не те, кто добивается совершенства, подкрепляя улучшения в его сторону. И именно поэтому люди, задавшиеся целью установить «дисциплину», часто пытаются управлять с помощью стимулов на основе: «Делай, что я скажу, иначе…» Поскольку субъект должен ошибиться или не послушаться, чтобы узнать, что значит «иначе», и поскольку тогда становится уже слишком поздно этого не совершать, то этот распространенный подход вовсе не так хорош. Истинное, изящное управление сигналами, установленное с помощью подкрепления, может делать то, что мы считаем дисциплиной субъекта. Однако кто должен стать действительно дисциплинированным так это тренер. Да, но с чего начать? Что, если вы живете и работаете среди людей, которые являются закоренелыми неслухами? Вот система Карен Прайор эффективного воздействия в тяжелом случае. Карен Прайор (видя мокрые плавки и полотенце Юного Гостя на кушетке в гостиной): Пожалуйста, снимите свои мокрые вещи с кушетки и повесьте на сушилку. Юный Гость: 0'кей, минуточку. К. П. (подходит к Ю. Г. и стоит рядом с ним молча). Ю. Г. В чем дело? К. П. Пожалуйста, снимите свой мокрый купальник с кушетки и повесьте на сушилку (NB: не прибавляя: «Сейчас же!», «Сию минуту!», «Я сказала» или что-нибудь в этом роде. Я обучаю этого человека выполнять просьбы с первого раза, а не ждать, когда сигнал будет усилен дальнейшими деталями ими угрозами.) Ю. Г. Вот еще, если вы так спешите, то почему бы вам не сделать это самим? К. П. (Любезная улыбка, но никакого ответа. Я жду момента подкрепить желаемое поведение. Препирательство со мной не является желаемым поведением, поэтому я пренебрегаю им.) Ю. Г. Ладно, ладно (Встает, идет к кушетке, забирает вещи, бросает их в комнату, где стирают.) К. П. В сушилку. Ю. Г. (Ворчит, поднимает и вешает вещи на сушку.) К. П. (Широкая улыбка, искренне, без издевки) Благодарю вас! В следующий раз, когда мне будет нужно попросить юного гостя что-нибудь сделать, возможно, мне потребуется всего лишь взглянуть на 68 него, чтобы вызвать действие. Мало-помалу он станет одним из тех домочадцев, которые быстро исполняют мои просьбы, а я со своей стороны – буду платить ему тем же, буду выполнять то, что он просит, если это выполнимо, и буду стараться не просить его делать более, чем он должен. Знание того, как добиться управления с помощью стимулов, не прибегая к крику и принуждению, в равной мере облегчает жизнь всем – воспитателю и обучаемому. Когда моя дочь Гейл поступила в высшую школу, ей пришлось ставить учебную пьесу, ежегодно для этого выбирали кого-либо из студентов. |