|
Карен Прайор Не рычите на собаку. О дрессировке животных и людей
Чего можно добиться с помощью положительного подкрепления Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем университете, где занятия происходили раз в неделю; из двадцати человек в классе большинство тоже были дизайнерами, либо коммерческими 23 художниками. Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из этих занятых людей себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, Джуди предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Шеннон, студентка колледжа, пришла в гости к одним знакомым и застала такую сцену. Четверо взрослых безуспешно и не без некоторого риска для себя пытались удержать немецкую овчарку и полечить ее больное ухо. Шеннон, которая не особенно любит собак, но изучает роль положительного подкрепления, достала из холодильника немного сыра и за пять минут научила собаку сидеть смирно, пока она без посторонней помощи обработала ей ухо. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мне мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. «Не беспокойся, мама, – сказала дочь, – поживем – увидим». Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками. Одна восьмиклассница, жившая в городе, любила по выходным брать свою собаку на загородные прогулки, но собака часто убегала очень далеко и не возвращалась на зов, особенно когда наступала пора ехать домой. Однажды во время прогулки, когда, бегая туда-сюда, собака сама подходила к девочке, та начала очень живо на это реагировать – хвалить, гладить, болтать, обнимать, возиться с собакой. Когда пришло время ехать домой, девочка позвала собаку, и та с радостью подошла к ней. Громадное радушие в качестве положительного подкрепления, очевидно, перевесило обычное продление собакой своей свободы. Больше на прогулках неприятностей с ней не было. Новый администратор одного грозного босса прикинул, что из его работы может являться подкреплением для босса – например принесение бумаг на подпись, – и старался как можно чаще приурочить это дело ко времени, когда босс не был в ярости. Босс стал спокойнее и, подписывая бумаги, стал даже отпускать шутки. Некоторые люди создают особые типы подкреплений, чтобы заслужить их, другие готовы многим пожертвовать. Аннет, неработающая женщина, имеющая взрослых детей и живущая за городом, была бы практически оторвана от мира, если бы не обилие друзей, которые звонят ей по телефону каждую неделю, а то и чаще, чтобы
24 поделиться новостями. Это не только соседи или родственники, звонят и многие занятые работающие, женщины, живущие далеко. И я одна из них. Почему же мы все звоним Аннет? Если у вас плохие новости – вы заболели гриппом, у вас грядет ревизия или няня вашего ребенка переехала в Кливленд, – вы получите у Аннет сочувствие и совет; но так поступит и любой друг при хороших же новостях от Аннет получаешь необычайное подкрепление. Сообщите ей, что банк открыл вам кредит, она не просто скажет: «Колоссально!». Она точно расскажет чем вы это заработали и заслужили. «Вот видишь? – откликнется Аннет. – Вспомни, как ты много работала, чтобы обеспечить хорошую сумму кредита. Вспомни все неприятности, которые у тебя были с телефонной компанией и с получением билета на самолет. Это тебе награда; в тебе признали деловую женщину. Для этого надо было делать правильные шаги, и ты их делала. Я просто горжусь тобой!» Невероятно! Это больше, чем одобрение, это подкрепление за прошлые усилия, которые в данное время кажутся в основном неудачами. Аннет принимает хорошие новости не с точки зрения «удачи», а превращает их в подкрепление. Это конечно же подкрепляет вашу склонность звонить Аннет. Организованное подкрепление Собрания участвующих в распродаже, клубы организации рекламы, курсы Дейдла Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою «команду» за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена. Несколько лет назад я посещала курсы хозяйствования Вернера Эрхарда, программа не лишена духа торгашества, но с точки зрения обучения это, как мне кажется остроумное, а часто даже блестящее применение формирования и подкрепления. Программа, называлась, и я думаю справедливо, тренировкой. Руководитель назывался тренером. Целью формирования было лучше познать самого себя, а основным подкреплением были не реплики тренера, а поведение всей группы, не имеющее словесного выражения. Чтобы групповое поведение стало подкреплением, 250 человек, составлявших группу, просили аплодировать каждому выступавшему независимо от того, понравилась ли им речь или нет. Таким образом, с самого начала застенчивые были ободрены, смелые вознаграждены, и все выступления, как 25 проникновенные, так и бессодержательные получили признание группы. Поначалу аплодисменты были не более чем обязанностью. Но скоро они стали действительно коммуникативным средством, выражающим не степень удовольствия, как в театре, а оттенки чувств и значений. Например, в нашей группе, а я полагаю, что такое бывает в каждой подобной группе, был заядлый спорщик, который часто подвергал сомнению то, что говорил тренер. Когда это произошло в третий или четвертый раз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логики любитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся и тянулся, всем остальным в аудитории было все равно, кто прав. Все 249 человек желали только одного: чтобы он замолчал и сел на место. Правила игры, то есть формирующие правила, не позволяли нам протестовать или сказать ему, чтобы он замолчал. Но постепенно всеобщее молчание дошло до его сознания. Мы видели, что он начинает понимать, что никому нет дела до того, что он прав. Может бьпъ, не всегда надо доказывать свою правоту. Мало-помалу он погрузился в молчание и сел. Группа немедленно разразилась целой бурей аплодисментов, выражавших сочувствие и понимание наряду с сердечным облегчением – очень мощное положительное подкрепление озарения, которое пришло к спорщику. Случаи обучения такого типа, в которых важную роль играют поведенческие аспекты, а не словесное выражение, безумно трудно объяснить постороннему. Эрхард, подобно учителю дзен, часто прибегает к афоризмам; в случае описанного выше спорщика говорится так: «Когда ты прав, с тебя требуется только одно – быть правым». Это значит, что не обязательно нравиться или вызывать другие приятные чувства: только быть правым. Если бы мне пришлось привести этот афоризм на вечеринке, на которой кто-нибудь распинается, человек, окончивший курсы, посмеялся бы, да и любой хороший современный тренер посмеялся бы, но большинство присутствующих решило бы, что я не в своем уме или пьяна. Озарение при тренировке не требует словесного выражения. Самоподкрепление Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один мой знакомый министр: «Немногие имеют столь низкие критерии, что по ним легко жить». В результате мы часто по нескольку дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, мне кажется, – один из факторов повышения нервозности и депрессий.
26 Вы можете подкрепить себя здоровыми способами – часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми – сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т. д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности". II. ПРОЦЕСС ВЫРАБОТКИ: ФОРМИРОВАНИЕ ВЫСШИХ ФОРМ ПОВЕДЕНИЯ БЕЗ ПРИНУЖДЕНИЯ И БОЛИ Что такое процесс выработки Подкрепить поведение, которое уже имеется, чтобы оно возникало чаще, – это понятно, но как обучающим заставить своих подопечных делать то, что случайно может ни когда и не возникнуть? Как заставить собаку сделать сальто назад или дельфина прыгнуть через обруч? Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях – наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например, представим, что я решила обучить цыпленка «танцевать». Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими. Теперь я могу избирательно подкреплять только более выраженные движения налево – например поворот на четверть круга. Когда эти движения станут преобладающими, естественная вариативность обусловит то, что некоторые повороты будут совершаться менее, чем на четверть круга, а некоторые будут приближаться к половине круга. Я могу повысить критерий, выдвинуть новую задачу и начать отбирать повороты на полкруга и более. Когда цыпленок обучится совершать несколько полных поворотов на большой скорости за одно подкрепление, я могу считать, что достигла своей конечной цели – танцующего цыпленка. Мы все хорошо знакомы с выработкой поведения,
27 являясь участниками или объектами этого процесса. – Попросту говоря, большая часть воспитания ребенка – процесс выработки поведения. Обучение различным физическим навыкам – от тенниса, до печатанья на машинке – представляет из себя в основном выработку поведения. Мы находимся в процессе выработки или, по крайней мере, стараемся что– либо выработать всякий раз, когда упражняемся в чем-либо, начиная от публичного выступления, кончая игрой на фортепьяно. Мы находимся в процессе выработки и тогда, когда пытаемся изменить свое поведение – бросить курить, быть менее застенчивым, лучше распоряжаться деньгами. Достигли или не достигли мы успеха в формировании какого-либо поведения у себя или кого-то другого, в конечном счета зависит не от нашего искусства, а от настойчивости. Музыкальный критик газеты «Нью-Йорк Таймс» писал об одном европейском дирижере, который не будучи великим музыкантом добивался необыкновенной музыки, заставляя свой оркестр репетировать каждый концерт в течение целого года. Большинство из нас может достичь определенного совершенства почти в любой деятельности, если потратить на это достаточно времени. Но это скучно. Разве мы не хотим всегда обучиться новому – катанию на лыжах, игре на пианино, как и любой другой деятельности – как можно быстрее? Конечно, хотим, и вот тут все дело в правильной выработке навыка. Далее, разве мы не предпочитаем избежать вообще или сократить до минимума повторения? Опять-таки, конечно же, но некоторые физические навыки требуют повторения, потому что мускулы «учатся» медленно, и требуется многократное повторение движений, прежде чем они станут совершаться с легкостью. Но даже в этом случае хорошо спланированная программа выработки может свести до минимума необходимую тренировку и сделать значимым каждый момент практических занятий тем самым чрезвычайно ускоряя совершенствование И наконец, в спорте, музыке и других творческих устремлениях вы можете захотеть развить не только стабильное выполнение навыка, но и выполнение на том наивысшем уровне, который доступен вам или тому, кого вы обучаете В этом случае правильное использование законов направленной выработки может быть решающим. Способы и приемы или закономерности Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй – закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться. Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров, – имеет дело пото[м] исключительно со способом или приемом. «Возьмите в руки клюшку для гольфа как показано на рисунке», «Подведите прицел винтовки под нужное место мишени», «Никогда не наклоняйтесь в горах», «Взбивайте яйца металлическим 28 венчиком по часовой стрелке» Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное – когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным. Десять правил выработки С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые – по крайней мере четыре первых – берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них: 1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. 2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. 3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т. е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент. 4. Вводя новый критерий, временно ослабьте старые. 5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее. 6. Не меняйте тренеров на «середине реки»; у вас может быть несколько 29 инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения. 7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать. 8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию. 9. Если навык ухудшается, «возвратитесь к детскому саду», быстро повторите весь процесс выработки с серией легких подкреплений. 10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого. 1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъ екту. Если ваша лошадь берет барьер в два фута, иногда имея фуг в запасет вы можете увеличить барьер до двух с полови ной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в со стоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье. То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь боль шое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепры гивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ва ше взаимодействие в процессе выработки, каковы ваши пра вила подкрепления. Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать под крепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным). Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне. Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас – неважно делал или не делал он это для себя, – вы сильно рискуете. Поведение может быть сорвано. У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый – а иногда единственный – способ сформировать поведение – это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения.
30 Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение. Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и С.-Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым. 2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью -в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т. д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз – потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу-требовать соблюдения обоих. У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, – чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т. д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, 31 пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени. Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю, что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления. Часто нам не удается добиться прогресса в каком-либо навыке, хотя мы много упражняемся, потому, что мы пытаемся сразу улучшить две или более стороны деятельности. Нужно подумать: одно ли свойство характеризует данное поведение? Нельзя ли его расчленить и работать отдельно над различными критериями? Когда вы займетесь этими вопросами, большинство проблем решаться сами собой. 3. Прежде чем увеличивать или повышать критерий, пользуйтесь вариативной шкалой подкреплений имеющегося в данный момент уровня ответа. Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление «сдвинет» нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением – когда достигнут новый уровень выполнения – и вари ативным подкреплением – когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов. Иногда смена стабильных и вариативных шкал происходит очень быстро, составляя два-три подкрепления на каждом уровне. Вероятность этого особенно велика, если у субъекта внезапно наступает «озарение» – он начинает понимать конечную цель, и улучшение поведения становится спонтанным. В этом случае введение вариативной шкалы столь значимо для обучения, что это необходимо постоянно помнить и все время
32 контролировать, не забуксовала ли, не перестала ли приносить успех ваша программа выработки. 4. Вводя новый критерий, временно ослабьте старые. Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью – послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится. То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это «синдромом нового бассейна». Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он «забудет» все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают, а иногда фиксируют внимание на ошибках, которые становятся постоянными. 5. Ведите ученика за собой. Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды' я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов. Такого рода «рывок» выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в данном случае – прыгнуть как можно выше), и делает это. Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию. 33 Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять. «Рывок» часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от «ага!» познания, и часто впадает в состояние явно повышенного настроения. Таким образом, «рывок» – это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, -лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания. За очень редкими исключениями наша школьная система построена так, чтобы помешать детям обучаться в их собственном темпе – наказываются не только медленные ученики, у которых не хватает времени на обучение, но и слишком быстро обучающиеся, которые не получают дополнительного подкрепления, когда быстрая сообразительность продвигает их вперед. Если ты мгновенно понял, о чем толкует учитель математики, твоей наградой может стать мучение от скуки в течение часов или даже недель, пока все остальные мало-помалу постигнут это. Поэтому нет ничего удивительного в том, что улица более привлекательна как для наиболее быстрых, так и для медленных. 6. Не меняйте тренеров на полпути. В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям. Конечно, у каждого обучающегося может быть много различных учителей – мы не испытываем затруднений от того, что один обучает нас французскому, другой – арифметике, третий – футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи. Те, кто хочет учиться, будут учиться при наихудших условиях.
34 В Колумбийском университете был поставлен получивший в настоящее время широкую известность эксперимент по «языку обезьян», в котором шимпанзе обучали словарю американского знакового языка и другим кодам; в эксперименте принимал участие детеныш шимпанзе по имени Ним Шимрски. По бюджетным и другим соображениям, у бедняжки за трехлетний период было чуть ли не сто «учителей» знакового обозначения. Студенты и экспериментаторы были разочарованы, поскольку Ним не демонстрировал твердых доказательств использования реального «языка». А именно, он, по-видимому, никогда не строил предложений. Но он выучился распознавать и понимать более трехсот символов – существительных, глаголов и т. д., что при данных обстоятельствах, с моей точки зрения, является поразительным. То же самое происходит с некоторыми детьми, которые переходят из школы в школу, проходя через бесконечную смену учителей, приемов и методов обучения, и тем не менее обучаются. Но есть более хорошие способы. Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены. 7. Если одна процедура выработки не приводит к успеху, попробуйте другую. Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие – быстро опускать в воду и поднимать обратно лицо, а третьи – прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов. Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому – вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать – надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение «рецепты» считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга. Однажды один телевизионный деятель, который ставил шоу в 35 океанариуме «Жизнь моря», пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лощадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама. Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления – что за мысль! Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом – нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл. 8. Не кончайте урок без положительного подкрепления, это равносильно наказанию. Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, – поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации – скажем, на уроке или при выработке поведения у какого-либо животного – преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это – хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, иди просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание – лучший способ сделать это. Дрессировщики дельфинов называют это «тайм-аут» и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту – один из способов сказать дельфину: «Нет!» или: «Неправильно!» Обычно это оказывается очень эффективным – не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания – мощный инструмент, поэтому не применяйте его без должной
36 осторожности и несправедливо. 9. Если выученное поведение ухудшается, пересмотрите процедуру выработки. Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение– например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу – вы стараетесь найти испанское слово, а всплывает немецкое. Самый быстрый способ исправить такое ухудшение – не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и "очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т. д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме «Жизнь моря» мы называли это «вернуться в детский сад», и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков Оно действенно как у животных, так и у людей. 10. Прекращайте работу, оставляя за собой лидирующее положение. - Сколько должен продолжаться каждый сеанс выработки? Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день. Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте – т. е. сразу как только достигнут успех. Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших 37 ответа – собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж – и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться. Будучи тренером вы должны, если это необходимо, затавлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше. Психологи называют это «латентным обучением». В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение. В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления. Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди. Феномен Дзен. Иногда вы не можете кончать каждый урок на высокой ноте. Возможно, что слушатели оплатили час занятий, и они хотят использовать весь этот час, хотя наилучшее время для окончания урока было достигнуто раньше. А может, урок идет не слишком хорошо, чтобы обеспечить наивысший подъем, и вот-вот наступит усталость. В этом случае наиболее мудро окончить урок чем-нибудь легким, что гарантирует получение подкрепления, чтобы весь урок в целом запомнился как подкрепленный. Дрессировщики дельфинов часто оканчивают длительные, требующие напряжения занятия легкой игрой в мяч; обучающие верховой везде иногда используют разные игры, например салочки. Самым нецелесообразным приемом является введение новых задач или материала в конце занятий, вследствие чего оно заканчивается серией
38 неадекватных и неподкрепляемых ответов. Когда я была ребенком, мои уроки музыки всегда кончались таким способом; это очень обескураживает, и я до сих пор не могу играть на пианино. |
|
|