файл. Годфруа Ж. Что такое психология в 2х т. Т. 1 Пер с франц. М. Мир 1992. 496 с., ил
Скачать 3.88 Mb.
|
Различные стороны процесса подкрепления Подкрепление - это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции. Например, если голодное животное каждый раз будет находить в определенном углу помещения пищу, то оно будет все чаще направляться в этот угол (хорошим примером могут служить эксперименты Олдса, в которых были открыты центры удовольствия; см. документ 6.4). И напротив, если после зажигания красной лампочки животное будет 312 получать удар током, а избежать его можно будет только перепрыгнув из одной половины клетки в другую, то вероятность такой реакции на красную лампочку будет возрастать. В первом случае потребление пищи или удовольствие, получаемое при электростимуляции мозга, играет роль положительного подкрепления. Во втором случае речь идет об отрицательном подкреплении1 - предотвращении электрического удара. Часто смешивают отрицательное подкрепление с наказанием. Однако, как мы уже знаем, подкрепление всегда увеличивает вероятность повторения данной поведенческой реакции, а наказание, наоборот, приводит к исчезновению такой реакции, которая сочтена нежелательной. Значит, в отличие от подкрепления при наказании стремятся либо подать аверсивный раздражитель (например, нанести животному удар током или отшлепать ребенка), либо лишить вознаграждения (вкусной еды или ласки) каждый раз, когда проявляется такая форма поведения, которую нужно устранить. Скиннер и многие психологи принципиально отрицают наказание как средство воспитания, предпочитая в основном использование положительных подкрепляющих факторов, которые способствуют выработке у ребенка социально адекватного поведения, а не подавлению социально неадекватного. По их мнению, нежелательные формы поведения легко могли бы исчезнуть, если бы те, кому доверен процесс воспитания, осуществляли его правильно и не были вынуждены наказывать за то, что они сами вначале непроизвольно поощряли. Кроме того, бихевиористы различают первичное и вторичное подкрепление. Первичное подкрепление - это удовлетворение физиологических потребностей, таких как голод, жажда, сон и т. п. Что касается вторичного подкрепления, то здесь речь идет об удовлетворении, как-то связанном с другими подкрепляющими факторами (первичными или вторичными). Когда мы получаем гонорар или диплом за выполненную работу, когда ребенка награждают игрушкой или военного - орденом2, когда человек получает престижную должность -во всех этих случаях действует вторичное подкрепление, удовлетворение социальных потреб- 1Надо сказать, что этот термин несколько неудачен, так как всякое подкрепление по определению должно способствовать выработке какой-то формы поведения, т. е. оказывать положительное действие. Видимо, правильнее было бы в обоих случаях говорить о подкреплении, но не о положительном и отрицательном, а о положительном и аверсивном (в зависимости от его значения для организма). Однако условности и общепринятые правила, особенно в науке, довольно живучи, и поэтому многие студенты еще долго будут недоумевать по поводу того, почему организм может столь активно стремиться к отрицательному подкреплению. 2Такое подкрепление широко практиковалось Наполеоном -основателем ордена Почетного легиона и ярко выраженным лидером. Его приемы поощрения вошли в историю: всем известно, что он мог потрепать за ухо гвардейца, который, возможно, вскоре будет убит в сражении, или присвоить дворянский титул первому подвернувшемуся вояке в награду за какие-то услуги. Научение 313 ностей, повышающее самоуважение у лиц, у которых оно высоко развито или, наоборот, поколеблено. Угасание, дифференцировка и генерализация Мы уже видели, что как при реактивном, так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Например, если сразу после звонка не следует подача пищи, у собаки вскоре перестает в ответ на этот стимул выделяться слюна. Точно так же, если в семье новорожденного ребенка вдруг перестанут интересоваться звуками, которые он произносит, его словарный запас, скорее всего, не будет развиваться быстро и адекватным образом. Все это проявления процесса угасания. Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать предъявлять безусловный раздражитель или подкрепляющий фактор, то исчезнувшее было поведение почти сразу же восстанавливается. С угасанием тесно связана так называемая дифференцировка. При дифференцировке те поведенческие реакции, которые перестают сопровождаться безусловным раздражителем или подкреплением, исчезают, и сохраняются лишь такие реакции, при которых эти факторы продолжают действовать. Например, если внезапно прекратить подачу пищи после звука колокольчика, но продолжать давать ее в сочетании со звуком зуммера, то слюноотделение на первый из этих звуковых раздражителей прекратится, а на второй сохранится. Точно так же и наш младенец в приведенном выше примере постепенно перестанет издавать неподкрепляемые звуки, и будет повторять лишь те, за которыми следует социальное поощрение. Важнейшую роль в научении путем выработки условных связей играет процесс генерализации1. Именно благодаря этому явлению вновь образованная связь распространяется на все то, что похоже на безусловный раздражитель или на ситуацию, в которой происходило подкрепление. Например, в опытах Уотсона и Рейнер у маленького Альберта (см. документ 7.1) быстро выработался страх перед всеми белыми пушистыми предметами - от бороды деда Мороза до мехового воротника на пальто матери. Все мы знаем, как быстро наступает генерализация у плаксивых детей - сначала они хнычут, требуя конфету, а потом-уже всегда, как только им чего-нибудь захочется, будь то игрушка в магазине или телевизионная передача, идущая по параллельному каналу одновременно с любимой передачей родителей (табл. 7.1).
Павлов называл этот процесс «иррадиацией».- Прим. перев.
316 Глава 7 Бихевиористы предложили множество различных сфер применения методов обусловливания в различных областях человеческой деятельности. Чаще всего реактивное и оперантное научение используется в психотерапии, когда врач пытается применить соответствующие принципы для помощи определенным больным. Подобные примеры приведены в документах 3.1 и 3.2. Подробнее мы рассмотрим этот вопрос в главе 12. В области образования Скиннер выдвинул, в частности, концепцию программированного обучения. По его мысли такое обучение может освободить ученика и преподавателя от скучного процесса простой передачи знаний: учащийся будет постепенно продвигаться в освоении той или иной темы в собственном ритме и маленькими шажками, каждый из которых подкрепляется1; из этих шажков и состоит процесс последовательного приближения (Skinner, 1969). Однако очень скоро обнаружилось, что такое обучение быстро достигает своего «потолка», и это связано именно с тем, что от учащегося требуются лишь минимальные усилия и поэтому подкрепление вскоре становится неэффективным. В результате учащемуся такое обучение быстро надоедает. Кроме того, для постоянного поддержания мотивации у учащегося и упорядоченной передачи знаний, видимо, необходим личный контакт с учителем. Все это, вероятно, можно объяснить с помощью принципов, лежащих в основе социального научения, и в частности научения путем наблюдения. Но еще ближе к истине, наверное, те ученые, которые стоят на позициях когнитивного научения. К этому вопросу мы вернемся в последующих разделах. Научение путем наблюдения (подражания модели) Итак, многие виды поведения, иногда довольно сложные, могут быть объяснены в свете принципов оперантного обусловливания и метода формирования реакций. Вместе с тем множество форм социальной активности индивидуума основано на наблюдении над другими особями из его ближайшего окружения, которые служат моделью для подражания. При этом может иметь место как чистое подражание, так и викарное научение. Подражание -это способ научения, при котором организм воспроизводит действия модели, не всегда понимая их значение. Оно свойственно в основном приматам. Японские этологи наблюдали над стадами обезьян в их естественной среде. Когда ученые смогли подходить близко к самым молодым животным, они стали в их присутствии мыть в воде бататы перед едой. Исследователи быстро убедились в том, что молодые обезьянки начали подражать такому поведению, а через некоторое время оно появилось и у их матерей. Вскоре этот навык усвоили все особи стада, за исключением самых старых, которые были 1Подкреплением служит лампочка, загорающаяся в ответ на каждый правильный ответ, слово «Молодец!», появляющееся на экране, сумма баллов и т. п. Научение 317 Рис. 7.7. Альберт Бандура, американский психолог, один из наиболее известных современных бихевиористов. В своих исследованиях он пытается проверить теорию «научения путем наблюдения», которую называют также теорией социального научения. к этому совершенно неспособны. Речь в данном случае идет именно о чистом подражании, так как животные не могут оценить то значение, которое подобный навык имеет для человека. Что касается викарного научения, то здесь индивидуум полностью усваивает ту или иную форму поведения другой особи, включая понимание последствий этого поведения для модели. Бандура и его коллеги (рис. 7.7) в лабораторных экспериментах показали, что такое научение зависит от многих факторов. Например, люди подражают главным образом каким-то знаменитостям или тем, перед кем они преклоняются. В то же время усвоение поведения модели облегчается, если предмет подражания «доступен» - как с точки зрения возможности контактирования с ним, так и в отношении степени сложности его поведения. Кроме того, если модель за свой поступок (даже агрессивный) получила поощрение, то ей подражают охотнее, чем в том случае, если она была наказана. Известно также, что живым моделям всегда подражают чаще, чем героям фильмов, в том числе мультипликационных (рис. 7.8). Здесь уместно напомнить, что сторонники теории социального обучения все же признают большую роль телевидения и героев телефильмов в развитии агрессивных наклонностей у молодежи (см. досье 6.1). Поскольку субъект в данном случае наблюдает за поведением модели и оценивает последствия, к которым оно приводит для самой модели, здесь должны участвовать когнитивные процессы, так что этот вид научения можно было бы отнести к следующей, третьей группе. Однако он встречается лишь в особых ситуациях, и его часто только с большим трудом можно обнаружить в нашей повседневной жизни. В самом деле, имеется мало свидетельств в пользу того, что подражание, наблюдаемое в искусственных лабораторных условиях или в каких-то специфических жизненных ситуациях, будет повторяться во всех случаях при сходных обстоятельствах. Как отмечал сам Бандура (Bandura, 1977), модель «учит» какому-то 318 Глава 7 Рис. 7.8. Научение путем наблюдения. Понаблюдав за моделью-человеком, «избивающим» резиновую куклу (вверху), маленький мальчик (в середине) или девочка (внизу) в соответствующей ситуации воспроизводят это поведение. поведению, однако использование результатов такого обучения в большой мере зависит от уровня эмоциональной активации субъекта в данный момент и от ее оценки ситуации. Иными словами, при викарном научении в мозгу создаются какие-то связи, но только когнитивные процессы-процессы анализа конкретных обстоятельств -будут в дальнейшем определять, станет ли человек в том или ином случае прибегать к этим связям. Поэтому мы и отнесли такое научение к выработке оперантных форм поведения: при викарном научении просто воспроизводится то или иное поведение в зависимости от его последствий, но не происходит, как при истинно когнитивных формах научения, переработки информации с целью формирования новой поведенческой программы. Когнитивные формы научения Исходя из принципов научения путем формирования реакций или путем наблюдения, легко можно объяснить усвоение каких-то эмоциональных или социальных поведенческих реакций или выработку навыков. Если, однако, мы хотим понять, как человек учится, например, печатать на машинке или играть на музыкальном инструменте (гитаре, кларнете и т. п.), наша задача становится более трудной. Еще сложнее объяснить, как человек может научиться ездить по столичному городу, Научение 319 и уже совсем невозможно понять на основе упомянутых принципов, каким образом мы описываем структуру окружающей среды с помощью понятий или научаемся мыслить и выражать наши мысли словами. В этом разделе мы попытаемся с позиций когнитивного подхода описать и даже понять, как формируются различные виды поведения на основе выработки «когнитивных карт» (при латентном научении), «когнитивных стратегий» (главным образом при выработке двигательных навыков) и, наконец, на основе интуиции и мышления. Латентное научение Из главы 5 мы уже знаем, что в организм все время поступает поток сигналов от окружающей среды, на которые он должен реагировать. Некоторые из этих сигналов ясно осознаются, другие воспринимаются менее четко, а третьи, вероятно, вообще не доходят до сознания, хотя и сохраняются в памяти на уровне низших нервных центров. Согласно представлениям Толмена (Tolman, 1948) (рис. 7.9)-одного из пионеров когнитивного подхода в теории научения -все эти сигналы обрабатываются и преобразуются мозгом. При этом в мозгу создаются своего рода карты окружающей среды, или когнитивные карты, с помощью которых организм определяет, какие реакции будут наиболее адекватными в какой-либо новой ситуации или при внезапном изменении привычных обстоятельств. Толмен пришел к этому выводу, когда установил, что обучение крыс в лабиринте не происходит чисто механически, как считали в те времена бихевиористы (Hull, 1943). Если бы речь шла о простом механическом усвоении, то в случае перекрытия обычного пути в лабиринте или изменения каких-то условий крысе пришлось бы отыскивать новый маршрут, ведущий к цели. Толмен же, напротив, обнаружил, что если крыса уже научилась находить пищу по кратчайшему пути, то после закрытия этого пути она спонтанно меняет свой маршрут и без какого бы то ни было нового научения и новых ошибок находит пищу, но идет теперь по другому, более длинному пути. В других экспериментах он Рис. 7.9. Эдуард Толмен, американский психолог (1886-1961). Он был представителем бихевиоризма и обогатил его представлением о «промежуточных переменных» в цепи стимул-реакция. Согласно Толмену, существуют внутримозговые процессы, детерминированные генетически или приобретенные в результате предшествующего опыта, которые могут изменять реакцию на тот или иной стимул. К промежуточным переменным относятся и так называемые когнитивные карты. 320 Глава 7 показал, что если залить коридоры лабиринта водой, то крыса все равно находит правильный путь, но уже вплавь. При этом, разумеется, используются уже совершенно иные двигательные реакции. Таким образом, по мнению Толмена, животные усваивают не связь между стимулом и реакцией, а значение стимула как своего рода «дорожного указателя». По формулировке Толмена, они узнают, «что к чему ведет». При обучении в лабиринте в единое целое интегрируются запахи, особенности того или иного угла или стенки и связи между различными элементами. Животное как бы располагает эти элементы в пространстве, преобразуя совокупность относительно разнородных стимулов в единое структурированное целое. В случае когда речь идет о сложных формах научения, подкрепление становится необходимым не столько в самом процессе усвоения новой информации, сколько при ее использовании. Это в особенности касается выработки сложных психомоторных навыков. Обучение сложным психомоторным навыкам Всякий, кто пытался научиться играть на музыкальном инструменте, например на фортепиано или гитаре, знает, какими вдохновляющими бывают первые успехи в управлении пальцами и в их правильном расположении на инструменте (достигаются ли они путем формирования реакции или путем наблюдения). К сожалению, картина становится совершенно иной, когда начинается настоящее обучение. Большинство тех, кто бросает занятия, оставляют их именно на этой критической стадии, где должны сформироваться когнитивные стратегии, направленные на выработку строгих последовательностей движений и на их программирование в зависимости от желаемого результата (Fitts, Rosner, 1967). Это когнитивная стадия, на которой все внимание учащегося сосредоточивается на расшифровке нотного текста, аппликатуре, ритме и мелодическом рисунке. По мере того как налаживаются связи между всеми этими элементами навыков, стратегия постепенно меняется. Забота о том, какие элементы и в какой последовательности должны быть соединены, становится все меньше, а вместе с ней постепенно снижается и сопутствующая познавательная активность. Это ассоциативная стадия, для которой характерно постоянное улучшение координации и интеграции различных элементов навыка (рис. 7.10). Если обучающийся проявляет должное упорство, то -он достигает следующей, автономной, стадии, соответствующей высокому уровню умения. Навык при этом становится автоматическим, ошибки -все более редкими, а сосредоточенность на технической стороне -все меньшей, и главное место теперь занимает союз ума и чувства. При этом рука (или рот) и музыкальный инструмент сливаются в единое целое и образуют ту основу, на которой только и возможны фантазия, вдохновение и творческий полет. Все сказанное относится, конечно, и к таким навыкам, как катание на Научение 321 Рис. 7.10. Овладение навыком игры на музыкальном инструменте, как и любым другим навыком, требует создания «когнитивных стратегий», необходимых для координации и интеграции отдельных элементов навыка. лыжах, плавание, езда на велосипеде или работа на пишущей машинке. Из главы 2 мы знаем, что в начале нашего века функционалисты уже описали такого рода научение, пытаясь вскрыть ту роль, которую в нем играет «сознание». Затем, однако, волна бихевиоризма, прокатившаяся по психологическим наукам, смела все менталистские концепции, и они были надолго забыты, пока снова не возродились в когнитивистской психологии. Научение путем инсайта Этот вид научения занимает промежуточное положение между латентным научением и творчеством (к последнему мы вернемся в главе 9). С латентным научением оно сходно в том, что при инсайте определенная информация, разбросанная в памяти, как бы объединяется и используется в новой ситуации. С творчеством инсайт сходен в том отношении, что задача, возникшая в такой ситуации, решается оригинально и решение приходит спонтанно. Научение путем инсайта было открыто Кёлером (Kohler, 1925) в результате наблюдений над обезьянами (см. гл. 1 и рис. 1.11), проведенных в 1917 году. В те времена школа Кёлера, или гештальт-психология, вела непримиримую борьбу с бихевиористскими концепциями. Согласно взглядам Кёлера, у высших животных научение в большинстве случаев обусловлено не созданием механических ассоциаций между какими-либо стимулами или стимулом и реакцией, а скорее объединением опыта, накопленного в памяти, с той информацией, которой располагает индивидуум при решении проблемы. Одна из обезьян Кёлера (рис. 7.11) в эксперименте с недосягаемым для нее бананом сначала пыталась достать плод одной палкой, потом другой, но палки были слишком коротки. Тогда она прекратила свои попытки, стала разглядывать находившиеся около нее предметы и вдруг 322 |