Хрестоматия. Петухов. Том 3. Книга 2. Учебник по общей психологии, предназначено для проведения семинарских занятий по данному курсу и самостоятельного чтения

Название	Учебник по общей психологии, предназначено для проведения семинарских занятий по данному курсу и самостоятельного чтения
Анкор	Хрестоматия. Петухов. Том 3. Книга 2.doc
Дата	22.09.2018
Размер	20.88 Mb.
Формат файла
Имя файла	Хрестоматия. Петухов. Том 3. Книга 2.doc
Тип	Учебник #24954
страница	49 из 53

1 ... 45 46 47 48 49 50 51 52 53

7. Восприятие и понимание речи

Г, Глейтман,

А. Фридлунд,

Д.Райсберг

[ПОНИМАНИЕ РЕЧИ]¹

Каким образом нам вообще удается понимать речь, которую мы слышим, или предложения, которые мы читаем? Как мы проникаем за поверхностные рамки, чтобы воссоздать скрытую структуру каждого предложения? Трудность здесь в некоторых отношениях напоминает проблему константности зрительного восприятия, с которой мы столкнулись при обсуждении зрительного восприятия <...>: наблюдатель должен определить подлинный размер объекта, если ему дан его образ на сетчатке. Последний образ изменяется всякий раз, когда меняется расстояние или угол между наблюдателем и целевым объектом. Тем не менее, наблюдатель может воспринимать фактические размеры и форму объекта, так как у него есть ряд подсказок, информирующих его о периферическом стимуле. Учитывая эти подсказки, наблюдатель может реконструировать фактический размер и форму объекта.

Нечто подобное происходит и с языком (рис. 1). Здесь слушатель должен определить скрытую структуру предложения, если ему дан лингвистический «проксимальный стимул», т.е. поверхностная структура; здесь тоже существуют подсказки, помогающие слушателю восстановить скрытую форму. Так, функциональные слова (например, кто, или) — хороший ключ к тому, что в предложении, которое мы слышим, содержится больше чем одно утверждение².

¹ Глейтман Г., Фридлунд А.., Райсберг Д. Основы психологии. СПб.: Речь, 2001. С. 417-418, 422-425.

^гСм.: Kimball J. Seven principles of surface structure parsing in natural language // Cognition. 1973. 2. P. 15-47.

592

Тема 18. Экспериментальные исследования мышления

Рис. 1. Аналогия между лингвистическим парафразом и константностью восприятия Лингвистический парафраз в некоторых отношениях напоминает константность восприятия <...>, поскольку в обоих случаях мы интерпретируем внешне различные паттерны стимуляции как приблизительно эквивалентные: А — постоянство формы. Когда мы смотрим на крышку стола, форма изображения, которое на самом деле попадает на сетчатку, зависит от нашего положения по отношению к столу. Однако постоянство формы позволяет нам воспринимать неизменную прямоугольную форму, которая является источником этих изображений; Б — парафраз. Ухо слышит множество поверхностных предложений, но лингвистическая система интерпретирует их все как содержащие одно и то же утверждение <...>

Аппарат для анализа предложений

Как именно мы используем эти подсказки, чтобы извлечь скрытую структуру из поверхностной? Согласно работам многих психолингвистов, наш аппарат для анализа предложений (ААП) полагается на несколько довольно общих стратегий, две из которых обсуждаются ниже¹.

¹ Общее описание обработки и понимания предложений см. в: FrazierL., FodorJJ). The sausage machine: A new two-stage parsing model // Cognition. 1978. 6. P. 291-325; Cairns RB. Research in language comprehension // R.C. Naremore (Ed.). Language science. San Diego: College-Hill Press, 1984; Joski A.K. Natural language processing // Science. 1991. 253. P. 1242-1249; Trueswell J.C., Tanenhaus M.K. Toward a lexicalist framework of constraint-based syntactic ambiguity resolution // C.J. Clifton, L. Frazier (Eds.). Perspectives on sentence processing. Hillsdale, N. J.: Eribaum, 1994. P. 155-179.

ГлейтманГ., ФридлундА., РайсбергД. [Понимание речи] 593

Простейший порядок предложения: действующее лицо, действие, объект действия

Несколько исследований показали, что ААП начинает работу с сильного предубеждения по поводу того, какого рода предложение он сейчас услышит: обычно он начинает с допущения, что предложение сначала назовет действующее лицо, затем — действие, а затем — объект действия. По грамматической терминологии, ААП начинает с допущения, что предложение будет иметь следующий порядок: субъект, глагол, объект.

Эта стратегия абсолютно разумна, так как в обычной речи активная форма предложений (например, Джон побил Фреда) встречается гораздо чаще, чем пассивная (Фред был побит Джоном). Однако пассивные предложения все же встречаются, и с ними первоначальная стратегия ААП терпит неудачу. ААП осознает свою ошибку, как только он сталкивается с глаголом в пассиве. Обнаружив эту подсказку, он пересматривает свою первоначальную догадку и определяет первое именное слово как объект действия, а не как действующее лицо.

Эти шаги — начать с одной гипотезы, а затем заменить ее другой — требуют некоторого усилия, что можно обнаружить, исследуя время реакции. Один исследователь просил участников слушать предложения типа «Собака преследует кошку» и «Кошка преследуется собакой». Сразу после этого участникам показывали одну из двух картинок: собаку, преследующую кошку (рис. 2, Б), или кошку, преследующую собаку (рис. 2, А). Их задача состояла в том, чтобы решить, соответствует ли прослушанное ими предложение предъявленной картинке или нет. Участники быстрее приходили к решению, когда предложение имело активную, а не пассивную форму¹.

Рис. 2. Принятие решения о том, кто является действующим лицом, а кто — объектом действия. Время реакции испытуемых было значительно меньшим, если глагол в предложении, прочитанном до предъявления картинок, стоял в активной форме

¹ См.: Slobin D. I. Grammatical transformations and sentence comprehension in childhood and adulthood // Journal of Verbal Learning and Verbal Behavior. 1966. 5. P. 219-227.

594 Тема 18. Экспериментальные исследования мышления

Функциональные слова, сигнализирующие о границе суждений

Учитывая множество форм предложений, с которыми мы сталкиваемся, попытка с ходу угадать структуру предложения может показаться рискованной. Лучше подождать, пока не появится информация, которая послужит руководством для толкования предложения. Необдуманная гипотеза о структуре предложения может легко пустить ААП по ложному следу. Например, поспешный грамматический разбор часто заставляет читателей думать, что Сев в соседней деревне — это рассказ о посевной; на самом деле речь идет совсем о другом, но это становится ясно лишь тогда, когда мы прочитаем все предложение {Сев в соседней деревне, вертолет простоял там два часа).

В действительности, однако, многие факторы помогают удерживать ААП на правильном пути. И если анализ все-таки сходит с этого пути, подсказки обычно гарантируют, что это будет быстро обнаружено и исправлено. Например, в предложении «Девочка, которая съела гамбургер, ударила по мячу» о границе между двумя суждениями сигнализирует функциональное слово которая. Функциональные слова играют важную роль в раскрытии структуры предложения и, следовательно, в управлении процессом анализа предложения.

Конечно, язык часто позволяет нам опускать эти функциональные слова в быстрой речи. В таком случае предложение можно произнести быстрее (хотя оно, в конце концов, не намного короче), но если слушатель полагается на эти функциональные слова, тогда их исключение сделает предложение немного более сложным для понимания. Так и происходит: анализ предложения занимает больше времени, когда удаляется подсказка в виде функционального слова¹.

Семантика и другие подсказки

ААП делает разбор предложения, обращая внимание на выявляющийся смысл и уделяя внимание не только функциональным словам, но и семантике, используя конкретные слова по мере их появления в качестве информации для раскрытия содержания предложения².

Мы уже говорили о том, что активные формы предложения обычно понимаются быстрее, чем пассивные. Так, нужно больше времени, чтобы понять второе (пассивное) предложение в следующей паре, чем для того, чтобы понять первое (активное).

¹ См.: Bever Т.О. The cognitive basis for linguistic structures // J.R. Hayes (Ed.). Cognition and the development of language. N. J.: Wiley, 1970. P. 279-362.

¹ См.: Trueswell J., Tanenhaus M„ Garnsey S. Semantic influences on parsing // Journal of Memory and Language. 1994. 33. (3). P. 285-318.

Глейтман Г., Фридлунд А., Райсберг Д. [Понимание речи]

595

Рис. 3. Семантическая подсказка Для понимания пассивного предложения «Цветы поливаются девочкой» нужно не больше времени, чем для понимания активного предложения «Девочка поливает цветы», так как его значение, несомненно, будет понято так, как это изображено на рис. А, а, не Б

Спаниель укусил сенбернара. Сенбернар был укушен спаниелем.

Однако в некоторых случаях семантические подсказки берут верх над этим правилом. Так, участники исследования понимают следующие два предложения одинаково быстро:

Собака съела мясо. Мясо съедено собакой.

В этом случае нет опасности перепутать, кто что с кем сделал: собака может съесть мясо, но мясо не может съесть собаку. Таким образом, здесь нет никакой неопределенности и слушатель понимает пассивное предложение так же быстро, как и активное¹ (рис. 3).

Внелингвистический контекст. Мы крайне редко встречаем отдельное, изолированное предложение. Как правило, предложения произносятся и понимаются в некотором контексте. Возможно, контекст обеспечивается остальной частью романа или учебника по психологии, в котором появляется предложение. Чаще контекст — это происходящий разговор, в котором говорящий и слушающий беседуют в духе сотрудничества. Говорящий пытается передать ровно столько подробностей, сколько необходимо слушающему для понимания. Слишком большое количество подробностей сделало бы разговор безнадежно медленным и невыносимо скучным, а недостаток подробностей запутал бы слушателя. Чтобы балансировать между этими двумя проблемами краткости и ясности, говорящий должен согласовывать каждое высказывание с тем, что слушатель знает и чего он не знает². Таким же образом слушатель знает, что

¹ См.: Slobln D. I. Grammatical transformations and sentence comprehension in childhood
and adulthood // Journal of Verbal Learning and Verbal Behavior. 1966. 5. P. 219-227.

² См.: Clark H.H. Using language. Cambridge: Cambridge University Press, 1996.

596

Тема 18. Экспериментальные исследования мышления

говорящий не будет проговаривать каждую посылку или каждое допущение, и он понимает, что ему придется заполнять пробелы, делая обоснованные выводы о тех деталях, которые остались невысказанными.

Как мы относимся к этой модели разговорного сотрудничества? Одно описание было дано философом Х.П.Грайсом, который утверждал, что разговором управляет небольшое количество правил, или максим¹, Одна из этих негласных максим — максима уместности — требует, чтобы партнеры по разговору говорили вещи, которые относятся к делу. Такое правило помогает нам понять следующий диалог.

Брайан: А где же ростбиф?

Фернанда: Не знаю, но у собаки весьма довольный вид.

Ответ Фернанды кажется совершенно не относящимся к заданному вопросу, но если мы принимаем максиму уместности Грайса, мы вынуждены искать связь между ее ответом и вопросом Брайана. Этот поиск уместности приводит к заключению, что собака могла украсть ростбиф. Другой пример касается максимы количества: партнеры в разговоре понимают, что они не должны говорить ни больше, ни меньше, чем это необходимо. Эта максима действует в следующем фрагменте диалога;

Т они: Как тебе понравились танцоры? Мария: Некоторые из них были очень хороши.

Здесь Мария подразумевает, что некоторые из танцоров были не хороши; мы понимаем, что «некоторые» означает «не все». Конечно, это толкование не следует логически из реплики Марии (если она думает, что все были хороши, то она могла с полным правом сказать, что некоторые были очень хороши). Тем не менее, мы делаем именно это заключение об оценке Марии, поскольку мы негласно предполагаем, что если бы она думала, что все танцоры были хороши, она бы так и сказала. В противном случае она нарушила бы максиму количества.

Эти максимы и общая динамика разговора позволяют говорящим оставлять многое невысказанным. Рассмотрим следующий отрывок из разговора²:

Женщина: Я ухожу от тебя. Мужчина (в гневе): Кто он?!

Мы можем легко сопроводить этот диалог мелодраматическим сценарием, придав большое значение богатству интерпретации, часто требуемому для понимания повседневного разговора³.

¹ См.: Grice H.P. Logic and conversation. // P.Cole, J.L.Morgan (Eds.). Syntax and
semantics 3: Speech acts. N. Y.: Academic Press, 1975.

² См.: Pinker S. The language instinct. N. Y.: William Morrow, 1994.

³Дополнительное обсуждение роли слушателя или читателя в понимании связной
речи см.: SperberD., WilsonD. Relevance: Communication and cognition. Oxford: Blackwell,
1986; Graesser A.C, Millie K.K., Zwaan RA. Discourse comprehension // Annual Review of
Psychology. 1997. 48. P. 163-189.

Дж.Р. Андерсон[РАСПОЗНАВАНИЕ РЕЧИ И ПОНИМАНИЕ ЯЗЫКА]¹

Распознавание речи

Главная проблема при распознавании речи — сегментация распознаваемых объектов. Речь не разбита на дискретные единицы, как печатный текст. Хотя кажется, что между словами в речи имеются четкие промежутки, часто это лишь иллюзия. При исследовании фактического физического речевого сигнала мы часто находим не уменьшающуюся интенсивность звука в границах слова. Действительно, снижение интенсивности речи так же вероятно в пределах слова, как и между словами, Эта особенность речи особенно заметна, когда мы слушаем, как кто-то говорит на неизвестном иностранном языке. Речь кажется непрерывным потоком звуков без очевидных границ слов. Именно знание нашего собственного языка ведет к иллюзии границ слова.

В пределах отдельного слова существуют еще большие проблемы с сегментацией. Эти проблемы включают в себя идентификацию фонем. Фонемы — это основной набор звуков речи; именно с их помощью мы распознаем слова². Фонема определяется как минимальная единица речи, которая может обусловливать различия в произнесенных сообщениях. В качестве иллюстрации рассмотрим слово bat. В этом слове есть три фонемы: [b], [а] и [t]. При замене [b] на фонему [р], мы получим pat; заменив [а] на [i], мы получим bit; заменив [t] на [n], мы получим ban. Очевидно, не всегда существует однозначное соответствие между буквами и фонемами. Например, слово oneсостоит из фонем [w], [а] и [n]; school

¹ Андерсон Д.Р. Когнитивная психология. СПб.: Питер, 2002. С. 63-71, 371-380.

²Массаро (см.: Massaro D.W. Modeling multiple influences in speech perception // A.Dijkst, K. de Smedt (Eds.). Computational psycholingvistics: A and connectionist models of human language processing. London: Taylor and Francis, 1996. P. 85-113) предполагает, что основными перцептивными единицами являются комбинации гласных-согласных и согласных-гласных.

598 Тема 18. Экспериментальные исследования мышления

состоит из фонем [s], [k], [u] и [1]; knightсостоит из [n], [i] и [t]. Именно отсутствие точного соответствия между буквами и звуками делает трудной английскую орфографию.

Проблема сегментации возникает, когда фонемы, образующие произносимые слова, должны быть идентифицированы. Трудность состоит в том, что речь непрерывна и фонемы не дискретны, в отличие от букв на напечатанной странице. Сегментация на этом уровне подобна распознаванию написанного от руки сообщения, где одна буква переходит в другую. Кроме того, разные люди по-разному произносят одни и те же фонемы, подобно тому, как обладают разным почерком. Разница между говорящими особенно очевидна, когда человек впервые пытается понимать говорящего с сильным и незнакомым акцентом, например когда американец пытается понять австралийца. Но анализ речевого сигнала показывает, что даже среди говорящих с тем же самым акцентом существуют значительные вариации. Например, голоса женщин и детей обычно намного выше, чем голоса мужчин.

Еще одна трудность в восприятии речи включает в себя феномен, известный как коартикуляция¹. Когда артикуляционный аппарат производит один звук, скажем [b] в bag, он начинает принимать форму, требующуюся для [а]. Когда он производит звук [а], он начинает принимать форму, требующуюся для [g]. В действительности различные фонемы накладываются друг на друга. Это создает дополнительные трудности при сегментации фонем, и это также означает, что фактический звук, произведенный для одной фонемы, будет определен контекстом, который образуют другие фонемы.

Считается, что восприятие речи включает в себя специализированные механизмы, которые выходят за рамки общих механизмов слухового восприятия. <...> Кроме того, есть пациенты, которые в результате поражения левой височной доли утратили способность лишь слышать речь². Их способность обнаруживать и распознавать другие звуки не нарушена, как и их способность говорить. Таким образом, их нарушение касается только восприятия речи. Иногда этим пациентам в некоторой степени удается распознать речь, если она очень медленная³, и это наводит на мысль, что отчасти их проблема может заключаться в сегментации речевого потока.

Распознавание речи включает в себя сегментацию фонем в непрерывном потоке речи.

¹ См.: Liberman A.M. The grammars of speech and language /7 Cognitive Psychology.
1970. 1. P. 301-323.

² См.: Goldstein M.N. Auditory agnosia for speech («pure word deafness»): A historical
review with current implications // Brain and Language. 1974. 1. P. 195-204.

³ См.: Okada S.. Hanada M., Hattori H., Shoyama T. A case of pure word-deafness // Studio Phonologica. 1963. 3. P. 58-65.

Андерсон Д.Р. [Распознавание речи и понимание языка]

599

Анализ особенностей речи

В основе восприятия речи, по-видимому, лежат почти такие же процессы, как подетальный анализ и комбинация деталей при зрительном распознавании. Как и отдельные буквы, отдельные фонемы можно рассматривать как характеризующиеся некоторым числом особенностей. Эти особенности связаны с тем, как порождена фонема. Фонемы могут различаться по таким признакам, как «согласные—гласные», «звонкие— глухие» и по месту артикуляции¹. Согласные фонемы по звучанию отличаются от гласных. Звонкие фонемы получаются в результате вибрации голосовых связок. Например, сравните, как вы произносите пот и дот, трупы и трубы, фон и вон. Вы можете обнаружить это различие, поместив пальцы на вашей гортани, когда вы произносите эти звуки. Гортань будет вибрировать при звонком согласном.

Местом артикуляции называется место, в котором речевой канал закрыт или сжат при произнесении фонемы. (Он закрыт в определенной точке при произнесении большинства согласных.) Например, звуки [п] и [м] относятся к билабиальным, так как при их произнесении губы закрыты. Фонемы [ф] и [в] считаются лабио-дентальными, так как при их произнесении нижняя губа прижата к передним зубам. Фонемы [т], [д], [н], [л] и [р] — альвеолярными, потому что язык прижат к альвеолам. Фонемы [к] и [г] — задненёбные, потому что язык прижат к мягкому нёбу, или нёбной занавеске в задней части нёба.

Рассмотрим фонемы [п], [б], [т] и [д]. Все четыре — согласные, однако различаются по звучанию и месту артикуляции. В табл. 1 эти четыре согласных звука классифицированы в соответствии с этими двумя особенностями.
Классификация звуков [б], [п], [д] и [т] по звонкости—глухости и месту артикуляции
Таблица 1

Существует немало доказательств роли таких особенностей в восприятии речи. Например, Миллер и Найсли² предлагали испытуемым попытаться на фоне шума опознать такие согласные, как [б], [д], [п] и [т]. На самом деле испытуемым предъявлялись звуки [ба], [да], [па] и [та]. Испытуемые оказывались сбитыми с толку, полагая, что они слышали один

¹ См.: Chomsky N.. Halle M. The sound pattern of English. N. Y.: Harper, 1968.

² См.: Miller GA„ Nicely P. An analysis of perceptual confusions among some English
consonants // Journal of the Acoustical Society of America. 1956. 27. P. 338-352.

600

Тема 18. Экспериментальные исследования мышления

звук, когда в действительности предъявлялся другой. Экспериментаторов интересовало, какие звуки будут путать между собой испытуемые. Казалось вероятным, что испытуемые будут наиболее часто путать согласные, которые различались между собой только единственной особенностью, и это предположение подтвердилось. Например, когда предъявлялся звук [п], испытуемые чаще полагали, что они слышат [т], чем что они слышат [д]. Фонема [т] отличается от [п] только местом артикуляции, тогда как [д] отличается и местом артикуляции, и звучанием. Точно так же испытуемые, которым предъявлялся звук [б], чаще полагали, что они слышат [п], чем что они слышат [т].

Этот эксперимент — ранняя демонстрация типа логики, которую мы наблюдали в исследовании распознавания буквы, проведенном Кин-ни, Марсеттой и Шоуменом¹. Когда испытуемый может идентифицировать только набор особенностей, лежащих в основе паттерна (в этом случае паттерном является фонема), ответы испытуемого будут отражать смешение фонем, имеющих один и тот же набор особенностей.

Фонемы распознаются в терминах особенностей, характеризующих их произнесение, таких как место артикуляции и звучание.

Категорическое восприятие

Особенности фонем связаны с тем, как они произносятся. Каковы свойства акустического стимула, который кодирует эти особенности произношения? Эта проблема была особенно хорошо изучена относительно звучания. При произнесении таких согласных, как [б] и [п], происходят две вещи: сомкнутые губы открываются, выпуская воздух, и голосовые связки начинают вибрировать (звучать). В случае звонкого согласного звука [б] выпуск воздуха и вибрация голосовых связок происходят почти одновременно. В случае глухого согласного звука [п] выпуск воздуха происходит на 60 мс раньше, чем начинается вибрация. При восприятии звонкого согласного по сравнению с глухим мы воспринимаем присутствие или отсутствие 60-миллисекундного интервала между выпуском воздуха и звучанием. Этот период времени называется временем начала звучания. Различия между звуками [п] и [б] показаны на рис. 1. Подобные различия существуют и в других парах звонких—глухих согласных, таких как [д] и [т]. Итак, на восприятие фонем влияет задержка между моментом выпуска воздуха и началом вибрации голосовых связок.

Лискер и Абрамсон² провели эксперименты с искусственными (генерируемыми компьютером) стимулами, в которых задержка между вы-

¹ См.: Kinney G.C, Marsetta M„ Showman D.J. Studies in display symbol legibility, part
XXI. The legibility of alphanumeric symbols for digitized television (BSD-TK-66-117). Bedford,
MA: The Mitre Corporation, 1966.

² См.: Llsker L., Abramson A. The voicing dimension: Some experiments in comparative
phonetics // Proceedings of Sixth International Congress of Phonetic Sciences, Prague, 1967.
Prague: Academia, 1970.

Андерсон Д.Р. [Распознавание речи и понимание языка] 601

Рис. 2. Процент идентификации звука [б] по сравнению со звуком [п]

как функция времени начала звучания голоса. Резкое изменение этих

функций происходит приблизительно за 25 мс²

пуском воздуха и звучанием варьировала от -150 мс (звучание за 150 мс до выпуска воздуха) до +150 мс (звучание через 150 мс после выпуска воздуха). Задача состояла в том, чтобы выделить, какие звуки были звуком [б], а какие — звуком [и]. На рис. 2 представлен график, на котором в процентах указано количество случаев идентификации звуков [б] и [п]. На большей части континуума испытуемые в 100% случаев сходились во взглядах на то, что они слышали, но имеется резкое изменение ответов от [б] к [п] приблизительно за 25 мс. При времени начала звуча-

¹ См.: Clark ИМ., ClarkE.V. Psychology and language. N. У.: Harcourt Brace Jovanovich,
1977.

² См.: Llsker L, Abramson A. The voicing dimension: Some experiments in comparative
phonetics // Proceedings of Sixth International Congress of Phonetic Sciences, Prague, 1967.
Prague: Academia, 1970.

602 Тема 18. Экспериментальные исследования мышления

ния в 10 мс испытуемые почти единодушно соглашаются с тем, что предъявляется звук [б]; при времени начала звучания в 40 мс испытуемые почти единодушно соглашаются с тем, что предъявляется звук [п]. Из-за этой четкой границы между звонкой и глухой фонемами восприятие этой особенности называется категорическим. Категорическое восприятие — это восприятие стимулов как принадлежащих к разным категориям и неспособность воспринимать градации между стимулами в пределах одной категории.

Другое доказательство категорического восприятия речи получено в исследованиях установления различий¹. Испытуемые очень плохо устанавливают различия между парой звуков [б] или парой звуков [п], которые отличаются по времени начала звучания. Но они хорошо различают пары, имеющие то же самое различие во времени начала звучания, но где один звук идентифицирован как [б], а другой — как [п]. По-видимому, испытуемые могут идентифицировать только фонематическую категорию звука и не способны делать акустическое различение в пределах этой фонематической категории. Таким образом, испытуемые способны различать между собой два звука, только если они находятся по разные стороны фонематической границы.

Существуют по крайней мере две точки зрения по вопросу о том, что именно имеется в виду под категорическим восприятием. Более слабая точка зрения состоит в том, что мы оцениваем стимулы как относящиеся к различным категориям. Кажется, нет сомнений в том, что восприятие фонем в этом смысле категорическое. Более сильная точка зрения состоит в том, что мы не можем устанавливать различие между стимулами в пределах одной категории. Массаро² выступил против этой точки зрения и доказал, что имеется некоторая резидуальная способность устанавливать различия в пределах категорий. Он также доказал, что плохое установление различий в пределах категории может отражать склонность испытуемых говорить, что стимулы в пределах категории одинаковы, даже когда имеются заметные различия.

Другое направление исследований, представляющих доказательства использования особенностей звучания в распознавании речи, включает в себя парадигму адаптации. Эймас и Корбит³ предлагали испытуемым слушать повторные предъявления звука [да]. Этот звук включает в себя звонкий согласный [д]. По мысли экспериментаторов, это постоянное повторение звонкого согласного могло бы утомить, или адаптировать, детектор

¹ См.: Studdert-Kennedy M. Speech perception // N.J. Lass (Ed..). Contemporary issues
in experimental phonetics. Springfield, IL: Charles C. Thomas, 1976.

² См.: Maasaro D.W. Broadening the domain of the fuzzy logical mode! of perception //
H.L. Pick, Jr.,P. Van den Broek, D.C. Knill (Eds.). Cognition: Conceptual and methodological
issues. Washington, DC: American Psychological Association, 1992. P. 51-84.

³ См.: Eimas P.D., Corbit J. Selective adaptation of linguistic feature detectors // Cognitive
Psychology. 1973. 4. P. 99-109.

Андерсон Д.Р. [Распознавание речи и понимание языка] 603

этой особенности, который отвечал на присутствие звучания. Затем они предъявили испытуемым последовательности искусственных звуков, которые располагались вдоль акустического континуума, — типа находящихся между [ба] и [па] (как в упоминавшемся выше исследовании Ликерта и Абрамсона). Испытуемые должны были указать, звучит ли каждый из этих искусственных стимулов скорее как звук [ба] или как звук [па]. (Вспомните, что единственная особенность, по которой различаются между собой звуки [ба] и [па], — это звучание.) Эймас и Корбит обнаружили, что некоторые из искусственных стимулов, которые испытуемые обычно называли звонким [ба], они теперь назвали глухим [па]. Таким образом, повторное предъявление звука [да] утомило детектор особенности «звонкий» и подняло порог для обнаружения звучания в [ба], приводя к тому, что для испытуемых многие прежние стимулы [ба] звучали как [па].

Люди склонны воспринимать фонемы как относящиеся к определенным категориям, даже когда они отличаются по одному непрерывному измерению.

Контекст и распознавание паттернов

До сих пор мы рассматривали распознавание паттерна так, как будто единственной информацией, доступной системе распознавания паттерна, была информация, содержащаяся в распознаваемом физическом стимуле. Но дело обстоит не так. Объекты существуют в контексте, и мы можем использовать эти контексты, чтобы облегчить распознавание объекта. Рассмотрим пример на рис. 3. Мы воспринимаем эти символы как THEи CATдаже при том, что символы, обозначающие А и Н, идентичны. Общий контекст, заданный словами, вынуждает давать соответствующую интерпретацию. Когда контекст или общее знание о мире направляет восприятие, мы называем это обработкой по принципу сверху— вниз, потому что общее знание высшего уровня влияет на интерпретацию перцептивных единиц низшего уровня. Общая проблема в восприятии касается того, как такие нисходящие влияния объединяются с информацией, идущей снизу—вверх от стимула.

Одно важное направление исследования нисходящих влияний берет начало от ряда экспериментов на идентификацию букв, проведенных Рейчером и Уилером². Испытуемым на очень краткий промежуток времени предъявляли букву (например, D) или слово (например, WORD).

¹См.: Reicher G. Perceptual recognition as a function of meaningfulness of stimulus
material // Journal of Experimental Psychology. 1969. 81. P. 275-280.

² См.: Wheeler D.D. Processes in word recognition // Cognitive Psychology. 1970. 1.
P. 59-86.

604

Тема 18. Экспериментальные исследования мышления

Сразу после этого им давали пару вариантов ответа и инструкцию сообщить, который вариант они видели. (Первоначальное предъявление было достаточно кратковременным, чтобы испытуемые делали много ошибок в этой задаче на идентификацию.) Если им показывали букву D, то могли дать в качестве альтернатив буквы D и К. Если им показывали слово WORD, то могли дать в качестве альтернатив слова WORDи WORK. Обратите внимание, что эти два слова отличаются только на одну букву — Dили К. Испытуемые были приблизительно на 10% более точны при предъявлении слов. Таким образом, они более точно устанавливали различие между буквами D и К в контексте слова, чем когда это были одиночные буквы, даже при том, что в некотором смысле в контексте слова они должны были обрабатывать в четыре раза больше букв. Это явление известно как эффект схватывания слова.

Румельхарт и Сипл¹ и Томпсон и Массаро² объяснили, почему испытуемые более точны, когда имеют дело со словом. Предположим, что испытуемые способны идентифицировать первые три буквы как WOR. Теперь рассмотрим, сколько слов с четырьмя буквами совместимы с началом WOR: WORD(слово), WORK(работа), WORM(червь), WORN(одеваться), WORT(трава). Предположим, что испытуемые обнаруживают только кривую линию в основании четвертой буквы. В контексте начала WORони знают, что стимул должен быть словом WORD. Но когда буква предъявляется одна и испытуемые обнаруживают кривую, они не будут знать, была ли это буква В, D, С, О или Q, так как в каждой из этих букв есть такая кривая. Таким образом, в контексте начала WORиспытуемые должны только обнаружить кривую, чтобы идентифицировать четвертую букву как D, но когда буква предъявляется одна, они должны обнаружить большее количество особенностей, чтобы быть способными однозначно идентифицировать букву. Обратите внимание, что этот анализ подразумевает, что восприятие — это процесс, в значительной степени основанный на выведении заключения. При этом испытуемый не видит, что Dлучше в контексте WOR; скорее, испытуемый приходит к выводу, что D — четвертая буква. Но испытуемый не осознает этих выводов; скорее, испытуемого просят делать неосознанные выводы в процессе восприятия. Обратите внимание,

¹ См.: Rumelhart D.E., Slple P. Process of recognizing taohistoscopically presented words
// Psychological Review. 1974. 81. P. 99-118.

² См.: Thompson M.C., Massaro D.W. Visual information and redundancy in reading //
Journal of Experimental Psychology. 1973. 98. P. 49-54.

Андерсон Д.Р. [Распознавание речи и понимание языка]

605

что испытуемый в этом примере не осознает тот факт, что кривая в основании буквы была обнаружена, иначе имелась бы возможность выбрать между Dи К. Скорее, испытуемый осознает только слово или букву, которую логически вывела перцептивная система,

Этот пример иллюстрирует избыточность многих сложных стимулов типа слов. Эти стимулы имеют намного больше особенностей, чем требуется, чтобы отличить один стимул от другого. Таким образом, восприятие может протекать успешно, когда распознаны лишь некоторые из особенностей, а информация об оставшихся особенностях получена из контекста. В языке эта избыточность существует на многих уровнях помимо уровня особенностей. Например, существует избыточность на уровне букв. Мы не должны воспринимать каждую букву в последовательности слов, чтобы прочитать ее. Длх илхюсхрахии хтохо я хогх захенхть хажхую хрехью хукху пхедхожхних на «х», х вы хем хе мехее хмохетх егх прхчихатх — хохя и хспхтыхая хекхтохые хатхудхенхя¹.

Контекст слова может быть использован для получения информации о дополнительных особенностях при распознавании букв.

Контекст и речь

Существуют такие же хорошие доказательства роли контекста в восприятии речи. Хорошей иллюстрацией является эффект восстановления фонемы, продемонстрированный в эксперименте, проведенном Уорреном². Он предлагал испытуемым прослушать предложение: Thestategovernorsmetwiththeirrespectivelegislaturesconveninginthecapitalcity(«Губернаторы встретились с законодательными органами свои штатов, собравшимися в столице»), — заменив на 120 же среднюю sв слове legislaturesна чистый тон. Но только один из двадцати испытуемых сообщил, что слышал чистый тон, и этот испытуемый не мог правильно определить его местонахождение.

Интересным продолжением этого первого исследования был эксперимент Уоррена и Уоррена³. Они предъявляли испытуемым предложения, подобные следующим:

It was found that the *eel was on the axle.

It was found that the *eel was on the shoe. It was found that the *eel was on the orange.

It was found that the *eel was on the table.

¹ См.: Lindsay P.H., Norman DA. Human information processing. N. Y.: Academic
Press, 1977. (Пример адаптирован.)

² См.: Warren R.M. Perceptual restorations of missing speech sounds // Science. 1970.
767. P. 392^393.

³ См.: Warren R.M., Warren R.P. Auditory illusions and confusions // Scientific American.
1970. 223. P. 30-36.

606 Тема 18. Экспериментальные исследования мышления

В каждом случае * обозначает фонему, замененную неречевым звуком. Для этих четырех предложений испытуемые сообщали, что слышали слова wheel, heel, peel и meal в зависимости от контекста¹. Важно отметить, что эти предложения идентичны вплоть до критического слова. Идентификация критического слова определена тем, что происходит после него. Таким образом, идентификация слов часто не происходит мгновенно, а может зависеть от восприятия последующих слов.

При распознавании речи контекстная информация может дополнять информацию об особенностях речи.

Контекст и распознавание лиц и картин

Пока наше обсуждение сосредоточивалось на роли контекста в восприятии напечатанного и выраженного словами материала. Когда мы обрабатываем другие сложные паттерны, такие как лица, очевидно, имеет место то же самое взаимодействие между особенностями стимула и контекстом, которое отмечается в случае с языковыми стимулами. Рассмотрим рис. 4, который взят из книги Палмера². Он указывает, что в контексте лица требуется очень немного информации об особенностях стимула для распознавания отдельных частей, таких как нос, глаз, ухо или губы. На-

Рис. 4. Лицевые особенности в контексте лица и вне его. В контексте лица необходима минимальная информация, но те же самые минимальные особенности нелегко распознать в ряду А. Нужно обеспечить более сложную внутреннюю структуру особенностей, чтобы сделать возможным распознавание, как в ряду Б

¹ С этими словами предложения переводятся на русский язык следующим образом:
«Было обнаружено, что колесо на оси», «Было обнаружено, что каблук на туфле», «Было
обнаружено, что кожица на апельсине», «Было обнаружено, что еда на столе». {Примеча
ниепереводчикаисточника.)

²См.: Palmer S.E. The effects of contextual scenes on the identification of objects /'/
Memory & Cognition. 1975. 3. P. 519-526.

Андерсон Д.Р. [Распознавание речи и понимание языка] 607

против, когда эти части представлены изолированно, требуется значительно больше деталей, чтобы сделать возможным их распознавание. <...>

Контекстная информация может использоваться, чтобы дополнять информацию об особенностях при распознавании лиц и картин. <...>

Понимание языка

Обсуждая вопрос понимания языка, мы рассмотрим понимание в процессе как слушания, так и чтения. Часто полагают, что процесс слушания является более фундаментальным. Но и при слушании, и при чтении задействованы многие общие факторы. Выбор материала исследования — письменного или устного — определяется с учетом удобства манипулирования им в ходе эксперимента. Это означает, что в большинстве случаев исследовался письменный материал.

Выделяют три стадии понимания. Первая стадия включает в себя процесс восприятия, с помощью которого первоначально кодируется акустическое или письменное сообщение. Вторая называется стадией синтаксического анализа. Синтаксический анализ — это процесс, при котором слова в сообщении преобразуются в ментальную репрезентацию совместного значения слов. Третья стадия — это стадия использования, в которой адресат фактически использует ментальную репрезентацию значения предложения. Если предложение является утвердительным, то слушатели просто сохраняют значение в памяти; если это вопросительное предложение, то они дают ответ; если это повеление, то они подчиняются. Но слушатели не всегда столь уступчивы. Они могут использовать утверждение о погоде, чтобы сделать вывод о личности собеседника, они также могут отвечать вопросом на вопрос или же делать диаметрально противоположное тому, о чем просит собеседник. Эти три стадии — восприятие, синтаксический анализ и использование — следуют друг за другом при необходимости; но они могут и частично накладываться друг на друга. В то время как слушатели воспринимают вторую часть предложения, они уже делают вывод о первой его части. <...>

Синтаксический анализ Компонентная структура

Структура языка определяется набором правил, которые позволяют перейти от отдельного ряда слов к интерпретации значения этого ряда. Например, в английском языке мы знаем, что, если мы слышим последовательность «существительное — действие — существительное», говоря-

608 Тема 18. Экспериментальные исследования мышления

щии имеет в виду, что инстанция первого существительного выполнила действие над инстанцией второго существительного. И наоборот, если предложение имеет последовательность «на существительное подействовало существительное», говорящий имеет в виду, что инстанция второго существительного выполнила действие над инстанцией первого существительного. Таким образом, знание синтаксической структуры английского языка позволяет нам видеть различие между предложениями: «Врач застрелил адвоката» и «Врач был застрелен адвокатом».

Обучаясь понимать язык, человек усваивает множество правил, которые кодируют различные лингвистические паттерны в языке и соотносят эти паттерны с интерпретацией значений. Но невозможно выучить правила для каждого паттерна предложения, так как предложения бывают длинными и сложными. Потребовалось бы значительное (вероятно, бесконечное) число паттернов, чтобы закодировать все возможные формы предложения. Хотя мы еще не научились интерпретировать все возможные паттерны целого предложения, но мы уже можем интерпретировать субпаттерны, т.е. словосочетания в этих предложениях, и объединять, или связывать, интерпретации этих субпаттернов. Эти субпаттерны соответствуют основным фразам, или модулям, в структуре предложения. Эти фразовые модули иначе называются компонентами. [Ранее] мы обсуждали данные, подтверждающие психологическую реальность структуры фразы при генерировании языка. Ниже мы рассмотрим несколько свидетельств психологической реальности использования компонентной структуры при понимании.

Казалось бы, чем более опознаваема компонентная структура предложения, тем легче данное предложение для понимания. Граф и Торри¹предъявляли испытуемым предложения, разбив их на отдельные строки. Эти отрывки могли быть представлены как в форме А, в которой каждая линия соответствует границе основного компонента, так и в форме Б, в которой применена другая последовательность. Ниже приведены примеры двух типов отрывков.

Испытуемые лучше понимали отрывки из формы А. Это указывает на то, что выявление компонентной структуры важно для синтаксического анализа предложения.

Форма А Форма Б

В течение Второй мировой войны даже В течение Второй мировой войны даже

фантастические схемы принимались во фантастические схемы принимались во

внимание если казалось, что они помогут внимание, если казалось, что они

в прекращении конфликта. помогут в прекращении конфликта.

¹ См.: Graf P., Torrey J.W. Perception of phrase structure in written language // American Psychological Association Convention Proceedings. 1966. P. 83-88.

Андерсон Д.Р. [Распознавание речи и понимание языка] 609

Рис. 5. Время пословного чтения предложения. Черточки на графике обозначают границы между фразовыми структурами¹

Когда люди читают подобные отрывки, они машинально делают паузу на границах между смысловыми группами. Ааронсон и Скарборо²предложили испытуемым прочитать слово за словом предложение, показанное на экране компьютера. Когда испытуемые хотели прочитать новое слово, они должны были нажать клавишу. На рис. 5 показан паттерн времени чтения предложения с целью последующего воспроизведения. Обратите внимание на V-образные паттерны с длительными паузами на границах фраз. По-видимому, после прочтения каждой главной фразы участникам требуется время, чтобы обработать информацию.

Когда человек обработал компонент или фразу, уже нет необходимости ссылаться на конкретные слова в данном компоненте. Это связано с тем, что такие компоненты являются естественными смысловыми единицами, а интерпретация слов может завершиться ближе к границе компонента. Таким образом, мы можем прогнозировать, что испытуемые будут хуже запоминать точную словесную форму выражения компонента после завершения синтаксического анализа одного компонента и начала анализа другого. Эксперимент Джарвеллы³ подтверждает это предположение. Он читал участникам отрывки, которые прерывал в разных местах. В паузах испытуемых просили записать прочитанный отрывок как можно полнее. Интерес представляли отрывки, заканчивавшиеся предложениями, в составе которых было 13 слов. Вот пример такого предложения.

¹ См.: Aaronson D., Scarborough H.S. Performance theories for sentence coding: Some
quantitative models // Journal of Verbal Learning and Verbal Behavior. 1977. 16. P. 277-
304.

² См.: Aaronson D., Scarborough H.S. Performance theories for sentence coding: Some quan
titative models // Journal of Verbal Learning and Verbal Behavior. 1977. 16. P. 277-304.

³ См.: Jarvella R.J. Syntactic processing of connected speech // Journal of Verbal Learning
and Verbal Behavior. 1971. 10. P. 409-416.

39 3iiK. 1949

610 Тема 18. Экспериментальные исследования мышления

12 3 4 5 6

Having failed to disprove the charges,

? 8 9 10 11 12 13

Taylor was later fired by the president.

(Поскольку Тейлор не смог опровергнуть обвинений, позднее он был уволен президентом.)

Сразу после завершения чтения участникам напоминали первое слово предложения и просили восстановить остальные слова. Каждое предложение состояло из придаточного предложения из 6 слов, за которым следовало главное предложение из 7 слов. На рис. 6 показан график вероятности вспоминания каждого из 12 слов в предложении (исключая первое слово, которое использовалось как подсказка). Обратите внимание на резкий подъем функции на 7 слове, т.е. в начале главного предложения. Эти данные указывают на то, что испытуемые лучше помнят последний главный компонент, и этот результат подтверждает гипотезу о том, что испытуемые дословно запоминают только последний главный компонент.

¹ Адаптировано из: Jarvella R.J. Syntactic processing of connected speech // Journal of Verbal Learning and Verbal Behavior. 1971. 10. P. 409-416.

Андерсон Д.Р. [Распознавание речи и понимание языка]

611

В эксперименте Каплана¹ также получены доказательства использования компонентной структуры, но в этом исследовании использовался метод, основанный на измерении времени реакции. Испытуемым сначала устно предъявляли предложения, а затем — тестовое слово; после этого их просили как можно быстрее определить, присутствовало ли тестовое слово в предложении. Каплан сравнивал пары предложений, подобные следующей.

Now that artists are working fewer hours oil prints are rare. (Теперь, когда художники работают меньшее время, масляные оттиски становятся раритетом.)
Now that artists are workingin oilprints are rare. (Теперь, когда художники работают маслом, оттиски становятся раритетом.)

Интерес исследователей был сосредоточен на том, чтобы узнать, насколько быстро участники опознают слово oil, когда оно стоит в конце каждого из двух предложений. Предложения были составлены так, чтобы в них обоих слово oilбыло четвертым с конца, а за ним следовали одни и те же слова. На самом деле путем монтажа пленки Каплан предъявлял стимул так, чтобы участники слышали ту же самую запись этих последних четырех слов, каким бы ни было все предложение. Но в предложении 1 слово oilявляется элементом последнего компонента — oilprintsarerare, — тогда как в предложении 2 это слово принадлежит первому компоненту — nowthatartistsareworkinginoil. Каплан предположил, что участники быстрее опознают слово oilв предложении 1, потому что в их памяти все еще активна репрезентация этого компонента. Как он и предполагал, тестовое слово опознается быстрее, если оно находится в последнем компоненте. Испытуемые обрабатывают значение предложения по одной фразе и сохраняют доступ к фразе только во время обработки ее значения.

1 ... 45 46 47 48 49 50 51 52 53