А. П. Журавлев. О чем эта книжка
Скачать 1.05 Mb.
|
Компьютер на первых порах осваивал язык довольно успешно. Ведь ему ничего не стоит запомнить всю лексику, все правила грамматики. Он очень быстро научился писать (хоть на экране, хоть на бумаге), а сейчас учится все лучше говорить. Один из первых отечественных синтезаторов речи начал свой монолог с приветствия: «Здравствуй, человек!» Эта обычная, казалось бы, фраза в данной ситуации глубоко символична: впервые машина 141 обратилась к человеку с помощью речи, впервые она поприветствовала его как друга, впервые пожелала ему добра и здоровья! Так что же, выходит, компьютер уже владеет русским языком? К сожалению, нет. Когда ваш знакомый говорит вам «здравствуйте!», вам и в голову не приходит задуматься над тем, понимает ли он, что говорит. Само собой разумеется, что понимает. А вот с компьютером все обстоит совсем по-другому. В том-то и заключается сложность обучения компьютера, что машина не понимает ни того, что говорит, ни того, что пишет, ни того, что говорят и пишут ей. Более того, компьютер, сколь бы совершенным он ни стал, никогда не будет мыслить в нашем, человеческом понимании итого слова, никогда не будет понимать язык так, как это дано человеку. Он сможет лишь «делать вид», что понимает, лишь имитировать понимание. Дело в том, что человеческое мышление -— это порождение наших целей, стремлений, желаний, проявление нашей духовной жизни. Чтобы машина мыслила так же, как человек, она должна иметь такое же тело, такую же кровь, те же стремления и желания, те же возможности и ограничения, ту же физическую и духовную организацию. Иначе говоря, она должна быть просто-напросто... человеком. Но имитировать какие-то аспекты мышления компьютер вполне способен, и этого достаточно, чтобы стать могучим информационным помощником человека. Может компьютер имитировать и понимание языка. Только для этого недостаточно владеть фонетикой, морфологией и синтаксисом. Главное — оперировать с языковым значением, т. е. имитировать владение языковой семантикой. Но даже такая задача оказалась чрезвычайно сложной, и на ее решении заметно притормозилось сейчас стремительное и триумфальное развитие кибернетики. Фразу «Здравствуй, человек!» компьютер не сам придумал и не сам изъявил желание ее сказать. Ему эту фразу напечатали на клавиатуре создатели синтезатора речи, машина только прочла ее вслух. Но в принципе можно заложить в компьютер программу, по которой он, услышав от вас (или прочитав) слово здравствуйте, как бы «сам» поздоровается с вами. Это будет уже имитация понимания вашей речи. А если вы скажете ему не «Здравствуйте!», а «Привет!» или «Доброе утро!»? Чтобы он вас «понял», нужно в его память ввести все эти формы приветствия, и не только эти. Мы можем поприветствовать другого человека самыми разными словами и выражениями: Здравствуйте! Здравствуй! Здорово! Привет! Приветствую! Приветик! Доброе утро! Добрый день! 142 Добрый вечер! Я вас приветствую! Мой вам привет! Разрешите вас поприветствовать! Позвольте с вами поздороваться! Рад вас приветствовать! Рад с вами поздороваться! Здравия желаю! И еще многими другими способами. Ну хорошо. Помучились мы немного, внесли в память все мыслимые формы приветствия. Все? Ничего подобного. Как быть, если приветствие сопровождается и другими словами? Скажем, «Привет, дорогой!» или «Здорово, железяка!». Дать указание компьютеру, чтобы он реагировал только на известные ему слова приветствия, а других слов просто бы «не замечал»? Но тогда могут возникнуть самые разные непредвиденные казусы. Допустим, в какой-то ситуации вы говорите компьютеру: — После приветствия здравствуйте нужно ставить восклицательный знак. А компьютер отвечает вам на это: — Привет! Да и во многих других случаях компьютер не сможет даже поздороваться разумно. Если, к примеру, поздним вечером нашему компьютеру, умеющему здороваться, сказать Доброе утро!, он не заподозрит подвоха и бесстрастно поприветствует вас в ответ. А человек? Представьте себе, скажем, такую (разумеется, совершенно невероятную) ситуацию: вечером на уроке ученик заснул. Учитель громко произносит его фамилию, он просыпается, и учитель говорит ему: — Доброе утро! Ответ «Доброе утро!» или «Здравствуйте!» будет здесь не только совершенно неуместен, но даже дерзок. Корректным был бы ответ «Извините!» или «Прошу прощения!». Конечно, можно обучить компьютер по часам определять, когда утро, когда вечер. Но такие семантические задачи придется решать почти с каждой другой формой приветствия. Какое множество разнообразных значений можно вложить хотя бы в форму «Приветик!». Можно, в конце концов, и вовсе не здороваться с компьютером, это в общем-то ни к чему. Но ведь это простейшая, стандартная речевая ситуация. И если даже в ней компьютер в языковом отношении оказывается не на высоте, то что же говорить о дальнейшем течении диалога! Нет, пример с приветствиями показывает, что прямое, «лобовое» решение проблемы «осмысленного» речевого общения с компьютером не получается. Нельзя заранее дать компьютеру готовые речевые подсказки на все случаи жизни, нужно основательно обучать его языковой семантике. 143 СЕМАНТИЧЕСКОЕ ЯДРО И СЕМАНТИЧЕСКИЕ ОРЕОЛЫ Вспомним рисунок на с. 28. На нем видно, что центральной, основной, наиболее важной частью значения слова является понятийное ядро. Оно окружено ореолами качественно-признаковой и фонетической семантики. Только вместе, в единстве все эти аспекты составляют полноценное значение слова. Заметьте, что существенной частью понятийного ядра на рисунке является штриховка, идущая от ореолов. Уберите штриховку, которой обозначен фоносеманти-ческий ореол,— и оставшиеся аспекты значения обеднеют, их штриховка станет реже. Если же убрать также и штриховку качественно-признакового ореола, то оставшееся понятийное ядро станет совсем бледным. Конечно, понятийное ядро — главная часть значения, но все же только часть. И хотя компьютеру особенно важно освоить именно понятия, нельзя забывать и о других сторонах значений слов. Понятийное ядро—самая определенная, явная, осознаваемая всеми говорящими часть значения слова. Понятийные значения слов достаточно полно и подробно описаны в толковых словарях. Казалось бы, ничего не стоит «объяснить» их компьютеру. Действительно, нетрудно заложить в память компьютера словарное определение: Дом — здание, строение, предназначенное для жилья, для размещения различных учреждений и предприятий. Теперь по простенькой программе компьютер на вопрос Что такое дом? скажет: — Дом — это здание, строение, предназначенное ... и т. д. Конечно, если бы таким образом занести в память компьютера весь (скажем, 17-томный) толковый словарь русского языка, то это было бы очень хорошо. Чтобы отыскать слово в большом словаре, нужно в нем порыться, а компьютер выполнит эту задачу моментально. Можно снабдить слова переводами на другие языки, и тогда какое было бы облегчение переводчикам и всем, кто изучает иностранные языки! Набрал слово на клавиатуре — тут же его перевод, да еще и с любыми необходимыми пояснениями, примерами и т. п. Но пытаться говорить с такой программой — все равно что беседовать со словарем. Никакой беседы, кроме словарных определений, не получится. Можно сказать, что такой способ описания понятийных значений обеспечивает компьютеру имитацию знания их, но не обеспечивает владения ими. У человека знание слова и владение им, по сути дела, одно и то же, поскольку человек понимает значение слов. Для компьютера это, оказывается, разные вещи: он может «знать» значение слов, но не знать, как их употреблять в речи, т. е. не уметь оперировать ими. Причем речь здесь не о правилах грамматики, не о том, как правильно соединить слова в предложении (этому компьютер можно научить), а о том, как построить осмысленное предложение, как словами выразить мысль. 144 Только способен ли справиться с такой задачей компьютер, если мыслей-то у него и нет? Вот в чем дело! Понятия — это то, что понято, осмыслено, а как раз понять, осмыслить что-либо компьютер не в состоянии. Потому и не поддается компьютеризации такой как будто бы простой, очевидный аспект значения слова. Работа в этом направлении идет, но в основном она все еще никак не выйдет за словарные рамки. Компьютер производит различные операции со словарными материалами, но выйти со своим огромным словарным запасом в живую речь никак не может. Ну что ж, с понятийными ядрами дела у компьютера пока не очень ладятся. А может, и неспроста? Может, не с того компьютер начал? Ведь чтобы добраться до ядра ореха, нужно сначала разгрызть скорлупу. Так не заняться ли сначала семантическими ореолами? Возможно, это и будет путь к семантическому ядру. Очень и очень существенную роль в действующей, функционирующей языковой семантике играет качественно-признаковый ореол. Ведь когда мы говорим, то для нас и для слушающих зачастую важны не только и не столько понятия, сколько оценки, суждения, которые характеризуют наши представления о понятиях, передают наше отношение к ним. Например, когда мы говорим силач, то мы подчеркиваем, что это нечто сильное, а конкретно это может быть и человек, и трактор, и' кран. В нашей речи гора — это не только «значительная возвышенность» (как определяет словарь понятийное ядро этого слова), это что-то вообще большое (отсюда выражение гора фактов), что-то тяжелое (поэтому говорят гора с плеч), что-то неподвижное (отсюда выражение гора с горой не сходятся), что-то трудное для преодоления (умный в гору не пойдет) и т. д. А каково различие между словами борьба и драка? Толковый словарь так определяет их понятийные ядра: БОРЬБА (1-е значение) — рукопашная схватка двоих, в которой каждый старается осилить другого. ДРАКА — ссора, стычка, сопровождаемая взаимными побоями. Если ориентироваться только на эти определения, то различия этих слов кажутся незначительными. В конце концов, драка тоже «рукопашная схватка, в которой каждый старается осилить другого». Но ведь мы никогда не допустим в речи замены этих слов одно на другое, например, в выражениях борьба за мир и они затеяли безобразную драку. Мы чувствуем, что, кроме понятийных значений, здесь есть что-то еще. Для нас борьба — нечто возвышенное, благородное, а драка — низменное, отвратительное. Иначе говоря, у этих слов при сходстве понятийных ядер резко различные качественно-признаковые ореолы. Или такой пример: разведчик и шпион. Вполне может оказаться, что это один и тот же человек, все дело в том, кто его называет — «свои» или «чужие». Понятийно это «агент разведки», 145 но если он свой, то разведчик, тогда он «хороший, смелый», а если чужой — то «плохой и зловредный» шпион. Ну хорошо, разведчика от шпиона компьютер отличит, но что это нам дает для содержательной беседы с машиной? Оказывается, кое-что любопытное намечается. Допустим, в памяти компьютера есть такой словарь качественно-признаковых значений: Компьютеру задана такая программа: Башня — большая, высокая, тяжелая, неподвижная. Весельчак — хороший, веселый. Заяц — быстрый. Лягушка — маленькая, слабая. Мячик - маленький, легкий, подвижный. Пенек — низкий. Преступник — плохой, опасный. Трактор — большой, сильный, тяжелый. Черепаха — медленная. действия можно нельзя дружить хорошее плохое прыгнуть низкое высокое поднять легкое тяжелое догнать медленное быстрое справиться слабое сильное сдвинуть легкое, подвижное тяжелое, неподвижное Теперь поговорим с компьютером. Мы спрашиваем: — Можно ли дружить с преступником? Компьютер по своей программе находит действие «дружить» и обнаруживает, что можно дружить с чем-то хорошим и нельзя — с чем-то плохим. Он нам так и отвечает: — Нет, нельзя. — Почему? — допытываемся мы. — Потому что он плохой и опасный. — Ас весельчаком? — С весельчаком можно, он хороший и веселый. Что же, совет компьютера вполне разумен. Продолжим беседу: — Можно ли догнать зайца? — Не стоит пытаться, он быстрый. — А черепаху? — Не составляет труда. Точно так же компьютер объяснит нам, что мы легко можем поднять мячик и не можем — тяжелый трактор, нам не стоит прыгать с башни, поскольку она высокая, а вот с пенька — пожалуйста, это не опасно. На том же материале можно построить программу, по которой компьютер будет сравнивать предметы и явления и легко установит, 146 что весельчак лучше преступника, заяц быстрее черепахи, а трактор сильнее лягушки. Как видим, компьютер, не зная понятийных значений слов, не имея ни малейшего представления о том, что такое башня, мячик и заяц, беседует о них так, как будто он понимает, о чем идет речь. Иначе говоря, он неплохо имитирует именно владение семантикой слов, что нам и нужно. Конечно, наш пример показывает сам принцип работы компьютера с качественным ореолом значения. А если вдаваться в детали беседы с компьютером, то здесь все не так-то просто. Вот компьютер считает, что с весельчаком дружить можно, потому что он хороший и веселый. Но ведь хорошим и веселым может быть и что-то другое, например карнавал. Тогда совет машины дружить с карнавалом выглядит странновато. Или не дружить с ужасом, поскольку он плохой и опасный. Такой семантический конфуз машины в данном случае возник из-за того, что мы дали ей возможность опираться лишь на один аспект значения слова — качественный. Подключение сюда еще и понятийного ядра сразу же заметно повысит «сообразительность» компьютера. В простейшем варианте для этого можно задавать словарь машине не списком, как мы только что сделали, а разбив его на понятийные группы. Например, образовать группы «человек», «явления», «состояния» и т. п. Например: «Человек» Весельчак — хороший, веселый. Преступник — плохой, опасный. «Явления» Карнавал — хороший, веселый. Лето — хорошее, приятное. Радуга — хорошая, красивая. «Состояния» Радость — хорошая, веселая. Ужас — плохой, опасный. В компьютерной программе нужно закрепить глагол дружить только за группой «человек», а к другим группам подобрать иные подходящие слова: дружить («человек») нравится («человек», «явления») приятно («состояния») можно нравится приятно нельзя не нравится неприятно хорошее плохое Теперь на вопрос: — Можно ли дружить с карнавалом? — компьютер ответит: — Дружить можно с человеком, а карнавал может нравиться, потому что он хороший и веселый. 147 С такой программой компьютер способен и на более тонкие языковые реакции. Если вы его спросите: — Нравится ли вам ужас?—то он вполне резонно ответит: — Лучше сказать, что ужас мне неприятен. Разговор, как видим, уже гораздо больше похож на беседу с человеком. Как и следовало ожидать, чем большее число аспектов семантики охватывает компьютерная программа, тем эффективнее компьютер оперирует с языковым значением, тем лучше он имитирует понимание человеческой речи и владение ею. А ПРИ ЧЕМ ЖЕ ЗДЕСЬ ФОНОСЕМАНТИКА? Вопрос резонный, потому что в этой главе автор как будто отклонился от основной темы книги. Но на самом деле это не так. Напротив, автор старается расширить узкую проблематику, ввести ее в круг общих идей и проблем, показав ее место и роль в целостной семантической системе языка и особенно в сфере практического использования семантических теорий, что было бы невозможно сделать без тех предварительных (очень беглых) пояснений, которые даны в предыдущих разделах главы. Теперь нам уже ясно: для того чтобы лучше обучить машину языку человека, нужно помочь ей в освоении всего сложного спектра семантики. И фоносемантика здесь тоже пригодится. Хотя это и далеко не главный семантический аспект, все же он тоже играет в семантической системе языка важную роль, и без его учета компьютер упустит какие-то семантические тонкости, которые могут иногда оказать существенное влияние на формирование общей семантики слова, высказывания и даже целого текста. И наоборот, владение еще и этим ореолом значения усилит имитационный эффект компьютерной речи, приблизит ее к человеческой. Чисто техническая выгода еще и в том, что для обучения компьютера фоносемантике не потребуется особых трудов: две таблицы да несколько формул — вот и вся премудрость. Освоить такую информацию компьютеру ничего не стоит, зато посмотрите, каких результатов мы добиваемся столь малыми усилиями. Как мы помним, фоносемантика — ореол подсознательный, почти не осознаваемый людьми. Они оперируют нм интуитивно, подсознательно. Значит, обучая компьютер фоносемантике, мы как бы конструируем какой-то аспект языкового подсознания, языковой интуиции компьютера! Машина, наделенная такой фоносемантической интуицией, могла бы оказывать помощь человеку везде, где его работа связана с задачами усилить языковое воздействие на читателя, слушателя. Она могла бы выступать консультантом при сравнении, отборе, придумывании самых разнообразных имен, названий, наименований. Пригодились бы ее расчеты и для специалистов в области рекламы, для переводчиков. 148 Но все же опора только на одну фоносемантику не дает особенно важных и интересных приложений теории. Лишь включение фоносемантики в единую семантическую систему языка раскрывает возможности этого ореола. И неудивительно: в книге несколько раз подчеркивалось, что разделение ореолов — искусственный прием, годный лишь для их описания, в живом языке все аспекты значения функционируют в неразрывном единстве, даже в сплаве, где трудно, а порой и невозможно отделить один компонент от другого. Компьютер и здесь должен быть имитатором — оперировать всеми аспектами семантики в их единстве. На первых порах он не сможет этого сделать без помощи человека. Поэтому придется конструировать не чисто машинную, а человеко-компьютерную систему переработки языковой семантики. Какие-то фрагменты этой системы уже существуют, компьютер их уже освоил и вполне успешно сотрудничает с человеком, оперируя языковой семантикой. Например, компьютер способен «сортировать» понятийные определения слов, предложенные человеком, находить в них общее и различное, соединяя слова в семантические группы. Иначе говоря, машина как бы выполняет те операции, которыми мы только что занимались, выделяя понятийные группы слов типа «человек», «явление» и т. д. |