Звегинцев В.А. - Очерки по общему языкознанию. Очерки по общему языкознанию
Скачать 0.87 Mb.
|
МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА?В течение последнего столетия языкознание всегда приводилось как пример науки, развивавшейся стремительно и очень быстро достигшей методической зрелости. Уже в середине прошлого столетия молодая наука уверенно заняла место в кругу наук, обладавших тысячелетней традицией, а один из виднейших ее представителей — А. Шлейхер — имел смелость полагать, что своими трудами он подводит уже итоговую линию.<113> История лингвистики, однако, показала, что такое мнение было слишком поспешно и неоправданно. В конце века языкознание претерпело первое большое потрясение, связанное с критикой младограмматических принципов, за которым последовали и другие. Следует при этом отметить, что все кризисы, которые мы можем вскрыть в истории науки о языке, как правило, не расшатывали ее основ, но, наоборот, способствовали укреплению и в конечном счете приносили с собой уточнение и усовершенствование методов лингвистического исследования, расширяя вместе с тем и научную проблематику. Но рядом с языкознанием жили и развивались также и другие науки, в том числе и большое количество новых. Особенно бурное развитие в наше время получили физические, химические и технические (так называемые «точные») науки, а над всеми ними воцарилась их теоретическая основа — математика. Точные науки не только сильно потеснили все гуманитарные науки, но в настоящее время стремятся «привести их в свою веру», подчинить своим обычаям, навязать им свои исследовательские методы. При создавшемся положении, используя японское выражение, можно сказать, что ныне языковеды-филологи оскверняют собой самый краешек циновки, где торжествующе и привольно расположились точные науки во главе с математикой. Не целесообразнее ли с точки зрения общенаучных интересов капитулировать перед математикой, целиком отдаться во власть ее методов, к чему уже откровенно призывают некоторые голоса59, и тем самым, быть может, обрести новую силу? Чтобы ответить на эти вопросы, надо сначала посмотреть, на что претендует математика в данном случае, в какой области лингвистики находят свое применение математические методы, в какой мере они согласуются со спецификой языкового материала и способны ли они дать или даже только подсказать ответы на те вопросы, которые ставит перед собой наука о языке. С самого начала следует отметить, что и среди энтузиастов нового, математического направления в лингви<114>стических исследованиях нет единства мнений относительно его целей и задач. Акад. А. А. Марков, первым применивший математические методы к языку, Болдрини, Юл, Мариотти рассматривают языковые элементы как подходящий иллюстративный материал для построения квантитативных методов, или для статистических теорем, совершенно не задаваясь вопросом, представляют ли интерес результаты такого исследования для лингвистов60. Росс полагает, что теория вероятностей и математическая статистика представляют инструмент или, как ныне предпочитают говорить, математическую модель для проверки и подтверждения тех лингвистических выводов, которые допускают числовую трактовку. Тем самым математические методы мыслятся лишь как вспомогательные средства лингвистического исследования61. На гораздо большее претендует Хердан, который в своей книге не только подытожил и систематизировал все попытки математического изучения языковых проблем, но и попытался дать им четкую ориентацию в отношении дальнейшей работы. Изложение всего материала своей книги он ориентирует на «понимание литературной статистики (так он называет изучение текстов методами математической статистики. — В. 3.) как неотъемлемой части лингвистики»62, а сущность и задачи этого нового раздела в языкознании формулирует в следующих словах: «Литературная статистика в качестве квантитативной философии языка применима ко всем отраслям лингвистики. По нашему мнению, литературная статистика есть структуральная лингвистика, поднятая на уровень квантитативной науки или же квантитативной философии. Таким образом, одинаково неправильно определять ее результаты как не относящиеся к области<115> лингвистики или же трактовать ее как вспомогательное средство для исследования»63. Едва ли целесообразно вдаваться в теоретизирования относительно того, правомерно ли в данном случае говорить о возникновении новой отрасли лингвистики и решать вопрос о ее претензиях, не обратившись сначала к рассмотрению уже фактически сделанного в этой области, и к выяснению того, в каком направлении идет применение новых методов64. Это поможет нам разобраться и в разноголосице мнений. Применение математического (или, точнее говоря, статистического) критерия для решения лингвистических вопросов является отнюдь не новым для науки о языке и в той или иной мере уже давно используется языковедами. Ведь, по сути говоря, такие традиционные понятия лингвистики, как фонетический закон (и связан<116>ное с ним — исключение из закона), продуктивность грамматических элементов (например, словообразовательных суффиксов) или даже критерии родственных отношений между языками в известной степени строятся на относительных статистических признаках. Ведь чем резче и отчетливее статистическое противопоставление наблюдаемых случаев, тем больше у нас оснований говорить о продуктивных и непродуктивных суффиксах, о фонетическом законе и исключениях из него, о наличии или отсутствии родственных отношений между языками. Но если в подобных случаях статистический принцип использовался более или менее стихийно, то в дальнейшем он стал применяться сознательно и уже с определенной целеустановкой. Так, в наше время большое распространение получили так называемые частотные словари лексики и выражений отдельных языков65 или даже значений разноязычных слов с «общей направленностью на действительность»66. Данные этих словарей используются для составления учебников иностранных языков (тексты которых строятся на наиболее употребительной лексике) и словарей-минимумов. Специально лингвистическое использование статистические исчисления нашли в методе лексикостатистики или глоттохронологии М. Сводеша, где на основе статистических формул, учитывающих случаи исчезновения из языков слов основного фонда, оказывается возможным установить абсолютную хронологию расчленения языковых семейств67. В последние годы случаи применения математических методов к языковому материалу значительно умножились и в массе подобного рода попыток наметились более или менее определенные направления. Обратимся <117> к последовательному их рассмотрению, не вдаваясь в детали. Начнем с того направления, которому присвоено наименование стилостатистики. Речь в данном случае идет об определении и характеристике стилистических особенностей отдельных произведений или авторов через посредство количественных отношений используемых языковых элементов. В основе статистического подхода к исследованию стилистических явлений лежит понимание литературного стиля как индивидуального способа владения средствами языка. При этом исследователь совершенно отвлекается от вопроса о качественной значимости исчисляемых языковых элементов, сосредоточивая все свое внимание только на количественной стороне; смысловая сторона исследуемых языковых единиц, их эмоционально-экспрессивная нагрузка, так же как и их удельный вес в ткани художественного произведения — все это остается вне учета, относится к так называемым избыточным явлениям. Таким образом, художественное произведение выступает в виде механической совокупности, специфика построения которого находит свое выражение лишь через числовые отношения ее элементов. На все отмеченные обстоятельства представители стилостатистики не закрывают глаза, противопоставляя методам традиционной стилистики, несомненно включающим элементы субъективности, одно единственное качество математического метода, которое, по их мнению, окупает все его недостатки — объективность достигнутых результатов. «Мы стремимся, — пишет, например, В. Фукс,—...охарактеризовать стиль языкового выражения математическими средствами. Для этой цели должны быть созданы методы, результаты которых должны обладать объективностью в такой же мере, как и результаты точных наук... Это предполагает, что мы, во всяком случае первоначально, будем заниматься только формальными структурными качествами, а не смысловым содержанием языковых выражений. Таким образом мы получим систему порядковых отношений, которая в своей совокупности представит собой основу и исходный пункт математической теории стиля»68. <118> Простейшим видом статистического подхода к изучению языка писателей или отдельных произведений является подсчет употребляемых слов, так как богатство словаря, видимо, должно определенным образом характеризовать и самого автора. Однако результаты подобных подсчетов дают несколько неожиданные в этом плане результаты и никак не способствуют эстетическому познанию и оценке литературного произведения, что не в последнюю очередь входит в число задач стилистики. Вот некоторые данные относительно общего количества слов, употребляемых в ряде произведений: Библия (латинская) . . . . . . . . . . 5649 слов Библия (древнееврейская) . . . . 5642 слова Демосфен (речи) . . . . . . . . . . . . 4972 слова Саллюстий . . . . . . . . . . . . . . . . . 3394 слова Гораций . . . . . . . . . . . . . . . . . . . .6084 слова Данте (Божественная комедия) 5860 слов (сюда входит 1615 имен собственных и географич. названий) Тассо (Неистовый Орланд) . . . . 8474 слова Милтон . . . . . . . . . . . . . . . . . . . . .8000 слов (прибл. дан.) Шекспир . . . . . . . . . . . . . . . . . . .15000 слов (приблизительно, по другим данным 20 000 слов) О. Есперсен указывает, что словарь Золя, Киплинга и Джека Лондона значительно превышает словарь Милтона, т. е. число в 800069. Подсчет словаря речей президента США В. Вилсона установил, что он богаче, чем у Шекспира. К этому следует добавить данные психологов. Так, Терман на основе наблюдений над большим количеством случаев установил, что словарь среднего ребенка составляет около 3600 слов, а в 14 лет — уже 9000. Средний взрослый употребляет 11700 слов, а человек «повышенной интеллигентности» до 1350070. Таким образом, подобные числовые данные сами по себе не дают никаких оснований для выявления стилистических качеств произведений и только «объективно» кон<119>статируют употребление разного количества слов разными авторами, что, как показывают приведенные подсчеты, не связано с относительной художественной ценностью их произведений. Несколько по-иному строятся подсчеты относительной частоты употребления слов у отдельных авторов. В этом случае учитывается не только общая сумма слов, но и частота употребления отдельных слов. Статистическая обработка полученного таким образом материала заключается в том, что слова с равной частотой употребления группируются по классам (или рангам), что приводит к установлению частотной дистрибуции всех употребляемых данным автором слов. Частным случаем такого рода подсчетов является определение относительной частотности специальных слов (например, романской лексики в произведениях Чосера, как это было сделано Мерсандом71). Относительная частотность употребляемых авторами слов содержит такие же объективные сведения о стиле отдельных авторов, как и вышеприведенные суммарные подсчеты, с той только разницей, что в результате получаются более точные числовые данные. Но она используется и для датировки отдельных произведений одного и того же автора на основе предварительно произведенного подсчета относительной частоты употребления им слов в разные периоды его жизни (по датированным самим автором произведениям). Другим видом использования данных подобных подсчетов является установление подлинности авторства произведений, относительно которых этот вопрос представляется сомнительным72. В этом последнем случае все строится на сравнении статистических формул частоты употребления в подлинных и спорных произведениях. Нет надобности говорить об очень большой относительности и приблизительности результатов, полученных такими методами. Ведь относительная частота употребления меняется не только с возрастом автора, но и в зависимости от жанра, сюжета, а также и исторической среды действия произведения (ср., например, «Хлеб» и «Петр I» А. Толстого). <120> Углубляя вышеописанный метод, стилостатистика в качестве стилевой характеристики стала прибегать к критерию стабильности относительной частоты наиболее употребительных слов. Применяемый в данном случае метод можно проиллюстрировать статистической обработкой рассказа Пушкина «Капитанская дочка», произведенной Есселсоном и Эпштейном в Институте славянских языков при Детройтском университете (США)73. Обследованию был подвергнут весь текст рассказа (около 30000 случаев употребления слов), а затем отрывки, содержащие около 10000 и 5000 случаев употребления. Далее, с целью определения стабильности относительной частоты употребления слов, у 102 наиболее употребительных слов (с частотой от 1160 раз до 35) было произведено сравнение расчетной относительной частоты (сделанной на основе выборочных отрывков) с действительной. Например, союз «и» во всем рассказе употреблялся 1 160 раз. В отрывке, содержащем 5 000 случаев употреблений всех слов, следует ожидать, что этот союз будет использоваться 5 000 x 1 160 : 30 000, или округло 193 раза, а в отрывке, содержащем 10 000 случаев употреблений всех слов, он предположительно используется 10 000 x 1 160 : 30 000, или 386 раз. Сравнение полученных с помощью подобного рода расчетов данных с фактическими показывает очень незначительное отклонение (в пределах 5%). На основе подобных расчетов было установлено, что в данном рассказе Пушкина предлог «к» используется в два раза чаще, чем «у», а местоимение «ты» в три раза чаще, чем «их» и т. д. Таким образом, несмотря на все перипетии сюжета, как на протяжении всего рассказа, так и в отдельных его частях, наблюдается стабильность относительной частоты употребления слов. То, что наблюдается в отношении некоторых (наиболее употребительных) слов, предположительно применимо и по отношению ко всем использованным в произведении словам. Отсюда следует, что стиль автора можно характеризовать определенным соотношением изменчивости средней частоты употребления слова к общей для данного языка<121> частоте его употребления. Это соотношение и рассматривается в качестве объективной квантитативной характеристики стиля автора. Аналогичным образом исследуются и иные формальные элементы структуры языка. Так, например, В. Фукс подверг сопоставительно-статистическому рассмотрению метрические особенности произведений Гёте, Рильке, Цезаря, Саллюстия и др.74 Критерий стабильности относительной частоты употребления слов, уточняя технику квантитативной характеристики стиля, ничего принципиально нового не вносит сравнительно с выше разобранными более примитивными способами. Все методы стилостатистики дают в конечном счете одинаково бесстрастные, скользящие по поверхности языка и цепляющиеся только за сугубо внешние признаки «объективные» результаты. Квантитативные методы, видимо, не способны ориентироваться на качественные различия исследуемого материала и фактически нивелируют все изучаемые объекты. Там, где необходима максимальная конкретизация, предлагаются максимально обобщенные критерии; качественные характеристики выражаются языком количества. Здесь не только логическое противоречие, но и несогласие с природой вещей. В самом деле, что получится, если мы попытаемся получить сравнительную стилистическую (т. е., следовательно, качественную) характеристику произведений Александра Герасимова и Рембрандта на основании количественного отношения красной и черной краски на их полотнах? Видимо, абсолютная несуразица. В какой мере вполне «объективные» квантитативные сведения о физических данных человека способны дать нам представление о всем том, что характеризует человека и составляет его истинную сущность? Очевидно, ни в какой. Они могут служить лишь индивидуальным признаком, отличающим одного человека от другого, вроде отпечатка извилин на большом пальце руки. Аналогичным образом обстоит дело и с квантитативными характеристиками литературного стиля. Если внимательно разобраться, то они дают столь же скудные данные для суждения о действительных стилистических<122> качествах языка автора, как и описание извилин на пальце для изучения психологии человека. Ко всему сказанному следует добавить, что в прошлом в так называемой формальной школе литературоведения уже делалась попытка квантитативного исследования стиля писателей, когда производились подсчеты эпитетов, метафор, ритмо-мелодических элементов стиха. Однако эта попытка не получила своего дальнейшего развития. Другое направление применения математических методов для изучения языковых явлений можно объединить под именем лингвостатистики. Оно стремится вторгнуться в основные вопросы теории языка и таким образом получить призвание в собственно лингвистической сфере. Для ознакомления с этим направлением лучше всего обратиться к уже упоминавшейся работе Хердана, по выражению одного из ее многочисленных рецензентов, «чудовищно претенциозной книге»75, получившей, однако, широкий отклик среди языковедов76. Ввиду того, что Хердан (на что уже указывалось выше) стремился собрать в своей книге все наиболее существенное в области применения математических методов к лингвистической проблематике, в его книге мы фактически имеем дело не столько с Херданом, сколько с целым направлением. Как показывает само название книги — «Язык как выбор и вероятность», — основное ее внимание направлено на выяснение того, что в языке предоставлено свободному выбору говорящего и что обусловлено имманентной структурой языка, точно так же, как и на определение количественного соотношения элементов первого и второго порядка. Книга Хердана дает почти исчерпывающую информацию о всех работах в этой области, проведенных представителями разных специальностей<123> (философами, лингвистами, математиками, техниками), но не ограничивается этим и включает много оригинальных наблюдений, соображений и выводов самого автора. В качестве суммирующего труда она дает хорошее представление о применяемых квантитативных методах, и о достигаемых с их помощью результатах. Вопросы, которые мы условно объединяем в раздел лингвостатистики, трактуются во второй и четвертой частях книги. Из множества случаев применения методов математической статистики к изучению лингвистических вопросов мы остановимся на наиболее общих, которые одновременно можно рассматривать и как наиболее типичные. Используя данные других авторов — Болдрини77123>122>121>120>119>118>117>116>115>114>113> |