Иванова.Курс лекций по общему языкознанию. Лекция 1 isbn 9668847172 Рекомендовано Министерством образования и науки Украины
Скачать 2.1 Mb.
|
/=? относительная ошибка (не ошибка исследователя, а степень достоверности. Результаты считаются достоверными, если она не превышает 30 %.). В формуле t — особый коэффициент, зависящий от50-е гг. XX века) характеризовался повышенным, а в некоторых случаях исключительным вниманием к структуре плана выражения как более доступной строгому описанию, что приводило к забвению содержательной стороны, преувеличению роли отношений между элементами системы и игнорированию самих элементов как языковых сущностей. |
С 50-х гг. начинается второй этап развития структурной лингвистики, для которого характерен поворот к изучению плана содер-272
жания и к динамическим моделям языка (в частности, развивается трансформационный метод в грамматике). Методы и приемы анализа, разработанные первоначально в фонологии, переносятся в грамматику и семантику. Принципы и методы структурной лингвистики начинают применяться в сравнительно-историческом языкознании (в работах Р. О. Якобсона, А. Мартине, Е. Куриловича, Э. А. Макаева, Т. В. Гамкрелидзе и др.). Вместе с тем, расширение фронта исследований и одновременное применение наряду со структурными методами также иных приемов и методов исследования привело к тому, что структурная лингвистика, углубив наши представления об устройстве языка, разработав аппарат строгого описания его системы, "растворилась" в новых направлениях, вызванных к жизни новыми теоретическими поисками.
С 70-х гг. структурная лингвистика перестает существовать как обособленное направление, противостоящее "традиционному" языкознанию; разработанные структурной лингвистикой методы исследования наряду с другими применяются и в иных лингвистических дисциплинах (психолингвистике, социолингвистике и др.). Структурная лингвистика повлияла на развитие структурных методов исследования в других гуманитарных науках — литературоведении, искусствознании, этнологии, истории, социологии, психологии.
Две основные идеи стали опорными пунктами структурной лингвистики: 1. Требование постоянного учета языковой функции, выдвинутое уже И. А. Бодуэном де Куртенэ и последовательно проведенное в жизнь лингвистами Пражской школы; 2. Идея описания языка как синхронной системы, на которой с особой решительностью настаивал Ф. де Соссюр. Идея целенаправленности представляет собой то общее, что объединяет все школы структурной лингвистики.
Если говорить в терминах общей семиотики, в составе которой, по традиции, выделяются семантика, синтактика и прагматика, то различие школ структурной лингвистики может быть сформулировано следующим образом: глоссематики ограничивали лингвистическую теорию описанием синтактики (внутренней организации кода), а пражцы охотно вводили в круг своих интересов также се-
273
мантическую и прагматическую стороны языка (т. е. его отношение к предметам внешнего мира и к участникам и условиям коммуникации).
Принятый структурной лингвистикой семиологический подход к языку определил и ее отношение к самому языковому материалу. Если лингвистика XIX века обращала большое внимание на реализацию языка, то для структурного языкознания текст служит лишь тем источником, из которого должна быть выведена семиологичес-кая система, затемненная условиями и формой ее физического воплощения. Осуществление этой общей задачи поставило структурную лингвистику перед необходимостью "извлечения" языковых единиц из непрерывного языкового потока, определения их функционального (инвариантного) содержания на основе их бесконечно варьирующихся репрезентаций, наконец, выявления иерархической организации языка, скрытой линейной реализацией речи. Эти цели в значительной степени определили те методы, которые получили название структурных.
Таким образом, для структурных методов основополагающую роль сыграло осознание дихотомии языка и речи, актуального и виртуального кода и сообщения, бесконечного варьирования при сохранении стабильным семиологического (функционального) содержания.
Итак, целью структурного описания должна быть как можно более точная характеристика структурных отношений, которые скрыты за непосредственно наблюдаемыми языковыми данными. Структурное языкознание предложило и обосновало определенную технику анализа. Если оставить в стороне некоторые формализованные процедуры, то наиболее общими приемами, используемыми в разных вариантах и с разными целями, являются: 1. Прием коммутации, или субституции, при помощи которого определяются инвариантные единицы языка, фиксируются релевантные признаки его планов, выявляется функциональная иерархия и т. п.; 2. Прием опущения (трактуемый иногда как нулевая субституция), также имеющий широкую сферу применения, и обратный ему; 3. Прием интерполяции (или "катализа") отсутствующих элементов. В каче-274
стве образцов структурных методик приведем дистрибутивное описание и компонентный анализ.
Дистрибутивная методика была разработана Л. Блумфилдом в 20-х гг. XX века, а затем развита в 30-50-х гг. в работах 3. Харриса. Изложим суть ее вслед за Ю. Д. Апресяном (Апресян Ю. Д. Идеи и методы современной структурной лингвистики. М., 1966).
Дистрибутивная лингвистика — это схема процессов, ведущих к открытию грамматики некоторого языка, или экспериментальная техника сбора и первоначальной обработки сырых данных. Таким образом, исследователь выступает в роли дешифровщика, стремящегося раскрыть код.
Единственной реальностью, с которой лингвист имеет дело, является текст, подлежащий "дешифровке". Все сведения о "коде" (языке), лежащем в основе этого текста, должны быть выведены исключительно из анализа последнего. Но в тексте непосредственно не содержатся данные о значениях слов языка, его грамматике, его истории и генетических связях с другими языками. Непосредственно в тексте даны лишь некоторые элементы (части, отрезки), и для каждого их них мы можем установить распределение или дистрибуцию — сумму всех окружений, в которых он встречается, т. е. сумму всех (различных) позиций элементов относительно других элементов.
Описать структуру языка исчерпывающим образом — значит установить: 1. Его элементарные единицы на всех уровнях анализа; 2. Классы элементарных единиц; 3. Законы сочетания элементов различных классов. Элементарные единицы — это фонемы и морфемы.
Выделение элементарных единиц языка достигается с помощью экспериментальной техники сегментации текста и дистрибутивного анализа текстовых единиц, обнаруженных в результате сегментации. Классы элементарных единиц строятся на основе экспериментальной техники субституции (замещения), а законы сочетания элементов различных классов устанавливаются с помощью анализа по непосредственно составляющим. Первые три техники могут применяться, по мнению их создателей, для анализа любого аспек-
275
та всякого языка, а анализ по непосредственно составляющим (НС) имеет силу только в области морфологии и синтаксиса.
Идея о том, что единицы языка, классы единиц и связи между единицами могут быть определены исключительно через их окружение, т. е. через их отношение к другим единицам того же порядка, и составляет существо дистрибутивного подхода к языку.
Сегментирование текста на элементарные единицы (звуки или фоны на фонологическом уровне и морфы на морфологическом) является лишь первым шагом в процедуре выделения соответствующих единиц языка — фонем или морфем. Вторым шагом является идентификация — установление того, какие из элементарных текстовых единиц тождественны между собой, т. е. являются вариантами одной и той же единицы языка (аллофонами одной фонемы или алломорфами одной морфемы), а какие различны, т. е. являются представителями разных единиц языка. Для решения этой задачи используется дистрибутивный анализ в собственном смысле слова.
Устанавливаются три типа дистрибуции элементов: 1. Текстовые единицы находятся в дополнительной дистрибуции, если они никогда не встречаются в одинаковых окружениях. Этого условия в большинстве случаев достаточно, чтобы признать ряд звуков вариантами (аллофонами) одной фонемы. Таковы различающиеся степенью закрытости — открытости гласные звуки в словах семь, день (наиболее закрытый вариант, произносимый в позиции после мягкого согласного и перед мягким согласным); сел, дел (более открытый вариант, произносимый после мягкого перед твердым); шерсть, жесть (еще более открытый вариант, произносимый после твердого и перед мягким), шест, жест (наиболее открытый вариант, произносимый после твердого согласного перед твердым);
2. Текстовые единицы находятся в контрастной дистрибуции, если они могут встречаться в одних и тех же окружениях, различая значения. В этом случае они являются представителями разных единиц (фонем или морфем). Таковы началь-276
ные согласные в словах том — дом — ком — лом — ром, принадлежащие пяти различным фонемам; 3. Текстовые единицы находятся в свободном чередовании, если они встречаются в одних и тех же окружениях, не различая значений. Например, варианты морфемы творительного падежа -ею и -ей в русском языке (землей — землею). Во всех задачах лингвистической дешифровки, которые ставятся в достаточно общем виде, изучение дистрибуции элементов, правда с учетом их числовых характеристик и прежде всего частотности, остается едва ли не единственным средством, ведущим к цели. В дальнейшем выяснилось, что дистрибутивный анализ противоречив и не решает тех задач, для которых он был предназначен, поэтому общие основания его были уточнены на базе теории множеств, результатом чего явилась теоретико-множественная концепция языка. В дополненном и уточненном виде дистрибутивный анализ применялся для исследования всех уровней языка, включая синтаксис и семантику; в целом он привел к осознанию важности экспериментирования с языковым материалом и усовершенствованию техники лингвистического эксперимента.
Компонентный анализ
Данная методика применяется к анализу различных единиц языка. Продемонстрируем его на примере компонентного анализа слова (см., например, работы 3. Д. Поповой и И. А. Стернина).
Известно, что одна лексема может выражать несколько значений, каждое из которых называется семемой. Одни семемы в своей основе денотативные, т. е. отражают предметы внешнего мира, другие коннотативные. т. е. выражают оценки, эмоции и т. д. (так, например, компоненты хорошо/плохо содержатся в коннотативной части слов прогресс, энергичный, паника, галиматья; эмоциональные семы нравится/не нравится наблюдаем в словах доносчик (презр.), аппетитный; функционально-стилистические семы — в словах местожительство (официально-деловой), егоза (разговори.); сугубо конногативные семы в словах кабак (в знач. "грязь, беспорядок"), дичь (в знач. "бескультурье, бессмыслица, абсурд").
277
Прямое номинативное значение слова обозначается Д1 (денотативная первая сема):
Сумка — Д1 — мешок, футляр из ткани, кожи и т. п. для ношения чего-нибудь;
Д2 (производно — номинативное значение) — полость в виде подбрюшного мешка у некоторых животных (кенгуру).
Коннотативные семемы бывают трех типов. К1 (коннотативная первая семема) находится в логически мотивированной связи со своей денотативной семемой). Например, хрустальный (К1) воздух — такой же прозрачный и сверкающий, как хрусталь. К2 (коннотативная вторая семема) утратила логическую связь с денотативными семемами, например, брать на пушку. КЗ (коннотативная третья семема) денотативной основы не имеет и наблюдается только в составе идиом (попасть впросак).
Совокупность семем, выражаемых одной лексемой, образует се-мантему. Семемы, входящие в одну семантему, находятся между собой в иерархических отношениях, исходной является семема Д1. Рассмотрим семантическую структуру слова журавль. Д1 — большая болотная птица с длинными ногами и шеей. Д2 — длинный шест у колодца, используемый как рычаг для подъема воды. Опускается с ведром в колодец и вынимается из него подобно тому, как журавль вынимает ее из воды, поймав лягушку. К1 — "экий журавль шагает!" — можно сказать о высоком нескладном мужчине.
Лексемы разных языков, которые эквивалентны по семеме Д1, как правило, неэквивалентны по семемам Д2 и К1, тем более по семеме К2. Например, русская лексема хлеб имеет семему Д2 "зерно" и Д2 "растущие хлебные злаки". Эквивалентные ей по семеме Д1 немецкая лексема Brot, английская bread, французская pain таких Д2 не имеют. Зато фр. pain имеет семему Д2 "кусок" (pain de savon — кусок мыла, pain de sucre — голова сахара).
Межъязыковые различия в семантемах отчетливо проявляются при анализе лексической сочетаемости разноязычных лексем, эквивалентных по Д1. Так, прилагательное глубокий по семеме Д1 эквивалентно англ. deep, но deep grass ("глубокая трава") — русск. 278
русск. скрыт-
"высокая трава", deep person (глубокий человек) ный, не показывающий своих чувств человек".
Различия по семемам К1 и К2 проявляются в больших расхождениях разных языков в области фразеологии. Например, чехи сравнивают худую женщину с лапшой, о неинтересном и ненужном деле говорят дословно "это для меня сарделька", о несведущем человеке — "понимает в этом деле как коза в петрушке", пустяковое дело символизируется "грибами": "это для него грибы", "он грибы из этого делал", т. е. это для него пустяки. Русские лексемы лапша, сарделька, петрушка, грибы таких семем К1 и К2 не имеют. То же касается и их украинских эквивалентов.
Основы компонентного анализа заложил Л. Ельмслев, затем его развивали Б. Потье, А. Греймас и др.
Семемы дробятся на семы. Сема понимается как отражение в сознание человека отдельного признака, какой-то детали того объекта, который целиком представлен в семеме. Членение семемы на семы бесконечно, его предел становится лишь мерой познания свойств и качеств денотата. Компонентный анализ показывает, что число сем, существенных для общения, в семеме вполне исчислимо и не очень велико. Оно выясняется из сопоставлений и противопоставлений разных семем друг другу. Сема, которая в одном контексте представляется далее неделимой, в другом контексте проявляет свою сложность и возможности дальнейшего деления. Например, в семеме Д2 слова перемена есть семы "время, отдых, конец урока, звонок, школа, среднее учебное заведение, время занятий в 45 минут, звуковой сигнал начала и конца урока" и т. д.
Семасиологи строят различные классификации сем.
Так, классемы — наиболее обобщённые по содержанию признаки, соответствующие значениям частей речи: предметность, признак и т. п. Архисемы — признаки, объединяющие группы слов внутри части речи, например одушевлённость/неодушевлённость, действие/состояние и т. п.
Дифференциальные семы — это признаки, по которым противопоставляются слова, сгруппированные в одной архисеме, и по которым можно отличить одну семему от другой. Например, для
279
слов равнина, плоскогорье, плато, неизменность, низина архисемой будет "участок земного рельефа с ровной или слабо волнистой поверхностью". Дифференциальные семы, разграничивающие значения этих слов, следующие: "выше 200 м над уровнем моря" (плоскогорье, плато), "ниже 200 м над уровнем моря" (низменность, равнина), "обширный, без видимых границ" (равнина, плоскогорье, низменность), "небольшой с видимыми границами" (плато, низина).
В. Г. Гак делит семы на описательные и относительные. Описательные семы отражают собственные свойства предмета (размер, устройство, форму, внешний вид, способ совершения действия и т. п.), относительные - связи объекта с другими объектами в разных отношениях (пространственные, временные, функциональные и др.). Например, для глаголов перемещения описательные семы характеризуют способ действия: идти — с помощью ног, плыть — по воде, лететь — по воздуху и т. п., относительные семы указывают направление перемещения: удаляться — от исходного пункта, приближаться — к конечному пункту.
Архисемы и дифференциальные семы достаточны для характеристики семемы, по ним содержание семемы определяется вполне удовлетворительно, однако помимо этих основных сем каждая семема может содержать неограниченное количество разнообразных сем, детализирующих всякие частности в соответствии с реальной неисчерпаемостью признаков объекта. Среди этих сем вероятностные, потенциальные, скрытые. Например, в семеме лексемы начальник путём эксперимента выявлены скрытые, вероятностные семы "толстый, злой, нервный", в семеме лексемы профессор — "в очках, старый, строгий, умный", студент — "веселый, общительный" и т. п.
Вероятностные семы шире всего реализуются в именах существительных, поскольку именно в предметах человек открывает, прежде всего, все новые и новые свойства. В словарях вероятностные семы чаще всего отмечаются словом обычно. Например, лагерь — временная стоянка, обычно под открытым небом, в палатках; голландка — комнатная, обычно кафельная печь.
280
Семы в составе семемы иерархически упорядочены и находятся в структурных отношениях, определяя категорию слова, родовые и видовые признаки объекта, его главные и второстепенные признаки. Семема предстает как микроструктура сем. Лексико-семанти-ческий вариант слова (т. е. лексема + семема) является элементом лексико-семантической подсистемы языка, которая формируется оппозициями семем, возникающими благодаря их сходствам и различиям по составу сем.
Логико-семантическое исчисление и моделирование
Логико-математическое моделирование пользуется формальным аппаратом логики, изучающей общие закономерности теории доказательства. Общим является допущение логической правильности инвариантной (моделирующей, генотипной) сущности речемыс-лительной деятельности, рассмотрение ее как логического устройства, в котором можно выделить простые исходные элементы и непротиворечивый формализованный аппарат логических операций.
Аксиоматический метод состоит в том, что множество элементов или объектов разбивается на части (подмножества); одна часть рассматривается как исходные положения — аксиомы, которые принимаются без доказательства, остальные положения (теоремы) доказываются логическим путем. Аксиоматический метод опирается на теорию множеств и теорию функций (в математическом значении этого слова).
Формализованная теория понимается как система символов, рассматриваемых как последовательность логических терминов, т. е. субъекта и предиката в суждении, субъекта и предикатов в силлогизме. Формальные символы включают: логические символы (v, и — л — или), символы предикатов (=) и функций (+), переменные (а, Ь, с). Из них создаются формальные выражения и их конечные последовательности.
Распространение аксиоматической и формализованной методик потребовало использования таких приемов решения лингвистических задач, как алгоритмизация, графическое исчисление и матричное (табличное) определение истинности функций сложных высказываний.
281
Применение логико-математических методик и приемов анализа привело к появлению различных видов логико-математического моделирования языка и текста, мысленного эксперимента и гипо-тетико-дедуктивного способа исследования. Наиболее известными видами логико-математического анализа являются различные модели порождения, синтаксические модели анализа и инвариантный семантический анализ.
Модели порождения.
Структурно-математические модели порождения используются для описания порождения языка и текста, а также для определения структуры речевой деятельности и структуры языка.
Примером модели порождения может служить апшшкативная (applicatio (лат.) — прикладывание) порождающая модель, разработанная отечественными учеными. АПМ предполагает понимание языка как порождающего устройства — математической системы, построенной на основе гипотактико — дедуктивного метода и формализованной трансформационной методики. АПМ состоит из 4 соединенных друг с другом частньк моделей (генераторов): абстрактного генератора, генератора слов, генератора фраз (комплекса слов) и генератора трансформационных полей. Рассмотрим как образец генератор слов. Корень квалифицируется как пустой семион 0, релято-ры — как абстрактные аффиксы: Rt — аффикс глагола, Щ — аффикс имени существительного, Щ — прилагательного, R4 — приглагольное наречие, R5 — приадъективное наречие. Слова бывают I, II и III производности: R,0 — глагол учит. RJlfi — имя существительное, образованное от глагола — учитель, R^R, 0 — глагол, образованный от отглагольного существительного учительствуют. Таким образом, аппликативная модель оказывается алгеброй релято-ров, а сам язык — метаязыком, который далек от конкретной реальности языка.
Синтаксические модели анализа текста были вызваны потребностями машинного перевода. Наибольшее распространение получили методика последовательного анализа текста и гипотеза глубины В. Ингве, а также алгоритм И. А. Мельчука.
И. А. Мельчук исходит из предположения о том. Что текст — это "черный ящик", который должен быть препарирован и описан
282
при помощи элементов анализа. Элементы анализа — это единицы, хранящиеся в памяти машины. Важнейшими единицами анализа являются морфы (основы и аффиксы) и синтагмы (классы двучленных сочетаний словоформ и сегментов,, имеющих одинаковое грамматическое строение). Алгоритм представляет собой множество таблиц стандартных форм (конфигураций) и правил обращения с таблицами.
Таким образом, логико-математические приемы связаны с переводом семантики естественных языков на семантический язык, который рассматривается как формализованная структура и метаязык. Конкретность семантики единиц реального языка утрачивает свою специфику, сами реальные единицы языка предстают как идеализированные модели, лишенные собственно языковой основы.
Количественные (симптоматические) и вероятно-статистические приемы изучения языка и текста.
Полное постижение языка без более специализированного обследования количественной стороны языковых, и в частности грамматических явлений невозможно. Причина этого заключается в том, что каждое языковое явление, помимо качественной определенности, обладает, по словам В. Г. Адмони, и некоторой "массой", т. е. занимает в кругу других языковых явлений некое пространство и соизмеримо с ними в неких аспектах с разной степенью интенсивности. Представая в самых разных обличиях и в разных соотношениях своих компонентов, "масса" языковых явлений выступает как понятие в высшей степени комплексное и сложное. Но она представляет собой объективный факт и требует применения количественных приемов исследования.
Попытки "измерить" художественную и нехудожественную речь, приложить к ней количественные оценки предпринимаются давно. И даже самые непримиримые противники применения статистики в изучении речи не могут избежать таких явно количественных по своей сути оценок, как "часто", "редко", "много", "мало" и т. п. Так, еще М. В. Ломоносов доказательством необходимости унификации флексии прилагательных считал тот факт, что "на е множественное окончание во всех родах употребительнее, нежели я". А. С. Буди-лович подсчитывал процент употребления букв в церковнославян-
283
ских текстах, Д. Н. Кудрявский определял, был ли аорист формой живого языка, составив кривую распределения глагольных форм в Лаврентьевской летописи. И таких примеров превеликое множество. Использование количественной методики, когда устанавливается процентное соотношение языковых фактов, В. Г. Адмони предложил называть симптоматической статистикой.
Математики еще в начале нашего века попытались ввести в анализ фактов речи и текста вероятностно-статистическую методику. Так, Н. А. Морозов в работе "Лингвистические спектры" выявил распределение гласных звуков в "Евгении Онегине" А. С. Пушкина. А. А. Марков, проанализировав его данные, доказал, что выделенные закономерности не являются статистически достоверными, необходимо определять размеры колебаний частот и относительную ошибку исследования.
Теперь хорошо известно, что развитие и функционирование языка, построение речевых цепей, применение в речи различных языковых единиц и категорий — все это подчиняется не жестким, а вероятностным закономерностям и, следовательно, нужны специальные методики, которые позволяли бы лингвисту, изучающему язык, улавливать пределы действия одной и той же закономерности в развитии или функционировании языка, отграничивать одну закономерность от другой. Качественная специфика статистических совокупностей состоит в том, что в них действует множество разнообразных факторов, существенных и несущественных, систематических и случайных, внутренних и внешних. При этом число и состав факторов, действующих на каждую единицу совокупности, часто не совпадают (частично или полностью). Поэтому один или несколько случаев здесь не показательны для всей массы в целом, здесь необходимо планомерное изучение достаточно большого количества единиц, чтобы выявить более или менее полный перечень представленных в данной совокупности факторов, установить возможности их комбинирования и взаимодействия и, наконец, определить меру участия каждого фактора.
Оценка достоверности результатов качественно-количественного исследования опирается на целый ряд критериев. Основной — соответствие между качественным анализом и количественными
284
данными, внутренняя логика цифр. Если исследуется конечная совокупность или бесконечная однородная совокупность, то появляется возможность оценить степень достоверности вероятностно-статистическими методами. В простейшем виде вероятностно-статистическая методика в применении к языкознанию выглядит следующим образом: 2 xi
Х---п — средняя частота явления
G