Главная страница
Навигация по странице:

  • Copyright ОАО «ЦКБ «БИБКОМ» ООО «Aгентство Kнига-Cервис»

  • 3.5. Дистрибутивно-статистический анализ

  • Контрольные вопросы и задания

  • 3.6. Субституционная методика

  • Учебнометодическое пособие Издво Омск Омгу 2005 2 удк 800 ббк 81. 1я73 м 748


    Скачать 0.88 Mb.
    НазваниеУчебнометодическое пособие Издво Омск Омгу 2005 2 удк 800 ббк 81. 1я73 м 748
    Дата30.04.2023
    Размер0.88 Mb.
    Формат файлаpdf
    Имя файла93310_f3f59ab7e8bfec92456adda885a81bd7.pdf
    ТипУчебно-методическое пособие
    #1098788
    страница7 из 11
    1   2   3   4   5   6   7   8   9   10   11
    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

    59
    новным фактором является валентность элемента, т. е. его потен- циальная способность сочетаться с другими элементами. При этом разграничивается обязательная и факультативная валентность эле- мента, обязательная и факультативная сочетаемость, обязательное и факультативное окружение. Так, для глагола to buy элементом обязательного окружения будет прямое дополнение, что можно сказать и о любом переходном глаголе и обо всем классе переход- ных глаголов. Обстоятельство же не входит в обязательное окру- жение глагола to buy, но входит в обязательное окружение таких глаголов, как глаголы направленного движения (Не went home).
    В настоящее время понятие дистрибуции, пожалуй, наибо- лее последовательно используется при контекстологическом опи- сании лексики – слов и словосочетаний. Нас здесь интересует лишь определенный аспект такого анализа, а именно процедура уста- новления сходства или различия не чисто лексических, а лексико- грамматических значений слов и словосочетаний и выделение не- которых лексико-грамматических классов слов. Важным понятием методики анализа выступает понятие дистрибуционной формулы.
    (Понятие дистрибуционной формулы совпадает с понятием мини- мального синтаксического контекста, введенного в практику кон- текстологического анализа Н.Н. Амосовой.)
    При использовании дистрибуционных формул приходится учитывать целый ряд разных семантических признаков элементов.
    Возьмем сочетание глагола to be с инфинитивом. Известно, что оно имеет два значения – употребляется как модальное сказуемое и как составное именное. Для реализации первого значения необ- ходимо, чтобы существительное-подлежащее, как правило, обо- значало лицо; для реализации второго значения необходимо, что- бы существительное-подлежащее имело отвлеченное, абстрактное значение (wish, intention, idea): My wish was to leave.
    Дистрибуционные формулы для таких предложений можно записать следующим образом: N
    p
    + V
    be
    + V
    to
    ; N
    abs
    + V
    be
    + V
    to
    Если взять подкласс прилагательных, выражающих эквива- лентность, тождество некоторых объектов, то мы увидим, что они регулярно реализуют свое значение в двух дистрибуционных формулах: N
    1
    +V
    be
    +A+N
    2
    и N
    1,2
    + V
    be
    + A. При этом, вероятно, обя- зательным условием является тождество реальных предметов,
    60
    лиц, понятий, обозначенных N
    1
    и N
    2
    (если не иметь в виду поэти- ческие сравнения):
    1) Gold is similar to brass (in colour);
    2) Gold and brass are similar (in colour).
    Данный подкласс включает такие прилагательные, как equal,
    different, analogous, synonymous, similar и др.
    Таким образом, и на семантическом уровне понятие дистри- буции свидетельствует лишь о факте совместной встречаемости элементов без учета их обязательного линейного соположения.
    Еще раз отметим, что если первоначально дистрибутивный анализ оценивался как метод, предназначенный исключить значе- ние из лингвистического описания, то в настоящее время он ис- пользуется в основном для выявления и изучения значения.
    Дистрибутивное моделирование широко применяется также в лексикографии для показа функционирования слова и его сочетае- мости. Первыми, кто применил такое моделирование, были пред- ставители прикладной лингвистики: известный методист Г. Паль- мер, использовавший моделирование в своих подстановочных таб- лицах для обучения английскому языку японцев, а затем в 40-х го- дах не менее известный лексикограф А.С. Хорнби в учебном сло- варе. Оба они применяли, однако, не формулы буквенного типа, а модели, выраженные словами. В лексикографии этот метод, или точнее прием, очень себя оправдал. Модели с формулами приво- дятся, например, во введении к «Англо-русскому словарю глаголь- ных сочетаний» под редакцией Э.М. Медниковой и использованы в словарных статьях этого словаря. Применяются они и в спра- вочнике наиболее употребительных английских словосочетаний, составителями которого являются В.И. Перебейнос, С.С. Хидекель и другие авторы.
    Моделью в этом последнем справочнике называется «конст- рукция, отражающая грамматическую сочетаемость слов и высту- пающая как общее правило соединения классов слов и построения словосочетаний». Модели записываются символами грамматиче- ских классов и подклассов слов и располагаются в статье в соот- ветствии с заданным порядком моделей каждой части речи. Упот- ребление каждого слова определяется набором моделей. Так, для глагола make дается 6 различных моделей. Среди них, например, модель VNV Let's make it go.
    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

    61
    В целом дистрибутивный анализ является, несомненно, пер- спективным методом научного исследования.
    К его положительным качествам относятся:
    1) согласованность выводов с процедурами анализа (напри- мер, о тождестве и различии функций каких-то элементов судят только по их окружению);
    2) простота выполнения соответствующих процедур (кото- рые при необходимости могут быть полностью автоматизирова- ны);
    3) достаточно широкий диапазон применения (дистрибутив- ный анализ с одинаковым успехом применяется не только к еди- ницам разных уровней языковой системы, но и к различным язы- кам, что создает хорошую общую основу для типологических со- поставлений).
    Однако дистрибутивный анализ имеет и более или менее оче- видные недочеты:
    1) результаты дистрибутивного анализа могут считаться на- дежными лишь при охвате огромного (в некоторых случаях без- гранично большого) количества наблюдаемых фактов, что делает осуществление дистрибутивного анализа необычайно трудоемким;
    2) классификации, разрабатываемые посредством дистрибу- тивного анализа (даже при условии исчерпывающего охвата всех наблюдаемых фактов), неполно раскрывают сущность изучаемых явлений. Так, например, тождество или различие семантико-син- таксических функций отдельных словесных форм далеко не всегда обнаруживаются в соответствующих контекстных окружениях
    (ср. высказывания типа: Посещение больного нас успокоило, до- пускающие различную интерпретацию в зависимости от того, как они будут осмыслены, здесь «посещение больного» = либо: «боль-
    ной посетил (кого-то)», либо: «(кто-то) посетил больного»). В подобных случаях, составляющих для дистрибутивного анализа, так сказать, камень преткновения, на помощь ему приходят уже другие методы исследования.
    Дистрибутивный анализ эффективно применяется для задач дешифровки, которые понимаются достаточно широко. Речь идет не только о дешифровке неизвестной письменности, например майя, карийского письма. Любой фрагмент структуры языка мо-
    62
    жет быть дешифрован дистрибутивными методами. Иначе говоря, структурные закономерности языка нуждаются в реконструкции, они не могут быть полностью обнаружены описательными прие- мами. Свойства сочетаемости элементов друг с другом являются основными характеристиками в их синтагматической развертке.
    Систематический анализ дистрибутивных признаков в связи с этим позволяет проникнуть во внутреннюю организацию структу- ры языка на всех его уровнях, от фонологического вплоть до син- таксического. Более того, дистрибутивные методы успешно при- меняются и для исследования структур плана содержания. Семан- тические оппозиции и семантические множители также манифе- стируются в дистрибутивных свойствах речевых единиц. В целом дистрибутивный анализ приводит к построению различных клас- сификационных (таксономических) описаний языка.
    3.5. Дистрибутивно-статистический анализ
    Только что описанная нами в предыдущем параграфе мето- дика хорошо коррелирует с применением статистики, а следова- тельно, и с другими отраслями прикладной лингвистики, а не только с лексикографией.
    Лингвистическая статистика – отрасль языкознания, зани- мающаяся изучением методов раскрытия закономерностей, свой- ственных большим совокупностям однородных объектов на осно- вании их выборочного обследования. Свои важнейшие понятия лингвистическая статистика заимствует у математической стати- стики. Существенно обратить внимание на то, что просто количе- ственный подсчет того или иного явления в нескольких или даже в большом числе текстов статистическим не является. Корректное применение статистики требует серьезного с ней ознакомления.
    Основным методом применения статистики в сочетании с дистрибутивным анализом следует признать дистрибутивно-ста- тистический анализ, как он представлен в трудах А.Л. Шайкевича и Ю.Д. Апресяна. Их методика имеет много общего с валентност- ным анализом, как он разработан Г. Хельбигом, а в Ленинграде –
    Б.М. Лейкиной.
    Дистрибутивно-статистический анализ в том виде, как его разработал и применяет А.Я. Шайкевич, «есть сумма формальных
    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

    63
    алгоритмических процедур, направленных на описание языка и опирающихся только на распределение (дистрибуцию) заданных элементов в тексте. Под заданными элементами могут пониматься буквы (и другие графические символы), цепочки букв между про- белами (слова), цепочки слов между более крупными пробелами
    (высказывания), короче – любые объекты в тексте, непосредствен- но доступные нашему восприятию. Сам анализ при этом носит не жестко-детерминистский, а статистический характер, постоянно использует количественную информацию о встречаемости эле- ментов в тексте».
    Важно подчеркнуть, что в своем анализе А.Л. Шайкевич убедительно показывает следующее: скрытое или явное предпо- ложение о том, что текст или какие-то явления в тексте можно представить как случайный процесс, для лингвостатистики непло- дотворно. Шайкевич доказывает, что основные перспективы лин- гвостатистики, если она хочет исследовать особенности структуры текста или структуры языка, связаны с поисками расхождений между теоретическими данными (чаще всего они сравниваются с нормальным распределением, или распределением Пуассона) и эмпирическими данными.
    Объяснять здесь сущность этих понятий мы не сможем за недостатком места. Это слишком отвлекло бы нас от основного изложения. Но тому, кто будет пользоваться методикой дистрибу- тивно-статистического анализа, необходимо проработать не толь- ко работы самого Шайкевича, но и какой-либо из современных учебников по статистике.
    Здесь мы ограничимся конкретным примером, иллюстри- рующим предложенную методику. Шайкевич исследовал распре- деление относительной частоты неопределенного артикля в речи персонажей У. Шекспира и показал неоднородность этого распре- деления для двух, выделившихся именно благодаря этому анали- зу, групп персонажей. У слуг, горожан и носителей комического начала (шутов, остряков, глупцов) отмечено повышение частоты неопределенного артикля. И напротив, у героев «серьезных» и вы- соко стоящих на социальной лестнице частота неопределенного артикля понижается.
    64
    Таким образом, метод может быть использован в стилисти- ке, но, разумеется, пригоден и для других целей. В информатике, например, его применяют для выделения ключевых слов.
    Контрольные вопросы и задания
    1. На чем основан дистрибутивный метод?
    2. Назовите цель дистрибутивного метода.
    3. Объясните различие дополнительной и контрастной ди- стрибуции. Приведите примеры.
    4. Опишите процедуру дистрибутивного анализа в морфоло- гии и синтаксисе.
    5. Дайте определение дистрибутивно-статистического ана- лиза.
    6. Что показало исследование текстов У. Шекспира, прове- денное А.Я. Шайкевичем с применением дистрибутивно-статисти- ческого анализа?
    7. Проведите дистрибутивно-статистический анализ текста, предложенного преподавателем.
    8. Назовите преимущества и недостатки метода дистрибу- тивного анализа.
    9. Назовите сферы эффективного применения дистрибутив- ных методов.
    3.6. Субституционная методика
    Как показывает само название, в основе описываемой про- цедуры анализа лежит прием субституции, или подстановки. Суб- ституционная методика разрабатывалась и в наиболее полном ви- де применялась американскими дескриптивистами. Она представ- ляла собой определенную стадию в дескриптивном описании еди- ниц языка, продолжение дистрибутивного анализа, этап, следую- щий за вычленением и идентификацией морфем, и использовалась для группировки элементов, объединения их в определенные клас- сы. Как исследовательский прием формального описания единиц языка субституция применялась на всех уровнях: фонетическом, морфологическом и синтаксическом, причем дескриптивисты при- давали большое значение этому методу.
    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

    65
    Метод субституции предполагает подстановку одного эле- мента вместо другого в окружениях, в которых встречается пер- вый элемент. Если при этом выполняются определенные условия, то элементы объединяются в один класс.
    Чтобы лучше представить себе суть субституционной мето- дики, вернемся к началу дистрибутивной процедуры, в ходе ко- торой определялась дистрибуция (возможные окружения) слова
    girl. Очевидно, что установить все контексты, в которых встреча- ется слово, все окружения, т. е. полную дистрибуцию, даже одно- го слова girl практически невозможно, так как не известно, какого объема нужно брать текст, где границы текста, в котором может встретиться слово girl, и где оно не встречается. Еще сложнее оп- ределить класс всех элементов, имеющих ту же дистрибуцию или хотя бы часть окружений, что и слово girl. Легко заметить, что хотя бы частично окружение таких слов, как girl и tree, plane бу- дет разным. The girl talks, но не the tree talks, the plane talks. Это одна трудность. Вторая связана с тем, что один и тот же конкрет- ный элемент будет иметь в сумме своих окружений такие, по ко- торым идентифицируются элементы, относящиеся к разным клас- сам, например: talk, walk, work. The – is (The talk is) – окружение для существительного, is – -ing (is talking) – окружение для глаго- ла. Уже по этим причинам пользоваться методом субституции на уровне конкретных отдельных элементов, т. е. подставлять все элементы в окружение, например слова girl, и технически трудно, и бессмысленно, несмотря на то, что хотя бы часть окружений не- которых элементов одинакова (The girl is, the tree is).
    Чтобы упростить процедуру анализа, используется ряд при- ближений и допущений. Так, вводится понятие пробной позиции, пробной рамки, или «диагностического окружения». Диагностиче- ским считается такое окружение элемента, в котором встречается только он и никакие другие элементы. Фактически здесь лингвист имеет дело не с описанием отдельных элементов, а с установлени- ем классов элементов, встречающихся в заданном диагностиче- ском окружении. Возьмем цепочку элементов the girl is. Вместо того чтобы отыскивать в текстах все элементы с окружением the –
    is, будем подставлять в эту рамку разные элементы (слова). Если при этом последовательность элементов оказывается осмыслен-
    66
    ной, допустимой, то будем считать, что такие слова замещают друг друга, являются субституционными эквивалентами и, следо- вательно, относятся к одному субституционному классу. Очевид- но, что вместо girl в эту рамку можно вставить слова boy, father,
    tree, plane и т. п. Назовем этот класс «существительное» и обозна- чим через N. Диагностическим окружением для таких слов, как, например, large, physical, practical будет the – lу, или, проще, по- зиция перед –ly: large – ly, physical – ly, practical – 1у. Допуская, что у нас уже имеется класс элементов N, мы можем, исходя заве- домо из наших знаний о возможных последовательностях элемен- тов в английском языке, задать для них диагностическое окруже- ние. Как следствие такого допущения мы получим конкретные последовательности элементов: The large girl (tree, plane); the
    physical girl (tree, plane); the practical girl (tree, plane). Очевидно, что часть из них бессмысленна с точки зрения человека, говоря- щего на английском языке, хотя все они составлены в соответст- вии с нормами английского языка. Здесь делается еще одно допу- щение – вводится понятие грамматической правильности. Это по- нятие не имеет строгого определения, в основе его лежит интуи- тивное понимание грамматических норм языка. Предложение счи- тается грамматически правильным, если оно построено по грам- матическим правилам. В результате грамматически правильными оказываются построения типа Woggles ugged diggles из слов, не существующих в языке.
    Таким образом, любая последовательность, образуемая эле- ментами рамки the – N и элементами large, physical, practical, бу- дет грамматически правильной. Поэтому элементы large, physical,
    practical можно объединить в один класс. Назовем его прилага- тельным и обозначим через А.
    Подобным образом можно получить систему субституцион- ных классов. Для слов talk, walk, work диагностическим можно считать окружение, например, is – ing (is – talk – ing/ – work – ing/
    – walk – ing).
    Можно заметить, что даже приведенные выше пробные рам- ки есть не что иное, как определенные позиции в структуре пред- ложения, структурно значимые позиции, а не случайные «места» элементов. Такая структурная, или синтаксическая, позиция может
    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

    67
    быть приписана элементу как его признак наряду с его дистрибуци- онной характеристикой, его окружением. Кроме этого, мы объеди- няли элементы в тот или иной класс при условии, если элементы заменяют друг друга в пробной рамке. Следовательно, получае- мые субституционные классы характеризуются тремя признаками:
    1) окружением (элементы диагностического окружения);
    2) свойством замещаемости: элемент x
    1
    не принадлежит клас- су X, если он не замещает элемента x, принадлежащего классу X;
    3) некоторым структурным значением, определяемым через пробную рамку.
    С помощью описанной процедуры можно получить классы не отдельных элементов, а субституционные классы цепочек, по- следовательностей элементов. Так, в рамке the – is может стоять последовательность, например таких элементов: the young girl is;
    the girl in the clock is; the girl who has just come in is. Последова- тельность элементов young girl, girl in the dock, girl who has just
    come in образует субституционный класс последовательностей эле- ментов, который также характеризуется тремя указанными выше признаками. Можно добавить, заведомо и сознательно обогащая процедуру, что структурная характеристика данного класса после- довательностей элементов есть их атрибутивная функция. Однако следует помнить, что, хотя полученные характеристики субститу- ционных классов отражают основные формальные свойства эле- ментов, их синтаксическую позицию и через нее порядок их линей- ного следования, они еще не отражают содержательных связей.
    В лингвистике сегодняшнего дня понятие субституции пре- терпело определенные изменения, хотя и меньшие, чем понятие дистрибуции. Оно используется при описании содержательного плана структуры предложения, когда в явном виде учитывается значение элементов.
    На синтаксическом уровне прием субституции применяется по меньшей мере в двух случаях. Так, с его помощью можно уста- новить и фактически устанавливается субституционная парадигма компонентов предложения. Возьмем позицию подлежащего. Она заполняется элементами, принадлежащими к разным морфологи- ческим классам, – существительным, местоимением, глаголом (ин- финитивом), герундием, прилагательным, числительным. Перечис-
    68
    ленные классы и составляют субституционную парадигму подле- жащего.
    Прием субституции на синтаксическом уровне применяется для разграничения и идентификации дополнения и обстоятель- ства. Если в глагольном словосочетании вместо зависимого при- глагольного элемента можно поставить личное местоимение it, то такой элемент считается дополнением: I walked the dog – walked it.
    Если же вместо него можно поставить одно из наречий there – thus
    – then, то элемент классифицируется как обстоятельство: I walked
    the street – walked where.
    Однако субституционная проверка в данном случае скорее служит удобным средством эксплицитной записи (регистрации) наших знаний о структурном значении элемента, а не его опре- деления, идентификации. Для того чтобы определить, что нужно подставить вместо данного элемента – местоимение it или одно из наречий, нам требуется столько же интуитивных знаний о его структурном значении, сколько нужно для определения того, яв- ляется ли элемент дополнением или обстоятельством.
    Субституционная методика может быть использована и для установления лексико-грамматических классов слов.
    1   2   3   4   5   6   7   8   9   10   11


    написать администратору сайта