Компьютерный анализ звучащей речи (скомпонованы все лекции) Синергия. КОМПЬЮТЕРНЫЙ АНАЛИЗ ЗВУЧАЩЕЙ РЕЧИ КАФЕДРА ЛИНГВИСТИКИ. Лекция 1 Область применения информационных технологий в лингвистике. Компьютерный анализ и синтез речи
Скачать 223.85 Kb.
|
в экспертизах по делам о защите чести и достоинства), и анализ текста (например, в экспертизах по определению семантического подобия текстов), и лингвостатистический анализ (например, в экспертизах по установлению авторства). Вербально-визуальные экспертизы в качестве объекта для исследования имеют сочетание вербальной и невербальной информации, т.е. комбинация текста и изображения. Это оказывается необходимым, например, при оценке степени близости товарных знаков, когда по набору символов, графем или «буквоподобных» элементов товарные знаки близки, но изобразительно поданы по-разному. Анализ изображения и текста в единстве требуется также в тех случаях, когда семантика текста или его фрагментов, иллюстрирующих изображение, не вполне ясна. Пример: Выражение «Знай наших!» может использоваться и как фразеологизм в значении выражения говорящим положительных эмоций, вызванных чем-либо, интерпретируемым как знак превосходства лица или группы лиц, с которыми говорящий себя отождествляет, и как свободное словосочетание – императиврекомендация, коммуникативная цель которого заключается в том, чтобы рекомендовать адресату пополнить свои знания о конкретной группе лиц, с которыми говорящий себя отождествляет. В одном из экспертных дел предметом исследования оказалась фраза Знай наших!, помещенная на банке напитка Fruttola. Претензия заключалась в том, что эта фраза была ранее закреплена как слоган в составе товарного знака другого производителя, причем именно в функции фразеологизма. Анализ фрагментов текста и изображения на банке напитка позволил сделать вывод о том, что в рассматриваемом случае фраза Знай наших! Использована в прямом значении и, следовательно, не может рассматриваться как заимствование слогана из товарного знака другого производителя. В ряде случаев вербально-визуальная экспертиза требует анализа целого видеоряда, его текстовых составляющих и текста «за кадром» позволило показать, что мини-сюжет о производстве парфюмерной продукции фирмы «МИРРА» и иллюстрирующий ее «закадровый» текст, с одной стороны, и фраза о распространении фальшивой парфюмерии и косметики из мини-сюжета о проверке вьетнамского рынка - с другой, связаны отношением экземплификации, т.е. фирма «МИРРА» связывается в телевизионной передаче с производством нелегальной продукции. Задачей автороведческих экспертиз является установление авторства текста. Данный вид экспертиз существенно отличается по методологии и используемому исследовательскому аппарату от экспертиз других типов. Экспертизы этого вида необходимы в основном в следующих случаях. 1. Предположительный автор есть, но его авторство вызывает сомнение и требует доказательства (идентификационные задачи). Сюда относятся ситуации: подозрение в плагиате (литературном воровстве); анонимное и псевдонимное авторство; стилизация, подражание, цитирование. Типовой вопрос: «Является ли данное лицо автором (соавтором) данного текста (фрагмента текста)?». На экспертизу в этом случае предоставляется спорный текст и образцы текстов предполагаемого автора, которые максимально близки к спорному по жанру, времени создания и стилю изложения. Есть случаи, в которых экспертлингвист, опираясь на общепринятые нормы (русского) языка, знание текстологии способен однозначно ответить на вопрос об авторстве; есть также случаи, когда ответ носит вероятный характер. Степень однозначности вывода находится в прямой зависимости от объема и информативности предоставленного на экспертизу материала. 2. Автор текста неизвестен, и необходимо выяснить, содержит ли текст информацию, позволяющую судить об обстоятельствах его создания и об авторе (диагностические, классификационные задачи). Типовой вопрос: «Что можно сказать по тексту об авторе и о самом тексте. Данные экспертизы позволяют во многих случаях определить, написан ли текст автором под диктовку или самостоятельно, переписан ли он с чужого текста, смонтирован ли он из текстов разных авторов, написан ли в соавторстве и т.п. место создания текста. Встречающиеся в текстах отклонения от языковых норм или варианты этих норм, а также отдельные упоминаемые в них реалии могут носить локальный, привязанный к определенной местности и времени характер. Это дает основание для выводов о времени и месте написания текстов. Биографические данные автора (пол, возраст, уровень и характер образования, область деятельности, родной язык, владение иностранными языками, место рождения, жительства и пребывания). Намеренное искажение биографических данных автора (например, занижение-завышение уровня образования, «изменение» пола и т.п.). Психологические особенности автора и его психическое состояние в момент написания текста («Находился ли автор в состоянии в алкогольного или наркотического опьянения?» «Испытывал ли он в момент создания текста страх?», «Находился ли он под психическим давлением?», «Менялось ли его эмоциональное состояние в процессе написания текста?», «Не страдает ли он каким-нибудь психическим заболеванием?» и т.п.). В тексте могут проявляться многие психические черты его автора. Выбор и особенности использования языковых средств позволяют оценить степень тревожности пребывание его в аффективном или нормальном состоянии и пр. В отдельных случаях они позволяют оценить также некоторые характерные особенности (например, тип темперамента, тяготение к мужскому или женскому психотипу). В части анализа и оценки психологической и психиатрической информации, извлекаемой из текста, лингвистическая экспертиза делит свой предмет с психологической и психиатрической экспертизой. Поэтому для решения таких вопросов желательно назначать комплексную экспертизу с участием психологов и психиатров. В большинстве случаев диагностические и классификационные выводы имеют вероятный характер. По области применения следует различать юридическую (правовую) экспертизу и патентоведческую экспертизу. Юридическая (правовая) экспертиза разделяется по институциональным основаниям на: экспертизу по делам о защите чести и достоинства, экспертизу по делам о клевете, экспертизу по делам о разжигании межнациональной розни, экспертизу по делам о порнографии. По объему анализа выделяются холистические («цельно-текстовые») экспертизы и частные экспертизы. В частных толкуются значения слов, словосочетаний и высказываний в рамках текстов законов и подзаконных актов; выявляются омонимия (сходство слов в звуковом отношении при различии значений), полисемия (наличие двух и более значений, взаимосвязанных по смыслу) и синонимия слов (сходство слов по значению при различии с звуковой стороны). По уровням анализа языка выделяются: -почерковедческие экспертизы (анализ почерка), -фонетические (в том числе фонологические и интонологические), -морфологические (чаще при анализе товарных знаков), -текстологические, в том числе лингвостилистические (фразовый и сверхфразовый уровень), -дискурсивные экспертизы. В дискурсивных экспертизах осуществляется исследование вербальных и невербальных компонентов реальной коммуникативной ситуации: анализируется и печатный или расшифрованный устный текст, и аудиовизуальный ряд, что предполагает учет жестикуляции, мимики и координация между визуальным рядом и вербальными комментариями и т.д. Дискурсивные эксперты позволяют, кроме всего прочего, выявлять коммуникативные намерения участников ситуации общения, что важно, например, при определении намерения дать взятку, при выявлении и квалификации угроз, призывов и т.д. С методической точки зрения проведение экспертизы предполагает выполнение следующих этапов: -Определение непосредственного объекта анализа (выделение лингвистического объекта поставленных эксперту вопросов). -Определение глубины анализа, круга привлекаемых источников информации по самому делу (часто глубина исследования ограничивается внешними факторами, например объемом материалов, которые предоставляет эксперту суд; формально расширение материала требует особого судебного решения). -Определение круга источников лингвистической информации: словари и справочники, теоретические работы. Особенно важным оказываются существующие нормативные словари и грамматики. -Определение возможностей использования репрезентативных корпусов текстов и других инструментов компьютерной обработки языковых данных. -Определение необходимости использования правовых документов – текстов законов, подзаконных актов, комментариев к законам. Лингвистическая экспертиза текста это не только изложение полученных результатов, но и их специальное оформление. В экспертизе текста так или иначе затребованы практически все разделы теории языка. Чаще всего в экспертной практике используются: Лексическая и лингвистическая семантика. Исследование и описание плана содержания слов, словосочетаний, предложений и фрагментов текстов невозможны без семантических метаязыков. По целому ряду причин прагматического характера особое положение в лингвистической экспертизе текста занимает исследование семантики слов и словосочетаний с использованием словарных толкований. В сложных случаях используются и более развитые семантические метаязыки, которые, однако, требуют последующей оптимизации и адаптации к конкретной проблемной ситуации – к участникам процесса, к их образованию, степени компетентности в науке о языке, способности воспринимать логику проведенного исследования и т.д. Семантические исследования в первую очередь имеют целью: выявление смыслов, выраженных в исследуемых текстах, и анализ этих смыслов с разных точек зрения; установление объема и содержания понятия, выражаемого словом или словосочетанием, употребленным в тексте; установление степени адекватности передачи в одном тексте содержания другого текста. Научную основу семантических исследований образуют такие разделы лингвистики, как семантика – учение о значении и смысле языковых выражений; прагматика – учение о структуре и содержании речевых, или коммуникативных, актов; анализ дискурса – учение о формальной и содержательной структуре целых текстов, рассматриваемых в составе коммуникативной ситуации; теория речевого воздействия, или риторика, – учение о вербальных и невербальных способах воздействия на сознание адресата. Экспертизы этого вида могут быть связаны с такими областями судебной практики, как дела о клевете, оскорблении, разжигании межнациональной и религиозной вражды; дела о защите чести, достоинства и деловой репутации, авторских прав; споры по имущественным и иным вопросам и т. п. Проведение семантических исследований целесообразно в тех случаях, когда требуется разъяснить значение текстов или отдельных слов в них, а также сопоставить несколько текстов друг с другом по смыслу. На экспертизу предоставляется текст (тексты) в письменном виде (в оригинале или в виде копий). Если исследуемым текстом является теле или радиопередача, наряду с письменной расшифровкой необходимо представить видеоили аудиозапись соответственно. Если предметом спора является значение слов или словосочетаний, предоставить текст (тексты), в которых соответствующие слова употреблены. Рассмотрим подробнее сущность указанных задач семантического исследования. Смысл текста (или его фрагмента – абзаца, периода, предложения, словосочетания) формируется на основе значений тех языковых единиц, из которых он построен, – слов, грамматических знаках, знаках обслуживания и наименованиях мест происхождения товаров»); раэлементов (морфем), синтаксических конструкций, а в случае звучащего текста также и интонационных конструкций. Поэтому важнейшими источниками информации, используемой при определения наличия / отсутствия в тексте того или иного смысла, являются словари, которые описывают значения грамматики, которые описывают значения грамматических форм, синтаксических и интонационных конструкций. При проведении СЛЭ эксперты вынуждены учитывать то важное обстоятельство, что словари и грамматики фиксируют языковые единицы и их основные значения, тогда как смысл текста (или его фрагмента) никогда не сводится к значениям входящих в него единиц языка. Это связано прежде всего с тем, что: слова в тексте включает в себя не только то значение, которое приписано слову в словаре, но и информацию о том реальном объекте или явлении действительности, которые данное слово в данном тексте обозначает, к которым оно отсылает (референт, денотат), и те традиционные представления и оценки, которые связаны с данным словом и его значением в данной культуре (коннотации), и общеизвестные сведения об обозначаемом объекте, имеющие отношение к теме данного теста (так называемые энциклопедические, или фоновые знания), и устойчивые ассоциации. Предложения – это не только сумма значений слов, грамматических морфем, синтаксических и интонационных конструкций, но и та функция, которую предложение выполняет в структуре коммуникативного взаимодействия (то есть его иллокутивная функция) и текста – не простая сумма смыслов составляющих его предложений, поскольку в него входят и смысловые отношения, которые возникают между отдельными предложениями, словосочетаниями и словами в связном тексте (причинноследственные, обусловленности, одновременности, последовательности и т.п.), и те смысловые приращения, которые наводятся общей жанровой принадлежностью текста и его функцией в процессе коммуникации. Смысл может быть выражен в тексте прямо или косвенно (ср. прямое утверждение и риторический вопрос, являющийся косвенным утверждением, или прямое побуждение и косвенное побуждение в форме вопроса). Смысл может присутствовать в тексте в явной (эксплицитной) и в скрытой (имплицитной) форме. Эксплицитным считается смысл, получивший в тексте буквальное и однозначное словесное выражение. Все прочие смыслы, содержащиеся в тексте, являются имплицитными. Имплицитность смысла – понятие градуируемое. Если расположить типы имплицитной информации, передаваемой языковым выражением, по степени нарастания имплицитности, то получится следующий ряд: следствия – презумпции (пресуппозиции, то есть исходные предпосылки речевого акта) – импликатуры (смыслы, выводимые с опорой на общие принципы коммуникативного). Учитывая все сказанное, при установлении наличия / отсутствия в исследуемом тексте того или иного смысла эксперт должен располагать всей необходимой фактической информацией о ситуации, составляющей предмет обсуждения в данном тексте (референтной ситуации), и о ситуации, в которой этот текст был порожден (коммуникативной ситуации). Учитывая многообразие факторов, участвующих в формировании смысла речевого произведения, эксперт должен при необходимости пользоваться не только толковыми словарями и грамматиками, но и рядом других источников: словарями ассоциативных норм; энциклопедическими словарями и справочниками; культурологическими словарями и справочниками; словарями цитат и прецедентных текстов; учебниками и монографическими исследованиями по лексической, грамматической и синтаксической семантике, прагматике речевого общения, теории речевого воздействия, написанными на основе авторитетных теорий соответствующих областей знания. Второй задачей семантического исследования является оценка объема и содержания понятия, выражаемого словом или словосочетанием. Все слова языка обладают одним или несколькими значениями и находятся друг с другом в определенных системных отношениях: например, они могут быть синонимичны или антонимичны, могут находиться в родовидовых отношениях (спорт – родовое наименование, бокс, плавание, виды спорта) и т. п. Слова, использованные в определенном значении, могут иметь разные сферы употребления, например, относиться к общеупотребительным или терминам (колбаса – мясопродукты), к нейтральной, разговорной или книжной лексике (спать – дрыхнуть – почивать). Они могут выражать положительную или отрицательную оценку обозначаемого ими объекта или не выражать никакой оценки (богатырь – качок – атлет). Эти и другие свойства слов проявляются в том, как эти слова ведут себя в текстах. Не менее существенна для экспертизы текста лингвистическая прагматика. В особенности теория речевых актов, определяющая коммуникативную направленность высказывания (его иллокутивную силу) и сущность таких важнейших речевых категорий, как утверждение, оценка, призыв. Также не менее важна и теория речевого воздействия. Механизмы вариативной интерпретации действительности, языковое варьирование оказываются основой приемов речевого воздействия и управления сознанием адресата, процессами понимания речевых сообщений. Последнее широко используется в СМИ, в сфере публичной политики и как следствие становятся предметом судебного разбирательства. Теория аргументации дает возможность выявлять тезисы и аргументы спорных текстов, эксплицируя неявные компоненты процессы аргументирования. Анализ аргументации спорного текста спорного текста оказывается важным способом обоснования позиции стороны в судебном споре. Продукт речевой деятельности может оцениваться с точки зрения цели его порождения, выражаемого им смысла, способа выражения этого смысла и характера его воздействия на адресата или аудиторию. Объективной основой оценки этих четырех его сторон служат нормы (русского) языка. Общие нормы (русского) языка зафиксированы в грамматиках, словарях и справочниках. Частные нормы в лингвистической литературе и специальных экспертных методиках. При необходимости лингвистические наблюдения могут быть сделаны экспериментально, путем анализа выборок или эталонных корпусов текстов. Судебная лингвистическая экспертиза опирается на разные виды лингвистического анализа, такие как семантический, грамматический, орфографический и проч., поэтому базовым для экспертов, работающих в этой области, является филологическое образование. В рамках комплексной экспертизы при необходимости также используются методы психологического, графологического и других видов анализа. Лингвистика анализирует контексты употребления слов и на основании этого анализа делает выводы об их свойствах. Такие выводы фиксируются прежде всего в словарях разных типов: толковых, синонимических, антонимических, семантических, терминологических и т. п. Поэтому, чтобы получить сведения о слове, можно обратиться к словарям. Следует, однако, иметь в виду, что каждый тип словарей и каждый конкретный словарь определенного типа обладает некоторыми особенностями и не в любом из них можно найти необходимую для ответа на конкретный вопрос информацию о слове. Наиболее известные неспециалистам толковый «Словарь русского языка» С. И. Ожегова и Н. Ю. Шведовой и «Толковый словарь живого великорусского языка» В. И. Даля далеко не всегда могут быть использованы для выяснения значения слов. Первый из них содержит около 70 тысяч слов (для сравнения: в 17томном «Словаре современного русского литературного языка» более 120 тысяч слов) не все имеющиеся у слова значения. Второй словарь создавался в середине XIX века, следовательно, не может содержать появившихся позже слов и значений, а кроме того, он содержит не только слова литературного языка, но и просторечные, диалектные, профессиональные слова. Каждый словарь до некоторой степени субъективен, только сравнение данных разных словарей позволяет сделать обоснованный вывод о свойствах того или иного слова или значения. Помимо грамотной работы с большим количеством словарей лингвист при проведении экспертизы обязательно обращается к анализу употребления слова в конкретном тексте (текстах). Необходимость такого обращения связана с тем, что установить, в каком именно значении использовано слово, можно, только проанализировав контекст его употребления. Кроме того, слово взаимодействует с контекстом и может в результате такого взаимодействия претерпевать некоторые изменения, например, приобретать или утрачивать отрицательную или положительную оценку. Третья задача семантического исследования заключается в оценке степени адекватности текстов друг другу. Этот тип задач возникает при наличии как минимум двух текстов, один из которых (вторичный) воспроизводит другой (первичный), являясь его переводом или пересказом или цитируя его. В этом случае прежде всего необходимо определить, искажает ли вторичный текст смысл первичного и определить характер искажений. Чтобы оценить степень адекватности текстов, необходимо осуществить семантический анализ каждого из них и выявить выраженные в нем смыслы. При решении этой задачи семантическое исследование использует те же методы, которые применяются при определении наличия / отсутствия в тексте того или иного смысла, и на те же понятия. Обычно бывает необходимо проанализировать отдельные слова и словосочетания в первичном тексте и языковые средства, используемые для передачи их значения во вторичном тексте, то есть провести ту же операцию, которая осуществляется при оценке объема и содержания понятия, выражаемого или словосочетанием. Таким образом, решение задач, связанных с оценкой адекватности текстов друг к другу, опирается на методы и подходы, используемые направлениями семантических исследований. При проведении семантических исследований чаще всего перед экспертом ставятся следующие вопросы: • Какая информация о человеке (людях), предприятии, социальной, этнической или иной группы содержится в тексте или фрагменте текста, представленного на экспертизу ? |