8. Криминалистическая фоноскопия и лингвистическая экспертиза звучащей речи
Устный текст, зафиксированный на фонограмме, традиционно является объектом рода криминалистических экспертиз, который носит название судебной фоноскопической1 экспертизы.
При этом в ее рамках решается комплекс самых разных задач, связанный с исследованием зафиксированного на фонограмме устного текста, в том числе с применением широкого спектра лингвистических методов. Это идентификация и диагностика лиц по устной речи, толкование используемых в речи диалектизмов, жаргонизмов и т. д., установление эмоционально- психологического состояния говорящего и дословного содержания устного текста и т. д. Таким образом, при производстве судебной фоноскопической экспертизы на основе методов лингвистического анализа устной речи достигается полное изучение устного текста, как в физическом, так и ментальном плане.
Типовой задачей лингвистического исследования при идентификации говорящего по речи, записанной на фонограмме, является выявление интеллектуального функционально-динамического речевого комплекса, то есть устойчивых навыков и умений индивида при порождении высказываний в устной форме. На этой основе осуществляется решение не только идентификационных, но и диагностических задач, связанных с установлением данных о личности говорящего по его голосу и речи. 1 Термин «фоноскопическая экспертиза» используется в системе экспертно-криминали- стических подразделений МВД российских учреждений. В других ведомствах могут использоваться иные, не всегда синонимичные данному термину номинации: «фонографическая», «видеофонографическая» экспертиза, «акустико-фонетическая» экспертиза, техническое исследование магнитных записей и др.
Устная речь, записанная на фонограмме, — это сложная система взаимосвязанных характеристик, индивидуальный характер которой обусловлен относительной стабильностью высшей нервной деятельности, мыслительной, интеллектуальной деятельности, психических функций человека, устойчивостью его анатомических и функциональных параметров его речевого аппарата.
Как справедливо отмечает Р. К. Потапова, «Речевое поведение — один из сложнейший видов поведенческой деятельности человека, включающий в себя целый ряд процессов, природа которых стала понятна сравнительно недавно в результате проведения комплексных научный исследований. Известно, что только фронтальный подход к изучаемому объекту с учетом всех его связей может расширить наши знания и представления об этом объекте»1.
Применение лингвистических методов в судебной фоноско- пической экспертизе первоначально ограничивалось задачами идентификации и диагностики говорящего, установления дословного содержания разговора. В отечественной фоноскопиче- ской экспертизе использование специальных лингвистических познаний было начато в начале 70-х годов во Всесоюзном научно-исследовательском институте МВД СССР (ВНИИ МВД) криминалистами А. А. Ложкевичем, В. А. Снетковым, В. Л. Шар- шунским при тесном сотрудничестве с творческими коллективами ученых филологического факультета МГУ им. М. В. Ломоносова под руководством профессора Л. В. Златоустовой. Дальнейшее развитие лингвистическое направление получило в работах Е.А. Брызгуновой, Е. И. Галяшиной (Азарченковой), Н. Б. Кураченковой, В. Х. Манерова, Р. К. Потаповой, М. Н. Хи- тиной, В. Г. Щукина, Л. А. Рычкаловой и ряда других. Необходимо отметить, что применение лингвистических методов в судебной фоноскопической экспертизе первоначально ограничивалось задачами идентификации и диагностики говорящего, установления вербального содержания фонограммы, в большей степени опиралось на фонетический инструментальный и аудитив- ный анализ.
В последние годы лингвистический анализ стал неотъемлемой частью комплексного исследования записанной на фоно 1 Златоустова Л.В., Потапова Р.К., Потапов В.В., Трунин-Донской ВН. Общая и прикладная фонетика. — М.: МГУ, 1997. — С.4.
124 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... грамме звучащей речи для решения многих экспертных задач, связанных с получением доказательственной информации. В настоящее время при производстве фоноскопической экспертизы, на разрешение которой ставится вопрос: «Имеются ли на фонограмме признаки монтажа?», наряду с визуальным анализом магнитного носителя и инструментальным изучением сигналограммы, в обязательном порядке проводится лингвистический анализ записанной на фонограмме звучащей речи.
В настоящее время при производстве фоноскопической экспертизы, на основе методов лингвистического анализа эксперт устанавливает дословное содержание высказывания, определяет количество говорящих, осуществляет их идентификацию по представленным сравнительным образцам голоса и речи, решает другие вопросы.
При исследовании фонограммы на предмет монтажа, наряду с визуальным анализом магнитного носителя магнитооптическим методом, инструментальным изучением, сегодня в обязательном порядке привлекается высокопрофессиональный эксперт с базовым лингвистическим образованием для анализа целостности, связности, непрерывности и естественности записанной звучащей речи.
На основе лингвистического анализа эксперт с определенной долей достоверности в принципе может дать оценку половозрастных и анатомо-физиологических характеристик диктора (наличие специфики или патологии речеобразующего аппарата, необычность физического состояния, наличия признаков измененного сознания, например, под влиянием алкоголя), эмоционального состояния (отклонение от нормы, тревожность, напряженность, наличие и тип эмоций, например, волнение, удивление, страх и т. п.), психофизиологическое состояние (ненормативность, наличие патологии).
По результатам лингвистического исследования устного текста на фонограмме могут быть установлены и индивидно- личностные характеристики диктора, например, родной язык, степень владения данным языком, уровень образования и развития речевой культуры, социокультурный статус (социальная принадлежность, воспитание и т.п.), темперамент, самооценка, отношение к собеседникам, ролевая функция в разговоре, наличие проявлений акцента, диалекта, принадлежность к определенной профессиональной среде. Специалист может помочь в определении списка наиболее ярких, броских особенностей голоса и речи, которые запоминаются и отражаются в памяти очевидцев, могут быть использованы в качестве вспомогательного средства для опознания преступника. Такая научная работа в настоящее время проводится, и в ближайшее время будут разработаны необходимые экспертные методики. Заметим, что вывод по таким диагностическим исследованиям, как правило, делается специалистом в вероятной форме и имеет ориентирующее значение.
В судебных разбирательствах сегодня нередки ситуации, когда обвиняемый или свидетель отказываются от своих показаний, данных как в устной форме в ходе допросов с применением звукозаписи, так и в письменной при собственноручной их фиксации или написании так называемого «чистосердечного признания». При этом в качестве аргументов высказываются утверждения, что данные устные или письменные показания были составлены с «чужих слов» или под диктовку.
Поэтому следующая задача, решаемая экспертом-фоноско- пистом с базовым лингвистическим образованием, — установление факта необычного состояния или необычных условий порождения устного или письменного текста.
Коллективом авторов1 были подготовлены методические рекомендации, посвященные проблеме идентификации диктора по русскоязычной речи с признаками интерференции национального языка (по материалам кавказских языков).
В последнее время очень активно развиваются разнообразные технические системы определения индивидуальности говорящего по речевым характеристикам.
Интерес к решению прикладных задач в этом направлении определяется наличием широкого круга практических приложений, которые могут быть разделены, по мнению В. И. Галу- нова, на два обширных класса: проверка прав доступа к различным системам (информационным и физическим): каналы связи; вычислительные системы; базы данных; банковские счета; служебные и индивидуальные помещения ограниченного пользования (секретность, материальные ценности и т. п.); различные устройства и механизмы (транспортные средства, оружие и т.п.); и т.д. 1 Галяшина Е.И. (руководитель научного проекта), Голощапова Т.И., Ремизова Н.А., Панасюгина Л.Е. и др.
127 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... Исследования в области речевых технологий в России (Советском Союзе) имеют довольно длительную историю. Известно, что работы по компрессии речи начались в начале 50-х годов, а по автоматическому распознаванию — в конце 50-х, а первая в мире система автоматического распознавания речи была продемонстрирована в 1939 году в Ленинградском Государственном Университете Л. Л. Мясниковым. В 60-х годах российские разработки в области речевых технологий значительно опережали достижения специалистов других стран, как в теории, так и на практике. Это было вызвано наличием комплекса прикладных задач, связанных с обороной страны, решение которых базировалось на интенсивных фундаментальных исследованиях.
В 70-х годах в области практического создания речевых систем приоритет был у США — благодаря тому, что военное ведомство организовало ряд конкурсных проектов, предоставив для них финансирование и возможность использования своих богатых вычислительных мощностей. Количество исследователей, работающих в это время в США, в области речевых технологий, по данным В. И. Галунова, превышало количество речевиков в Советском Союзе минимум в 10 раз. Тем не менее уровень теоретических и прикладных разработок в Советском Союзе и США до середины 80-х годов оставался приблизительно одинаковым. В настоящее время помимо США в области речевых технологий активно и очень успешно работает еще EC и ряд стран (Япония, Канада, Австралия, Великобритания).
В настоящее время научные исследования, стимулируемые практическими интересами, сконцентрированы на поиске оптимального решения проблемы автоматического распознавания и синтеза речи путем попыток внедрения новых подходов к речевым технологиям.
Если прежде каждая из практических задач решалась автономно (распознавание, синтез речи, идентификация, верификация говорящего), то сегодня, со всей очевидностью, актуализируется интерактивное речевое взаимодействие человека с различными техническими системами.
Анализ взаимоотношений речевой науки и речевых технологий показывает, что речевые технологии более инертны, чем речевая наука. Крайне важно, чтобы при интерактивном взаимодействии человека и распознающей системы разрыв между принятыми в речевых технологиях моделями и моделями речевого поведения человека был сведен к минимуму.
Наиболее популярным (и наиболее эффективным) в автоматическом распознавании речи сегодня является использование марковских моделей. Однако многие ученые критически оценивают перспективность применения данного метода. По мнению профессора В. И. Галунова, речь не является структурой, точно подчиняющейся вероятностным законам. Кроме того, опыт исследования компилятивного синтеза речи с помощью аллофонов или дифонов показывает, что количество структурных единиц речи, обладающих физическим и перцептивным единством, составляет многие сотни. Это заметно превышает количество таковых элементов, предполагаемых в современных марковских моделях речи. Используемый в основном в автоматическом распознавании, метод на основе марковской модели носит статистический характер, который далеко не соответствует механизму речевого поведения человека.
Рассматривая анализ речевых процессов у человека, В. И. Галунов подчеркивает, что близость систем автоматической обработки речи к организации обработки речи у человека представляется критической. Математические модели обработки речевой информации показали свою ограниченность и не позволяют решить сложные, но решаемые легко человеком проблемы, связанные с распознаванием слитной речи без подстройки под диктора.
Накопленные в науке и практике знания о процессах восприятия речи, распознавания речевых элементов, организации продуцирования речи, которые были бы полезны для оптимизации существующих технических систем, довольно ограниченны.
Научные исследования, нацеленные на изучение речевого поведения, часто не могут быть формализованы и переведены в вид моделей, доступных для компьютерного моделирования и дальнейшей их проверки. Это приводит в дальнейшем к невозможности их использования в речевых технологиях. Вследствие этого в последние годы речевые исследования и речевые технологии развиваются в значительной степени автономно. В результате достижения в области речевых технологий используют малую часть имеющихся знаний о речевом поведении человека, а само развитие речевых технологий не расширяет саму сферу 128 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... знаний о процессах продуцирования и обработки человеком речевой информации.
Знания и результаты исследований в области речевого поведения человека являются важным, но пока слабо используемым источником прогресса в области автоматического распознавания и синтеза речи. Важно учитывать, что перспективным направлением практического использования систем распознавания и синтеза является их взаимодействие с человеком.
Попытки использовать накопленные эмпирическим путем знания о структуре периферии слуховой системы для разработки построения системы первичного анализа при автоматическом распознавании речи не привели к принципиальному решению поставленной проблемы. Гипотеза о повышении надежности и помехозащищенности таких систем распознавания не нашла своего экспериментального подтверждения вследствие несоответствия характеристик формализованных моделей с биологическим прототипом.
Очевидно, что преимущества периферического слухового описания могут быть оценены только в общей модели восприятия речи, включающей центральные уровни обработки. При этом сам периферический слуховой анализатор неидеален с точки зрения системного анализа процесса продуцирования и восприятия речи.
В реальных условиях слуховое восприятие происходит в присутствии постоянных помех. Понятно, что одно из основных требований, предъявляемых к системе любого восприятия, — это помехоустойчивость. В процессе эволюции у слуховой системы человека сформировался специальный механизм помехоустойчивости, основанный на механизме обнаружения и локализации звука.
Известно, что защита от интенсивных помех и от маскировки собственным голосом при восприятии внешней речи во время фонации осуществляется с помощью стременной мышцы среднего уха, сокращение которой увеличивает жесткость цепи слуховых косточек, что уменьшает проводимую ими энергию (так называемый акустический рефлекс).
Большое значение в восприятии зашумленной речи имеет бинауральное взаимодействие правого и левого каналов слуховой системы, приводящее к снижению порогов обнаружения речи (до 15 дБ) и повышения ее разборчивости (до 6 дБ). Для слуховой системы человека характерна также кратковременная адаптация, проявляющаяся в уменьшении реакции в течение первых 50—100 мс действия стимула, что способствует подчеркиванию его переднего фронта и подавлению реакции в перерывах между сигналами.
Особенное значение для обеспечения помехоустойчивости восприятия, как показано в работах В. И. Галунова (2001), имеет многоканальная организация слухового анализатора, в основе которой лежит деление на каналы по признаку частотных диапазонов. Пространственная упорядоченность нейронов, соответствующая распределению резонансных частот на базиляр- ной мембране, характерна для всех уровней слуховой системы. Она является не только способом кодирования информации о частоте сигнала, но, прежде всего, служит основой для выделения локальных по спектру особенностей сигнала, отражающихся в определенных частотных каналах. Это при наличии большого числа каналов, содержащих элементы с различными свойствами (порогами и типами реакции, постоянной времени, характеристическими частотами, динамическим и частотным диапазонами реакции и др.) обеспечивает детальное представление сигнала в слуховой системе.
Существование же в каждом канале элементов с различными свойствами обеспечивает способность выделения различных признаков стимулов. Так, наличие быстро и медленно адаптирующихся элементов дает возможность выделять, соответственно, стационарные и изменяющиеся во времени отрезки сигнала. Все это позволяет при маскировке одних признаков сигнала распознавать сигнал с помощью других его признаков (или способов обработки), устойчивых в данных условиях. Примером решения одной задачи несколькими способами может служить обнаружение изменений частоты основного тона гласного, которое может осуществляться посредством оценки изменений первой гармоники или более мощных и других гармоник, а также по изменению средней спектральной огибающей сигнала.
Анализ эмпирических и экспериментальных данных позволяет заключить, что левополушарная обработка речи осуществляется преимущественно последовательно, т. е. распознаванию смысла сообщения предшествует процесс выделения временных составляющих сигнала, соответствующих лингвистическим 130 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... единицам (фонемам, слогам), определение характеристик и идентификация этих составляющих. Правое полушарие использует преимущественно целостный способ обработки, при котором поступающие сигналы сопоставляются с хранящимися в памяти эталонами слуховых образов и акустической картины целых слов или более крупных элементов текста.
При восприятии речевых сигналов в помехах существенно возрастает роль правого полушария. Это вызвано задействованием механизма вероятностного прогнозирования, а также использованием просодических признаков речевого сигнала, на которых базируется целостный способ обработки (мелодика, ритмика). Известно, что эти признаки наиболее помехоустойчивы.
Шум, затрудняя процесс слуховой обработки сигналов, приводит к возрастанию нагрузки на элементы слухового анализатора и повышению степени их утомляемости. Естественно, работа параллельного канала (левого полушария), выполняющего часть обработки, увеличивает помехоустойчивость всей системы. При том, что правое полушарие не обладает способностью делить речевое сообщение на элементы, подобные фонемам.
В. И. Галунов обосновывает тезис о наличии отдельного речевого канала в системе восприятия, что в значительной степени объясняет cocktail-party эффект и наличие у младенцев врожденной способности отличать речь от неречи, а также различать речевые признаки до овладения речью.
Проведенные эксперименты убеждают в раздельности речевой и неречевой составляющих слуховой системы и о функциональной блокировке речеслуховой системой механизмов восприятия неречевых составляющих звука. При этом способность различать некоторые признаки, которые не используются в данном конкретном языке, исчезает по мере овладения речью.
Следует указать еще на одну особенность восприятия речи человеком, Речевой сигнал даже в очень узкой полосе частот, причем расположенной в любой части речевого диапазона, достаточно хорошо распознается человеком. Существует мера разборчивости, обладающая свойством аддитивности при расширении частотного диапазона: индекс артикуляции или фор- мантная разборчивость.
Любопытные данные были получены при исследовании восприятия певческих голосов. Так, например, было установлено, что в спектре певцов с хорошо поставленными голосами име ются, по крайней мере, две частотные области, две группы обертонов с повышенным уровнем. Эти области называют певческими формантами. Их положение на оси частот и уровни определяют характер певческих голосов и их специфическое свойство, называемое музыкантами носкостью или полетностью. В зависимости от частот формант, различают виды мужских и женских голосов: бас, баритон, тенор, контральто, меццо-сопрано, сопрано. Для мужских голосов характерны нижняя форманта в области частот примерно 300—600 Гц и высокая в области частот примерно 2,5—3 кГц. Низкая форманта придает мужскому голосу своеобразную массивность, ощущение мощи, высокая — носкость, способность переноситься вдаль, перекрывать звучание оркестра. Заметим, что данное свойство особенно важно в опере, где оркестр, помещающийся перед сценой, в оркестровой яме, находится к слушателям ближе, чем певцы- солисты, и голоса солистов должны «переноситься» через оркестр. Ноский голос — не обязательно громкий. Бывает, что голос, вблизи воспринимаемый как сильный, «громоподобный», оказывается совсем неслышным в большом зале. Наоборот, казалось бы, слабый голос певца бывает хорошо слышен вдали.
Объяснение причин носкости дал выдающийся русский ученый С. Н. Ржевкин. Его объяснение развили отечественные ученые Е. А. Рудаков и Д. Д. Юрченко. Они показали, что это свойство присуще лишь тем голосам, в которых широко развита высокая форманта. Певцу, обладающему ею, легко выработать отличную дикцию, его хорошо слышно в большом зале. Физиологическая причина носкости та, что частоты развитой высокой форманты приходятся на область наибольшей чувствительности слуха.
В женских и детских голосах все форманты расположены несколько выше, чем в мужских. Этим объясняется, что хороших женских голосов заметно больше, чем мужских. Заметим, что в женских голосах высокая певческая форманта менее важна, чем в мужских, так как спектры сопрано или меццо-сопрано и без того богаты составляющими верхних частот и потому обладают хорошей носкостью.
Носкостью, полетностью обладают не только хорошие певческие голоса, но и музыкальные инструменты, даже не обладающие большой акустической мощностью. Таковы, например, скрипки великих итальянских мастеров Амати, Гварнери, Страдивари. 132 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... Носкость в настоящее время оценивают численно, используя явление маскировки звука. В измерительную установку входят генератор белого шума, магнитофон с фонограммой исследуемого звука, смеситель, головные телефоны и измеритель уровня. Шум и сигнал подают через смеситель на головные телефоны и измеритель уровня. Белый шум представляет собой как бы звуковую завесу, которую должно преодолеть звучание голоса или инструмента. Уровень шума поддерживается постоянным, например 80 дБ, а уровень голоса уменьшают, пока голос не станет еле слышен на фоне шума. Этот уровень — порог слышимости голоса в шуме. Его называют коэффициентом носкости (полетности). У хороших певцов этот коэффициент равен 25—30 дБ, у певцов-любителей 15—20 дБ. Коэффициент носкости известного тенора С. Я. Лемешева составлял 28 дБ. Если из хорошего, «звонкого» голоса фильтром вырезать высокую певческую форманту, коэффициент носкости упадет с 25—30 до 12—15 дБ.
Заметим, что описанная особенность важна не только для восприятия вокальных партий или музыкальных произведений, но и речи. Замечено, что речь, порождаемая в условиях шумов или записываемая на материальный носитель с искажениями, легче воспринимается на слух, если в голосе говорящего присутствует сильно развитая высокая форманта.
В. И. Галунов в своем обзоре современного состояния речевых технологий в России и за рубежом отмечает, что многие варианты использования речевых технологий (автоматическое распознавание и синтез речи) предполагают автоматическую идентификацию пользователя. Прежде всего это касается использования речевых технологий в телефонных сетях, где приходится решать все задачи обработки в их единстве: распознавание и синтез речи, распознавание личности говорящего и компрессия речи.
Задачи определения личности говорящего традиционно принято подразделять на верификацию и идентификацию. При этом под верификацией подразумевается, что диктор предъявляет эталонный образец своего голоса, произнося парольную фразу (называет имя, фамилию, PIN-код, пароль или имя доступа — login). Система автоматического распознавания индивидуальных характеристик голоса и речи (или эксперт) должна подтвердить или отвергнуть индивидуальность данного конкретного лица. Предъявить пароль (а следственно, и право индивидуального доступа к системе или средству информации) может как истинный носитель данной индивидуальности, так и злоумышленник. Исходя из риска потерь в случае возможного несанкционированного доступа, можно для данной системы определить допустимую вероятность пропуска «чужого».
В целом система верификации может быть охарактеризована ошибками 1-го рода (захват ложной цели или, в нашей интерпретации, это принятие злоумышленника за зарегистрированного пользователя) и ошибками 2-го рода (пропуск цели или отказ признать зарегистрированного пользователя). Каждая данная система может перестраиваться таким образом, что ошибки одного рода могут быть уменьшены за счет увеличения ошибок другого рода (даже при сохранении всех других факторов, влияющих на вероятность ошибки: длительности и характера речевого сообщения, помехи и т.п.). Изменение соотношения ошибок 1-го и 2-го рода достигается путем изменения порога принятия решения.
Классическая процедура идентификации диктора на закрытом множестве подразумевает, что имеется ограниченная и строго контролируемая группа пользователей системы. При поступлении речевого сигнала на вход системы определения индивидуальных речевых характеристик эта система должна определить, кто из пользователей в настоящий момент вступает в речевой контакт с системой ограниченного доступа. В определенном смысле так формулируемая задача идентификации говорящего проще задачи верификации, сформулированной выше. В этом случае исключена ситуация допуска возможного злоумышленника. Разделение же допущенных пользователей (особенно при их небольшом количестве) может оказаться более простой задачей, чем задача верификации.
Пропускная биометрическая система может быть охарактеризована средней вероятностью правильной идентификации.
К сожалению, среди возможных применений ситуация идентификации на закрытом множестве возникает достаточно редко. Примерами могут быть анализ и протоколирование переговоров экипажей самолетов или подводной лодки, выявление каналов утечки информации при контроле телефонных разговоров и т. п.
В большинстве приложений (особенно криминалистических) возникает ситуация так называемой идентификации на 134 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... открытом множестве («open set identification»). В этом случае ситуация аналогична описанной выше верификации, но отличается тем, что пользователь не объявляет свою индивидуальность (фамилию, PIN-код или другой индекс индивидуальности) и система должна сверить поступивший речевой сигнал со всеми речевыми эталонами зарегистрированных пользователей. Таким образом, задача открытой идентификации совпадает с задачей многократной верификации.
В. И. Галунов отмечает еще один специфический вариант задачи верификации. Возможно возникновение такой ситуации, когда злоумышленник не пытается получить доступ к системе ограниченного пользования, а предоставляет сделать это санкционированному (зарегистрированному) пользователю системы. После того как доступ к системе открыт, злоумышленник заменяет санкционированного пользователя и получает доступ к интересующей его информации или передает в систему связи какие-либо команды. Задачей системы идентификации в описанной ситуации является обнаружение смены индивидуальности говорящего. Очевидно, что смена диктора, скорее всего, происходит во время речевой паузы. Таким образом, после каждой речевой паузы может возникнуть необходимость подтверждения идентичности диктора.
В криминалистической практике эта ситуация аналогична последовательной смене абонентов телефонного разговора, передающих трубку телефона другому участнику в речевой паузе.
В ряде случаев по речи требуется определить не индивидуальность говорящего, а некоторый групповой признак: возраст, наличие того или иного акцента или регионального типа произнесения, наличие патологии голоса и т. п. Этот тип задач возникает в основном при криминалистической экспертизе или контроле каналов связи. Чаще всего решение таких задач опирается на слуховую экспертную оценку анализируемого речевого сообщения и использует автоматические способы анализа только на предварительном этапе или как вспомогательные.
Все перечисленные выше виды задач верификации и идентификации могут быть разбиты на два больших класса в зависимости от используемого речевого материала: тексто-зависимые и тексто-независимые. Разница между этими двумя классами заключается в том, является ли исследуемый речевой отрезок лингвистически подобным сравнительному образцу или нет. Очевидно, что совпадение лингвистической формы сопоставляемых речевых сообщений существенно упрощает процесс идентификации (верификации).
По способу решения задачи идентификации могут быть разделены на автоматические системы и субъективные (экспертные). Экспертные методы исходно появились в связи с присущей человеку способностью различать индивидуальные голоса. При этом субъективная экспертиза может опираться как на слуховой анализ речевых сообщений, так и на анализ видеограмм, т. е. на то или иное визуально анализируемое изображение речевого сигнала.
Преимуществом перцептивного анализа является то, что способность к определению индивидуальности на слух является имманентно присущей речеслуховой системе человека. К сожалению, психо-акустических работ, связанных с анализом этой особенности человека, очень мало. Скорее всего, анализ знакомых и незнакомых голосов использует разные процедуры. Более того, соответствующие центры в мозгу находятся в разных полушариях. Кроме того, дискриминационные возможности слуховой системы (вопреки имеющемуся мнению) относительно индивидуальных характеристик весьма ограничены.
Однако в настоящий момент следует учитывать следующие факторы, которые дают преимущества слуховым методам анализа признаков индивидуальности говорящего. Слуховая система использует различительные признаки, отличающиеся от тех, которые используются большинством автоматических систем. Голоса, очень похожие субъективно, хорошо различаются автоматическими системами, и наоборот. В практических задачах может быть использована двухступенчатая процедура идентификации говорящего. На первом этапе автоматическая система производит отсев кандидатов, не допуская при этом ошибок второго рода (пропуска цели). Тем самым сокращается объем работы эксперта по слуховому анализу для окончательного решения. При этом сохраняется возможность сравнивать по субъективным различительным признакам голоса, плохо различимые системой автоматической идентификации говорящего. Кроме того, речеслуховая система для идентификации говорящего использует, как правило, яркие отличительные черты, характерные именно для данного индивидуума. Для систем автоматической идентификации характерен статистический подход, 136 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... который не адекватен качественным различительным признакам: наличие какой-либо патологии голоса или речи, яркие акцентные или диалектные черты, заикание и т. п. При этом следует отметить, что речеслуховая система использует параллельно и индивидуальные признаки речевого сигнала, имеющие вероятностный характер: высота голоса, тембр и др.
Таким образом, слуховая система использует не только другие признаки, чем ныне существующие системы идентификации говорящего, но и принципиально другой подход к решению задачи идентификации.
Это объясняется тем, что в области высоких частот мы имеем чисто спектральный слух не очень высокого разрешения, а для частот близких к речевому диапазону — более полный, основанный не только на разделении спектра, а еще и на дополнительном анализе информации самим мозгом, давая более полную стереокартину. Динамический диапазон (от самых тихих воспринимаемых звуков до самых громких) речи составляет около 96 дБ (или более чем 1 к 30 000 по линейной шкале). Основное восприятие звука происходит в диапазоне 1—4 кГц, в этом же диапазоне находится речь. С возрастом слышимый человеком частотный диапазон сужается. Корректная передача этого частотного отрезка — первое условие естественности звучания. Но, помимо высоты звука, мы способны достаточно точно определять положение звукового источника в пространстве. Это означает, что звуковые волны должны обладать свойством, на которое реагирует наш слуховой аппарат. Слуховые приемники (уши) разнесены на некоторое расстояние друг от друга, поэтому звук в каждое из них поступает не в одно и то же время, а в разное. По задержке попадания одной и той же звуковой волны на барабанные перепонки мы и определяем пространственное положение источника звука.
Таким образом, бинауральный слух, играющий большую роль в локализации источника звука, лучше всего развит на частотах, меньших 1,5 кГц. Выше этой частоты источником информации о местоположении служит лишь разница амплитуд сигнала для левого и правого уха.
Слуховая система нелинейна и не может быть точно описана с помощью только линейных элементов (таких, как фильтры и линии задержки). Как побочный результат нелинейности может проявляться, например, следующий эффект: при подаче двух тонов с частотой 1000 и 1200 Гц может также быть слышен третий тон с частотой 800 Гц.
В области частот 1—4 кГц чувствительность уха по всем параметрам максимальна. Человек среднего возраста может чувствовать звуки от 10 Гц до 20 кГц, осмысленно слышать — от 30 Гц до 16 кГц. Звуки выше и ниже воспринимаются, но не составляют акустических ощущений. Звуки выше 16 кГц ощущаются как раздражающий неприятный фактор — давление на голову, боль, особо громкие звуки приносят резкий дискомфорт. Звуки ниже 30—40 Гц при достаточной амплитуде воспринимаются как вибрация. Человек акустически почти не определяет пространственное положение настолько низких звуков, поэтому они ощущаются телом.
Рассмотрим пространственное разрешение человеческого слуха, то есть способность к локализации источника звука.
Согласно работам психоакустиков Б. Мура (Англия) и Б. Хартмана (США), при локализации единичного источника точность локализации в горизонтальной плоскости достаточно высока и составляет примерно 3 градуса, хотя имеются данные, что минимальное разрешение смещения источника может составлять даже 1 градус. Существуют два механизма локализации источника в горизонтальной плоскости:
на низких частотах (до 1500 Гц) — это оценка разности по времени прихода звука к разным ушам. При угловом смещении в 1 градус разница по времени составляет 10 мс, что показывает высокую точность оценки в слуховой системе;
на высоких частотах (выше 2 кГц) — это оценка разности по интенсивности, возникающая за счет дифракции звука вокруг головы. В реальных условиях человек может в большинстве случаев достаточно уверенно локализовать источники звука. Это связано с тем, что обычно спектры звуков каждого источника существенно различаются. Как правило, сигналы рассинхронизова- ны (включаются и звучат неодновременно), и поэтому слуховая система, выполняя спектральный анализ, справляется с задачей локализации.
Человеческая система восприятия звука имеет ограниченное, зависящее от частоты разрешения. Равномерное, с точки зрения восприятия человеком, измерение частоты может быть выражено в единицах ширины критических полос: менее 100 Гц 138 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... для нижних слышимых частот и более 4 кГц для наиболее высоких. Весь частотный диапазон может быть разделен на 25 критических полос. Если громкий звук внезапно прекращается, то слуховой системе требуется некоторое время, чтобы услышать более тихий звук. Этот эффект называется временное или последовательное маскирование.
Однако слуховые методы речевого сигнала экспертизы слабо освещены в литературе. Помимо слуховых методов, при субъективной оценке индивидуальности говорящего возможно использование зрительного анализа тех или иных видов визуализированной речи. Явным преимуществом такого подхода является возможность длительного во времени анализа картинок «видимой речи» (в отличие от мгновенного слухового впечатления). Однако сама возможность идентификации говорящего с помощью того или иного визуального анализа в научном плане слабо обоснована. В 60-х годах в США была популярна методика анализа визуалограмм Керста. Она была даже в течение некоторого времени принята как официальная для доказательства в суде. Однако после одного из громких судебных процессов ряд ведущих речевиков показал, что реально экспертиза по методике Керста недостоверна.
Слуховая перцепция — неотъемлемый атрибут исследования звучащей речи. Восприятие речи экспертом-речеведом — фундаментальный процесс, принципиально предопределяющий возможность судебно-экспертной деятельности по исследованию фонограмм, фигурирующих в судопроизводстве в качестве доказательств. Как известно, не прослушав фонограмму, нельзя установить ее относимость к делу, определить — есть ли на ней криминалистически значимая звуковая и вербальная информация, составить так называемую расшифровку или стенограмму дословного содержания записанных переговоров, отобразив вербальные компоненты звуковой речи в графической форме, доступной для чтения и понимания участниками судопроизводства.
Слуховой анализ — обязательный компонент и других видов комплексного судебно-экспертного исследования речи в рамках процессуальной проверки достоверности и подлинности фонограмм.
Уникальность и принципиальное отличие этого рода экспертного исследования от всех видов судебных экспертиз заключается в том, что не зрительный, а слуховой анализатор человека выступает в роли основного исследовательского инструмента. Аудитивная перцепция эксперта воспроизводимой звуковой информации неизбежно пронизывает все стадии исследования фонограммы, начиная от самой предварительной и заканчивая решением большинства вопросов данного рода судебной экспертизы1. И хотя психологически человек склонен с большим доверием относится к информации, поступающей по визуальному каналу, чем по акустическому, тем не менее, даже при наличии современных способов визуализации звуковых сигналов с помощью различных устройств и приборов без субъективного слухового анализа речевого потока обойтись в принципе оказывается невозможно.
Слуховая перцепция неотъемлема от технологии исследования фонограмм в силу специфики самого объекта — звуковой информации, зафиксированной на материальном носителе. Посредством прослушивания определяются наличие и содержание звучащей речи, местоположение фонограммы на материальном носителе, временная протяженность (длительность звучания), язык, степень разборчивости, способ порождения и форма интеракции в момент звукозаписи. На уровне аудитив- ного восприятия эксперта устанавливается дословное содержание записанного разговора (диалога, монолога, полилога). В результате анализа слухового образа реконструируется ситуация коммуникативного акта в момент речепорождения и ее звукозаписи на материальном носителе: количество участников, их взаимоотношения и распределение ролевых функций, условия записи в помещении или на открытом пространстве, особенности использованной аппаратуры для съема, передачи и записи звуковых сигналов и т. д.
Аудитивный анализ — неотъемлемый атрибут всех видов анализов, этапов и стадий исследования речевого сигнала при решении задачи идентификации диктора по голосу и речи. При участии слухового анализатора проводится фонетический 1 В данной работе мы не будет вдаваться в дискуссию относительно названия данного рода судебной экспертизы, переадресовав читателей к следующей работе: Галяшина Е.И. Прикладные аспекты судебной фоноскопической экспертизы // Теория и практика судебных экспертиз. — СПб.: Питер, 2003. Укажем только, что термин «фоноскопическая» не является абсолютным синонимом термина «фонографическая», который нередко употребляют только в отношении идентификации диктора по голосу и речи, в отличие от технического исследования магнитной звукозаписи при решении вопроса монтажа фонограмм.
141 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... анализ, осуществляются разделение (дифференциация) говорящих, атрибуция реплик, распознавание источников записанных речевых и иных акустических сигналов и диагностика звуковой обстановки, существовавшей при записи, объясняются причины возникновения различных артефактов.
Аудитивная оценка качества звучания фонограммы обязательна на этапе предварительного анализа, целью которого является идентификация диктора по голосу и речи. Уже на этапе определения степени пригодности записанного на фонограмме речевого сигнала для идентификационных исследований и соотнесения их с существующими критериями эксперты непременно фиксируют не только результаты инструментальных измерительных процедур (технических параметров фонограммы), но и собственное впечатление о качестве воспроизводимого речевого сигнала на уровне слуховой перцепции эксперта. При решении вопроса о степени сопоставимости сравнительных образцов и спорной фонограммы по эмоциональному состоянию, форме и содержанию речевого материала результаты именно слухового восприятия разнообразных тонких отличий и нюансов, обусловленных экстралингвистическими факторами, приобретают первостепенное значение.
Впечатление эксперта об акустической обстановке, существовавшей при записи, базируется на его субъективной оценке размеров помещения или наличия открытого пространства, на количестве участников разговора, характере их взаимоотношений по воспроизводимому звуковому сигналу. Для получения объективных оценок важно учитывать, что речевой сигнал неизбежно претерпевает определенные искажения при записи и воспроизведении. Оптимизируя условия для прослушивания, можно в определенной мере компенсировать или уменьшить информационные потери от искажений, повысить комфортность восприятия и снизить утомляемость эксперта. Поэтому крайне важна перцептивная оценка таких параметров, как четкость голосовой фактуры, разборчивость текста, естественность, натуральность тембральной окраски, степень искажения речевого сигнала. Восприятие тембральной окраски голоса и речи может существенно изменяться не только от характеристик записывающей, но и воспроизводящей аппаратуры. Так, например, при повышенных нелинейных искажениях в тракте звукопередачи и звукозаписи, детонации при записи, а также при возникающих в аппаратуре искажениях нестационарных процессов могут искажаться перептивные признаки тональных и нетональных звуковых сегментов, атаки звуков, их затухание, переходы от одного звука к другому. При превышении уровня звукозаписи могут появляться сильные нелинейные искажения, заметная на слух детонация, помехи срабатывания автоматических регуляторов уровня (ограничителей, компрессоров), трески и другие помехи, маскирующие криминалистически значимые перцептивные фонетические особенности.
Результаты слухового восприятия отражаются и описываются экспертом в виде значений идентификационных признаков перцептивной и фонетической групп. Прослушивание обязательно сопровождает и инструментальный идентификационный анализ, помогая выделить отрезки фонации, триады и иные элементы звукового потока, подлежащие объективным измерениям, сравнению числовых значений акустических признаков. Слуховой контроль присутствует и на этапе сравнительного анализа и оценки выявленной совокупности признаков, без чего невозможно принятие решение о тождестве или различии сравниваемых по голосу дикторов.
Слуховой анализатор — практически единственный инструмент для решения диагностических задач фоноскопии: определения данных о возрасте, половой принадлежности, социальной среде и месте формирования языковых навыков, эмоциональном состоянии говорящего в момент записи речи и др.
Особое значение приобретают результаты слуховой перцепции при проверке аутентичности фонограммы, при установлении однородности звукового фона, целостности и связности устно-речевых единиц, правильной квалификации тех или иных артефактов, выявлении не только признаков монтажа, но и следов иных манипуляций (намеренных искажений голоса и речи, маскировки, имитации и инсценировки) и т. д.
Как мы видим, ни один этап действий эксперта-речеведа не может обойтись без обязательного и постоянного слухового контроля записанного на фонограмме речевого сигнала. Какие бы точные измерительные приборы и изощренные методы визуализации звука ни применяли эксперты, тем не менее, вывод экспертизы звучащей речи начинает формироваться и окончательно оформляется только с учетом слухового восприятия записанной на фонограмме звучащей речи. 143 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... Измерениям технических параметров фонограмм, инструментальным методам исследования речевых сигналов и соответствующим рекомендациям посвящена обширная специальная методическая и техническая литература, система стандартов многих стран. Тогда как особенностям индивидуальной слуховой перцепции эксперта в аспекте фоноскопической экспертизы столь пристального внимания не уделялось. В то же время опыт работы экспертов ГУ ЭКЦ МВД РФ, судебно-экспертных учреждений других ведомств показывает, что от чувствительности слуха, качества слухового анализатора, оптимизации условий и корректности применения слуховой перцепции как метода экспертного исследования фонограммы могут зависеть достоверность выводов экспертов и, как следствие, надежность статуса фонограммы как судебного доказательства.
Доминирование метода слухового анализа звучащей речи и специфические условия его применения предъявляют определенные требования к субъекту перцепции (эксперту), условиям прослушивания (помещению) и средствам звуковоспроизведения (рабочему месту эксперта). И если исправить и улучшить сам объект экспертизы — фонограмму часто нельзя, то добиться более хороших результатов за счет оптимизации воспроизводимого и соответственно улучшения качества воспринимаемого ухом сигнала до определенного предела вполне возможно. Не секрет, что результативность, достоверность и объективность слуховой перцепции во многом зависит от того, кто слушает, что слушает, где и посредством чего слушает, как графически отображаются результаты услышанного в форме письменной расшифровки или так называемого текстового содержания звучащей речи.
Таким образом, система звуковоспроизведения может быть представлена триадой: звучащая фонограмма — эксперт — графический аналог слухового образа, где центральная фигура процесса слухового анализа речи — это эксперт, то есть субъект слуховой перцепции и распознавания слуховых образов.
Исследования связи эффективности деятельности эксперта по аудитивному анализу фонограмм и индивидуально-типических различий личности эксперта, показало, что свойства нервной системы оказывают заметное влияние на динамику и результативность восприятия звуковой информации. Эксперты, отличающиеся друг от друга в типологическом отношении, по-разному приспосабливаются к деятельности, в основе которой лежит слуховая перцепция. Для людей подвижных характерны относительно легкая адаптация к быстроменяющимся условиям слуховой перцепции, быстрая перестройка знаний в соответствии с конкретной экспертной задачей. Для инертных — равномерный, последовательный темп слухового анализа, наличие большего числа операций по прослушиванию сложных для восприятия участков фонации, большее время слуховой адаптации, затруднения в перестройке и смене режимов деятельности.
В рекомендациях МЭК (Международной Электротехнической Комиссии), касающихся особенностей проведения субъективных аудиоэкспертиз1, ставится задача протестировать эксперта с целью выявления возможностей его слухового аппарата и недопущения до работы людей с редукцией слухового восприятия. В рекомендациях других международных организаций на первый план выступает задача выявления особенностей звукозаписывающей и звуковоспроизводящей аппаратуры, сводящие к минимуму всевозможные искажения записываемого и воспроизводимого сигналов. В первом случае на первый план выходит человек как инструмент слухового анализа, во втором — оборудование как средство, вносящее искажение в воспринимаемый слуховым аппаратом человека сигнал.
В данной работе мы рассмотрим только те моменты, которые могут повлиять на результаты, качество и эффективность применения метода слухового восприятия в судебно-экспертной практике.
Какие же требования предъявляются к личности эксперта как субъекту слуховой перцепции звучащей речи?
Как известно, в психологии личность рассматривается как социальное свойство индивида, как совокупность интегрированных в нем социально значимых черт, образовавшихся в прямом и косвенном взаимодействии данного лица с другими людьми и делающих его, в свою очередь, субъектом познавательной деятельности и коммуникации2. 1 Справедливости ради укажем, что эти субъективные экспертизы к фоноскопии имеют лишь отдаленное отношение, так как проводятся в основном для оценки качества звучания музыкальных произведений.
2 Леонтьев А.Н.Деятельность. Сознание. Личность. — М., 1975.
145 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... Структура личности эксперта представляется как система (половые, возрастные, индивидуальные свойства психики); психологические характеристики — отдельные психологические процессы (память, эмоции, ощущения, восприятие, мышление, чувства, воля), ставшие свойством личности и выражающиеся индивидуальным образом; опыт (знания, умения, навыки, привычки); направленность личности (влечения, интересы, склонности, идеалы, убеждения и т.д.). В целом ряде исследований выявлена взаимосвязь между показателями эффективности профессиональной деятельности и уровнем развития профессионально важных качеств.
Практика показывает, что обязателен предварительный отбор экспертов по результатам их тестирования, начиная с объективных метрологических измерений, т. е. аудиометрии, и заканчивая всесторонним психо-акустическим аудиотестом. В качестве тестовых фонограмм, например, В ГУ ЭКЦ МВД РФ используются специально подобранные фонограммы, содержащие запись определенного звукового события. По результатам аудирования тестовой фонограммы испытуемый заполняет протокол прослушивания, где указываются качество звукозаписи, количество участников, их обликовые данные, характер взаимоотношений, ситуационные особенности звуковой обстановки, отмечаются воспринимаемые на слух артефакты. В зависимости от числа правильно или ошибочно распознанных на слух звуковых событий принимается решение о пригодности или не пригодности претендента для работы в данной экспертной области.
Для профессиональной экспертной деятельности в области судебно-экспертного исследования звучащей речи недостаточно наличие у претендента на экспертную должность только музыкального слуха. Например, эксперт, специализирующийся в области фонетического анализа, должен обладать не только тренированной, цепкой слуховой памятью, способностью слышать тончайшие нюансы звучания, но и уметь воспроизвести слышимые фонетические особенности или дефекты, сымитировав тот или иной артикуляторный уклад или специфическую просодическую особенность, которые отмечаются в качестве фонетического признака сегментного или супрасегментного уровня.
Разумеется, прежде чем допустить эксперта к проведению судебной экспертизы, его необходимо специально тренировать, так как аудирование фонограммы и оценка перцептивных параметров голоса и речевого потока в целом требуют определенного опыта, развития навыка профессионального слухового анализа, расширения системы слуховых образов, хранящихся в памяти эксперта.
Как известно, становление первичных звуковых образов в сознании и слуховой памяти, которые формируют у человека слуховое представления об окружающей звуковой действительности, происходит в процессе формирования личности и неизбежно несет на себе отпечаток той культуры, той языковой и социальной среды, в которой развивается индивид, формируется его языковая личность. Первичные звуко-ассоциативные представления прежде всего детерминированы родной речью, с общим интонационно-мелодическим строем и фонетическими особенностями произношения фонем родного языка. В силу этих причин голос хорошо знакомого человека легко узнается по комплексу различных особенностей, присущих только данному конкретному лицу: тембру, интонации, специфике произнесения звуков и их сочетаний в словах, наличию характерных речений и т. д., даже при значительных аппаратурных искажениях речевого сигнала.
Как показывают результаты многочисленных психоакустических экспериментов, фонетическому строю каждого языка свойственна специфическая картина произнесения гласных и согласных звуков, которая и формирует в слуховом восприятии его носителя определенный селективный спектроанализатор, от настройки которого зависит правильность распознавания акустических феноменов: особенностей человеческой речи вообще и родной в частности. Благодаря такой способности человеческого слуха при наличии образцов иноязычной речи эксперт, даже не зная конкретного языка, в принципе может отличить, например, звучание речи на грузинском, чеченском языке и т. п.
Правильность слухового восприятия во многом определяется также тем, насколько эксперт знаком с апперцепционной базой, владеет языковым материалом, обладает теми же фоновыми знаниями, что и участники записанной на фонограмме речевой коммуникации.
Кроме того, личностные качества эксперта также могут существенно повлиять на результаты слухового анализа фонограмм. 146 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... В связи с этим можно упомянуть о результатах психо-акусти- ческих экспериментов, в ходе которых проверялась способность человека адекватно распознавать родную речь на слух в различных условиях и при разных обстоятельствах. Необходимость таких исследований была вызвана разработкой практических приложений речевых технологий в линиях телефонной, правительственной, радиосвязи (на различных диапазонах и видах модуляции), спутниковой. Результаты экспериментов показали, что на одном и том же зашумленном канале со случайными и статистическими помехами степень распознавания родной речи в несколько раз выше, чем хорошо знакомого, но неродного языка или одиночных фонем, не привязанных к смысловому содержанию высказывания. Для определения нижнего предела качества передачи канала связи, с которого начинается устойчивое распознавание характерных элементов родного языка, были формализованы критерии качества и определена степень влияния параметров канала связи на разборчивость речевых сигналов. Помимо различных искажений и помех, вносимых техническими линиями и средствами связи, влияющих на степень разборчивости родной речи, на результаты перцепции влияет способность эксперта воспринимать речь билингва с явно выраженным иноязычным акцентом, понимать смысл высказывания, несмотря на фонетические, лексико-грамматические признаки интерференции. Понятно, что в экспертной практике преобладают фонограммы с различными переговорами, записанными в основном на русском языке. Тем не менее, слуховое восприятие речи даже на русском языке, но с сильно выраженными признаками межъязыковой интерференции, может вызвать серьезные проблемы в распознавании текста и оценке идентификационных признаков.
Поэтому для эксперта-речеведа, слуховой опыт которого базируется на восприятии языка с большим числом сибилянтов и с характерной экспрессивной атакой (так называемые «взрывные» согласные), характер тембровой окраски при восприятии иноязычной речи, обладающей похожим фонетическим строем, быть отмечен как идентификационно значимый признак. Для другого эксперта, привыкшего к интонационно-мелодическому строю, например, тональных языков, обилие взрывных согласных и шипящих звуков в иноязычной речи на субъективном уровне перцепции вполне может восприниматься как аппаратурное искажение (артефакт).
И здесь возникают сразу две сложнейшие проблемы. Первая — проблема разделения ошибок слуховой перцепции по причине незнания характера звучания речи на иностранном для эксперта языке от идентификационно значимых признаков (зачастую эксперты «цепляют» непривычные для их языкового сознания особенности звучания, которые отличают всю группу носителей данного языка, а не индивидуально-конретного индивида). Таким образом, общий или групповой признак ошибочно принимается за частный.
Другая проблема заключается в том, как отличить особенности, присущие данному звуковому событию, от артефактов, которые могут быть искусственно привнесены вследствие аппаратурных искажений (завалов или наоборот подъемов частот различных диапазонов спектра при записи и воспроизведении) или дефектов настройки слухового механизма конкретного эксперта.
В литературе данных о психоакустических особенностях аудиоперцепции качества звучания или идентификационных признаков голоса и речи у представителей разных социальных, возрастных групп почти не встречается. Проведенный нами эксперимент показал, что при формировании для прослушивания разнородной по возрасту, гендерному признаку, социальному опыту группы экспертов имеют место существенные расхождения не только в оценке таких признаков голоса, как тембр, высота, сила на одном и том же тестовом материале, но и текстового содержания фонограмм с низкой степенью речевой разборчивости.
В то же время после специального тренинга с обсуждением результатов слуховой перцепции речи и опыта совместной работы эксперты в такой группе приобретают умение оценивать перцептивные параметры голоса и фонетические особенности речи так, что их субъективные мнения практически совпадают. При этом было отмечено, что субъективное ощущение громкости речи зависит от целого ряда причин, в том числе от индивидуально локализованных зон максимальной чувствительности слуха на разных уровнях громкости у разных экспертов.
Многолетний опыт работы экспертов отдела фоноскопиче- ских экспертиз ГУ ЭКЦ МВД РФ показывает, что наиболее 148 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ КРИМИНАЛИСТИЧЕСКАЯ ФОНОСКОПИЯ... достоверные результаты слухового анализа достигаются тогда, когда результаты заносятся в протоколы аудитивного анализа каждым экспертом самостоятельно. Таким образом, усредненные значения признаков, определяемых по результатам слуховой перцепции, группы подготовленных экспертов (если ауди- тивный анализ осуществляет комиссия экспертов) можно в известной степени считать объективными.
Для облегчения поставленной перед экспертами задачи нами был разработан метод аудитивного анализа фонограмм, основанный на строгой конкретизации отдельных параметров, определяющих в совокупности качество фонограммы и индивидуальные свойства источников записанных звуковых сигналов. Прослушивание должно проводиться в удовлетворяющем установленным акустическим нормам помещении через стандартные громкоговорящие установки или головные телефоны.
Кроме того, как известно, слуховая чувствительность зависит от возраста. По мере старения у человека развиваются сложные сдвиги в различных функциональных системах, которые захватывают все этажи слуховой системы: и наружное ухо, и слуховой проход, и барабанную полость, и ушной лабиринт. Ушная раковина истончается, становится дряблой, слуховой проход сужается, что затрудняет поступление звуковых волн. Барабанная перепонка утолщается. Система косточек среднего уха становится тугоподвижной, суставы между косточками хуже функционируют.
Но основная причина снижения слуха у пожилых людей — изменение звуковоспринимающего аппарата. Происходят естественная возрастная дегенерация и гибель волосковых клеток кортиевого органа. Нарушается функция слухового нерва, определенные изменения возникают и в коре головного мозга.
В то же время отмечено, что лица, ведущие интеллектуальный, активный образ жизни в пожилом и старческом возрасте, занимающиеся общественной деятельностью, имеют лучший слух, чем люди того же возраста со сниженной интеллектуальной активностью. К числу неблагоприятных факторов риска по развитию преждевременной тугоухости относятся также неправильный режим трудовой деятельности, отдыха и образа жизни в целом, погрешности в диете, вредные привычки и т. п. Таким образом, если эксперт постоянно напрягает свой слуховой аппарат, например, слушая громкую музыку, это может привести к преждевременному снижению слуховой чувствительности. Уровень окружающего непромышленного шума в целом ниже многих производственных шумов, но время воздействия на человека такого шума несоизмеримо больше. Это, по современным представлениям, может привести к необратимым изменениям слуха. Об этом говорит высокая острота слуха у людей, живущих в тихой сельской местности.
У людей, долгие годы работающих в шумном цехе, постепенно, но необратимо происходит гибель клеток кортиева органа. Сначала человек перестает различать высокие звуки. Он еще не чувствует наступающей глухоты в разговорах с товарищами, но уже не слышит стрекотания кузнечика, песни цикад. Со временем под влиянием шума слух становится все хуже и хуже, вплоть до полной его потери.
Таким образом, качество воспроизведения звучащей речи зависит не только от параметров звуковоспроизводящей техники, но и от акустических свойств помещения, расположения акустических систем. Слуховое восприятие же обусловлено не только качеством воспроизводимого речевого сигнала, но и индивидуальными слуховыми способностями эксперта. Дело в том, что даже специально подготовленные и тренированные эксперты с «золотыми» ушами могут по-разному относиться к различным аспектам воспроизведения звука.
Другая трудность аудитивного анализа психологического характера часто возникает при установлении текстового содержания записанной на фонограмме речи. Она связана с особенностями восприятия звучащей речи при условии наличия перед глазами эксперта заранее составленной письменной расшифровки, сделанной каким-то другим лицом, например следователем, при осмотре и прослушивании фонограммы. Опытные эксперты знают, что текст такой расшифровки в деталях не всегда точно соответствует звучащей речи.
Здесь надо указать и еще на одну проблему. Графическая фиксация звучащей речи требует, с одной стороны, максимально точного отображения на письме всех нюансов и специфики речепорождения, с другой — нужно приспособить ее к сложившейся письменной традиции, с тем чтобы текст был 150 125
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ЭЛЕМЕНТЫ АРМА ЭКСПЕРТА-РЕЧЕВЕДА читаемым для неспециалиста. Представление устного текста в транскрипции1 (представляющей известный компромисс между указанными тенденциями) не в полной мере удовлетворяет требованиям читаемости, поскольку распечатка (или как ее иногда называют — расшифровка текста) приобщается к материалам дела и используется в судопроизводстве в качестве источника доказательств.
Любая графическая фиксация устной речи по существу является искусственным образованием, в котором причудливо переплетаются различные способы порождения устной и письменной речи.
Речевое произведение, порождаемое в устной или письменной форме, является одновременно процессом и результатом коммуникативной деятельности. Причем для устной речи в большей степени важно, что это процесс порождения, тогда как для письменной превалирует результат. В каждом конкретном акте коммуникации фактически наблюдаемые речевые произведения определяются комплексом экстралингвистических параметров и разнообразными способами их сочетаемости (способ коммуникации, цель общения, социальный статус коммуникантов, характер отношений между ними, ролевая функция). В устном речевом произведении, в отличие от письменного, доминирует временное течение речи, ее линейная необратимость, когда планирование и продуцирование речи происходят практически параллельно.
Проявления устного способа продуцирования в виде фальстартов, повторов, коррекции, хезитации, других явлений, детально отображаемых в виде фонетической транскрипции, трудны для восприятия и озвучивания. Для изображения звуковой субстанции при установлении дословного содержания текста принята традиционная орфографическая запись, что облегчает зрительное восприятие и чтение текста. Просодическая организация речевого потока передается знаками пунктуации с словесными комментариями экстралингвистических или невербальных явлений, влияющих на восприятие смыслового содержания фразы. В качестве порции звукового потока удерживаемой в слуховой памяти эксперта удобно выбирать синтагму как результат просодического членения звучащего 1 См. например: Методическая разработка по современному русскому языку: Спонтанные тексты разговорной речи в транскрипции. Ч.1. — Л., 1983; Ч.2—3. — Л., 1984.
текста и с точки зрения перцепции — как отрезок фонации между воспринимаемыми паузами1. Здесь мы имеем триаду: звучащий текст — письменная расшифровка — озвученный текст расшифовки.
|