Галяшина Е.И. Основы судебного речеведения. Монография Москва стэнси 2003 удк 343. 148 81 ббк 67. 5 Г17
Скачать 2.7 Mb.
|
11. Акустические системы Остановимся на другом важнейшем элементе АРМ экспер- та-речеведа — это акустические системы. От качества данных систем во многом зависит успешная работа специалиста по прослушиванию звучащей речи. Обычно акустической системой (АС) называется громкоговоритель, предназначенный для использования в качестве функционального звена в бытовой радиоэлектронной аппаратуре. Под АС понимается устройство для излучения звука в окружающее пространство, содержащее одну или несколько головок громкоговорителей, при наличии акустического оформления и дополнительных электрических устройств. Головкой громкоговорителя (ГГ) называется пассивный электроакустический преобразователь, предназначенный для преобразования электрической формы сигналов звуковой частоты в акустическую. В соответствии с определением МЭК 50 (801), термин «громкоговоритель» может применяться как к акустической системе, так и к одиночному громкоговорителю, который в отечественных 166 167 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АКУСТИЧЕСКИЕ СИСТЕМЫ стандартах называется головкой громкоговорителя. Однако в технической литературе термин громкоговоритель обычно применяется к одиночным громкоговорителям, а многополосные системы, в зависимости от их назначения, называются акустической системой. Классификация ГГ может быть проведена по различным признакам. Основные из них: принцип действия, способ трансформации акустической энергии, полоса передаваемых частот, форма диафрагмы, тип акустического оформления, область применения. По принципу действия (по способу преобразования электрической формы сигнала в акустическую) громкоговорители делятся на электродинамические, электростатические, пьезо- керамические, ионные и др. Наибольшее распространение получили электродинамические ГГ. Реализуются, в зависимости от формы проводника, в трех вариантах: катушечном, ленточном, изодинамическом. Преобразование энергии в катушечном ГГ основано на взаимодействии проводника с током звуковой катушки и поля постоянного магнита. В результате электрические колебания сигнала звуковой частоты проводника преобразуются в механические колебания диафрагмы головки громкоговорителя. По способу трансформации акустической энергии громкоговорители делятся на ГГ прямого излучения, у которых поверхность диафрагмы излучает звук непосредственно в окружающую среду, и рупорные ГГ (узкогорлые), у которых диафрагма излучает звук в предрупорную камеру, где происходит трансформация скорости звукового давления. Громкоговорители, в зависимости от частотной области применения, называются низко-, средне- или высокочастотными. По форме диафрагмы ГГ делятся на конусные, купольные, плоские. Наибольшее распространение получили электродинамические катушечные конусные (диффузорные) или купольные ГГ прямого излучения. В связи с тем, что очень трудно создать головку громкоговорителя, которая бы воспроизводила звуки в широком диапазоне частот (и низкие, и высокие) с минимальными искажениями, поэтому объединяют несколько ГГ в акустические агрегаты, обычно называемые акустическими системами. В акустических системах (АС) обычно используется многополосный принцип построения, т. е. весь воспроизводимый диапазон частот подразделяется на несколько частотных поддиапазонов, каждый из которых воспроизводится своим громкоговорителем. В отечественных АС высшей категории и зарубежных типа Hi-End обычно используются три частотных поддиапазона. Это обусловлено тем, что применение одного широкополосного громкоговорителя не позволяет обеспечить равномерность АЧХ акустической мощности в полном диапазоне частот и снизить уровень искажений. В более простых АС других классов применяют одно- или двухполосный принцип построения. В настоящее время большинство зарубежных АС класса Hi-Fi изготавливаются по двухполосной схеме. Для двухполосных систем частоту раздела звукового сигнала выбирают в диапазоне от 2000 до 4000 Гц. Для трехполосных АС полосы раздела выбираются в диапазонах 200—500 Гц и 3000—5000 Гц. Акустические системы классифицируют:
Акустические системы бывают пассивными и активными. В активных АС имеется встроенный усилитель сигналов. Такие АС обычно используются в компьютерных системах мультимедиа. Приведем основные электроакустические и технические характеристики АС, значимые для результатов прослушивания звучащей речи. Важнейшим параметром АС является их мощность. Однако существует несколько параметров, описывающих мощность АС и громкоговорителей, содержащихся в них. Был введен новый отраслевой стандарт — ОСТ 4.383.001-85 «Головки громкоговорителей динамические. Общие технические условия». Основным параметром стандарта принята шумовая мощность, а не номинальная, как было прежде. 168 167 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АКУСТИЧЕСКИЕ СИСТЕМЫ Предельная шумовая (паспортная) мощность (Рпасп) — электрическая мощность, при которой АС может длительное время работать без механических и тепловых повреждений. Она проверяется при подведении к АС в течение 100 часов через корректирующую цепь сигнала типа стационарного розового шума. Максимальная кратковременная мощность (Ркрат) — электрическая мощность, которую выдерживают громкоговорители АС без повреждений (проверяется по отсутствию дребезжания) в течение короткого времени. В качестве испытательного сигнала используется шумовой сигнал с тем же спектральным распределением, что и при испытаниях на паспортную мощность, только сигнал подается на АС в течение 2 с (±50 мс). Испытания проводятся 60 раз с интервалом в 1 минуту. Данный вид мощности дает возможность судить о кратковременных перегрузках, которые может выдержать АС в ситуациях, возникающих в процессе эксплуатации. Максимальная долговременная мощность (Рд) — электрическая мощность, которую выдерживает ГГ АС без повреждений в течение 1 мин (±3 с). Испытания повторяются 10 раз с интервалом 2 минуты. Испытательный сигнал такой же, как и при испытаниях паспортной мощности. Данный вид мощности позволяет оценить способность АС к сравнительно продолжительным перегрузкам, возникающим в процессе эксплуатации. По значению Рпасп можно приблизительно оценить Рд. макс и Ркрат макс по их соотношению: P : Р : Р = 12 4 А пасп • А д. макс • А крат макс а..^.^. Номинальное электрическое сопротивление (R^) — активное сопротивление, которым можно заменить сопротивление АС при определении подводимой к ней электрической мощности. Величина номинального электрического сопротивления обычно определяется минимальным значением модуля полного электрического сопротивления АС в диапазоне частот выше частоты основного резонанса. Диапазон воспроизводимых частот — диапазон, в пределах которого частотная характеристика звукового давления АС не выходит за пределы заданного поля допусков или обладает неравномерностью заданного значения. Амплитудно-частотная характеристика (АЧХ) — графическая или численная зависимость звукового давления от частоты. АЧХ звукового давления определяет субъективное восприятие громкости на различных частотах звукового диапазона. Неравномерность частотной характеристики АС — разность максимального и минимального значений уровней звукового давления (отношение максимального звукового давления к минимальному, выраженное в децибелах) в заданном диапазоне частот. Чем меньше неравномерность частотной характеристики, тем выше качество звучания АС при равных прочих параметрах. Уровень гармонических (нелинейных) искажений — определяются суммарным характеристическим коэффициентом гармоник на заданной частоте или в полосе частот. Полный коэффициент гармонических искажений — среднеква- дратическое значение отношения звуковых давлений высших гармоник, обусловленных нелинейностью преобразователя, к звуковому давлению первой гармоники. Чувствительность (отдача) АС — звуковое давление, развиваемое АС в заданном диапазоне частот на акустической оси на расстоянии 1 м от рабочего центра и подводимой электрической мощностью 1 Вт. Чувствительность определяет минимальную мощность, при которой диффузоры акустической системы входят в рабочий режим и обеспечивают корректное воспроизведение звука на малой громкости. Характеристика направленности АС — зависимость звукового давления, развиваемого АС на определенной частоте или в полосе частот в точках свободного поля, находящихся на определенном расстоянии от рабочего центра излучателя, от угла между рабочей осью и направлением на указанные точки. В России, как и в бывшем СССР, АС по электрическим и электроакустическим параметрам подразделяются на три группы сложности: нулевая (высшая), первая и вторая. В таблице 5 (см. с. 172) приведены основные требования к параметрам для отечественных АС всех трех групп сложности. В соответствии с ГОСТ 23262-88 полное наименование отечественных АС включает в себя: величину предельной долговременной мощности; буквы АС; номер группы сложности; номер разработки. Определим общие требования к АС, предназначенных для эксперта-речеведа:
170 167
При прослушивании фонограмм эксперты в качестве оконечного устройства используют также головные телефоны. Головные телефоны характеризуются следующими параметрами: чувствительность, диапазон воспроизводимых частот, импеданс. Чувствительность головных телефонов равна отношению уровня звукового давления к подводимой электрической мощности. Большинство современных динамических головных телефонов имеют чувствительность 90—100 дБ/мВт. Диапазон воспроизводимых частот у них, как правило, превышает аналогичный диапазон АС. Головные телефоны среднего уровня воспроизводят частоты от 7—10 Гц до 25—30 кГц. Импеданс наушников — это его внутреннее сопротивление, или нагрузка источника звукового сигнала. Профессиональные головные телефоны имеют номинальный импеданс 200—600 Ом. У полупрофессиональных моделей импеданс обычно равен 32—35 Ом. На уровень сигнала, передаваемого головными телефонами барабанной перепонке, существенно влияют физические свойства материала, из которого изготовлен диффузор, а также конструкция амбушюров, изголовья и корпусов, в которых закреплены динамики. В зависимости от вида корпусов-чашек, динамические головные телефоны бывают открытыми (чашки открыты сзади) и закрытыми (чашки сзади закрыты). Последние головные телефоны лучше воспроизводят низкие частоты и блокируют проникновение звуков извне. При работе эксперта в головных телефонах звуковые волны каждого канала попадают прямо в барабанные перепонки. Поэтому в головных телефонах нельзя определить, как изменения фазы и амплитуды сигнала в одном канале влияют на другой. Кроме того, высокочастотные составляющие звуковых сигналов обычно лучше воспроизводятся головными телефонами, а акустические системы лучше воспроизводят низкие частоты. АЧХ головных телефонов обычно более гладкая, и уровень искажений у них меньше. Все это приводит к тому, что впечатления эксперта от прослушивания одной и той же фонограммы через головные телефоны и АС могут различаться. Однако опыт большинства экспертов и акустиков-профессионалов показывает, что предпочтение следует отдавать акустическим системам. На восприятие звука влияет и помещение для прослушивания. Помещение никогда не бывает нейтральным по звучанию, оно всегда вносит окраску в звук, так как все поверхности помещения и предметы обстановки воздействуют на фазовую и частотную характеристику звука. Поэтому характеристики помещения, в котором проводится прослушивание фонограммы, оказывают существенное воздействие на характер звучания фонограммы. Фактически такую комнату, с ее акустическими характеристиками, следует рассматривать как еще одно звено тракта воспроизведения звука. Восприятие звука при прослушивании фонограммы искажают:
172 167 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АКУСТИЧЕСКИЕ СИСТЕМЫ
Поэтому специальные, профессиональные звуковые студии — это помещения с нормированной акустикой, в которых должны быть соблюдены определенные акустические параметры. Эти параметры, их количество и точность реализации определяются нормативными документами (СНиП, ГОСТ, ведомственные рекомендации). Помещения характеризуются следующими акустическими параметрами: время стандартной реверберации (T), частотная характеристика времени реверберации (зависимость времени стандартной реверберации от частоты звукового сигнала), диф- фузность звукового поля (то есть равномерность распределения энергии отраженных волн по всему объему помещения), структура звуковых отражений и наличие стоячих волн. Кроме того, нормируются показатели звукоизоляции и уровень посторонних шумов в помещении. Область пространства, в котором наблюдаются акустические волны, называется акустическим полем. В помещениях акустическое поле формируется не только прямой волной, идущей от источника сигналов по кратчайшему пути, но и волнами, образующимися в результате ее отражений от стен, потолка, предметов в комнате. При каждом новом отражении часть звуковой энергии волны поглощается отражающими поверхностями и воздушной средой, а часть воздействует на слух, накладываясь на основной (прямой) звук. В результате из прямых и отраженных волн образуется так называемое диффузное (рассеянное) звуковое поле. При подборе помещения для организации комнаты для прослушивания фонограмм необходимо принимать во внимание следующие положения:
При размещении громкоговорителей необходимо учитывать свойства помещения, используемого для прослушивания фонограмм. В случае его неудовлетворительных акустических свойств надо постараться минимизировать отрицательное воздействие, вносимое акустическими свойствами помещения. В пользу этого говорит следующее рассуждение: нет особой разницы между ситуациями, когда при небольшом расстоянии между громкоговорителями слушатель расположен близко к ним или когда слушатель отдален от широко разнесенных громкоговорителей, так как в обоих случаях образовавшиеся треугольники геометрически подобны. Однако акустические свойства помещения при удалении слушателя от источников звука оказывают большее влияние на получаемую им звуковую картину, нежели при близком расположении, ибо во втором случае он слышит больше прямого звука из громкоговорителей и меньше отраженного от стен помещения. Некоторые типы АС, например многополосные акустические системы, необходимо располагать на таком удалении от слушателя, при котором общая звуковая картина уже не распадается на сумму излучений отдельных динамиков, составляющих акустическую систему (АС). Аналогично ситуация обстоит и с акустическими свойствами помещения. Гулкие помещения имеют большое время реверберации, и в них энергия звуковой волны спадает медленно. В таких помещениях теряется разборчивость речи. В сильно заглу- шенных помещениях, где поглощение звуковой энергии идет быстро и время реверберации мало, речь звучит сухо, лишается естественной окраски. Форма помещения имеет для эксперта-речеведа важное значение. Наименее удачная форма комнаты — кубическая. В помещениях кубической и прямоугольной формы с целочисленными соотношениями сторон (например, 1:2:3), а также длинных коридорах речь, как и музыку, лучше не слушать. Для прослушивания наиболее пригодна комната с размерами, близкими к «Золотому сечению». Понятие «Золотого сечения» ввел Леонардо да Винчи. Для комнаты с пропорциями, основанными на «Золотом сечении», резонансные частоты для высоты, длины и ширины не будут кратными и, таким образом, погасят друг друга. В литературе приводится несколько таких пропорций: например, высота с шириной и длиной помещения может соотноситься как 0,618:1:1,618 или как 1:1,6:2,6. При этом наблюдается наиболее равномерное распределение резонансных частот помещения. У любой комнаты есть акустические резонансы или моды. Соотношения, в которых находятся длина, ширина и высота комнаты, определяют распределение мод по частоте, задают 174 167 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АКУСТИЧЕСКИЕ СИСТЕМЫ местоположение скоплений и провалов в этом распределении. Концентрации (скопления) мод могут служить причиной искусственного подчеркивания определенных частот, а провалы в модальном распределении могут делать отдельные частоты совершенно неслышимыми. Размеры помещения определяют частоты, на которых имеют место резонансы, т. е. то, будут ли отдельные, имеющие значение для воспроизводимой фонограммы, частоты усиливаться или же подавляться. В идеально прямоугольных комнатах с идеально ровными и отражающими поверхностями (стенами, полом и потолком) эти резонансы легко могут быть вычислены. В помещении любой конфигурации точно так же, как и внутри акустического оформления АС, на низких частотах возникают стоячие волны. Стоячие волны — это низкочастотные отражения (резонансы) между двумя параллельными стенами. Они окрашивают звучание в вашей комнате, подчеркивая некоторые музыкальные ноты и создают грубое и неестественное распределение акустической энергии в пределах комнаты. В помещениях кубической формы интенсивность стоячих волн максимальна, поскольку они образуются на совпадающих частотах вследствие равенства расстояния между противоположными стенами. Чаще всего проблемы в комнатах для прослушивания фонограмм возникают из-за неверного расположения акустических систем. Подбор подходящего места для громкоговорителей — важнейший фактор в процессе достижения наилучшего звучания АС. Ведь от их положения зависят тональный баланс, насыщенность и качество НЧ и ВЧ составляющих, глубина и ширина звуковой сцены, прозрачность звучания средних частот, разборчивость речи и т. д. Специалисты определяют шесть фундаментальных положений, касающихся влияния расположения акустических систем на их звучание. 1. Относительное положение АС и слушателя. Эксперт и АС должны располагаться в вершинах равнобедренного треугольника. Эксперт должен сидеть точно посередине между акустическими системами, и расстояние от него до каждой из них должно слегка превышать расстояние между акустическими системами (хотя это и не всегда обязательно). Выбор расстояния между акустическими системами — компромисс между шириной звуковой сцены и остротой восприятия центрального звукового образа. Чем дальше друг от друга расположены АС (при неизменном расположении слушателя), тем шире будет воспроизводимая звуковая сцена. В то же время при дальнейшем увеличении расстояния отчетливость восприятия звукового образа в центре падает и он может даже исчезнуть совсем. В результате возникает «звуковой провал». Если же АС расположены слишком близко друг от друга, ширина звуковой сцены невелика.
Эти резонансы имеют вполне определенные для каждого конкретного помещения значения частот и проявляются в виде пиков частотной характеристики. Они возникают вследствие так называемых стоячих волн, представляющих собой неподвижные в пространстве чередования областей повышенного и 176 167 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ пониженного (относительно атмосферного) звукового давления, называемых пучностями и умами. Структура стоячих волн в помещении определяется его размерами и расположением в нем источников звука. Наличие таких волн придает дополнительную окрашенность звучанию. Когда резонансы помещения не слышны, прозрачность звучания средних частот выше, а басовые составляющие более определенные. Собственные резо- нансы помещения подробно описаны ниже в этой главе. Оптимально размещение АС от задней стены на расстоянии примерно от одной трети до одной пятой длины помещения. Примерно на таком же расстоянии от противоположной стены (передней от АС) располагается и специалист при прослушивании фонограммы.
Так как изменения частотной характеристики АС наблюдаются в основном в области средних и высоких частот, уши эксперта должны находиться на оси ВЧ-головок. В большинстве АС такие головки расположены на высоте от 80 до 100 см от пола, что соответствует обычной высоте расположения головы сидящего эксперта.
Экран телевизора великолепно отражает звук, поэтому не рекомендуется ставить телевизор между акустическими системами. Для улучшения взаимодействия АС и слушателя можно попробовать выполнить следующие действия: 1) изменить акустическое сопряжение АС с границами комнаты и/или комнатными модами, т. е. переставить АС в другое место;
7) акустически изменить комнату, т. е. устранить пики и провалы. Последнее сделать довольно сложно, так как это требует дополнительных затрат. То есть, если на низкие частоты при прослушивании основное влияние оказывает комната, на СЧ и ВЧ — уже сама акустическая система, АЧХ и направленность которых определяют качество звука. Поэтому необходимы АС, которые обеспечивают одинаково хорошую тембральную окраску как в прямом, так и раннеотраженном и прочих звуковых полях. Такие АС можно иначе охарактеризовать как АС с ровной и гладкой аксиальной АЧХ и постоянной направленностью, что в совокупности дает ровное и однородное звуковое давление. 12. Аддитивные шумы и помехи В экспертной практике звучащая речь, которая записывается на фонограмму, приобщаемую к делу в качестве доказательства, имеет, как правило, сравнительно невысокое качество, выражающееся в узком спектральном диапазоне (обычно от 300—400 до 3400—5000 Гц), низком отношении сигнал/шум (от 0 до 25 дБ), низкой амплитуде полезного сигнала на фоне шума. То есть на фоне полезного речевого сигнала очень часто наблюдаются интенсивные посторонние шумы и различного рода помехи, затрудняющие понимание лингвистического содержания речи, поскольку они мешают слуховому восприятию вербальной (словесной) информации, а потому от помех желательно избавляться, используя различные методы и способы шумоочистки. Чтобы выбрать оптимальный метод или способ фильтрации шума, повышения разборчивости записанной звучащей речи и комфортность ее прослушивания, необходимо предварительно кратко рассмотреть типы возникающих помех и их источников. Это могут быть: 178 179 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ
Здесь же необходимо отметить, что к мешающим факторам можно также отнести и собственную нестабильность речеобра- зующего тракта, которая выражается в интериндивидуальной вариативности речевых параметров, а также намеренное или функциональное изменение или искажение присущих человеку голосовых или речевых параметров. Указанные факторы присутствуют практически всегда в речевом сигнале, что требует их учета и нормализации. Что такое помехи и как с ними можно бороться? Помехой называется стороннее возмущение, действующее на пути следования сигнала от его источника до приемника и препятствующее правильному приему (восприятию) сигнала. Точное математическое описание помех, как правило, невозможно. Информативные параметры помех определяются путем их анализа. Источники помех могут быть внутренние и внешние. Если зашумленный сигнал можно представить в виде суммы полезного сигнала и помехи, то такая помеха называется аддитивной. Аддитивную помеху часто называют шумом. Если на речевой сигнал накладывается какой-либо неотрицательный процесс, то помеху называют мультипликативной. На практике мультипликативная помеха возникает в тех случаях, когда параметры системы претерпевают случайные изменения во времени. В сущности, это наблюдается во всех реальных системах звукозаписи, но в большинстве случаев такие изменения всех параметров, хотя и существуют, но достаточно малые. То есть при звукозаписи на речевой сигнал воздействуют аддитивные и мультипликативные помехи. Так, например, если звукозапись проводится на открытой местности, то в качестве помех выступают различного рода шумы. В этом случае зашумленный речевой сигнал, как указано выше, представляется как сумма полезного сигнала и шума. Если звукозапись проводится в помещении или сигнал передается по радио, а также по телефонному тракту, то кроме различного рода аддитивных помех на сигнал накладываются мультипликативные помехи, имеющие частотнозависимую передаточную характеристику. То есть аддитивная смесь претерпевает дополнительные мультипликативные искажения, смесь домножается на резонансы передаточной характеристики тракта, и в результате полезный сигнал еще больше искажается. Задача устранения таких аддитивных и мультипликативных помех осложняется вариативностью характеристик акустических помех и трактов передачи. Таким образом, под шумом понимают помехи, представляющие собой смесь случайных и кратковременно детерминированных (периодических) процессов. Часто под «шумом» подразумевают так называемый белый шум, характеризующийся тем, что его амплитудный спектр распределен по нормальному закону, а спектральная плотность мощности (мощность, приходящаяся на полосу 1 Гц) постоянна для всех частот. Белый шум может быть узкополосным и широкополосным. Для шума характерным является то, что невозможно предсказать точное мгновенное значение сигнала в тот или иной момент времени. Можно лишь путем длительного наблюдения оценить вероятность появления мгновенного значения функции внутри заданного интервала. По этой причине шумы описываются статистически. Другая основная разновидность шума — это импульсный шум. В нем имеются лишь два значения сигналов шума и случайность процесса проявляется в том, что переход от одного значения к другому может происходить в любой момент времени. Основные характеристики и параметры шума (эффективное значение его напряжения, спектральная плотность мощности, корреляционная функция и иные), а также шумы, вносимые электронной аппаратурой, могут быть экспериментальным путем зафиксированы и измерены. Часто к импульсному шуму относят случайные импульсные помехи. Детерминированные сигналы с незначительной случайной составляющей шумом как таковым не являются. Например, наводки от сети переменного тока (однотонное гудение с частотами 50 или 100 Гц) или другой слегка зашумленный гармонический процесс следует относить к классу помех. 180 179 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ Аддитивные фоновые сигналы можно также классифицировать на шумоподобные (например, уличный шум, шум от работающих механизмов и т. д.) или речеподобные (например, при одновременном разговоре нескольких говорящих). В зависимости от источника, помехи могут быть нескольких типов: постоянные и непостоянные (или стационарные и нестационарные). По времени помехи различаются на долговременные и ударные. Постоянные (стационарные) шумы — это шумы медленно изменяющиеся, например, шум постоянно работающих приборов и устройств. Непостоянные помехи, как и шумы, могут быть импульсными, колеблющимися и прерывистыми. Импульсные помехи состоят из одного или нескольких коротких звуковых импульсов. В нашем случае они представлены шумами типа «песок» (мелкие частые выбросы, которые накладываются на полезный сигнал), «треск» (короткие выбросы с частой потерей полезной информации), «щелчки» (относительно длинные участки с поражениями сложной формы) и т. д. Колеблющиеся шумы — это нерегулярная помеха с изменяющимся уровнем сигнала. Прерывистый шум — это помеха, уровень которой периодически резко падает до уровня фона тракта. В общем виде искажения, вносимые различными элементами систем звукозаписи и воспроизведения (магнитофоны, усилители, акустические системы и т.д.), называют нелинейными. Они представляют собой изменения формы колебаний, проходящих через электрическую цепь (усилитель, трансформатор и т. п.) и вызванных нарушениями пропорциональности между мгновенными значениями напряжения на выходе и входе этой цепи. То есть имеет место нелинейная зависимость характеристики выходного напряжения от входного. Нелинейные искажения, вносимые аппаратурой, оцениваются величиной коэффициента нелинейных искажений. Незначительные нелинейные искажения (до 1,5—2%) изменяют тембр речи и затрудняют раздельное ее восприятие. С ростом нелинейных искажений на фонограмме появляются неприятные хрипы и дребезжание. Шумовые составляющие, вносимые в полезный сигнал устройствами звукозаписи и ее воспроизведения, характеризуются отношением сигнал/помеха. Это отношение выражается в децибелах и показывает, насколько номинальный уровень выходного полезного сигнала превышает уровень помехи на выходе используемого устройства. Кроме того, телефонная сеть может вносить специфические дополнительные помехи в виде слабого эхо с большой задержкой, которое в комплексе с узкополосными аддитивными помехами значительно влияет на восприятие речи, хотя ее разборчивость при этом может падать незначительно. Их появление связано с тем, что телефонная линия от абонента до телефонной станции делается двухпроводной (приходящий и уходящий сигналы переносятся одной парой проводов), которая преобразуется при помощи оконечного устройства на АТС в четырехпроводную, разделяя сигналы, следующие в противоположных направлениях. В идеале такое разделение может быть организовано достаточно точно, однако экономически не выгодно подбирать для каждого абонента свое оконечное устройство для получения сбалансированной мостовой схемы. В результате часто наблюдаемой разбалансировки и наблюдаются эхо-сигналы как результат возвращения говорящему части сигнала путем отражения. Они особенно заметны при передаче сигнала на большие расстояния (например, при междугородних разговорах). Основными причинами помех являются:
Необходимо также обратить внимание на такие часто встречающиеся искажения речевого сигнала, как реверберационные. 183 179 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ Реверберационные искажения - это те искажения, которые претерпевает речевой сигнал от источника сигнала (речеобразую- щего тракта человека) до приемника звукового давления (микрофон). Эти искажения относятся к классу мультипликативных помех и являются продуктом свертки речевого сигнала с импульсной характеристикой акустического тракта. Импульсная характеристика зависит от отражений и переотражений акустического сигнала, попадающего в микрофон (например, от стен, потолка помещения, мебели, различных предметов и т. п.). Она характеризуется временем реверберации, RT60 или Т, (иногда говорят: время стандартной реверберации) или временем, когда звуковое давление на микрофоне падает относительно начального уровня на определенную величину (на 60 дБ или в 1000 раз). Это время тем больше, чем меньше звуковой энергии при отражениях поглощается стенами и предметами, находящимися в помещении. Акустические свойства помещения существенно влияют на спектр речевого сигнала и, в первую очередь, на его высокочастотную область (они сильнее поглощаются элементами обстановки комнаты: коврами, мягкой мебелью, материалами ее обшивки, а также быстрее затухают с увеличением расстояния). При этом может меняться восприятие натуральности звучания речи. Наименьшие реверберационные искажения наблюдаются в открытой местности или в специально подготовленных без- эховых помещениях. При малых значениях Т за счет реверберации увеличивается полезный уровень звукового давления в точке прослушивания. Так, в лучших концертных залах задержка между прямым звуком и первым отражением составляет от 10 до 20 мс. По мере увеличения времени реверберации речь начинает искажаться: сначала взрывные звуки, затем снижается разборчивость в целом, появляются «гулкость» и «бубнение», что, в конце концов, делает речь абсолютно неразборчивой. Примером могут служить фонограммы, полученные в гулких пустых залах с голыми стенами. В настоящее время в мире имеется значительное число как аппаратных, так и аппаратно-программных комплексов, предназначенных для борьбы с различными шумами и помехами, мешающими восприятию звучащей речи, записанной на фонограмме. Причем основная масса таких устройств используется в музыкальной звукозаписи и в радиовещании. Развитие компьютерных технологий позволило реализовы- вать сложные и эффективные алгоритмы цифровой обработки сигнала. Все они в той или иной степени базируются на информации о речевом сигнале и фоновом шуме и могут быть разбиты, согласно литературным данным1, на несколько групп и основаны на следующих подходах:
Наиболее широко в экспертной деятельности по исследованию звучащей речи используются устройства, реализующие метод адаптивной фильтрации. 13. Форматы звуковых файлов Звучащая речь может быть записана как на аналоговом, так и цифровом носителе. Сегодня особую сложность в исследовании представляют цифровые фонограммы. Рассмотрим, в каких форматах может эксперт получить на исследование цифровую фонограмму и файл. Понятие формата используется в двух различных смыслах. При использовании специализированного носителя или способа записи и специальных устройств чтения/записи в понятие формата входят физические характеристики носителя звука - размеры кассеты с магнитной лентой или диском, самой ленты или диска, способ записи, параметры сигнала, принципы кодирования и защиты от ошибок и т. п. При использовании универсального информационного носителя широкого применения - например, компьютерного гибкого или жесткого диска - под форматом понимают только способ кодирования цифрового сигнала, особенности расположения битов и слов и структуру служебной информации; вся «низкоуровневая» часть, относящаяся непосредственно к работе с носителем, в этом случае остается в ведении компьютера и его операционной системы. 1 Галяшина Е.И.Прикладные основы судебной фоноскопической экспертизы // Теория и практика судебной экспертизы. - СПб: ПИТЕР, 2003. 184 185 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ Многие форматы отличаются друг от друга только порядком битов в слове, отсчетов левого и правого каналов в потоке и служебной информацией — заголовками, контрольными суммами, помехозащитными кодами и т. п. Точный способ проверки неискажаемости сигнала заключается в преобразовании нескольких различных потоков (файлов) формата F1 в формат F2, а затем обратно в F1. Если информационная часть каждого потока (файла) при этом будет идентична исходной — данный вид преобразования можно считать неискажающим. Под информационной частью потока (файла) понимается собственно набор данных, описывающих звуковой сигнал; остальная часть считается служебной и на форму сигнала в общем случае не влияет. Например, если в служебной части файла или потока предусмотрено поле для времени его создания (передачи), то даже в случае полного совпадения информационных частей двух разных файлов или потоков их служебные части окажутся различными, и это будет зафиксировано логическим анализатором в случае потока или программой побайтного сравнения — в случае файла. Кроме этого, временной сдвиг одного сигнала относительно другого, возникающий при выравнивании цифрового потока по границам слов или блоков и состоящий в добавлении нулевых отсчетов в начало и/или конец файла или потока, также приводит к их кажущемуся цифровому несовпадению. В таких ситуациях для проверки идентичности цифровых сигналов необходимо пользоваться специальной аппаратурой или программой. Из специализированных форматов и носителей цифрового звука в настоящее время наиболее известны следующие: CD (Compact Disk — компакт-диск) — односторонний пластмассовый диск с оптической лазерной записью и считыванием, диаметром 120 или 90 мм, вмещающий 80 или 90 минут стереозвучания с частотой дискретизации 44,1 кГц и 16-разрядным линейным квантованием. Система предложена фирмами Sony и Philips и носит название CD-DA (Compact Disk — Digital Audio). Различаются штампованные (CD), однократно записываемые (CD-R) и многократно перезаписываемые (CD-RW) компакт- диски. S-DAT (Stationary head Digital Audio Tape — цифровая звуковая лента с неподвижной головкой) — система наподобие обычного кассетного магнитофона, запись и чтение в которой ведутся блоком неподвижных тонкопленочных головок на ленте шириной 3,81 мм в двухсторонней кассете размером 86 x 55,5 x 9,5 мм. Реализует 16-разрядную запись двух или четырех каналов на частотах 32, 44,1 и 48 кГц. R-DAT (Rotary head Digital Audio Tape — цифровая звуковая лента с вращающейся головкой) — система наподобие видеомагнитофона с поперечно-наклонной записью вращающимися головками. Наиболее популярный формат ленточной цифровой записи системы R-DAT часто обозначаются просто DAT. В R-DAT используется кассета размером 73 x 54 x 10,5 мм, с лентой шириной 3,81 мм, а сама система кассеты и магнитофона очень похожа на типовой видеомагнитофон. Базовая скорость движения ленты — 8,15 мм/с, скорость вращения блока головок — 2000 об/мин. R-DAT работает с двухканальным (в ряде моделей — четырехканальным) сигналом на частотах дискретизации 44.1 и 48 кГц с 16-разрядным линейным квантованием, и 32 кГц — с 12-разрядным нелинейным. Для защиты от ошибок используется двойной код Рида-Соломона и модуляция кодом 8-10. Емкость кассеты — 80—240 минут в зависимости от скорости и длины ленты. Бытовые DAT-магнитофоны обычно оснащены системой защиты от незаконного копирования фонограмм, не допускающей записи с аналогового входа на частоте 44,1 кГц, а также прямого цифрового копирования при наличии запрещающих кодов SCMS (Serial Code Managenent System). Студийные магнитофоны таких ограничений не имеют. DASH (Digital Audio Stationary Head) — система с записью на магнитную ленту шириной 6,3 и 12,7 мм в продольном направлении неподвижными головками. Скорость движения ленты — 19,05, 38,1, 76,2 см/с. Реализует 16-разрядную запись с частотами дискретизации 44,056, 44,1 и 48 кГц от 2 до 48 каналов. DAT (Alesis DAT) — собственная система восьмиканальной записи звука на видеокассету типа S-VHS, разработанная фирмой Alesis. Использует 16-разрядное линейное квантование на частоте 48 кГц, емкость кассеты составляет до 60 минут на каждый канал. Магнитофоны ADAT допускают каскадное соединение, в результате чего может быть собрана система 128-канальной синхронной записи. Для ADAT выпускается множество различных интерфейсных блоков для сопряжения с DAT, CD, MIDI и т. п. Модель Meridian (ADAT Type II) использует 20-разрядное квантование на частотах 44,1 и 48 кГц. 186 185 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ПРИЛОЖЕНИЕ 1 DCC (Digital Compact Cassette — цифровая компакт-кассета) — бытовая система записи в продольном направлении на стандартную компакт-кассету, разработанная Philips. Скорость движения ленты — 4,76 см/с, максимальное время звучания такое же, как при аналоговой записи. Частоты дискретизации — 32, 44,1, 48 кГц, разрешение — 16/18 разрядов (метод сжатия PASC). На DCC-магнитофонах могут воспроизводиться (но не записываться) обычные аналоговые компакт-кассеты. В настоящее время система DCC признана неперспективной. MD (MiniDisk) — бытовая и концертная система записи на магнитооптический диск, разработанная Sony. Диск диаметром 64 мм, помещенный в пластмассовый футляр размером 70 x 67,5 x 5 мм, вмещает 74 минуты (60 в ранних версиях) стереофонического звучания. При обмене с внешними устройствами используется формат 16-разрядных отсчетов на частоте 44,1 кГц, однако на сам диск сигнал записывается после сжатия методом ATRAC. Из универсальных компьютерных форматов наиболее популярны следующие: Microsoft RIFF/WAVE (Resource Interchange File Format/Wave — формат файлов передачи ресурсов/волновая форма) — стандартный формат звуковых файлов в компьютерах IBM PC. Файл этого формата содержит заголовок, описывающий общие параметры файла, и один или более фрагментов (chunks), каждый из которых представляет собой волновую форму или вспомогательную информацию — режимы и порядок воспроизведения, пометки, названия и координаты участков волны и т. п. Файлы этого формата имеют расширение WAV. Apple AIFF (Audio Interchange File Format — формат файла обмена звуком) — стандартный тип звукового файла в системах Apple Macintosh. Похож на RIFF и также позволяет размещать вместе со звуковой волной дополнительную информацию, в частности — самплы WaveTable инструментов вместе с параметрами синтезатора. Формат «чистой оцифровки» RAW, не содержащий заголовка и представляющий собой только последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном знаковом (signed) формате, когда первыми в каждой паре идут отсчеты левого канала, хотя могут быть и исключения. Приложение 1 Глоссарий по компьютерной обработке звука и магнитной звукозаписи |