Главная страница
Навигация по странице:

  • 12. Аддитивные шумы и помехи

  • 13. Форматы звуковых файлов

  • Приложение 1

  • Галяшина Е.И. Основы судебного речеведения. Монография Москва стэнси 2003 удк 343. 148 81 ббк 67. 5 Г17


    Скачать 2.7 Mb.
    НазваниеМонография Москва стэнси 2003 удк 343. 148 81 ббк 67. 5 Г17
    АнкорГаляшина Е.И. Основы судебного речеведения.doc
    Дата18.12.2017
    Размер2.7 Mb.
    Формат файлаdoc
    Имя файлаГаляшина Е.И. Основы судебного речеведения.doc
    ТипМонография
    #11953
    страница12 из 18
    1   ...   8   9   10   11   12   13   14   15   ...   18

    11. Акустические системы

    Остановимся на другом важнейшем элементе АРМ экспер- та-речеведа — это акустические системы. От качества данных систем во многом зависит успешная работа специалиста по прослушиванию звучащей речи.

    Обычно акустической системой (АС) называется громкого­воритель, предназначенный для использования в качестве функционального звена в бытовой радиоэлектронной аппарату­ре. Под АС понимается устройство для излучения звука в окру­жающее пространство, содержащее одну или несколько головок громкоговорителей, при наличии акустического оформления и дополнительных электрических устройств. Головкой громкого­ворителя (ГГ) называется пассивный электроакустический пре­образователь, предназначенный для преобразования электри­ческой формы сигналов звуковой частоты в акустическую.

    В соответствии с определением МЭК 50 (801), термин «гром­коговоритель» может применяться как к акустической системе, так и к одиночному громкоговорителю, который в отечественных

    166

    167


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АКУСТИЧЕСКИЕ СИСТЕМЫ

    стандартах называется головкой громкоговорителя. Однако в технической литературе термин громкоговоритель обычно при­меняется к одиночным громкоговорителям, а многополосные системы, в зависимости от их назначения, называются акусти­ческой системой.

    Классификация ГГ может быть проведена по различным признакам. Основные из них: принцип действия, способ транс­формации акустической энергии, полоса передаваемых частот, форма диафрагмы, тип акустического оформления, область применения.

    По принципу действия (по способу преобразования элект­рической формы сигнала в акустическую) громкоговорители делятся на электродинамические, электростатические, пьезо- керамические, ионные и др.

    Наибольшее распространение получили электродинамичес­кие ГГ. Реализуются, в зависимости от формы проводника, в трех вариантах: катушечном, ленточном, изодинамическом. Преобразование энергии в катушечном ГГ основано на взаимо­действии проводника с током звуковой катушки и поля посто­янного магнита. В результате электрические колебания сигнала звуковой частоты проводника преобразуются в механические колебания диафрагмы головки громкоговорителя.

    По способу трансформации акустической энергии громко­говорители делятся на ГГ прямого излучения, у которых по­верхность диафрагмы излучает звук непосредственно в окружа­ющую среду, и рупорные ГГ (узкогорлые), у которых диафрагма излучает звук в предрупорную камеру, где происходит транс­формация скорости звукового давления. Громкоговорители, в зависимости от частотной области применения, называются низко-, средне- или высокочастотными. По форме диафрагмы ГГ делятся на конусные, купольные, плоские.

    Наибольшее распространение получили электродинамичес­кие катушечные конусные (диффузорные) или купольные ГГ прямого излучения.

    В связи с тем, что очень трудно создать головку громкогово­рителя, которая бы воспроизводила звуки в широком диапазо­не частот (и низкие, и высокие) с минимальными искажения­ми, поэтому объединяют несколько ГГ в акустические агрегаты, обычно называемые акустическими системами. В акустических системах (АС) обычно используется многополосный принцип

    построения, т. е. весь воспроизводимый диапазон частот под­разделяется на несколько частотных поддиапазонов, каждый из которых воспроизводится своим громкоговорителем. В отече­ственных АС высшей категории и зарубежных типа Hi-End обычно используются три частотных поддиапазона. Это обус­ловлено тем, что применение одного широкополосного гром­коговорителя не позволяет обеспечить равномерность АЧХ аку­стической мощности в полном диапазоне частот и снизить уровень искажений. В более простых АС других классов приме­няют одно- или двухполосный принцип построения. В настоя­щее время большинство зарубежных АС класса Hi-Fi изготав­ливаются по двухполосной схеме.

    Для двухполосных систем частоту раздела звукового сигнала выбирают в диапазоне от 2000 до 4000 Гц. Для трехполосных АС полосы раздела выбираются в диапазонах 200—500 Гц и 3000—5000 Гц.

    Акустические системы классифицируют:

    • по виду акустического оформления (закрытый корпус, корпус с фазоинвертором, плоский экран и т. д.);

    • по форме корпуса (параллелепипед, сфера, куб и т. д.);

    • по конструктивному исполнению (настенные, наполь­ные, встроенные);

    • по числу каналов разделения по частотам (однополосные, многополосные);

    • по группам сложности (нулевая, высшая, первая, вторая) для отечественных АС;

    • по внутреннему объему.

    Акустические системы бывают пассивными и активными. В активных АС имеется встроенный усилитель сигналов. Такие АС обычно используются в компьютерных системах мультимедиа.

    Приведем основные электроакустические и технические ха­рактеристики АС, значимые для результатов прослушивания звучащей речи.

    Важнейшим параметром АС является их мощность. Однако существует несколько параметров, описывающих мощность АС и громкоговорителей, содержащихся в них. Был введен новый отраслевой стандарт — ОСТ 4.383.001-85 «Головки громкогово­рителей динамические. Общие технические условия». Основ­ным параметром стандарта принята шумовая мощность, а не номинальная, как было прежде.

    168

    167


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АКУСТИЧЕСКИЕ СИСТЕМЫ

    Предельная шумовая (паспортная) мощность (Рпасп) — элект­рическая мощность, при которой АС может длительное время работать без механических и тепловых повреждений. Она про­веряется при подведении к АС в течение 100 часов через кор­ректирующую цепь сигнала типа стационарного розового шума.

    Максимальная кратковременная мощностькрат) — электри­ческая мощность, которую выдерживают громкоговорители АС без повреждений (проверяется по отсутствию дребезжания) в течение короткого времени. В качестве испытательного сигнала используется шумовой сигнал с тем же спектральным распреде­лением, что и при испытаниях на паспортную мощность, толь­ко сигнал подается на АС в течение 2 с (±50 мс). Испытания проводятся 60 раз с интервалом в 1 минуту. Данный вид мощно­сти дает возможность судить о кратковременных перегрузках, которые может выдержать АС в ситуациях, возникающих в про­цессе эксплуатации.

    Максимальная долговременная мощность (Рд) — электричес­кая мощность, которую выдерживает ГГ АС без повреждений в течение 1 мин (±3 с). Испытания повторяются 10 раз с интерва­лом 2 минуты. Испытательный сигнал такой же, как и при испы­таниях паспортной мощности. Данный вид мощности позволя­ет оценить способность АС к сравнительно продолжительным перегрузкам, возникающим в процессе эксплуатации.

    По значению Рпасп можно приблизительно оценить Рд. макс и Ркрат макс по их соотношению:

    P : Р : Р = 12 4
    А пасп • А д. макс • А крат макс а..^.^.


    Номинальное электрическое сопротивление (R^) — активное сопротивление, которым можно заменить сопротивление АС при определении подводимой к ней электрической мощности. Величина номинального электрического сопротивления обыч­но определяется минимальным значением модуля полного эле­ктрического сопротивления АС в диапазоне частот выше часто­ты основного резонанса.

    Диапазон воспроизводимых частот — диапазон, в пределах которого частотная характеристика звукового давления АС не выходит за пределы заданного поля допусков или обладает не­равномерностью заданного значения.

    Амплитудно-частотная характеристика (АЧХ) — графичес­кая или численная зависимость звукового давления от частоты.

    АЧХ звукового давления определяет субъективное восприятие громкости на различных частотах звукового диапазона.

    Неравномерность частотной характеристики АС — разность максимального и минимального значений уровней звукового давления (отношение максимального звукового давления к ми­нимальному, выраженное в децибелах) в заданном диапазоне ча­стот. Чем меньше неравномерность частотной характеристики, тем выше качество звучания АС при равных прочих параметрах.

    Уровень гармонических (нелинейных) искажений — определя­ются суммарным характеристическим коэффициентом гармо­ник на заданной частоте или в полосе частот.

    Полный коэффициент гармонических искажений — среднеква- дратическое значение отношения звуковых давлений высших гармоник, обусловленных нелинейностью преобразователя, к звуковому давлению первой гармоники.

    Чувствительность (отдача) АС — звуковое давление, разви­ваемое АС в заданном диапазоне частот на акустической оси на расстоянии 1 м от рабочего центра и подводимой электричес­кой мощностью 1 Вт. Чувствительность определяет минималь­ную мощность, при которой диффузоры акустической системы входят в рабочий режим и обеспечивают корректное воспроиз­ведение звука на малой громкости.

    Характеристика направленности АС — зависимость звуково­го давления, развиваемого АС на определенной частоте или в полосе частот в точках свободного поля, находящихся на опре­деленном расстоянии от рабочего центра излучателя, от угла между рабочей осью и направлением на указанные точки.

    В России, как и в бывшем СССР, АС по электрическим и электроакустическим параметрам подразделяются на три груп­пы сложности: нулевая (высшая), первая и вторая. В таблице 5 (см. с. 172) приведены основные требования к параметрам для отечественных АС всех трех групп сложности.

    В соответствии с ГОСТ 23262-88 полное наименование оте­чественных АС включает в себя: величину предельной долго­временной мощности; буквы АС; номер группы сложности; но­мер разработки.

    Определим общие требования к АС, предназначенных для эксперта-речеведа:

    • высокая номинальная мощность (более 100 ватт);

    • количество полос —2—3;

    170

    167




    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АКУСТИЧЕСКИЕ СИСТЕМЫ

    • широкая полоса пропускания (примерно от 30 до 20 000
      герц);

    • небольшой коэффициент гармонических и интермодуля-
      ционных искажений (менее одного процента на всей полосе час-
      тот);

    • высокая чувствительность АС (90 и более децибел);

    • неравномерность АЧХ (не более 1—3 дБ).

    Таблица 5
    Параметры

    Норма по группам сложности

    нулевая

    первая

    вторая

    Эффективный рабочий диапазон частот Гц

    40-25 000

    50-12 500

    100-8 000

    Различие частотных характеристик зву­кового давления АС, усредненных в ок- тавных полосах в диапазоне 250—8000 Гц, дБ, не более

    2

    2

    4

    Полный коэффициент гармонических искажений, при среднем уровне звуково­го давления 90 дБ, в диапазоне частот, Гц, не более: 250-1000 1000-2000 2000-6300

    1,5 1,5 1,0

    2,0 2,0 1,0

    4,0 3,0 3,0

    Показатель направленности в диапазоне частот 250-8000 Гц, измеренный под уг­лом, указанным в ТУ и находящимся в пре­делах: в горизонтальной плоскости 20-30°, в вертикальной плоскости 5-10°

    по ТУ по ТУ

    4 4

    по ТУ по ТУ

    Номинальное электрическое сопротивле­ние, Ом, устанавливается из следующего ряда значений

    4, 8, 16


    При прослушивании фонограмм эксперты в качестве оконеч­ного устройства используют также головные телефоны. Головные телефоны характеризуются следующими параметрами: чувстви­тельность, диапазон воспроизводимых частот, импеданс.

    Чувствительность головных телефонов равна отношению уровня звукового давления к подводимой электрической мощ­ности. Большинство современных динамических головных те­лефонов имеют чувствительность 90—100 дБ/мВт. Диапазон воспроизводимых частот у них, как правило, превышает ана­логичный диапазон АС. Головные телефоны среднего уровня воспроизводят частоты от 7—10 Гц до 25—30 кГц. Импеданс

    наушников — это его внутреннее сопротивление, или нагрузка источника звукового сигнала. Профессиональные головные те­лефоны имеют номинальный импеданс 200—600 Ом. У полу­профессиональных моделей импеданс обычно равен 32—35 Ом.

    На уровень сигнала, передаваемого головными телефонами барабанной перепонке, существенно влияют физические свой­ства материала, из которого изготовлен диффузор, а также конструкция амбушюров, изголовья и корпусов, в которых за­креплены динамики. В зависимости от вида корпусов-чашек, динамические головные телефоны бывают открытыми (чашки открыты сзади) и закрытыми (чашки сзади закрыты). Послед­ние головные телефоны лучше воспроизводят низкие частоты и блокируют проникновение звуков извне.

    При работе эксперта в головных телефонах звуковые волны каждого канала попадают прямо в барабанные перепонки. Поэтому в головных телефонах нельзя определить, как измене­ния фазы и амплитуды сигнала в одном канале влияют на дру­гой. Кроме того, высокочастотные составляющие звуковых сиг­налов обычно лучше воспроизводятся головными телефонами, а акустические системы лучше воспроизводят низкие частоты. АЧХ головных телефонов обычно более гладкая, и уровень ис­кажений у них меньше. Все это приводит к тому, что впечатле­ния эксперта от прослушивания одной и той же фонограммы через головные телефоны и АС могут различаться. Однако опыт большинства экспертов и акустиков-профессионалов по­казывает, что предпочтение следует отдавать акустическим си­стемам.

    На восприятие звука влияет и помещение для прослушива­ния. Помещение никогда не бывает нейтральным по звучанию, оно всегда вносит окраску в звук, так как все поверхности поме­щения и предметы обстановки воздействуют на фазовую и час­тотную характеристику звука. Поэтому характеристики поме­щения, в котором проводится прослушивание фонограммы, оказывают существенное воздействие на характер звучания фо­нограммы. Фактически такую комнату, с ее акустическими ха­рактеристиками, следует рассматривать как еще одно звено тракта воспроизведения звука. Восприятие звука при прослу­шивании фонограммы искажают:

    • отражения;

    • низкочастотные стоячие волны;

    172

    167


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АКУСТИЧЕСКИЕ СИСТЕМЫ

    • резонансные стоячие волны (СЧ);

    • флаттеры (ВЧ стоячие волны).

    Поэтому специальные, профессиональные звуковые сту­дии — это помещения с нормированной акустикой, в которых должны быть соблюдены определенные акустические парамет­ры. Эти параметры, их количество и точность реализации опре­деляются нормативными документами (СНиП, ГОСТ, ведом­ственные рекомендации).

    Помещения характеризуются следующими акустическими параметрами: время стандартной реверберации (T), частотная характеристика времени реверберации (зависимость времени стандартной реверберации от частоты звукового сигнала), диф- фузность звукового поля (то есть равномерность распределения энергии отраженных волн по всему объему помещения), струк­тура звуковых отражений и наличие стоячих волн. Кроме того, нормируются показатели звукоизоляции и уровень посторон­них шумов в помещении.

    Область пространства, в котором наблюдаются акустические волны, называется акустическим полем. В помещениях акусти­ческое поле формируется не только прямой волной, идущей от источника сигналов по кратчайшему пути, но и волнами, обра­зующимися в результате ее отражений от стен, потолка, пред­метов в комнате. При каждом новом отражении часть звуковой энергии волны поглощается отражающими поверхностями и воздушной средой, а часть воздействует на слух, накладываясь на основной (прямой) звук. В результате из прямых и отражен­ных волн образуется так называемое диффузное (рассеянное) звуковое поле.

    При подборе помещения для организации комнаты для про­слушивания фонограмм необходимо принимать во внимание следующие положения:

    • расположение помещения;

    • размеры и пропорции помещения;

    • расположение АС и слушателя;

    • поглощение и отражение звука в помещении.

    При размещении громкоговорителей необходимо учитывать свойства помещения, используемого для прослушивания фоно­грамм. В случае его неудовлетворительных акустических свойств надо постараться минимизировать отрицательное воз­действие, вносимое акустическими свойствами помещения.

    В пользу этого говорит следующее рассуждение: нет особой раз­ницы между ситуациями, когда при небольшом расстоянии между громкоговорителями слушатель расположен близко к ним или когда слушатель отдален от широко разнесенных гром­коговорителей, так как в обоих случаях образовавшиеся треу­гольники геометрически подобны. Однако акустические свой­ства помещения при удалении слушателя от источников звука оказывают большее влияние на получаемую им звуковую кар­тину, нежели при близком расположении, ибо во втором случае он слышит больше прямого звука из громкоговорителей и меньше отраженного от стен помещения. Некоторые типы АС, например многополосные акустические системы, необходимо располагать на таком удалении от слушателя, при котором общая звуковая картина уже не распадается на сумму излучений отдель­ных динамиков, составляющих акустическую систему (АС).

    Аналогично ситуация обстоит и с акустическими свойствами помещения. Гулкие помещения имеют большое время ревербе­рации, и в них энергия звуковой волны спадает медленно. В та­ких помещениях теряется разборчивость речи. В сильно заглу- шенных помещениях, где поглощение звуковой энергии идет быстро и время реверберации мало, речь звучит сухо, лишается естественной окраски.

    Форма помещения имеет для эксперта-речеведа важное зна­чение. Наименее удачная форма комнаты — кубическая. В по­мещениях кубической и прямоугольной формы с целочислен­ными соотношениями сторон (например, 1:2:3), а также длинных коридорах речь, как и музыку, лучше не слушать.

    Для прослушивания наиболее пригодна комната с размера­ми, близкими к «Золотому сечению». Понятие «Золотого сече­ния» ввел Леонардо да Винчи. Для комнаты с пропорциями, ос­нованными на «Золотом сечении», резонансные частоты для высоты, длины и ширины не будут кратными и, таким образом, погасят друг друга. В литературе приводится несколько таких пропорций: например, высота с шириной и длиной помещения может соотноситься как 0,618:1:1,618 или как 1:1,6:2,6. При этом наблюдается наиболее равномерное распределение резонанс­ных частот помещения.

    У любой комнаты есть акустические резонансы или моды. Соотношения, в которых находятся длина, ширина и высота комнаты, определяют распределение мод по частоте, задают

    174

    167


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АКУСТИЧЕСКИЕ СИСТЕМЫ

    местоположение скоплений и провалов в этом распределении. Концентрации (скопления) мод могут служить причиной ис­кусственного подчеркивания определенных частот, а провалы в модальном распределении могут делать отдельные частоты со­вершенно неслышимыми. Размеры помещения определяют ча­стоты, на которых имеют место резонансы, т. е. то, будут ли отдельные, имеющие значение для воспроизводимой фоно­граммы, частоты усиливаться или же подавляться. В идеально прямоугольных комнатах с идеально ровными и отражающими поверхностями (стенами, полом и потолком) эти резонансы легко могут быть вычислены.

    В помещении любой конфигурации точно так же, как и внут­ри акустического оформления АС, на низких частотах возникают стоячие волны. Стоячие волны — это низкочастотные отражения (резонансы) между двумя параллельными стенами. Они окраши­вают звучание в вашей комнате, подчеркивая некоторые музы­кальные ноты и создают грубое и неестественное распределение акустической энергии в пределах комнаты. В помещениях куби­ческой формы интенсивность стоячих волн максимальна, по­скольку они образуются на совпадающих частотах вследствие ра­венства расстояния между противоположными стенами.

    Чаще всего проблемы в комнатах для прослушивания фонограмм возникают из-за неверного расположения акусти­ческих систем. Подбор подходящего места для громкоговорите­лей — важнейший фактор в процессе достижения наилучшего звучания АС. Ведь от их положения зависят тональный баланс, насыщенность и качество НЧ и ВЧ составляющих, глубина и ширина звуковой сцены, прозрачность звучания средних час­тот, разборчивость речи и т. д.

    Специалисты определяют шесть фундаментальных положе­ний, касающихся влияния расположения акустических систем на их звучание.

    1. Относительное положение АС и слушателя. Эксперт и АС должны располагаться в вершинах равнобедренного треуголь­ника. Эксперт должен сидеть точно посередине между акусти­ческими системами, и расстояние от него до каждой из них должно слегка превышать расстояние между акустическими си­стемами (хотя это и не всегда обязательно).

    Выбор расстояния между акустическими системами — ком­промисс между шириной звуковой сцены и остротой восприятия

    центрального звукового образа. Чем дальше друг от друга распо­ложены АС (при неизменном расположении слушателя), тем шире будет воспроизводимая звуковая сцена. В то же время при дальнейшем увеличении расстояния отчетливость восприятия звукового образа в центре падает и он может даже исчезнуть совсем. В результате возникает «звуковой провал». Если же АС расположены слишком близко друг от друга, ширина звуковой сцены невелика.

      1. Влияние расположения акустических систем относительно стен на количество низких частот. Близость АС к стенам усили­вает басы. Чем ближе они расположены к стенам и углам, тем большее количество баса они воспроизводят. Это свойство на­зывается «усилением помещения». Некоторые фирмы-разра­ботчики АС класса Hi-End прямо указывают, на каком расстоя­нии от стены должны устанавливаться АС для получения наилучшего звучания. В случае, когда АС расположена около стены, энергия отраженных от нее низкочастотных составляю­щих излучаемого звука имеет почти ту же фазу, что и прямой звук. При суммировании прямых и отраженных волн происхо­дит повышение громкости низкочастотных звуков. Если АС в углу, то нижние частоты будут максимальными, и вы услышите наиболее басовое звучание. Эксперт, в зависимости от ситуа­ции и решаемых вопросов, должен сам определить, нужно ли ему такое излишне басовое звучание, или лучше АС отодвинуть подальше от стены. Следует стремиться к их размещению на разных расстояниях от боковых и задней стен. Лучших резуль­татов и максимального комфорта при прослушивании можно добиться, если расстояние от боковой стены до АС и расстоя­ние от нее до задней стены отличаются друг от друга не менее чем на одну треть. А также лучше располагать АС вдоль большей стены помещения, вдали от углов.

      2. Положение громкоговорителей и слушателя влияет на про­явление собственных резонансов помещения. Они усиливают не­которые частотные составляющие, что может привести к нена­туральным «бубнящим» призвукам.

    Эти резонансы имеют вполне определенные для каждого конкретного помещения значения частот и проявляются в виде пиков частотной характеристики. Они возникают вследствие так называемых стоячих волн, представляющих собой непо­движные в пространстве чередования областей повышенного и

    176

    167


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ

    пониженного (относительно атмосферного) звукового давле­ния, называемых пучностями и умами. Структура стоячих волн в помещении определяется его размерами и расположением в нем источников звука. Наличие таких волн придает дополни­тельную окрашенность звучанию. Когда резонансы помещения не слышны, прозрачность звучания средних частот выше, а ба­совые составляющие более определенные. Собственные резо- нансы помещения подробно описаны ниже в этой главе.

    Оптимально размещение АС от задней стены на расстоянии примерно от одной трети до одной пятой длины помещения. Примерно на таком же расстоянии от противоположной стены (передней от АС) располагается и специалист при прослушива­нии фонограммы.

      1. Чем дальше от стен расположены громкоговорители, тем лучше передается глубина звуковой сцены.

      2. Высота расположения слушателя влияет на восприятие ча­стотной характеристики АС.

    Так как изменения частотной характеристики АС наблюда­ются в основном в области средних и высоких частот, уши экс­перта должны находиться на оси ВЧ-головок. В большинстве АС такие головки расположены на высоте от 80 до 100 см от по­ла, что соответствует обычной высоте расположения головы си­дящего эксперта.

      1. Угол разворота громкоговорителей относительно слушате­ля. Угловая ориентация громкоговорителей относительно слу­шателя также влияет на формирование тембрального баланса и на ширину звуковой сцены. При отклонении слушателя от оси АС всего на несколько градусов интенсивность ВЧ-составляю- щей сигнала резко падает. Поэтому каждая АС должна быть по­вернута так, чтобы линия, перпендикулярная ее рабочей плос­кости и исходящая из центра диффузора ВЧ-головки, была направлена точно на слушателя.

    Экран телевизора великолепно отражает звук, поэтому не рекомендуется ставить телевизор между акустическими систе­мами.

    Для улучшения взаимодействия АС и слушателя можно по­пробовать выполнить следующие действия:

    1) изменить акустическое сопряжение АС с границами ком­наты и/или комнатными модами, т. е. переставить АС в другое место;

        1. изменить акустическое сопряжение места слушателя с границами комнаты и/или комнатными модами, т. е. передви­нуть слушателя, что наиболее просто сделать;

        2. передвинуть и АС, и слушателя одновременно;

        3. изменить при помощи эквалайзера сигнал на пути к АС, в самих АС;

        4. проверить, устойчивы ли подставки под АС, при необхо­димости примените шипы или конусные ножки;

    7) акустически изменить комнату, т. е. устранить пики и провалы. Последнее сделать довольно сложно, так как это тре­бует дополнительных затрат.

    То есть, если на низкие частоты при прослушивании основ­ное влияние оказывает комната, на СЧ и ВЧ — уже сама акусти­ческая система, АЧХ и направленность которых определяют ка­чество звука. Поэтому необходимы АС, которые обеспечивают одинаково хорошую тембральную окраску как в прямом, так и раннеотраженном и прочих звуковых полях. Такие АС можно иначе охарактеризовать как АС с ровной и гладкой аксиальной АЧХ и постоянной направленностью, что в совокупности дает ровное и однородное звуковое давление.

    12. Аддитивные шумы и помехи

    В экспертной практике звучащая речь, которая записывается на фонограмму, приобщаемую к делу в качестве доказательства, имеет, как правило, сравнительно невысокое качество, выража­ющееся в узком спектральном диапазоне (обычно от 300—400 до 3400—5000 Гц), низком отношении сигнал/шум (от 0 до 25 дБ), низкой амплитуде полезного сигнала на фоне шума. То есть на фоне полезного речевого сигнала очень часто наблюдаются ин­тенсивные посторонние шумы и различного рода помехи, затрудняющие понимание лингвистического содержания речи, поскольку они мешают слуховому восприятию вербальной (словесной) информации, а потому от помех желательно избав­ляться, используя различные методы и способы шумоочистки.

    Чтобы выбрать оптимальный метод или способ фильтрации шума, повышения разборчивости записанной звучащей речи и комфортность ее прослушивания, необходимо предварительно кратко рассмотреть типы возникающих помех и их источников. Это могут быть:

    178

    179


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ

    • помехи, вызванные каналом связи (телефонный тракт, радиоканал);

    • шумы и нелинейные искажения звукозаписывающей ап­паратуры и магнитного носителя;

    • шумы, обусловленные дефектами и изношенностью зву­козаписывающей и воспроизводящей аппаратуры;

    • шумы и помехи, вызванные акустической средой звукоза­писи и звуковоспроизведения (помещение для прослуши­вания).

    Здесь же необходимо отметить, что к мешающим факторам можно также отнести и собственную нестабильность речеобра- зующего тракта, которая выражается в интериндивидуальной вариативности речевых параметров, а также намеренное или функциональное изменение или искажение присущих человеку голосовых или речевых параметров. Указанные факторы при­сутствуют практически всегда в речевом сигнале, что требует их учета и нормализации.

    Что такое помехи и как с ними можно бороться? Помехой называется стороннее возмущение, действующее на пути следо­вания сигнала от его источника до приемника и препятствую­щее правильному приему (восприятию) сигнала. Точное мате­матическое описание помех, как правило, невозможно. Информативные параметры помех определяются путем их ана­лиза. Источники помех могут быть внутренние и внешние. Ес­ли зашумленный сигнал можно представить в виде суммы по­лезного сигнала и помехи, то такая помеха называется аддитивной. Аддитивную помеху часто называют шумом. Если на речевой сигнал накладывается какой-либо неотрицательный процесс, то помеху называют мультипликативной.

    На практике мультипликативная помеха возникает в тех слу­чаях, когда параметры системы претерпевают случайные изме­нения во времени. В сущности, это наблюдается во всех реаль­ных системах звукозаписи, но в большинстве случаев такие изменения всех параметров, хотя и существуют, но достаточно малые. То есть при звукозаписи на речевой сигнал воздейству­ют аддитивные и мультипликативные помехи.

    Так, например, если звукозапись проводится на открытой местности, то в качестве помех выступают различного рода шу­мы. В этом случае зашумленный речевой сигнал, как указано выше, представляется как сумма полезного сигнала и шума.

    Если звукозапись проводится в помещении или сигнал пере­дается по радио, а также по телефонному тракту, то кроме раз­личного рода аддитивных помех на сигнал накладываются мультипликативные помехи, имеющие частотнозависимую пе­редаточную характеристику. То есть аддитивная смесь претер­певает дополнительные мультипликативные искажения, смесь домножается на резонансы передаточной характеристики трак­та, и в результате полезный сигнал еще больше искажается. За­дача устранения таких аддитивных и мультипликативных помех осложняется вариативностью характеристик акустических по­мех и трактов передачи.

    Таким образом, под шумом понимают помехи, представляю­щие собой смесь случайных и кратковременно детерминиро­ванных (периодических) процессов. Часто под «шумом» подра­зумевают так называемый белый шум, характеризующийся тем, что его амплитудный спектр распределен по нормальному зако­ну, а спектральная плотность мощности (мощность, приходя­щаяся на полосу 1 Гц) постоянна для всех частот. Белый шум может быть узкополосным и широкополосным. Для шума ха­рактерным является то, что невозможно предсказать точное мгновенное значение сигнала в тот или иной момент времени. Можно лишь путем длительного наблюдения оценить вероят­ность появления мгновенного значения функции внутри задан­ного интервала. По этой причине шумы описываются статисти­чески.

    Другая основная разновидность шума — это импульсный шум. В нем имеются лишь два значения сигналов шума и случай­ность процесса проявляется в том, что переход от одного значе­ния к другому может происходить в любой момент времени. Ос­новные характеристики и параметры шума (эффективное значение его напряжения, спектральная плотность мощности, корреляционная функция и иные), а также шумы, вносимые электронной аппаратурой, могут быть экспериментальным пу­тем зафиксированы и измерены. Часто к импульсному шуму от­носят случайные импульсные помехи. Детерминированные сигналы с незначительной случайной составляющей шумом как таковым не являются. Например, наводки от сети перемен­ного тока (однотонное гудение с частотами 50 или 100 Гц) или другой слегка зашумленный гармонический процесс следует относить к классу помех.

    180

    179


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    АДДИТИВНЫЕ ШУМЫ И ПОМЕХИ

    Аддитивные фоновые сигналы можно также классифициро­вать на шумоподобные (например, уличный шум, шум от рабо­тающих механизмов и т. д.) или речеподобные (например, при одновременном разговоре нескольких говорящих). В зависимо­сти от источника, помехи могут быть нескольких типов: посто­янные и непостоянные (или стационарные и нестационарные). По времени помехи различаются на долговременные и удар­ные. Постоянные (стационарные) шумы — это шумы медленно изменяющиеся, например, шум постоянно работающих прибо­ров и устройств. Непостоянные помехи, как и шумы, могут быть импульсными, колеблющимися и прерывистыми. Импульсные помехи состоят из одного или нескольких коротких звуковых импульсов. В нашем случае они представлены шумами типа «песок» (мелкие частые выбросы, которые накладываются на полезный сигнал), «треск» (короткие выбросы с частой потерей полезной информации), «щелчки» (относительно длинные уча­стки с поражениями сложной формы) и т. д. Колеблющиеся шумы — это нерегулярная помеха с изменяющимся уровнем сигнала. Прерывистый шум — это помеха, уровень которой пе­риодически резко падает до уровня фона тракта.

    В общем виде искажения, вносимые различными элемента­ми систем звукозаписи и воспроизведения (магнитофоны, усили­тели, акустические системы и т.д.), называют нелинейными. Они представляют собой изменения формы колебаний, проходя­щих через электрическую цепь (усилитель, трансформатор и т. п.) и вызванных нарушениями пропорциональности между мгно­венными значениями напряжения на выходе и входе этой цепи. То есть имеет место нелинейная зависимость характеристики выходного напряжения от входного. Нелинейные искажения, вносимые аппаратурой, оцениваются величиной коэффициента нелинейных искажений. Незначительные нелинейные искаже­ния (до 1,5—2%) изменяют тембр речи и затрудняют раздельное ее восприятие. С ростом нелинейных искажений на фонограмме появляются неприятные хрипы и дребезжание.

    Шумовые составляющие, вносимые в полезный сигнал уст­ройствами звукозаписи и ее воспроизведения, характеризуются отношением сигнал/помеха. Это отношение выражается в де­цибелах и показывает, насколько номинальный уровень выход­ного полезного сигнала превышает уровень помехи на выходе используемого устройства.

    Кроме того, телефонная сеть может вносить специфические дополнительные помехи в виде слабого эхо с большой задерж­кой, которое в комплексе с узкополосными аддитивными по­мехами значительно влияет на восприятие речи, хотя ее раз­борчивость при этом может падать незначительно. Их появление связано с тем, что телефонная линия от абонента до телефонной станции делается двухпроводной (приходящий и уходящий сигналы переносятся одной парой проводов), кото­рая преобразуется при помощи оконечного устройства на АТС в четырехпроводную, разделяя сигналы, следующие в проти­воположных направлениях. В идеале такое разделение может быть организовано достаточно точно, однако экономически не выгодно подбирать для каждого абонента свое оконечное устройство для получения сбалансированной мостовой схемы. В результате часто наблюдаемой разбалансировки и наблюда­ются эхо-сигналы как результат возвращения говорящему ча­сти сигнала путем отражения. Они особенно заметны при пе­редаче сигнала на большие расстояния (например, при междугородних разговорах).

    Основными причинами помех являются:

    • недостаточная звукоизоляция помещений, где произво­дится звукозапись или где воспроизводится звуковая информа­ция;

    • пульсации выпрямленного тока в источниках питания, электрические и магнитные «наводки» от цепей переменного тока;

    • хаотическое движение (флуктуации) электронов или дру­гих заряженных частиц в проводниках, резисторах, электрон­ных приборах (транзисторах, лампах и т. д.);

    • посторонние электрические и магнитные поля, создавае­мые трансформаторами, электродвигателями, цепями перемен­ного тока, соседними цепями в многопарных кабелях;

    • специфические недостатки носителей записи, обуслов­ленные неоднородностью магнитной ленты, а также копирэф- фект и модуляционный шум;

    • посторонние источники в каналах связи (атмосферные электрические разряды, промышленная, медицинская, быто­вая электроаппаратура).

    Необходимо также обратить внимание на такие часто встре­чающиеся искажения речевого сигнала, как реверберационные.

    183 179

    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ

    Реверберационные искажения - это те искажения, которые пре­терпевает речевой сигнал от источника сигнала (речеобразую- щего тракта человека) до приемника звукового давления (мик­рофон). Эти искажения относятся к классу мультипликативных помех и являются продуктом свертки речевого сигнала с им­пульсной характеристикой акустического тракта. Импульсная характеристика зависит от отражений и переотражений акусти­ческого сигнала, попадающего в микрофон (например, от стен, потолка помещения, мебели, различных предметов и т. п.). Она характеризуется временем реверберации, RT60 или Т, (иногда говорят: время стандартной реверберации) или временем, когда звуковое давление на микрофоне падает относительно началь­ного уровня на определенную величину (на 60 дБ или в 1000 раз). Это время тем больше, чем меньше звуковой энергии при отражениях поглощается стенами и предметами, находя­щимися в помещении.

    Акустические свойства помещения существенно влияют на спектр речевого сигнала и, в первую очередь, на его высокочас­тотную область (они сильнее поглощаются элементами обста­новки комнаты: коврами, мягкой мебелью, материалами ее об­шивки, а также быстрее затухают с увеличением расстояния). При этом может меняться восприятие натуральности звучания речи. Наименьшие реверберационные искажения наблюдаются в открытой местности или в специально подготовленных без- эховых помещениях. При малых значениях Т за счет ревербера­ции увеличивается полезный уровень звукового давления в точ­ке прослушивания. Так, в лучших концертных залах задержка между прямым звуком и первым отражением составляет от 10 до 20 мс. По мере увеличения времени реверберации речь на­чинает искажаться: сначала взрывные звуки, затем снижается разборчивость в целом, появляются «гулкость» и «бубнение», что, в конце концов, делает речь абсолютно неразборчивой. Примером могут служить фонограммы, полученные в гулких пустых залах с голыми стенами.

    В настоящее время в мире имеется значительное число как аппаратных, так и аппаратно-программных комплексов, пред­назначенных для борьбы с различными шумами и помехами, мешающими восприятию звучащей речи, записанной на фоно­грамме. Причем основная масса таких устройств используется в музыкальной звукозаписи и в радиовещании.

    Развитие компьютерных технологий позволило реализовы- вать сложные и эффективные алгоритмы цифровой обработки сигнала. Все они в той или иной степени базируются на инфор­мации о речевом сигнале и фоновом шуме и могут быть разби­ты, согласно литературным данным1, на несколько групп и ос­нованы на следующих подходах:

    • оценка периодичности вокализированной речи;

    • оценивание параметров цифровой модели речеобразова- ния, или Марковская фильтрация;

    • подавление помех методом адаптивной фильтрации по кри­терию минимума среднеквадратичной ошибки фильтрации;

    • непосредственное оценивание кратковременного амплитуд­ного спектра речи (методы спектрального вычитания).

    Наиболее широко в экспертной деятельности по исследова­нию звучащей речи используются устройства, реализующие ме­тод адаптивной фильтрации.

    13. Форматы звуковых файлов

    Звучащая речь может быть записана как на аналоговом, так и цифровом носителе. Сегодня особую сложность в исследова­нии представляют цифровые фонограммы. Рассмотрим, в ка­ких форматах может эксперт получить на исследование цифро­вую фонограмму и файл.

    Понятие формата используется в двух различных смыслах. При использовании специализированного носителя или способа записи и специальных устройств чтения/записи в понятие фор­мата входят физические характеристики носителя звука - раз­меры кассеты с магнитной лентой или диском, самой ленты или диска, способ записи, параметры сигнала, принципы кодирова­ния и защиты от ошибок и т. п. При использовании универсаль­ного информационного носителя широкого применения - на­пример, компьютерного гибкого или жесткого диска - под форматом понимают только способ кодирования цифрового сиг­нала, особенности расположения битов и слов и структуру слу­жебной информации; вся «низкоуровневая» часть, относящая­ся непосредственно к работе с носителем, в этом случае остается в ведении компьютера и его операционной системы.
    1 Галяшина Е.И.Прикладные основы судебной фоноскопической экспертизы // Теория и практика судебной экспертизы. - СПб: ПИТЕР, 2003.


    184

    185


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ

    Многие форматы отличаются друг от друга только порядком битов в слове, отсчетов левого и правого каналов в потоке и слу­жебной информацией — заголовками, контрольными суммами, помехозащитными кодами и т. п. Точный способ проверки неис­кажаемости сигнала заключается в преобразовании нескольких различных потоков (файлов) формата F1 в формат F2, а затем об­ратно в F1. Если информационная часть каждого потока (фай­ла) при этом будет идентична исходной — данный вид преобра­зования можно считать неискажающим.

    Под информационной частью потока (файла) понимается собственно набор данных, описывающих звуковой сигнал; ос­тальная часть считается служебной и на форму сигнала в общем случае не влияет. Например, если в служебной части файла или потока предусмотрено поле для времени его создания (переда­чи), то даже в случае полного совпадения информационных час­тей двух разных файлов или потоков их служебные части окажут­ся различными, и это будет зафиксировано логическим анализатором в случае потока или программой побайтного срав­нения — в случае файла. Кроме этого, временной сдвиг одного сигнала относительно другого, возникающий при выравнива­нии цифрового потока по границам слов или блоков и состоя­щий в добавлении нулевых отсчетов в начало и/или конец файла или потока, также приводит к их кажущемуся цифровому несо­впадению. В таких ситуациях для проверки идентичности циф­ровых сигналов необходимо пользоваться специальной аппара­турой или программой.

    Из специализированных форматов и носителей цифрового звука в настоящее время наиболее известны следующие:

    CD (Compact Disk — компакт-диск) — односторонний пласт­массовый диск с оптической лазерной записью и считыванием, диаметром 120 или 90 мм, вмещающий 80 или 90 минут стерео­звучания с частотой дискретизации 44,1 кГц и 16-разрядным линейным квантованием. Система предложена фирмами Sony и Philips и носит название CD-DA (Compact Disk — Digital Audio). Различаются штампованные (CD), однократно записываемые (CD-R) и многократно перезаписываемые (CD-RW) компакт- диски.

    S-DAT (Stationary head Digital Audio Tape — цифровая звуко­вая лента с неподвижной головкой) — система наподобие обыч­ного кассетного магнитофона, запись и чтение в которой ведутся

    блоком неподвижных тонкопленочных головок на ленте шири­ной 3,81 мм в двухсторонней кассете размером 86 x 55,5 x 9,5 мм. Реализует 16-разрядную запись двух или четырех каналов на ча­стотах 32, 44,1 и 48 кГц.

    R-DAT (Rotary head Digital Audio Tape — цифровая звуковая лента с вращающейся головкой) — система наподобие видео­магнитофона с поперечно-наклонной записью вращающимися головками. Наиболее популярный формат ленточной цифро­вой записи системы R-DAT часто обозначаются просто DAT. В R-DAT используется кассета размером 73 x 54 x 10,5 мм, с лен­той шириной 3,81 мм, а сама система кассеты и магнитофона очень похожа на типовой видеомагнитофон. Базовая скорость движения ленты — 8,15 мм/с, скорость вращения блока голо­вок — 2000 об/мин. R-DAT работает с двухканальным (в ряде моделей — четырехканальным) сигналом на частотах дискрети­зации 44.1 и 48 кГц с 16-разрядным линейным квантованием, и 32 кГц — с 12-разрядным нелинейным. Для защиты от ошибок используется двойной код Рида-Соломона и модуляция кодом 8-10. Емкость кассеты — 80—240 минут в зависимости от скоро­сти и длины ленты. Бытовые DAT-магнитофоны обычно осна­щены системой защиты от незаконного копирования фоно­грамм, не допускающей записи с аналогового входа на частоте 44,1 кГц, а также прямого цифрового копирования при наличии запрещающих кодов SCMS (Serial Code Managenent System). Студийные магнитофоны таких ограничений не имеют.

    DASH (Digital Audio Stationary Head) — система с записью на магнитную ленту шириной 6,3 и 12,7 мм в продольном направ­лении неподвижными головками. Скорость движения ленты — 19,05, 38,1, 76,2 см/с. Реализует 16-разрядную запись с частота­ми дискретизации 44,056, 44,1 и 48 кГц от 2 до 48 каналов.

    DAT (Alesis DAT) — собственная система восьмиканальной записи звука на видеокассету типа S-VHS, разработанная фир­мой Alesis. Использует 16-разрядное линейное квантование на частоте 48 кГц, емкость кассеты составляет до 60 минут на каждый канал. Магнитофоны ADAT допускают каскадное соединение, в результате чего может быть собрана система 128-канальной син­хронной записи. Для ADAT выпускается множество различных интерфейсных блоков для сопряжения с DAT, CD, MIDI и т. п. Модель Meridian (ADAT Type II) использует 20-разрядное кван­тование на частотах 44,1 и 48 кГц.

    186

    185


    ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ

    ПРИЛОЖЕНИЕ 1

    DCC (Digital Compact Cassette — цифровая компакт-кассе­та) — бытовая система записи в продольном направлении на стандартную компакт-кассету, разработанная Philips. Скорость движения ленты — 4,76 см/с, максимальное время звучания та­кое же, как при аналоговой записи. Частоты дискретизации — 32, 44,1, 48 кГц, разрешение — 16/18 разрядов (метод сжатия PASC). На DCC-магнитофонах могут воспроизводиться (но не записываться) обычные аналоговые компакт-кассеты. В насто­ящее время система DCC признана неперспективной.

    MD (MiniDisk) — бытовая и концертная система записи на магнитооптический диск, разработанная Sony. Диск диаметром 64 мм, помещенный в пластмассовый футляр размером 70 x 67,5 x 5 мм, вмещает 74 минуты (60 в ранних версиях) стереофониче­ского звучания. При обмене с внешними устройствами исполь­зуется формат 16-разрядных отсчетов на частоте 44,1 кГц, одна­ко на сам диск сигнал записывается после сжатия методом ATRAC.

    Из универсальных компьютерных форматов наиболее попу­лярны следующие:

    Microsoft RIFF/WAVE (Resource Interchange File Format/Wave — формат файлов передачи ресурсов/волновая форма) — стан­дартный формат звуковых файлов в компьютерах IBM PC. Файл этого формата содержит заголовок, описывающий общие параметры файла, и один или более фрагментов (chunks), каж­дый из которых представляет собой волновую форму или вспо­могательную информацию — режимы и порядок воспроизведе­ния, пометки, названия и координаты участков волны и т. п. Файлы этого формата имеют расширение WAV.

    Apple AIFF (Audio Interchange File Format — формат файла обмена звуком) — стандартный тип звукового файла в системах Apple Macintosh. Похож на RIFF и также позволяет размещать вместе со звуковой волной дополнительную информацию, в ча­стности — самплы WaveTable инструментов вместе с параметра­ми синтезатора.

    Формат «чистой оцифровки» RAW, не содержащий заголов­ка и представляющий собой только последовательность отсче­тов звуковой волны. Обычно оцифровка хранится в 16-разряд­ном знаковом (signed) формате, когда первыми в каждой паре идут отсчеты левого канала, хотя могут быть и исключения.

    Приложение 1

    Глоссарий по компьютерной обработке звука и магнитной звукозаписи
    1   ...   8   9   10   11   12   13   14   15   ...   18


    написать администратору сайта