Слух и восприятие звука. Курс лекций СанктПетербург 2012
Скачать 450.25 Kb.
|
Интенсивность звука I . Она определяется как среднее количество звуковой энергии, проходящей в единицу времени через единицу поверхности, и связана со звуковым давлением равенством I = P 2 / Q 0 , где Q 0 – удельное сопротивление воздуха, Q 0 = 1.23 кГ/м 3 . Единицей измерения интенсивности является Вт/м 2 Уровни интенсивности и децибелы. При исследовании восприятия изменений интенсивности звука было установлено, что одинаковые относительные изменения интенсивности вызывают одинаковые абсолютные изменения слухового ощущения, т.е. слуховое ощущение E пропорционально логарифму раздражающей силы. Математически это записывается в виде E = a lg I + C. Интенсивность на пороге слышимости обозначим I пс . При этом слуховое ощущение равно нулю, поэтому С = – a lg I пс , откуда E = a lg (I / I пс ). Для оценки величины слухового ощущения была предложена единица под названием «бел» (а = 1). Эта единица соответствует десятикратному отношению интенсивностей, поэтому была введена более мелкая единица – децибел, равная 0,1 бела. Слуховое ощущение в децибелах E = 10lg( I / I пс ). Диапазон изменения интенсивности звука составляет 10 14 раз, а слуховое ощущение изменяется на 130 дБ. Это значит, что величина элементарного скачка по диапазону амплитуд в среднем равна 0,8 дБ, что соответствует изменению интенсивности в 1,2 раза. Вследствие логарифмического закона восприятия звука и широкого диапазона интенсивностей слышимых звуков было введено понятие уровня интенсивности N(I) = 10 lg (I / I 0 ). За нулевой уровень интенсивности условились принимать интенсивностьзвука, равную I 0 = 10 –12 Вт/м 2 . Эта интенсивность близка, но не равна, порогу слышимости для нормального слуха на частоте 1 кГц. Нулевой уровень по звуковому давлению P 0 определяется расчетным путем по формуле P 0 = (I 0 Q 0 C 0 ) 0,5 = 2.04 10 –5 Па. Интенсивность и звуковое давление связаны квадратичной зависимостью, поэтому уровень звукового давления N определяется равенством N = 20 lg (P / P 0 ), но всегда уровни по звуковому давлению и интенсивности равны. 9 Из приведенных формул следует, что каждое двукратное изменение интенсивности соответствует изменению уровня на 3 дБ. Каждое двукратное изменение звукового давления приводит к изменению его уровня на 6 дБ. Уровни интенсивности и звукового давления сложного звука суммируются алгебраически: N(I) = 10lg [(I a +I b +I c +...) / I 0 ] = N(I) a + N(I) b + N(I) c +… В качестве объективной характеристики широкополосных шумов с непрерывным спектром используются спектральная плотность мощности R, которая определяет распределение интенсивности звука по частоте и измеряется в Вт/м 2 , Гц. Численно она равна интенсивности звука в полосе ∆ F шириной 1 Гц R = I / ∆ F. Уровень спектральной плотности мощности шума вычисляется по формуле N(R) = 10 lg (R / R 0 ), где R 0 – нулевой уровень спектральной плотности (R 0 = 10 –12 Вт/м 2 , Гц). Для большинства музыкальных инструментов спектральная плотность мощности равномерна до 3,5…4 кГц и далее уменьшается с крутизной 6 дб/октаву. Частота – 20...20000 Гц (диапазон – 10 октав). Гармоническая октава – диапазон частот с отношением частот 2:1, Октавная шкала частот. В этой шкале диапазон звуковых частот разделен только на октавы. Если в эту шкалу входит частота 1 кГц, она называется основной шкалой. Октавная шкала может быть разделена на меньшие отрезки: в пол-октавы, треть-октавы и.т.д. Значения октавных частот и внутри октавы определяются расчетным путем. Октавные частоты: F ОКТ =1000 2 i , Гц где i – номер октавы, от 0 до ±5 . Частоты внутри октав: F x = F ОКТ 2 j/x где x – число, указывающее на сколько частей делится октава (2, 3, 6,…), j = 0 ÷ (x – 1). В электроакустике и аудиотехнике преимущественно используется основная треть октавная шкала частот. 5. Пороги слышимости Порог слышимости – это минимальное звуковое давление, при котором еще существует слуховое ощущение. Наличие порога слышимости определяется строением слуховой системы человека. Этот порог характеризует чувствительность уха к интенсивности звуковой энергии. Величина порога слышимости зависит от характера используемых звуковых колебаний и условий измерений. Порог слышимости называют абсолютным при измерении его на тональном звуке в полной тишине. Определяется он для людей в возрасте 18…20 лет при размещении источника звука перед слушателем Длительность воздействия звука должна быть не меньше 250 мс. График частотной зависимости уровня абсолютного порога слышимости N АПС приведен на рис. 5. На этом графике по оси абсцисс отложена частота испытательного тона F Т , а по осям ординат звуковое давление P в Паскалях и 10 уровень звукового давления N в децибелах. Напомним, что уровень звукового давления и уровень его интенсивности всегда равны. Чувствительность уха максимальна на частотах 2…5,0 кГц. На этих частотах абсолютный порог слышимости меньше 2 10 –5 Па. За нулевой уровень принято звуковое давление 2Е–5 Па. Следует заметить, что звуковое давление, возникающее вследствие броуновского движения молекул при температуре 25 градусов, составляет 5Е–6 Па. Если бы ухо было вдвое чувствительней, оно слышало бы непрерывный шум флуктуаций молекул воздуха и тока крови. Таким образом, чувствительность уха находится на пределе биологической целесообразности. Пороги слышимости разные для левого и правого уха, поэтому результаты измерений зависят от того, что используется при измерениях: громкоговоритель или телефоны. При использовании телефонов абсолютный порог слышимости выше на 5…10 дБ. С возрастом слух людей притупляется и быстрее всего на высоких частотах. Обычно на частоте 10 кГц чувствительность уха у 60-летнего человека на 20 дБ ниже, чем у 20-летнего. При давлении от 60 до 80 Па возникает ощущение давления на уши – эта величина называется порогом осязания. При уровне давления около 100 дБ возникают неприятные ощущения. Давление от 150 до 200 Па причиняет боль и называется болевым порогом. Слуховая система человека приспособлена к звукам малой и средней интенсивности с уровнем давления не выше 90 дБ. Звуки с уровнем давлением уже больше 75 дБ приводят к изменению порогов слышимости и даже к полной глухоте. Степень повреждения пропорциональна времени воздействия. Иногда порог чувствительности восстанавливается через 16...20 часов. Наибольшее влияние на сдвиг порога чувствительности оказывают высокие частоты. Понижение слуха по этим причинам лечению не поддается. Исследования показали, что в последние годы резко снизился порог слышимости у молодых людей, что возможно связано с образом их музыкальной жизни. Области слышимости тональных звуков. Кривые абсолютного порога слышимости и порога болевого ощущения на рис. 5 ограничивают области слышимости музыки и речи. Диапазон давлений : речь от 40 до 84 дБ, музыка от 35 до 100 дБ. Полоса частот: речь от 100 до 7000 Гц, музыка от 31 до 15000 Гц. 11 В этой области чувствительность уха на граничных частотах понижается на 60…80 дБ. Поэтому очевидно, что совершенно бесполезно при цифровом кодировании передавать составляющие спектра звука не ниже абсолютного порога слышимости. Так как этот порог существенно зависит от частоты, то целесообразно кодирование производить в частотной области с помощью субполосной фильтрации. Диапазон слышимых звуков составляет 120…130 дБ, однако уровень звукового давления на музыкальной программе не превышает 100 дБ, а для речи – 84 дБ. Причем этот диапазон существенно зависит от частоты. Это необходимо учитывать при выборе числа разрядов для различных программ и в зависимости от частотной полосы кодирования. Целесообразно также при кодировании иметь переключение речь/музыка, что позволит при передачи речи существенно сократить скорости цифровых потоков. Кривая порога слышимости может быть также снята с помощью узкополосного шума и созвучий. Особый интерес представляет порог слышимости шума с равномерной спектральной плотностью в звуковом диапазоне частот. Он равен +12 дБ. Таким шумом являются ошибки квантования в цифровых звуковых трактах. Они в значительной мере определяют качество звучания. 6. Критические полосы слуха При восприятии звука слуховой аппарат человека разделяет его на частотные группы, называемые критическими полосами. Эта особенность слуха является одним из важнейших его свойств. Понятия частотная группа и критическая полоса слуха тождественны. В диапазоне от 20 до 16000 Гц число критических полос равно 24. Ширина этих полос меняется от низких к высоким частотам нерегулярным образом: 80,100,100,100,110,120,140,150,160...Гц, на 20 кГц ширина полосы увеличивается до 5 кГц. Стандартом MPEG установлены нижние границы критических полос слуха: 20, 100, 200, 300, 400, 510, 630, 770, 920, 1080, 1270, 1480, 1720, 2000, 2320, 2700, 3150, 3700, 4440, 5300, 5400, 7700, 9500, 12000, 16000 Гц. Критические полосы слуха не зависят от уровня интенсивности шума.В области до 500 Гц ширина частотных групп почти не зависит от средней частоты шума и равна примерно 100 Гц. В области выше 500 Гц она увеличивается пропорционально средней частоте (рис. 6). При этом соблюдается не абсолютное, а относительное постоянство ширины полосы ∆ F / F – const. Ширина критической полосы при этом определяется равенством 12 ∆ F КР = 0,2F. В пределах частотных групп слух интегрирует возбуждение по частоте и не различает тонкой структуры возбуждения. На этом основании при субполосном кодировании звука в пределах каждой частотной группы достаточно передавать лишь одну максимальную составляющую спектра. По этой же причине слух реагирует не на общую мощность шума, а на мощность шума в критических полосах. Таким образом, при воздействии широкополосного шума слух как бы превращает сплошной спектр в дискретный. Такой спектр состоит из конечного числа составляющих по числу критических полос слухового аппарата. Если ширина спектра узкополосного шума меньше ширины критической полосы слуха, то уровень громкости в этой полосе определяется лишь общей энергией шума и совершенно не зависит от характера распределения интенсивности в полосе.Она может быть распределена равномерно или сосредоточена в части полосы или быть в виде одного тона. Критические полосы слуха оказалось удобно использовать в качестве единицы субъективной высоты тоны, которую назвали барк. В настоящее время в психоакустических моделях слуха вместо частотных шкал используются шкалы высоты тона звука в барках. Такие же шкалы используются при расчете коэффициентов маскировки. На рис. 7 приведен график перевода частотной шкалы высоты тона в октавах в шкалу высоты тона в барках. По оси абсцисс отложена высота тона в октавах, а по оси ординат – высота тона Z в барках. 7. Пороги слышимости при маскировке При одновременном воздействии на слух двух звуков один из них может не прослушиваться на фоне другого звука. Этот эффект называется маскировкой. Маскирующее действие различных звуков выявляется путем определения повышения порога слышимостииспытательных тонов N ПС относительно абсолютного порога слышимости N АПС . Понятия порога слышимости и уровня порога слышимости тождественны. Коэффициент маскировки К М рассчитывается в децибелах как разность уровней этих двух порогов К М = N ПС – N АПС 13 Маскировка чистым тоном. На рис. 8 приведены кривые маскировки испытательных тонов в диапазоне частот, когда маскирующим звуком является тоже тон, но с фиксированной частотой F М и заданным уровнем интенсивности N М. На этом рисунке по оси ординат откладывается уровень порога слышимости маскируемого тона N ПС , а по оси абсцисс – его частота F Т и частота маскирующего звука F M . По этим кривым для заданных значений N М , F M и F Т определяется порог слышимости маскируемого тона F Т и рассчитывается коэффициент маскировки тонального звука чистым тоном K M.TT ( по приведенной выше общей формуле для коэффициента маскировки К М ). Особенности маскировки чистым тоном. Эти особенности могут быть сформулированы следующим образом: • маскировка максимальна, когда частоты F Т и F М близки, чем дальше по частоте они расположены друг от друга, тем меньше коэффициент маскировки; • коэффициент маскировки увеличивается по мере возрастания уровня интенсивности маскирующего тона N М ; • кривые маскировки существенно несимметричны по шкале частот, у них более резкий спад в сторону низких частот и плавное понижение в сторону верхних частот, поэтому маскировка сильнее проявляется в области высоких частот; • сдвиг маскирующего звука по частоте приводит к изменению формы кривой маскировки. Если частота тона F Т равна удвоенной, утроенной и выше частоте маскирующего тона F М , то в широком диапазоне слышимости возникают биения, которые проявляются в виде провалов на графиках кривых маскировки, показанные штриховкой. Эти биения тем заметнее, чем больше уровень интенсивности маскирующего тона. Они возникают из-за нелинейности слуха. Если маскировка осуществляется сразу несколькими тонами (созвучием), то кривая порога слышимости во всем частотном диапазоне созвучия лежит выше абсолютного порога слышимости. В этом случае кривые порога слышимости имеют множество максимумов и зон биений. При малой громкости высокий тон хорошо слышен одновременно с низким тоном. При высокой громкости высокие частоты могут полностью маскироваться низкими. Маскировка узкополосным шумом. При маскировке тона с частотой F Т узкополосным шумом с центральной частотой F М и уровнем интенсивности N М (рис. 9) кривые маскировки примерно такие же, как при маскировке тоном с некоторыми отличиями: • нет биений и провала коэффициента маскировки на средней частоте мешающего звука, 14 F M • максимум маскировки на 4 дБ ниже максимума уровня интенсивности маскирующего шума. Для тональных звуков выше 1 кГц маскирующее действие шума значительное, в то время как частоты на октаву ниже частоты F М практически не маскируются. Это очень важно, так как при дискретизации часто возникают искажения ниже спектра основного тона, которые не маскируются. Например, на частоте тона 9 кГц 5 гармоника ошибок квантования с частотой дискретизации 44 кГц образуют паразитную составляющую в звуковом спектре с частотой 1 кГц. Графики на рис. 9 позволяют рассчитать допустимое отношение сигнал-шум квантования (С/Ш) с учетом маскировки. Дело в том, что тональный сигнал и узкополосный шум маскируют не только тоны, но и широкополосные шумы квантования с равномерной спектральной плотностью. Для маскирующих звуков с большим уровнем интенсивности, например, 100 дБ, нижняя граница частотной области, где происходит маскирование шумов квантования, равна примерно 500 Гц. На этой частоте порог слышимости при маскировке на 20 дБ выше порога слышимости в тишине (это видно из графика на рис. 9). В этом диапазоне критические полосы слуха в 10 раз меньше таких полос в области 2…5 кГц. Поэтому для шума квантования с равномерной спектральной плотностью допустимое увеличение уровня интенсивности шума в такой полосе составит 10 дБ. В результате порог слышимости шума увеличивается до 30 дБ. Если учесть, что пороговый уровень слышимости шума в тишине равен +12 дБ, то допустимое значение уровня интенсивности шума квантования составит 42 дБ, а допустимое отношение сигнал/шум квантования 58 дБ ( 100 - 42 ) дБ. Поэтому величина отношения С/Ш 60 дБ является нормой при цифровой передаче узкополосных сигналов в широкополосных трактах. Маскировка шума квантования тональными звуками и узкополосными шумами имеет очень большое значение при кодировании звука, так как передавать составляющие спектра, которые маскируются, не нужно. Это позволяет существенно сократить необходимое число разрядов и, следовательно, избыточность в звуке и скорости цифровых потоков. Смещение частоты маскирующего звука приводит к смещению кривой маскировки по оси частот (рис. 9). В области выше 1 Кгц кривая маскировки меняется мало. На частотах ниже 1 кГц эта кривая видоизменяется достаточно сильно. Особенно важно, что она расширяется в область НЧ. Маскировка тональных звуков широкополосным белым шумом. При маскировке тона белым шумом кривые маскировки существенно видоизменяются (рис. 10). Эти особенности могут быть сформулированы следующим образом: 15 F M • вместо уровня интенсивности маскирующего звука для характеристики мощности шума используется уровень спектральной плотности мощности N(R) БШ • до частоты 500 Гц кривые маскировки идут горизонтально, • на частотах выше 500 Гц порог слышимости повышается, это изменение составляет 3 дБ/октаву и при увеличении частоты в 10 раз порог возрастает на 10 дБ. Такая зависимость объясняется тем, что органы слуха реагируют не на общую мощность, а на мощность шума в критических полосах слуха. Ниже 500 Гц все критические полосы слуха имеют одинаковую ширину, поэтому порог слышимости от частоты не зависит. В области частот, где ширина критических полос слуха пропорциональна средней частоте, при увеличении частоты в 10 раз порог слышимости возрастает на 10 дБ. При маскировке шумом слух расчленяет широкополосный шум на частотные группы и может распознать испытательный тон c частотой F Т лишь тогда, когда его уровень всего на несколько децибел ниже уровня мешающего шума в частотной группе, где находится тон. При маскировке тона белым шумом с уровнем спектральной плотности мощности N(R) БШ коэффициент маскировки определяется как разность между величинами порога слышимости тона и абсолютного порога слышимости этого же звука K M ТШ = N ПС - N АПС Например, при N(R) БШ = 40 дБ на частоте 1 кГц порог слышимости тона равен 58 дБ, а абсолютный порог слышимости – 3 дБ, поэтому коэффициент маскировки тона шумом K М.ТШ равен 55 дБ. |