Главная страница
Навигация по странице:

  • Основы цифрового представления речевых сигналов: и мпульсно-кодовая модуляция

  • Рихтер лекции системы радиосвязи. рихтер лекции. Кафедра радиовещания и электроакустики


    Скачать 3.27 Mb.
    НазваниеКафедра радиовещания и электроакустики
    АнкорРихтер лекции системы радиосвязи
    Дата20.12.2019
    Размер3.27 Mb.
    Формат файлаdoc
    Имя файларихтер лекции.doc
    ТипКонспект
    #101315
    страница4 из 10
    1   2   3   4   5   6   7   8   9   10

    а)




    б)





    Рис. 5.2. Схематичное изображение угольного (а) и электромагнитного (б) микрофонов

    Такие микрофоны стабильны в работе, однако им свойственны большая неравномерность частотной характеристики и значительные нелинейные искажения. С целью повышения разборчивости речи частотную характеристику этих микрофонов корректируют (поднимают) в области высоких частот с крутизной 6 дБ/октава.

    В качестве электроакустических преобразователей, превращающих электрические колебания в звуковые, акустические колебания воздушной среды (т.е. акустические волны), используют громкоговорители и телефоны. В настоящее время наиболее распространены электродинамические громкоговорители непосредственного излучения (диффузорные). Однако в абонентских устройствах СПРС они находят ограниченное применение. В отличие от громкоговорителя задачей теле­фона является не излучение акустической энергии в окружающее воз­душное пространство, а подведение ее непосредственно к уху. Это определяет конструкцию голов­ного телефона, который состоит из электроакустического преобразователя, капсю­ля, корпуса, а также эластичной раковины, являющейся элементом, свя­зывающим его с ухом (рис. 5.3). Здесь: 1 – раковина, 2 – капсуль, 3 – преобразователь, 4 – канал уха.

    В телефонах, в основном, применяются электромагнитные преобразо­ватели, а также электродинамические, электростатические, и угольные. На рис. 5.4 показаны варианты конструкций телефонов: 1 электродинамического с сосредоточенной звуковой катушкой; 2 электродинамического с распределенной звуковой катушкой; 3 электростатического; 4 — электретного (близкого по конструкции к конденсаторному). Катушку в электродинамических преобразователях телефонов выполняют либо в традиционной форме, когда она намотана проводом на каркас, либо в варианте, в котором она состоит из концен­трических плоских колец, напыленных или нанесенных другим методом на плоскую диафрагму.





    Рис. 5.3. Конструкция голов­ного телефона

    Важными характеристиками телефона являются его чувствительность и частотная характеристика чувствительностифактически АЧХ по звуковому давлению, создаваемому телефоном в слуховом канале человека. Чувствительность измеряется в Па/В, т.е. в единицах звукового давления на 1 В подведенного напряжения сигнала. Типичные значения чувствительности (иногда называемой в справочниках – отдачей) – от 5…8 до 15…21 Па/В. Типичные полосы частот, эффективно воспроизводимые телефонами, составляют 300…3400 Гц, в то же время для контроля звукозаписи выпускаются телефоны с полосой 100…5000 Гц и даже 40…16000 Гц, а стереофонические телефоны характеризу-ются полосой 20…20000 Гц.
    Рис. 5.4. Варианты конструкций телефонов

    Технические характеристики громкоговорителя и телефона должны соответствовать характеристикам канала, передающего речевой сигнал. Этому требованию довольно трудно удовлетворить, поскольку громкоговоритель работает в относительно широкой полосе частот, в которой отношение граничных частот достигает 1000 (длина акустической волны изменяется примерно от 17 м до 17 мм), а у телефонов это отношение изменяется от 10 до 400.

    6. Передача речевых сигналов по сетям связи

    Рассмотрим общую модель цифровой системы связи, представленную на рис. 6.1. Структура системы определяет необходимые процедуры обработки речевого сигнала, а её характе­ристики - основные свойства СПРС и прежде всего – энергетические и спектральные.



    Рис. 6.1. Модель цифровой системы связи

    Источник сообщения генерирует сообщения, представляющие собой либо непрерыв­ные функции от времени, либо потоки дискретных сигналов. Пример непрерыв­ного во времени сообщения - волновой сигнал, передающий человеческую речь. Чтобы передать такой аналоговый сигнал через цифровую систему связи, его не­обходимо преобразовать в цифровую форму. С этой целью сигнал последовательно подвергается аналого-цифровому преобразованию (АЦП) и кодированию с устранением избыточности в кодере источника. Хороший кодер источника «подгоняет» длину двоичных последовательно­стей под статистические свойства источника сообщений. В случае передачи речевого сигнала, кодер источника принято называть коде­ром речи. Важной характеристикой сигнала, преобразованного в цифровую форму, является цифровая скорость передачи (скорость цифрового представления), измеряемая числом формируемых на выходе АЦП двоичных символов в единицу времени - Rц, бит/с. В результате сжатия информациикоде­ром речи скорость цифрового потока многократно уменьшается при сохранении приемлемого качества передачи речи.

    На следующем этапе компактно представленный речевой сигнал подвергается ряду преобразований, основное из которых – помехоустойчивое (избыточное) кодирование. Дело в том, что некоторые физические явления, происходящие в каналах связи, приводят к возникновению ошибок при приеме сигналов. Эти ошибки можно представить как разность переданной и восстановленной из принятого сигнала двоичными после­довательностями. Для того чтобы обнаружить и по возможности исправить ошибки, применяются канальный кодер в передатчике и канальный декодер в приемнике. К информационным блокам добавляется определенное число вы­бранных особым образом дополнительных битов. Значения этих битов рассчи­тываются путем сложения по модулю двух информационных битов, подбираемых таким образом, чтобы между ними существовала алгебраическая взаимосвязь, позволяющая обнаружить и скорректировать возможные ошибки.

    Следующая процедура преобразования речевого сигнала на передающей стороне канала связи – модуляция, которой на приемной стороне соответствует демодуляция. Модем, реализующий эти процедуры, является своеобразным интерфейсом, согласующим дискретную часть системы с её непрерывной частью, которая представлена на рис. 6.1 радиоблоком и физическим каналом. Модулятор - это блок, формирующий синусоидальный сигнал, параметры которого (частота, амплитуда и/или фаза) являются функциями по­данной на его вход цифровой последовательности. В результате модуляциинесу­щий информацию сигнал переносится в соответствующую часть радиодиапазо­на и приобретает четко сформированные спектральные параметры. Это свойство сигнала — важнейшее для систем подвижной связи. Здесь необходимо эффектив­но использовать выделенные спектральные ресурсы, чтобы не искажать сигна­лы, передаваемые пользователями соседних областей спектра. Электромагнитный спектр - ценный и ограниченный ресурс, поэтому каждая система должна использовать максимально возможное количество своих собственных каналов в выделенном ей частотном диапазоне.

    Радиоблок, иначе – высокочастотый (ВЧ) блок, работает в радиочастотном диапазоне и усиливает радиосигнал до требуемого уровня. Ширина полосы сигнала зависит от выбранного типа модуляции и используемого метода многостанционного до­ступа. Обычным требованием к применяемому в системе подвижной связи усилителю ВЧ является ограничение энергопотребления. Поэтому усилитель ВЧ дол­жен обладать большим динамическим диапазоном и вынужден функционировать в нелинейной области своих характеристик. Компенсировать нелинейные искажения, вносимые усилите­лем ВЧ, позволяет применение методов модуляции с постоянной или слабо ме­няющейся огибающей.

    В системах подвижной связи передатчик излучает сигнал в пространство с помощью антенны. Свойства канала тесно связаны с типами передающей и при­емной антенн. Особенно важную роль играют параметры направленного дейст­вия и усиления антенны. Характеристики антенны определяют рабочий диапа­зон системы и ее эффективность.

    Преобразования, производимые в приемнике, имеют обратное соответствие процессам, происходящим в передатчике. После усиления и фильтрации в каска­дах ВЧ блока принятый сигнал демодулируется. Характер преобразования зави­сит от применяемого метода цифровой модуляции и параметров канала. Сильное влияние на выбор типа применяемого демодулятора оказывает фактор стоимост­ной реализации приемника. Основная задача демодулятора - выделить последо­вательность импульсов из модулированного сигнала, полученного после ВЧ об­работки. На основе этих импульсов демодулятор выделяет из принятого сигнала переданные символы данных и преобразует их в двоичные последовательности.

    Канальный декодер, используя добавленные канальным кодером избыточные биты, а также дополнительную информацию о достоверности принятого сигна­ла, определяет кодовую последовательность. Из полученной кодовой последова­тельности выделяется двоичная информационная составляющая. Именно она является основной целью декодирования.

    Декодиро­ванный сигнал преобразуется в декодере источника (в СПРС – в декодере речи) и после цифро-аналогового преобразования (ЦАП) попадает через усилитель и громкоговоритель (телефон) в приемник сообщений - ухо пользователя.

    Основные требования, предъявляемые к процессу передачи речи по сетям связи, — это высокое качество сигнала и низкая системная (временная) задержка. При этом качество речи по большей части напрямую связано со ско­ростью цифрового потока на выходе кодера речи, в то же время более сложные алгоритмы кодирования речи способны достичь более высоких отношений качества к скорости ци­фрового потока.

    Сжатие речи при ее передаче сокращает объем передаваемых данных, затраты и, благодаря этому, позволяет снижать цены на услуги. Очевидно, чем изощренней алгоритм кодирования речевого сигнала, тем сложнее его реализовать. Сложность связана с вычислениями, необходимыми для воспроизведения процессов кодиро­вания и декодирования сигналов в реальном времени в микросхемах АТ. Скорость обработки измеряется миллионами опе­раций в секунду (MIPS). Достижения в технологии сигнальных процессоров (DSP), сверхбольших интегральных схем (VLSI) и увеличение емко­сти элементов памяти позволяют выполнять более сложные алгоритмы кодирования-декодирования речи даже в однокристальных микропро­цессорах. Сложность обработки влияет на физические размеры кодека речи, на его стоимость, потребляемую мощность, а также отражается на величине коммутационной задержки – временной задержке сигнала при его обработке и буферизации в кодере и декодере. Задержка речевого сигнала в трактах передачи и приема не имеет большого значения в системах вещания, однако в телефонном канале значительное запаздывание сигнала заметно снижает качество восприятия речи. Реальные коммутационные задержки (при кодировании и декодировании) составляют от 125 мкс (в линиях с ИКМ) до 100 мс (в некоторых низкоскоростных системах кодирования). Предельно допустимой в телефонии считается общая задержка порядка 400 мс. Например, в стандарте GSM система синхронизации рассчитана на компенсацию абсолютного времени задержки сигналов до 233 мкс, что соответствует максимальному радиусу соты 35 км.

    Исторически сложились два направления кодирования речи: кодирование формы сигнала (КФС), называемое также аппроксимацией формы речевой волны, ипараметриче­ское компандирование речи, иногда называемое кодированием источника сигнала. В первом методе кодер формы волны аппроксимирует форму речевого сиг­нала во времени. Этот метод основан на использовании статистических характеристик речевого сигнала (РС) и практически не зависит от механизма его формирования. Кодеры этого типа обеспечивают высокое качество пере­дачи речи, но скорость цифрового потока редко бывает меньше 32 кбит/с. Поэтому для кодирования речи со скоростью передачи 16 кбит/с и меньше – прежде всего для цифровых систем сотовой и персональной спутниковой связи - получили мощное развитие разнообразные методы параметриче­ского компандирования речи (табл. 6.1).

    Таблица 6.1.

    Вид преобразования речи

    Устройства преобра- зования

    Алгоритмы кодирования -декодирования речи

    Скорость передачи, кбит/с

    Кодирование формы сигнала


    Кодеры формы

    сигнала

    Импульсно - кодовая модуляция (ИКМ)

    64

    Дифференциальная ИКМ (ДИКМ)

    48/52/56

    Адаптивная дельта-модуляция (АДМ)

    40

    Адаптивная дифференциальная ИКМ (АДИКМ)

    32

    Парамет-

    рическое компандирование

    (кодирова-

    ние) речи

    Вокодеры

    Спектрально-временные (полосный, формантный, гармонический)

    1,2-4,8

    Кодирование на основе линейного предсказания (LPC)



    Гибридные

    кодеры

    Линейное предсказание с возбуждением от остатка предсказания (RELP)



    4,8-16

    Линейное предсказание с многоимпульсным возбуждением (MPE-LPC)

    Линейное предсказание с долговременным предсказанием

    (LTP-LPC)

    Линейное предсказание с регулярным импульсным возбуждением (RPE-LPC)

    Линейное предсказание с кодовым возбуждением (CELP)

    Линейное предсказание с кодовым возбуждением и малой

    задержкой (LD-CELP)

    Линейное предсказание с возбуждением алгебраическим кодом (ACELP)

    Линейное предсказание с векторным возбуждением (VSELP)

    Адаптивное кодирование с предсказанием (АРС)

    Метод квантования по максимуму правдоподобия (MP-MLQ)


    Трудность создания кодеков, обеспечивающих минимально возможную скорость передачи для речевого источника, обусловлена рядом причин. Во-первых, речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего, а речевой сигнал не является стационарным процессом. Законы изменения его вероятностных характеристик на участках произнесения гласных и согласных звуков существенно различаются, не говоря уже о паузах и смычках (участки звучания согласных типа «м», «н», «п» и т. п.), где характеристики могут изменяться почти скачком.

    Вторая причина связана с определением (формализацией) критерия верности передачи, свойственным получателю. Действительный критерий восприятия, который характеризует качество слухового приема речевого сигнала человеком, отличается от распространенного критерия среднеквадратической ошибки или от какого-либо другого критерия, контролирующего отклонение «формы реализаций». Поэтому воспользоваться непосредственно результатами теории передачи информации для расчета качественных характеристик источника речевого сигнала затруднительно. Однако, можно попытаться получить оценки минимально возможной скорости передачи из других соображений, используя физические свойства получателя и источника речевых акустических колебаний.

    При параметрическом компандировании моделирует­ся процесс речеобразования человека. Для этого в кодере из речевого сигнала вычисляются определенные параметры, которые передаются к декодеру, где они используются для восстановления формы сигна­ла. Восстановленная форма сигнала очень часто отличается от формы исходного сигнала; при этом звук подобен или близок к оригиналу. Ис­пользование полностью параметрических методов в настоящее время ограничено, так как они приводят к заметному ухудшению натурально­сти звучания голоса и чрезвычайно чувствительны к фоновому шуму. Один из способов снижения скорости передачи речи и повышения эф­фективности использования полосы пропускания канала связи состоит в применении гибридных методов, основанных на принципах линейного предсказания и объединяющих параметрическое компандирование и кодирование формы волны (табл. 6.1).

    Основные характеристики наиболее распространенных и перспективных методов кодирования речи являются предметом изучения в следующих лекциях.

    1. Основы цифрового представления речевых сигналов: импульсно-кодовая модуляция

    Под цифровым представлением речевых сигналов (РС) будем понимать их аналого-цифро­вое преобразование (АЦП). Первый шаг при АЦП РС состоит в его периодической дискретизации -замене непрерывной функции её дискретными значениями. Процесс базируется на теореме отсчетов (теорема В.А. Котельникова), в соответствии с кото­рой произвольный сигнал со спектром, ограниченным некоторой частотой Fв, может быть полностью восстановлен (т.е. преобразован в ана­логовую форму с помощью линейной интерполяции) по последовательности своих отсчетов, следующих с интервалом времени Тд = 1 / (2Fв). Здесь Fв - наивысшая частота спектра (ширина полосы) входного сигнала. Обычно за наивысшую частоту спектра (называемую частотой Найквиста) принимают частоту, ниже которой максимумы спектра имеют уровень не более – 40 дБ. На практике неискаженная передача непрерывного (аналогового) сигнала с полосой частот, ограниченной значением Fв, дискретной последовательностью его отсчетов возможна, если Fд = kFв, где k2, а для восстановления используется идеальный фильтр (рис. 7.1). Метод, представленный на этом рисунке, называют обычно амплитудно-импульсной моду­ляцией (АИМ).

    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта