Кодеки с изменением скорости передачи (переменной скоростью) в процессе сеанса связи. Алгоритм их работы.. Кодеки с изменением скорости передачи (переменной скоростью) в. Основной задачей развития современных телекоммуникационных технологий является разработка системы, обеспечивающей хорошее качество речи в широком диапазоне
Скачать 26.65 Kb.
|
Основной задачей развития современных телекоммуникационных технологий является разработка системы, обеспечивающей хорошее качество речи в широком диапазоне. Для систем с ограничением скорости одно из решений состоит в том, чтобы позволить приемопередатчикам контролировать состояние канала связи и динамически распределять битовый поток между исходным и канальным кодерами соответственно. Для каналов с низким отношением сигнал/шум (SNR) исходный кодер работает с низкой скоростью передачи битов, что позволяет эффективно контролировать прямые ошибки. Для каналов с высоким SNR исходный кодер использует высокую скорость, которая приводит к высокому качеству речи. Адаптивный алгоритм выбирает наилучшую комбинацию кодирования источникканал из набора доступных исходных и канальных кодеров, работающих с различными скоростями, на основе оценок качества канала. Канальные кодеры, избыточность которых позволяет варьировать, адаптируя скорость кодирования после того, как передатчик получает информацию об условиях канала, называются канальными кодерами с переменной скоростью Кодеки – это разные математические модели, которые используются для цифрового сжатия и кодирования аналоговой аудио информации. Большинство из таких математических моделей оснуются на том, что человеческий мозг имеет способность формировать полное впечатление даже из неполной информации. Ведь на самом деле, наш мозг интерпретирует нам то, что мы хотим услышать, а не то, что мы слышим на самом деле. Точно то же происходит и с оптическими иллюзиями. Различные алгоритмы кодирования имеют перед собой конкретную цель – между эффективностью полосы пропускания и качеством передачи голоса должен быть баланс. Например, в случае с аудио CD качество звука выходит на первый план, поэтому экономия пропускной способности не так важна. CD-диск квантуется в режиме 16 бит (2 раза для стерео), с частотой дискретизации 44100 Гц. Учитывая, что такие показатели он имел наконец 70-х годов, качество было достаточно хорошим. Но для телефонной линии нет необходимости в таком высоком уровне качества, как и для оптимизации полосы пропускания. Поэтому кодировка телефонных сигналов происходит с использованием 8 бит, а частота дискретизации составляет 8000 Гц. Вообще изначально “кодек” имело название устройство, которое конвертировало сигнал с аналогового в цифровой. Теперь же это слово имеет значение компрессия/декомпрессия. Любой VoIP телефон, шлюз или программное приложение обычно поддерживают несколько видов кодеков, и во время совершения звонка они могут между собой “договориться”, какой кодек будут использовать. Рассмотрим некоторые из них. AMR Codec Адаптивное кодирование с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. AMR (англ. – Adaptive Multi-Rate) кодек позволяет декодировать узкополосные сигналы (200-3400Гц) при переменном битрейте в диапазоне от 4,75 до 12,2 кбит с качеством, начиная с 7,4 кбит для междугородних звонков. Кодек AMR – стандартный кодек, обязательный для 2.5G/3G беспроводных сетей, который работает на базе GSM (WDMA, EDGE, GPRS). Изначально кодек AMR разрабатывался для GSM и был стандартизован в 1999 году Европейским институтом телекоммуникационных стандартов ETSI. Уже в 2006 году его включили в спецификацию CableLabs PacketCable 2.0. AMR может работать на различных битрейтах и есть в каждом GSM и WCDMA телефоне. Он гарантирует, что такой контент, который он генерирует, будет восприниматься абсолютно любым мобильным телефоном в любой точке мира. GIPS GIPS (Global IP Sound) – производитель семейства кодеков VOIP и соответствующего программного обеспечения. Его скорость передачи составляет: 13,3 кб/с и выше. Кодек GIPS может поддерживать качество передачи голоса с 30% потерей пакетов. Данная технология является лицензированной для использования Skype. GIPS создали iLBC узкополосного кодека, который они также предоставляют, однако под ограниченной, но свободной лицензией. Такой кодек по умолчанию поддерживается в Asterisk и является стандартом IETF. Широкополосные GIPS кодеки (частота дискретизации равна 16 кГц) являются платными. К ним относятся: iSAC (internet Speech Audio Codec): кодек с переменным битрейтом высокой производительности, предназначенным для низкоскоростных соединений включая dialup. Это кодек, который наиболее близко соответствует тому, который используется клиентом Skype. iPCM-wb (internet Pulse Code Modulation wide-band): для более высокоскоростных соединений. iLBC iLBC – первоначально создался компанией Global IP Sound как VoIP кодек, но позже он стал доступен в рамках свободной, но ограниченной лицензии. В том числе, стал доступным его исходный код, который разрешается изменять. iLBC можно назвать свободным кодеком, которые передает голос и прекрасно подходит для надежной голосовой связи через интернет. Его используют при узкополосных линиях передачи с битрейтом 13,33 кбит/с, а также поддержкой кодирования длины фрейма в 30 мс и 15,20 кбит/с кодировкой фреймов длиной 20 мс. Кодек iLBC имеет более высокие основные качества, чем, к примеру G.729A, а также обладает высокой устойчивостью к потере пакетов. iLBC кодек является очень привлекательным миксом качества и низкого уровня пропускной способности, и если вам необходимо поддерживать приемлемое качество связи на низкой скорости интернета, то такой кодек является лучшим решением. iLBC придерживается Asterisk, но он не обрел такой популярности, как кодеки ITU , поэтому его нельзя совместить с обычными IP-телефонами или коммерческими системами VoIP. В IETF RFC 3951 и 3952 была включена поддержка iLBC. Поскольку кодеки iLBC в своей работе используют сложные алгоритмы, им удается достичь высокой степени сжатия, и поэтому они достаточно сильно загружают процессор в Asterisk. Хотя можно использовать iLBC без уплаты лицензионных платежей, но вы должны каждый раз, когда будете использовать кодеки в коммерческих целях, оповещать обладателя патента на iLBC – Global IP Sound (GIPS). G.722.1 G.722.1 — это более новая версия кодека G.722 от 1999 г. Он предназначен для сжатия широкополосного аудиосигнала и базируется на третьем поколении технологии сжатия Siren® от компании Polycom. Этот стандарт обеспечивает широкополосный аудиосигнал, более близкий по качеству к FM-радио, чем к обычному телефону. G.722.1 определяет работу кодека на скоростях 24 и 32 кбит/с при ширине полосы пропускания 50 Гц - 7 кГц. G.722.2 G.722.2 (2002 г.) — более свежий и часто используемый вариант кодека, также известный как Adaptive Multi Rate — WideBand (AMR-WB) «Адаптивный, с переменной скоростью — широкополосный»; предлагает возможность быстрого изменения скорости сжатия при изменении пропускной способности сети передачи данных. G.722.2 определяет 9 различных режимов скорости передачи от 6,6 кбит/с до 23,85 кбит/с. В России применяется в сетях операторов сотовой связи под названием технологии HD Voice. Поддерживаются следующие скорости передачи: В обязательных многоскоростных конфигурациях: 6,60 кбит/с (используется в системах коммутации каналов (circuit switched) в GSM- и UMTS-соединениях; должен использоваться только временно в случае плохого радиосоединения и не считается предназначенным для передачи широкополосного речевого сигнала) 8,85 кбит/с (используется в системах коммутации каналов (circuit switched) в GSM- и UMTS-соединениях; должен использоваться только временно в случае плохого радиосоединения и не считается предназначенным для передачи широкополосного речевого сигнала; обеспечивает качество, равное G.722 при скорости передачи 48 кбит/с для качественной речи) 12,65 кбит/с (основная скорость; используется в системах коммутации каналов (circuit switched) в GSM- и UMTS-соединениях; предлагает отличное качество аудиосигнала на этой и более высоких скоростях передачи; обеспечивает качество, равное G.722 при скорости передачи 56 кбит/с для качественной речи) ITU G.722 G.722 – это кодек стандарта ITU с высоким битрейтом – 48/56/64 кб/с. В данном кодеке кодирование речи отличается более широкой пропускной способностью, в результате чего качество передачи голоса является очень хорошим. Широкополосный алгоритм кодирования речевых сигналов CCITT поддерживает скорости передачи 64, 56 и 48 кбит. Весь кодек интегрируется на одной микросхеме, поэтому ее полная задержка составляет около 3 мс, что является достаточно хорошим показателем и не вызывает эха в сетях связи. Также кодек позволяет обеспечить приемлемую производительность для коэффициента битовых ошибок передачи до 1000. Поэтому даже при плохих условиях передачи производительность будет ухудшаться полого. Высококачественное кодирование широкополосным речевым кодером G.722 обеспечено фиксацией выборки битов информации, где низкие и высокие кодеры ADPCM поддиапазонов используют 6 бит/сэмпл и 2 бит/сэмпл квантизаторы, соответственно. Когда сигнал находится в низком поддиапазоне, то он больше похож на узкополосный речевой сигнал, а высокий SNR в более низкой полосе пропускания становится перцепционно более важным чем в более высокой полосе. Чтобы препятствовать появлению нулевого кода в представлении данных на 4 бита, используются только 15 уровней квантизатора. Это также ограничивает представление данных на 5 и 6 битов на 30 и 60 уровнях квантизатора. ITU G.723.1 G.723.1 – кодек стандарта ITU. Он имеет достаточно низкой битрейт (6.3Kbps или 5.3Kbps) и используется в стандарте H.323 Компания Sipro Lab Telecom требует покупки лицензии, если вы хотите использовать эти кодеки в своем продукте. G.723.1 является официальным названием кодера речи для организации мультимедийной связи с передачей данных в 5,3 и 6,3 кбит/с. Кодек G.723.1 может работать при битрейте 6,3 кбит/с (при использовании 24 байтовых фреймов) с помощью MPC-MLQ алгоритма или с битрейтом 5,3 кбит/с (при использовании 20 байтовых кадров), используя алгоритм ACELP. Чтобы использовать G.723.1, вам понадобится патент или лицензия, которые покрывают алгоритм. Авторизованные права интеллектуальной собственности и лицензиатор для технологии G.723.1 является Sipro Lab Telecom. Членами патентного пула G.723.1 являются AudioCodes, France Telecom, Университет Шербрука, Nippon Telegraph и Nokia. ITU G.726 G.726 – это кодек ITU стандарта. Он использует адаптивную дифференциальную импульсно-кодовую модуляцию (ADPCM). Как и G.711, G.726, в кодека есть свои корни в сети PSTN. Как правило, его стараются использовать для международных линий, поскольку он дает возможность сохранить пропускную способность. G.726 имеет битрейт 32 Kbps, и дает качество, практически аналогичное к G.711 c битрейтом 64kbps. Также, он является стандартным кодеком в беспроводных телефонах DECT. G.726 не обрел большой популярности в 1990-х годах, поскольку он не мог передавать модемные и факсимильные сигналы. Однако, его пропускная способность и малая нагрузка на систему все же сделали его известным и широко применяемым. Битрейт может варьироваться в районе 16, 24, 32 или 40 Kbps, но 32 Kbps, но является стандартом. Speex Speex – открытый и бесплатный исходящий код, который не имеет патентов. Это лучший кодек voip, который является аудиоформатом сжатия речи. Speex является бесплатной альтернативой дорогим кодекам. Кроме того, одним из важный преимуществ Speex выступает его адаптация для интернет-приложений. Он предоставляет множество полезных функций, которые зачастую отсутствуют в других кодеках. Также стоить упомянуть, что Speex является частью проекта GNU и доступен в соответствии с Xiph.org разновидностью BSD лицензии. Speex стал популярным благодаря своей гибкости. Тем не менее он потребляет больше ресурсов процессора, чем G729, G726 или GSM кодеки, и примерно такую же, как iLBC. В то время как iLBC поставляется с атипичным количеством фреймов – 30 мс и при его работе теряются пакеты, вы можете скорректировать Speex под свои нужды через codecs.conf в системе Asterisk, в отличие от любого другого кодека. |