|
Основы инфокоммуникационных технологий. Контрольная работа по основам ифн техн. Способы сжатия звуковой информации
3.7 Звук в MPEG
Кодирование звука и музыки осуществляется отдельным аудиокодером. По мере развития стандарта MPEG звуковые кодеры также совершенствовались, становясь все эффективнее. В основе повышения эффективности - та же идея: сократить объем «второстепенной» для слушателя аудиоинформации. В результате в составе стандарта MPEG1 было создано семейство из трех звуковых кодеров, названных «слоями»: Layer I, Layer II, Layer III. Все они, подобно видеокодерам, построены на несовершенстве «человеческого фактора»: психоакустическая модель здесь эксплуатирует несовершенства слухового аппарата человека. В частности, если сначала подать громкий звук на частоте 1000 Гц, то более тихий звук на частоте 1100 Гц уже не будет фиксироваться слухом. В модели используется и явление ослабления чувствительности человеческого уха на период в 5 мс - до и 100 мс - после возникновения сильного звука. Существуют похожие временные эффекты маскирования; известны и более сложные взаимодействия, когда временный эффект может выделить конкретную частоту или, наоборот, подавить. Психоакустическая модель - как свод правил - разбивает весь спектр на блоки, в которых уровень звука считается близким. Затем удаляет звуки, формально не воспринимаемые человеком в соответствии с описанными выше эффектами. Потом следует процедура «упаковки» методами, напоминающими по принципу компьютерные архиваторы (опять же - с устранением избыточности), и, наконец, формируется цифровой информационный поток. Идеология сжатия всех «слоев» сходна, разница - в методах и в математике.
Первый «слой» (Layer I) был рассчитан на поток скоростью 192 кбит/с на канал. Алгоритм его в целом похож на систему сжатия звука ATRAC, которая реализована на мини-дисках Sony. Разновидность Layer I используется и в устройствах записи цифровых компакт-кассет DCC. Разновидность Layer II, предназначенная для потоков до 128 кбит/с на канал, была разработана как компромисс между качеством звука, величиной потока и сложностью кодера. В нем были, в первую очередь, усовершенствованы гребенчатые фильтры. Этот «слой» весьма сходен с известным аудиостандартом MUSICAM. Наибольшее применение Layer II нашел в сетях цифрового радиовещания DAB (Digital Audio Broadcasting).
И, наконец, Layer III исходно был рассчитан на низкоскоростные сети с потоком до 64 кбит/с на канал. Благодаря усилиям до того малоизвестного немецкого института информационных технологий имени Фраунгофера (IIS Fraunhofer) в 1998 г. был сделан почти революционный прорыв. Усовершенствование математики в части алгоритма преобразования Фурье и механизмов упаковки спектральных коэффициентов позволило сохранить «CD-качество» звука при низкой скорости потока. Естественно, такое достижение потребовало больших вычислительных ресурсов, но производительности современных компьютеров к тому времени уже хватало и на это. В результате появился формат сжатия аудиоинформации МР3 (полное его название - MPEG Audio Layer III), который начал вполне самостоятельную жизнь. Тот же институт Фраунгофера выпустил первый аппаратный кодер, работающий в реальном времени. За этим шагом последовали другие (МР3-Pro). Сегодня миниатюрные МР3-плейеры и диктофоны с флэш-картами разных мастей знакомы многим. Любой пользователь Интернета знает о распространении сжатого звука через сеть, знает о серверах, «набитых» музыкой в формате МР3. Естественно, вслед за удачным решением массовому потребителю уже предложены форматы-конкуренты, в частности, WMA от Microsoft, ААС (как «продвинутый» Dolby Digital АС-3)
3.8 Формат Ogg Vorbis
Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам, как AAC, AC3 и VQF, превосходящим МР3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников.
Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение .ogg и называется двойным именем «Ogg/Vorbis» или «Ogg Vorbis». Однако «Ogg Vorbis» называют и сам кодек без контейнера, так как он является частью проекта Ogg.
Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными метками. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.
Формат имеет гибкую систему меток. Заголовок меток легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотографиями обложек альбомов). Текстовые метки хранятся в UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками.
Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 500 до 1000 кбит/с. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2 до 192 кГц.
Vorbis был разработан сообществом «Xiph.Org» для того, чтобы заменить все платные запатентованные аудиоформаты. Несмотря на то, что это самый молодой формат из всех конкурентов MP3, Ogg Vorbis имеет полную поддержку на всех популярных платформах (Microsoft Windows, Linux, Apple Mac OS, Android, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций.
Vorbis является частью мультимедиапроекта Ogg, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.
Для хранения звука в Vorbis используется формат‐контейнер Ogg.
Преимущества Vorbis:
Отсутствие патентных ограничений. До 255 каналов. «Sample accurate» — звуковые данные не будут иметь смещений, дополнительных или потерянных семплов относительно друг друга. «Streamable» — поддержка поточного воспроизведения. Эффективные алгоритмы переменного битрейта. Частота дискретизации до 192 кГц. Разрядность до 32 бит. Гибкий Joint stereo. Гибкая психоакустическая модель. Метки хранятся в Юникоде, а не в национальной кодировке. Большая степень компрессии по сравнению с MP3 при равном качестве (размер файла меньше)
3.9 Формат WMA
Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации. Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Apple противопоставляет ему формат AAC (используется в популярном онлайновом музыкальном магазине iTunes).
Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC.
Файл WMA, сконвертируемый в двухпроходном режиме из lossless источника, в отличие от других lossy файлов, не страдает клиппингом.
Большинство портативных аудиопроигрывателей поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах (вследствие его закрытости).
Microsoft включила в WMA поддержку цифровой системы управления авторскими правами (DRM) (система защиты). Основным следствием её является невозможность прослушивать защищённые композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина.
В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества (англ. lossless), многоканальное кодирование объёмного звука и кодирование голоса.
Аудио, сжатое в формат WMA поддерживается сегодня большим количеством аппаратных плееров.
Плюсы
Полная поддержка со стороны Windows.
Минусы
Низкое качество при низком битрейте. Полная закрытость.
Microsoft WMA V1
Этот формат кодирования аудиоинформации стал второй попыткой Microsoft штурмовать проблему сжатия звука. В 1995 году компания занималась активным продвижением и пропагандой формата сжатия Microsoft ADPCM, в котором на сэмпл вместо 16 приходилось всего 4 бита. Кроме того, радикально менялся смысл хранимой информации – если для обычного PCM формата значение сэмпла равно уровню сигнала в данный момент времени, то для ADPCM оно стало равно смещению уровня сигнала относительно предыдущего момента времени. В рекламных проспектах говорилось, что искажения, вносимые таким способом кодирования абсолютно незаметны на слух, однако в реальности частоты выше 15 кГц зарезались на корню, что делало этот способ сжатия неприменимым для хранения звуковых данных CD качества.
Windows Media Audio был создан сравнительно недавно, и, по всей видимости, основан на методе кодирования, похожем на МP3. На слух этот формат выдавал практически неотличимый от МP3 результат, что сделало WMA весьма сильным конкурентом.
Существенным недостатком WMA стало отсутствие поддержки битрейта выше 160 кбит/с.
По сути формат WMA отличается от МP3 кодеков, тем, что имеет одну единственную реализацию. Устанавливается он наравне с другими системными кодеками Windows 9x в качестве еще одного формата сжатия звуков. После этого все MCI-основанные плееры начинают распознавать новый формат звуковых данных. Кроме того, для все тех же MCI-основанных программ появляется возможность конвертирования звуковых данных в WMA. Одной из таких программ является специальный plug-in к Winamp out_wma.dll.
3.10 Microsoft WMA V2
После успешной раскрутки первой версии своего формата WMA Microsoft решила выпустить его новую версию (V2), кодер которой закрыла от использования везде, кроме Microsoft Media Encoder 4.1. Декодер WMA V2 остался открытым, чтобы сторонние фирмы могли применять это формат в своих приложениях для хранения и воспроизведения звука. Тем не менее, Microsoft преследует и пресекает в судебном порядке все попытки создать декодер WMA-WAV.
3.11 Microsoft WMA V7
Эта версия формата вышла одновременно с Windows Millennium Edition, и была встроена в новую версию Windows Media Player. Важным отличием WMA V7 от V2 и V1 можно назвать поддержку битрейта 192. Само качество кодирования значительно ухудшилось по сравнению с первыми версиями формата. Кроме того, явно изменился алгоритм кодирования. Если первые две версии были основаны на алгоритме, похожем на МP3 – 2048 первых сэмпла в файле содержат “раскруточную” информацию, необходимую декодеру для корректного начала декодирования – то в V7 алгоритм радикально изменили, и сигнал начинается с 0 сэмпла. Однако в силу неизвестных причин 0 сэмплу декодированного сигнала соответствует 40000 исходного – это означает, что теряется почти секунда в начале файла.
3.12 Microsoft WMA V9
Кодек претерпел большие изменения. Вернее это уже несколько кодеков в одном пакете. Каждый из них использует свою технологию сжатия, несовместимую между собой, например, битовые потоки Windows Media Audio 9 Professional не могут быть декодированы с помощью Windows Media Audio 9 декодера. Тем не менее, обратная совместимость все же существует. Разработка декодера была “заморожена” четыре года назад, и с тех пор улучшается только кодер. Новый WMA предлагает:
Однопроходной CBR режим кодирования (единственный режим, который поддерживался в прошлых версиях), использующий улучшенный контроль частоты и маскирующие алгоритмы. Двухпроходной VBR режим кодирования, который позволяет добиться лучшего качества, чем однопроходной режим.
Итак, пакет состоит из следующих кодеков:
Windows Media Audio 9 Professional Windows Media Audio 9 Lossless Windows Media Audio 9 Voice
3.13 Формат Opus
Opus (ранее Harmony) — аудиокодек для сжатия с потерями, разработанный сообществом Internet Engineering Task Force (IETF) специально для применения в приложениях реального времени в Интернете. Является открытым форматом, стандартизованным в RFC 6716, a эталонная реализация распространяется под трёхчастной лицензией BSD. Основное преимущество данного кодека — низкая задержка кодирования (от 2,5 до 60 мс, настраиваемо), более сильное сжатие аудиоданных, поддержка многоканального звука (до 255 каналов).
Формат битового потока был зафиксирован 8 января 2012 года.
Основные возможности Opus:
Возможна дискретизация от 8 до 48 кГц; Битрейт от 6 до 510 кбит/с[8]; Поддерживаются режимы постоянного и переменного битрейта; Задержка кодирования от 2,5 до 60 мс, настраиваемо; Существуют реализации, использующие арифметику либо с фиксированной запятой, либо с плавающей запятой; Многие параметры (практически, все, за исключением частоты дискретизации и числа каналов) можно менять «на лету», без переинициализации и, следовательно, прерывания потока; При потере блока (например, при передаче посредством UDP) возможна попытка восстановления сигнала. Не является обязательной синхронизация настройки частоты дискретизации между кодером и декодером. Рекомендуется настраивать частоту дискретизации при декодировании исходя из вычислительной мощности.
Opus продемонстрировал высокое качество на битрейте 64 кбит/с по сравнению с Apple HE-AAC, Nero HE-AAC, Vorbis и AAC LC.
В 2011 году Яном Скёглундом из Google были проведены две серии тестов, в ходе которых было проведено сравнение кодирования и декодирования в Opus на основе оценки группы экспертов и неподготовленных слушателей. По его выводам, для стерео-музыки Opus при 64 кбит/20 мс, 80 кбит/10 мс и 128 кбит/5 мс дает такое же качество, как MP3 96 кбит, AAC-LC 64 кбит и лучшее качество, чем G.719 64 кбит.
СПИСОК ЛИТЕРАТУРЫ
Панфилов И.П., Дырда В.Е. Теория электрической связи. — М.: Радио и связь, 1991; Никамин В. А. Цифровая звукозапись. Технологии и стандарты. — СПб.: Наука и Техника, 2002; Журнал «Радио», № 11, 1987; Российские многоканальные SACD записи и диски; Общая информация о SACD; Direct Stream Digital: однобитный цифровой формат записи; Журнал «Звукорежиссёр», 1999, № 2; SACD vs. DVD-Audio: практическое исследование форматов высокого разрешения; Лапин Е. В. Подготовка и запись DVD всех типов. Краткое руководство. — М.: «Вильямс», 2006; Марк Л. Чемберс. Запись компакт-дисков и DVD для «чайников» = CD & DVD Recording For Dummies. — 2-е изд. — М. «Диалектика», 2005; Семейство форматов MPEG. Часть первая - MPEG-1. Wiki MPEG Wiki MPEG-2 Форматы сжатия видео семейства MPEG; http://vorbis.org.ru; https://www.file-extension.info/ru/format/wma; opus-codec.org — официальный сайт Opus.
|
|
|