Документ Microsoft Word. 2. Преобразование музыкальной информации и её сжатие
Скачать 29.67 Kb.
|
1.Введение Тема хранения музыкальной информации особенно актуальна в наши дни, так как в XXI веке человек сталкивается с данным типом информации каждый день: некоторые люди ставят любимую песню на будильник или же на входящий звонок, ну а кто-то же не представляет себе пробежку или занятия в тренажёрном зале без играющей в наушниках музыки. Но, принимая ежедневно музыкальную информацию, далеко не каждый задумывается как она представлена внутри устройств. Целью сегодняшней работы является изучение способов хранения музыкальной информации, как и в наше время, так и в прошлом, и ознакомление с основными форматами звуковых файлов. Для достижения данных целей обратимся к различным электронным ресурсам. Объектом исследования будут выступать различные устройства, предназначенные для хранения музыкальной информации. 2.Преобразование музыкальной информации и её сжатие 2.1. Преобразование звука Преобразование звука в современных аудио воспроизводящих и записывающих устройствах осуществляется благодаря цифро-аналоговым и аналогово-цифровым преобразователям (ЦАП и АЦП). ЦАП используется для преобразования цифрового кода (зачастую двоичного) в аналоговый сигнал (напряжение), а АЦП используется для обратной операции: аналоговый сигнал преобразуется в цифровой код. ЦАП используется в устройствах, которые воспроизводят аудио, а АЦП необходим для обработки входящих звуковых сигналов в цифровой в дискретный код. 2.1.1. Цифровое аудио-кодирование Чтобы представить звуковые колебания в цифровом виде, в каждый конкретный момент звучания измеряют амплитуду звукового сигнала. Так как волновая форма звука по своей природе непрерывна, то для ее точного цифрового отображения необходимо измерять амплитуду бесконечное количество раз в секунду и делить амплитудную шкалу на бесконечное количество градаций. В реальности же количество измерений в секунду (частота дискретизации) колеблется обычно от 10000 до 96000. В настоящее время наиболее употребительные частоты дискретизации – 44100 Гц (стандарт для CD-аудио) и 48000 Гц (основной стандарт для DAT). Количество же амплитудных градаций (разрешение) обычно принимается равным 28, 216 или 224 (в зависимости от количества битов, выделенных для этой информации). Разумеется, при дискретизации непрерывного сигнала неизбежно возникают искажения. Чем меньше частота дискретизации и/или разрешение, тем сильнее волновая форма на выходе приближается к прямоугольной. При этом возникают высокочастотные искажения, которые частично подавляются с помощью фильтров, устанавливаемых на выходе ЦАП. [1] 2.1.2. Объемы аудио файлов Оцифрованный звук требует больших объемов памяти. В самом деле, при стандартной частоте дискретизации в 44100 Гц и разрешении 16 бит звуковой материал (стерео) продолжительностью в одну минуту будет занимать 10584000 байт (приблизительно 10,09 Мбайт). Кроме того, звуковые файлы очень плохо сжимаются стандартными программами архивации (zip, arj и т. п.). Поэтому для них существуют особые алгоритмы сжатия. Например, WAV-файл, сжатый с помощью ADPCM, занимает примерно в четыре раза меньше места. Однако при этом могут появиться искажения. Следовательно, при профессиональной работе алгоритмы сжатия звука лучше не использовать. [1] 2.2. Сжатие аудио файлов Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психо-акустической избыточности цифрового звукового сигнала. [2] Сжатие аудио файлов делится на два типа (сжатие без потерь и сжатие с потерями). 2.2.1. Сжатие аудио файлов без потерь Сокращение статистической избыточности основано на учете свойств самих звуковых сигналов. Она определяется наличием корреляционной связи между соседними отсчетами цифрового звукового сигнала, устранение которой позволяет сокращать объем передаваемых данных на 15…25 % по сравнению с их исходной величиной. Для передачи сигнала необходимо получить более компактное его представление, что возможно осуществить с помощью ортогонального преобразования. Важными условиями применения такого метода преобразования являются: возможность восстанавливать исходный сигнал без искажений способность обеспечивать наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования быстрый вычислительный алгоритм Этим требованиям отвечает модифицированное дискретно-косинусное преобразование (МДКП). Уменьшить скорость цифрового потока позволяют методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Одним из таких методов является код Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП. Подобные методы применяются при архивации файлов. [2] 2.2.1. Сжатие аудио файлов с потерями Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы: частотное (одновременное) маскирование временное (неодновременное) маскирование Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного. Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки (изменение порога слышимости после сигнала высокого уровня) и предмаскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Более слабый сигнал становится неслышимым за 5−20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения. Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров который разделяет сигнал на частотные поддиапазоны. На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее, в каждой полосе с помощью психоакустической модели, анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть переквантована на меньшее число бит. Для сокращения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. Эта операция аналогична компандированию в аналоговом вещании. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами. Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве. [2] 3.Хранение аудио файлов Способы хранения аудио файлов схожы с способами хранения основных файлов, хранящихся на компьютере. Хранить и делиться звуковой информацией можно с помощью: Грампластинок Устройств на основе магнитных лент: компакт-кассета, DAT-кассета и стримеры и др. Дисковых устройств: HDD (жёсткий диск), CD-RW, DVD-RAM, DVD-RW, CD-R, DVD-R, и др. SSD, USB-флеш-накопителей и SD-карт памяти Музыкальные стриминговые сервисы 3.1. Грампластинка Грампластинка (граммофонная пластинка)— аналоговый носитель звуковой информации - диск, на одной или на обеих сторонах которого нанесена непрерывная спиральная канавка (дорожка), форма которой модулирована звуковой волной. Для проигрывания воспроизведения звука грампластинок используются специально предназначенные для этой цели аппараты: граммофоны, патефоны, в дальнейшем — электропроигрыватели и электрофоны. При движении по дорожке грампластинки игла проигрывателя начинает вибрировать (поскольку форма дорожки неравномерна в плоскости пластинки вдоль её радиуса и перпендикулярно направлению движения иглы, и зависит от записанного сигнала). При вибрации пьезоэлектрический материал либо электромагнитная катушка звукоснимателя вырабатывает электрический сигнал, который усиливается усилителем и далее воспроизводится акустической системой. Главным достоинством грампластинки являлось удобство массового тиражирования путём горячей прессовки, кроме того, грампластинки не подвержены действию электрических и магнитных полей. Недостатками грампластинки являются подверженность температурным изменениям и влажности, механическим повреждениям (появление царапин), а также неизбежный износ при постоянном использовании (снижение и потеря аудиохарактеристик). Кроме того, грампластинки обеспечивают меньший динамический диапазон, чем более современные форматы хранения звукозаписей.[3] 3.2. Носители на основе магнитных лент Магнитная лента - носитель информации в виде гибкой ленты, покрытой тонким магнитным слоем. Информация на магнитной ленте фиксируется посредством магнитной записи. Устройства для записи звука и видео на магнитную ленту называются соответственно магнитофон и видеомагнитофон. Устройства для хранения компьютерных данных на магнитной ленте называется стример. Магнитная лента произвела революцию в вещании и записи. Вместо прямых эфиров в телевизионном и радиовещании стало возможным производить предварительную запись программ для последующего воспроизведения. Первые многодорожечные магнитофоны позволяли производить запись на несколько раздельных дорожек от различных источников, а затем впоследствии сводить их в конечную запись с наложением необходимых эффектов. Также развитию компьютерной техники послужила возможность сохранения данных на длительный период с возможностью быстрого доступа к ним. Магнитная лента состоит из гибкой основы, на которую с одной стороны нанесён рабочий слой - суспензия тонкого ферромагнитного порошка в специальном лаке. [4] Магнитная звукозапись основана на использовании свойств некоторых материалов сохранять намагниченность после прекращения воздействия на них внешнего магнитного поля. Запись производится с помощью специального устройства — записывающей магнитной головки, создающей переменное магнитное поле на участке движущегося носителя (чаще всего магнитной ленты), обладающего магнитными свойствами. На ферромагнитном слое носителя остается след остаточного намагничивания. След и есть дорожка фонограммы. При воспроизведении магнитная головка преобразует остаточный магнитный поток движущегося носителя записи в электрический сигнал звуковой частоты. [5] В наше время использование таких носителей информации не актуально, так как они имеют ряд недостатков, например: короткий срок службы и последовательный доступ к информации. 3.3 HDD(Жёсткий диск) Накопитель на жёстких магнитных дисках - запоминающее устройство (устройство хранения информации) произвольного доступа, основанное на принципе магнитной записи. Является основным накопителем данных в большинстве компьютеров. В отличие от гибкого диска (дискеты), информация в НЖМД записывается на жёсткие (алюминиевые или стеклянные) пластины, покрытые слоем ферромагнитного материала, чаще всего диоксида хрома — магнитные диски. В НЖМД используется одна или несколько пластин на одной оси. Считывающие головки в рабочем режиме не касаются поверхности пластин благодаря прослойке набегающего потока воздуха, образующейся у поверхности при быстром вращении. Принцип работы жёстких дисков похож на работу магнитофонов. Рабочая поверхность диска движется относительно считывающей головки (например, в виде катушки индуктивности с зазором в магнитопроводе). При подаче переменного электрического тока (при записи) на катушку головки возникающее переменное магнитное поле из зазора головки воздействует на ферромагнетик поверхности диска и изменяет направление вектора намагниченности доменов в зависимости от величины сигнала. При считывании перемещение доменов у зазора головки приводит к изменению магнитного потока в магнитопроводе головки, что приводит к возникновению переменного электрического сигнала в катушке за счёт электромагнитной индукции. [6] 3.4. Оптические диски Оптический диск — собирательное название для носителей информации, выполненных в виде дисков, чтение с которых ведётся с помощью оптического (лазерного) излучения. Диск обычно плоский, его основа сделана из поликарбоната, на который нанесён специальный слой, который и служит для хранения информации. Для считывания информации используется обычно луч лазера, который направляется на специальный слой и отражается от него. При отражении луч модулируется мельчайшими выемками на специальном слое, на основании декодирования этих изменений устройством чтения восстанавливается записанная на диск информация. Большое распространение получила технология оптической записи на диск. Предназначенные для этого устройства имеют большую емкость и хорошо защищены от внешних электрических и магнитных воздействий. Емкость обычного компакт-диска - 650 Мб, что эквивалентно 74 мин стереозвука с частотой дискретизации 44,1 кГц. Появились и компакт-диски большей емкости, например, 700 Мб.[7] Оптическая запись выполнялась в формате CD-R, когда при помощи достаточно мощного лазерного луча осуществляется однократная запись на специальный многослойный диск. В точках воздействия луча материал отражающего слоя диска необратимо изменяет свои оптические свойства. Таким образом можно записать любую информацию, в том числе и оцифрованный звук. Конечным результатом является компакт-диск, либо звуковой диск, который проигрывается на обычных CD-проигрывателях. [1] 3.5 SD-карты памяти Secure Digital Memory Card (SD) — формат карт памяти (флеш-память), разработанный SD Association (SDA) для использования в портативных устройствах. На сегодняшний день широко используется в цифровых фотоаппаратах и видеокамерах, мобильных телефонах, КПК, коммуникаторах и смартфонах, электронных книгах, GPS-навигаторах и в музыкальных плеерах. [8] На sd-карту каждый из нас может перенести любой музыкальный файл, не превышающий объем карты, и использовать ее в телефоне, плеере, планшете, наушниках и слушать музыку в высоком качестве. 3.6 Флеш-накопители USB-флеш-накопитель - запоминающее устройство, использующее в качестве носителя флеш-память, и подключаемое к компьютеру или иному считывающему устройству по интерфейсу USB. Флэш-накопители USB обычно являются съёмными и перезаписываемыми, и физически намного меньше, чем оптический диск. Большинство весит менее 30 грамм. USB-накопители часто используются для тех же целей, для которых когда-то использовались гибкие диски или компакт-диски; то есть для хранения, резервного копирования данных и передачи компьютерных файлов. Они меньше, быстрее, имеют гораздо большую ёмкость и более прочны и надежны, потому что у них нет движущихся частей. Кроме того, они невосприимчивы к магнитным полям (в отличие от флоппи-дисков) и не подвергаются воздействию поверхностных царапин (в отличие от компакт-дисков).[9] Благодаря флеш-накопителям мы можем хранить на них музыкальную информацию, переносить ее и воспроизводить на устройствах, оборудованных USB разъемом, будь то другой компьютер, музыкальный центр, аудиосистема в машине. 3.7. Музыкальные стриминговые сервисы Благодаря интернет-сервисам потокового аудио мы можем слушать музыку с устройства, поддерживающего интернет-соединение почти в любой точке мира как онлайн, так и офлайн. На данных сервисах можно, как и слушать музыку различных исполнителей так и загружать свои аудиофайлы. Такие площадки пользуются огромной популярностью, так как там можно найти песни на любой вкус и в хорошем качестве 4.Форматы звуковых файлов Цифровой аудио-формат — формат представления звуковых данных, используемый при цифровой звукозаписи, а также для дальнейшего хранения записанного материала на компьютере и других электронных носителях информации, так называемых звуковых носителях. Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудиоданных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов: Аудио-форматы без сжатия, такие как WAV, AIFF Аудио-форматы со сжатием без потерь (APE, FLAC) Аудио-форматы со сжатием с потерями (MP3, Ogg)[10] Список всех цифровых аудио-форматов: AA AAC AC3 (DolbyDigital) ADX AHX AIFF APE ASF AU (SND) AUD DMF DTS DXD FLAC MMF (Yamaha SMAF) MOD MP1 MP2 MP3 MP4 MPC Ogg Vorbis Opus RA TTA VOC VOX VQF WAV WMA XM 4.1. WAV(WAVE) Waveform Audio File Format (WAVE, WAV) - формат файла-контейнера для хранения записи оцифрованного аудиопотока, подвид RIFF. Этот контейнер, как правило, используется для хранения несжатого звука в импульсно-кодовой модуляции. Однако контейнер не налагает каких-либо ограничений на используемый алгоритм кодирования. Разработчиками данного аудио-формата является компании IBM Microsoft. 4.2. APE Monkey’s Audio(APE) — популярный формат кодирования цифрового звука без потерь. Кодек распространяется в виде бесплатного одноимённого программного обеспечения для Microsoft Windows, а также плагинов к популярным медиаплеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и .apl для хранения метаданных. Несмотря на то, что кодек распространяется бесплатно вместе с исходным кодом, Monkey’s Audio не является формально свободным, так как его лицензия накладывает некоторые ограничения на использование. Главная особенность Monkey’s Audio, обеспечившая этому формату популярность, — очень высокая степень сжатия аудиоданных. Вместе с тем следует иметь в виду, что данный кодировщик использует симметричный алгоритм, то есть распаковка (восстановление файла в несжатом формате WAV) занимает столько же времени, сколько и его упаковка. Как следствие — высокие требования к вычислительным ресурсам. Ещё один существенный недостаток Monkey’s Audio — неустойчивость файлов .ape к повреждениям. 4.3.MP3 MP3 является одним из самых распространённых и популярных форматов цифрового кодирования звуковой информации. Он широко используется в файлообменных сетях для оценочного скачивания музыкальных произведений. Формат может проигрываться практически во всех популярных операционных системах, на большинстве портативных аудиоплееров, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров. В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения звука, близкого к оригинальному (по мнению большинства слушателей), но с ощутимыми потерями качества при прослушивании на качественной звуковой системе. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха на повсеместно распространённой аппаратуре низкой точности воспроизведения звука (например, доминирующее большинство портативных устройств, звуковых карт, музыкальных центров, автомагнитол и прочей не специальной аппаратуры).Данный метод называют перцепционным кодированием. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация, не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/11 от оригинального файла с CD-Audio (само по себе несжатое аудио формата CD-Audio имеет битрейт 1411,2 кбит/с). MP3-файлы могут создаваться с высоким или низким битрейтом, что влияет на качество файла-результата. 5.Заключение В конце данной работы хотелось бы отметить, что сфера музыкальной информации постоянно прогрессирует: появляются новые способы её хранения и передачи, ведутся работы над созданием новых аудио-форматов, которые будут занимать меньший объем при лучшем качестве. Такой прогресс связан с тем, что музыка является неотъемлемой частью культуры каждого человека, которая сопровождает каждого из нас на протяжении всей жизни. Именно поэтому направление музыкальной информации и аппаратуры должно развиваться . |