рпрпь. Практическая работа № 4. Дискретное (цифровое) представление звуковой и видеоинформации

Название	Дискретное (цифровое) представление звуковой и видеоинформации
Анкор	рпрпь
Дата	15.03.2023
Размер	118 Kb.
Формат файла
Имя файла	Практическая работа № 4.doc
Тип	Методические указания #991925

,, ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГОУ СПО ПОЛИТЕХНИЧЕСКИЙ КОЛЛЕДЖ № 39

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к практической работе № 4
«Дискретное (цифровое) представление звуковой и видеоинформации»
дисциплины «Информатика и ИКТ»
для групп первого курса СПО

технический профиль

Тема: Дискретное (цифровое) представление звуковой и видеоинформации.

Цель занятия: научиться представлять в компьютере звуковую и видеоинформацию, решать задачи на представление этих видов информации.

Основные понятия

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала; 1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Вам приходится постоянно сталкиваться с устройством, которое может находиться только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Вид информации	Двоичный код
Числовая	10110011
Текстовая
Графическая
Звуковая
Видео

Двоичное кодирование звуковой информации

Компьютерные способы хранения и обработки звуковой информации получают в последнее время все большее распространение. Переход к записи звука в компьютерном виде потребовал принципиально новых подходов: в процессе сохранения звуковой информации она должна быть “оцифрована”, т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Дискретизация звука – это преобразование непрерывного звука в набор дискретных значений в форме кодов.

За воспроизведение и запись звука в компьютерах отвечают специальные звуковые адаптеры. Звуковой адаптер содержит еще один специализированный процессор, тем самым, освобождая основной процессор от функций по управлению воспроизведением звука. С помощью звукового адаптера можно записывать звуковую информацию, воспроизводить речь и музыку.

Современные звуковые платы позволяют производить обработку звука, монтаж музыкальных композиций. Основным направлением развития современных звуковых плат является поддержка объемного звука. В этом случае появляется возможность позиционирования источников звука в пространстве.

В процессе записи звукового сигнала происходитдискретизация записываемого звукового сигнала по времени.

В
Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче, чем больше частота, тем выше тон. Для того, чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. При этом звуковая волна разбивается на мелкие временные участки, для каждого из которых устанавливается значение амплитуды. На графике это выглядит как замена гладкой кривой на последовательность” ступенек”, каждой из которых присваивается значение уровня громкости. Чем большее количество уровней громкости будет выделено в процессе кодирования, тем более качественным будет звучание.
ременная дискретизация звука
A(t)

t

Рис. 1. Временная дискретизация звука

Каждой «ступеньке» присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, поэтому, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем боле качественным будет звучание.

последовательностью дискретных уровней громкости сигнала.

! Качество кодирования зависит от частоты дискретизации, т.е. количества измерений уровня громкости звука в единицу времени,

Чем большее количество измерений проводится в 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Частота дискретизации аналогового звукового сигнала может принимать значения от
8 кГц до 48 кГц (1 кГц = 1000 Гц). При частоте 8 кГц качество декретированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц – качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стереорежимы. Чаще при цифровой звукозаписи используется частота дискретизации 44100 Гц и 48000 Гц. Это означает, что за каждую секунду звукозаписи в цифровом виде записывается более 44000 единиц информации, последовательность которых моделирует звук длительностью в одну секунду.

В процессе записи звукового сигнала происходит дискретизация амплитуды звукового сигнала. Уровни громкости звука можно рассматривать как набор возможных состояний, поэтому количество различных уровней громкости сигнала можно рассчитать по формуле: N= 2^I. Минимально для кодирования амплитуды сигнала отводятся 8 бит – 1 байт, N= 2^I= 2⁸= 256, что позволяет описать двести пятьдесят шесть уровней громкости. Качество звука при этом получается не слишком высокое. Если и частота дискретизации невелика, то при воспроизведении будут присутствовать сильные искажения. Значительно лучшее качество получается при использовании
2 байт, N= 2^I= 2¹⁶=65536, столько уровней громкости можно описать, числа 8 или 16 — характеризует глубину кодирования звука.

! Глубина кодирования – это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Современные звуковые карты обеспечивают 16-битную глубину кодировки звука. Т.о., современные звуковые карты обеспечивают кодирование 65536 уровней сигнала. Каждому значению амплитуды присваивается 16-ти битный код.

Для того чтобы записать стереозвук, следует одновременно кодировать два независимых канала звука. При этом чтобы получить хорошее качество, нужно использовать 2 байта для кодирования и частоту дискретизации 44100 Гц для каждого из каналов. Именно так кодируется звук на компакт-дисках. При этом одна минута закодированного звука займет более 10 Мб.

! Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Форматы звуковых файлов

Результаты дискретизации звуковой информации, как и все остальные компьютерные данные, сохраняются на внешних носителях в виде файлов. Звуковые файлы могут иметь различные форматы, рассмотрим наиболее распространенные из них.

Формат AU. Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows является специальным типом другого, более общего формата RIFF (Resource Interchange File Format), другой разновидностью RIFF служат видеофайлы AVI. Звуковые файлы формата WAV чаще всего используются для хранения произвольных звуковых данных. В этом формате может храниться моно- или стереозвук, закодированный одним или двумя байтами и с различной частотой дискретизации. Файлы этого формата могут быть сжаты разными способами для достижения меньшего размера, а могут оставаться и несжатыми.

Формат MP3 (MPEG Layer3). Это один из форматов хранения аудиосигнала, позднее утвержденный как часть стандартов сжатого видео. Природа получения данного формата во многом аналогична сжатию графических данных по технологии JPEG. Успехи технологии MP3 привели к тому, что ее применяют сейчас и во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах. Наряду с МР3 применяется формат сжатия по стандарту WMA (Windows Media Audio), поддерживаемый последними версиями операционных систем Windows.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные, освещение). Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. В последнее время стало модным караоке, и в компьютере стали кодировать музыку вместе с текстом. Фактически караоке является вариантом MIDI. Музыка закодирована обычным способом, но дополнительно добавлен текст, заменивший описание одного из инструментов.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

Музыкальные файлы используют формат mid, так как цифровой музыкальный интерфейс и способ кодирования музыкальной информации называется MIDI. Сжатые файлы могут иметь расширение wav, а могут расширением указывать на используемый способ сжатия – mp3 или wma. Есть и несколько других форматов звуковых файлов, но они применяются значительно реже

Решение задач

Задача 1. Рассчитать информационный объем моноаудиофайла, длительность звучания которого
1 секунда, при среднем качестве звука (16 бит, 24 кГц = 24000 Гц)?

Решение. Количество битов, приходящихся на одну выборку («ступеньку»), нужно умножить на количество выборок в 1 секунду:

16 бит * 24000 = 384000 бит = 48000 байт = 48000 / 1024 = 47 кБайт

Задача 2. Рассчитать информационный объем стереоаудиофайла длительностью 1 секунд при
20-битном кодировании и частоте дискретизации 44,1 кГц = 44100 Гц.

Решение. Количество битов, приходящихся на одну выборку («ступеньку»), нужно умножить на количество выборок в 1 секунду, умножить на 2 (стерео):

20 бит * 44100 * 2 = 882000 бит = 882000 / 8 = 110250 байт = 110250 / 1024 = 107,7 Кб

Задача 3. Рассчитать информационный объем стереоаудиофайла длительностью 20 секунд при
20-битном кодировании и частоте дискретизации 44.1 кГц = 44100 Гц.

Решение. Количество битов, приходящихся на одну выборку («ступеньку»), нужно умножить на количество выборок в 1 секунду, умножить на длительность звучания и на 2 (стерео):

20 бит * 44100 * 20 * 2 =35280000 бит=35280000 / 8 = 4410000 байт = 4410000/1024/1024 = 4,41 Мб

Задача 4. Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой 44,1 кГц = 44100 Гц и разрядностью 16 бит для моно- и стереосигнала.

Решение.

а) Если записывают моносигнал с частотой 44,1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 44100 * 2 * 60 = 529000 байт = 529000/1024/1024 = 5 Мбайт данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск.

б) Если записывают стереосигнал с частотой 44,1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 44100 * 2 * 60 * 2 = 529000 байт = 529000 /1024/1024 = 10 Мбайт данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск

Задача 5. Определить количество уровней звукового сигнала К при использовании устаревших
8-битных звуковых карт.

Решение. К = 2⁸ = 256.

II. Кодирование видеоинформации

В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей работой является просмотр кинофильмов и видеоклипов, а также многочисленные видеоигры. Более правомерно данным термином называть создание и редактирование такой информации с помощью компьютера.

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная

по своей сути технология быстрой смены статических картинок.

Чтобы хранить и обрабатывать видео на компьютере, необходимо закодировать его особым образом. Кодирование звукового сопровождения видеоинформации описано выше. Изображение в видео состоит из отдельных кадров, которые меняются с определенной частотой. Кадр кодируется как обычное растровое изображение, то есть разбивается на множество пикселей. Закодировав отдельные кадры и собрав их вместе, можно описать все видео.

Видеоданные характеризуются частотой кадров и экранным разрешением. Скорость воспроизведения видеосигнала составляет 30 или 25 кадров в секунду, в зависимости от телевизионного стандарта. Наиболее известными из таких стандартов являются: SECAM, принятый в России и Франции, PAL, используемый в Европе, и NTSC, распространенный в Северной Америке и Японии. Разрешение для стандарта NTSC составляет 768 на 484 точек, а для PAL и SECAM – 768 на 576 точек. Не все пиксели используются для хранения видеоинформации. Так, при стандартном разрешении 768 на 576 пикселей, на экране телевизора отображается всего 704 на 540 пикселей. Поэтому для хранения видеоинформации в компьютере или цифровой видеокамере, размер кадра может отличаться от телевизионного. Например, в формате Digital Video или, как его еще называют DV, размер кадра составляет 720 на 576 пикселей. Такое же разрешение имеет кадр стандарта DVD Video. Размер кадра формата Video-CD составляет 352 на 288 пикселей.

В основе кодирования цветного видео лежит известная модель RGB. В телевидении же используется другая модель представления цвета изображения, а именно модель YUV. В такой модели цвет кодируется с помощью яркости Y и двух цветоразностных компонент U и V, определяющих цветность. Цветоразностная компонента образуется путем вычитания из яркостной компоненты красного и зеленого цвета. Обычно используется один байт для каждой компоненты цвета, то есть всего для обозначения цвета используется три байта информации. При этом яркость и сигналы цветности имеют равное число независимых значений. Такая модель имеет обозначение 4:4:4.

Опытным путем было установлено, что человеческий глаз менее чувствителен к цветовым изменениям, чем к яркостным. Без видимой потери качества изображения можно уменьшить количество цветовых оттенков в два раза. Такая модель обозначается как 4:2:2 и принята в телевидении. Для бытового видео допускается еще большее уменьшении размерности цветовых составляющих, до 4:2:0.

Если представить каждый кадр изображения как отдельный рисунок указанного выше размера, то видеоизображение будет занимать очень большой объем, например, одна секунда записи в системе PAL будет занимать 25 Мбайт, а одна минута – уже 1,5 Гбайт. Поэтому на практике используются различные алгоритмы сжатия для уменьшения скорости и объема потока видеоинформации.

Если использовать сжатие без потерь, то самые эффективные алгоритмы позволяют уменьшить поток информации не более чем в два раза. Для более существенного снижения объемов видеоинформации используют сжатие с потерями.

Среди алгоритмов с потерями одним из наиболее известных является MotionJPEG или MJPEG. Приставка Motion говорит, что алгоритм JPEG используется для сжатия не одного, а нескольких кадров. При кодировании видео принято, что качеству VHS соответствует кодирование MJPEG с потоком около 2 Мбит/с, S-VHS – 4 Мбит/с.

Свое развитие алгоритм MJPEG получил в алгоритме DV, который обеспечивает лучшее качество при таком же потоке данных. Это объясняется тем, что алгоритм DV использует более гибкую схему компрессии, основанную на адаптивном подборе коэффициента сжатия для различных кадров видео и различных частей одного кадра. Для малоинформативных частей кадра, например, краев изображения, сжатие увеличивается, а для блоков с большим количеством мелких деталей уменьшается.

Еще одним методом сжатия видеосигнала является MPEG. Поскольку видеосигнал транслируется в реальном времени, то нет возможности обработать все кадры одновременно. В алгоритме MPEG запоминается несколько кадров. Основной принцип состоит в предположении того, что соседние кадры мало отличаются друг от друга. Поэтому можно сохранить один кадр, который называют исходным, а затем сохраняются только изменения от исходного кадра, называемые предсказуемыми кадрами. Считается, что за 10-15 кадров картинка изменится настолько, что необходим новый исходный кадр. В результате при использовании MPEG можно добиться уменьшения объема информации более чем в двести раз, хотя это и приводит к некоторой потере качества. В настоящее время используются алгоритм сжатия MPEG-1, разработанный для хранения видео на компакт-дисках с качеством VHS, MPEG-2, используемый в цифровом, спутниковом телевидении и DVD, а также алгоритм MPEG-4, разработанный для передачи информации по компьютерным сетям и широко используемый в цифровых видеокамерах и для домашнего хранения видеофильмов.

В состав современных версий операционной системы Windows включены несколько программ для работы с видео. Это программа Проигрыватель Windows Media Player. Эта программа предназначена для воспроизведения разнообразных мультимедийных файлов. Под мультимедийными файлами понимаются различные звуковые или видеофайлы всевозможных форматов, как использующих сжатие, так и не использующих. Программа Windows Movie Maker предназначена для оцифровки, редактирования и записи видео.

Существует множество различных форматов представления видеоданных. Рассмотрим некоторые из них:

AVI. В среде Windows, например, уже более 10 лет (начиная с версии 3.1) применяется формат Video for Windows, базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave чередование аудио и видео). Файл как таковой представляет собой единый блок, причем в него, как и в любой другой, могут быть вложены новые блоки. Заметим, что идентификатор блока определяет тип информации, которая хранится в блоке.

Внутри описанного выше своеобразного контейнера информации (блока) могут храниться абсолютно произвольные данные, в том числе, например, блоки, сжатые разными методами. Таким образом, все AVI-файлы только внешне выглядят одинаково, а внутри могут различаться очень существенно.

Quick Time. Еще более универсальным является мультимедийный формат Quick Time, первоначально возникший на компьютерах Apple. По сравнению с описанным выше, он позволяет хранить независимые фрагменты данных, причем даже не имеющие общей временной синхронизации, как этого требует AVI. В результате в одном файле может, например, храниться песня, текст с ее словами, нотная запись в MIDI-формате, способная управлять синтезатором, и т.п. Мощной особенностью Quick Time является возможность формировать изображение на новой дорожке путем ссылок на кадры, имеющиеся на других дорожках. Полученная таким способом дорожка оказывается несоизмеримо меньше, чем если бы на нее были скопированы требуемые кадры. Благодаря описанной возможности файл подобного типа легко может содержать не только полную высококачественную версию видеофильма, но и специальным образом "упрощенную" копию для медленных компьютеров, а также рекламный ролик, представляющий собой "выжимку" из полной версии. И все это без особого увеличения объема по сравнению с полной копией.

DivX. В последнее время все большее распространение получает технология под названием DivX (происходит от сокращения слов Digital Video Express, обозначающих название видеосистемы, которая "прославилась" неудачной попыткой взимать небольшую оплату за каждый просмотр видеодиска; к собственно технологии DivX это никакого отношения не имело). Благодаря DivX удалось достигнуть степени сжатия, позволившей вмесить качественную запись полнометражного фильма на один компакт-диск – сжать 4,7 Гб DVD-фильма до 650 Мб. И хотя это достижение, к сожалению, чаще всего используется для пиратского копирования, сам по себе этот факт не умаляет достоинств новой технологии. Как и то, что самая первая версия сжатия DivX была сработана французскими хакерами из MPEG-4 – современные версии DivX уже не имеют к этому событию никакого отношения

Кодеки. Наиболее популярные программы проигрывания видеофайлов позволяют использовать замещаемые подсистемы сжатия и восстановления видеоданных – кодеки (от англ. compression/decompression – codec). Такой подход позволяет легко адаптировать новые технологии, как только те становятся доступными. Замещаемые кодеки хороши как для пользователей, так и для разработчиков программного обеспечения. Тем не менее, большое разнообразие кодеков создает определенные трудности для производителей видеопродукции. Часто в качестве выхода из создавшегося положения необходимые кодеки помещают на компакт-диск с фильмами или даже поставляют видеоматериалы в нескольких вариантах, предоставляя тем самым возможность выбрать подходящий. Все больше распространяется автоматизация распознавания, когда плейер, обнаружив информацию об отсутствующем кодеке, загружает его из Интернет.

Задания для самостоятельной работы

Задача 1. Рассчитать информационный объем моноаудиофайла длительностью звучания 1 секунда при низком качестве звука (16 бит, 8кГц = 8000 Гц).
Задача 2. Рассчитать информационный объем стереоаудиофайла длительностью звучания
1 секунда при высоком качестве звука (16 бит, 48 кГц = 48000 Гц).
Задача 3. Рассчитать информационный объем стереоаудиофайла длительностью 40 секунд при
20-битном кодировании и частоте дискретизации 44.1 кГц = 44100 Гц.

Задача 4. Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой 32 кГц = 32000 Гц и разрядностью
16 бит для моно- и стереосигнала.

Контрольные вопросы

Какое минимальное количество байт достаточно для получения высококачественной записи звука? Сколько уровней громкости это количество позволяет описать?
Какая используется частота дискретизации для качественного кодирования звука? Сколько при этой частоте места на диске займет одна минута закодированного звука?
В каких форматах хранятся звуковые данные?
Какие устройства в компьютере используются для воспроизведения и записи звука?
Какие программы для работы со звуком вы знаете?
Какими параметрами характеризуются видеоданные?
Какая модель лежит в основе кодирования цветного видео?
Какие применяются алгоритмы сжатия для уменьшения скорости и объема потока видеоинформации?
Какое оборудование необходимо для ввода и обработки видео на компьютере?
Какое программное обеспечение используется для редактирования видео на компьютере?
Какие параметры программы Windows Movie Maker можно настроить перед началом работы?

Литература

Угринович Н.Д. «Информатика и ИКТ» Учебник для 10 класса (Профильный уровень), 7-е издание, М., БИНОМ, Лаборатория знаний, ОАО «Московские учебники», 2011 г.
Н.В. Угринович Н.Д. «Информатика и ИКТ» Учебник для 11 класса (Профильный уровень), 4-е издание, М., БИНОМ, Лаборатория знаний, ОАО «Московские учебники», 2012 г.
Н.В. Макарова «Информатика и ИКТ. Учебник 10 класс (Базовый уровень)», ООО «Питер Пресс», ОАО «Московские учебники», 2008 г.