Главная страница
Навигация по странице:

  • Лекция 7. Стандарты сжатия движущихся изображений и MPEG-1 и MPEG-2

  • Стандарты: MPEG-1

  • 7.1 Стандарты сжатия MPEG Слово MPEG

  • 7.2 Стандарт сжатия MPEG-1 Части MPEG-1

  • Характеристики формата MPEG-1

  • Достоинства MPEG-1 Video

  • Недостатки MPEG-1 Video

  • 7.3 Стандарт сжатия MPEG2

  • камальдинова. Мультимедиа технологии


    Скачать 6.03 Mb.
    НазваниеМультимедиа технологии
    Анкоркамальдинова
    Дата23.05.2023
    Размер6.03 Mb.
    Формат файлаpdf
    Имя файла440020236.pdf
    ТипУчебное пособие
    #1153250
    страница12 из 37
    1   ...   8   9   10   11   12   13   14   15   ...   37
    TV высокого разрешения (HDTV) – разрешений широкого формата
    (16:9) обеспечивает наивысшее из всех форматов телевизионного вещания разрешение и качество изображения. В сочетании с цифровой технологией повышения качества звучания, HDTV устанавливает для телевидения новые стандарты качества изображения и звука.
    Применение цифрового телевидения обеспечивает ряд преимуществ по сравнению с аналоговым телевидением.
    Вопросы по лекции 6
    1. Перечислить основные стандарты цифрового телевидения
    2. Перечислить и описать этапы создания цифрового телевидения.
    3. Перечислить и охарактеризовать уровни качества цифрового телевизионного вещания.
    4. Перечислить достоинства и недостатки аналогового телевидения.
    5. Перечислить достоинства и недостатки цифрового телевидения.

    142 6. Рассказать про стандарт ATSC.
    7. Рассказать про стандарт DVB.
    8. Рассказать про стандарт ISDB.
    9. Описать уровень качества Цифрового телевидения HDTV.
    10.
    Назовите дату начала работы по внедрению цифрового телевидения в нашей стране.
    11.
    Опишите принципы передачи при аналоговом и цифровом способе вещания.
    12.
    Описать основные положения стандарта DVB.
    13.
    Представить и пояснитьструктурную схему цифровой телевизионной системы.
    14.
    Привести пример кодирования компонентного видеосигнала
    (4:2:2) и модели дискретизации (4:2:2).
    15.
    Привести пример кодирования компонентного видеосигнала
    (4:2:2) и модели дискретизации (4:2:0).

    143
    Лекция 7. Стандарты сжатия движущихся изображений и MPEG-1 и
    MPEG-2
    Краткая аннотация лекции: Рассматриваются стандарты сжатия MPEG-1 и MPEG-2.
    Цель лекции: изучить основы стандартов сжатия движущихся изображений и MPEG-1 и
    MPEG-2.
    В 1988 г. в рамках Международной организации по стандартизации
    (ISO) начала работу группа MPEG (Moving Pictures Experts Group) –
    Экспертная группа по движущимся изображениям. Группа работала в направлениях, которые можно условно назвать MPEG-Vide – сжатие видеосигнала в поток со скоростью до 1.5 Мбит/с, MPEG-Audio – сжатие звука до 64, 128 или 192 Кбит/с на канал и MPEG-System – синхронизация видео- и аудиопотоков. Как алгоритм MPEG имеет несколько предшественников. Самый известный из них – это универсальный алгоритм
    JPEG (универсальный – показывает неплохие результаты на широком классе изображений).
    Стандарты:
    MPEG-1, используется при записи видеопрограмм на CD-диски, утвержден в1993 г.
    MPEG-2 для ТВ-вещания – а ноябре 1994 г.
    Видеоизображение стандарта
    PAL или
    SECAM
    – это последовательность картинок, отображаемая с частотой 25 кадров в секунду.
    В одном цифровом кадре содержится 720х576 точек, то есть 414 тыс. 720 элементов (пикселей). Каждая точка может иметь один из 16,7 млн. цветов и занимать 3 байта в компьютере. Следовательно, один кадр занимает порядка
    1,2 Мб. При стандартной частоте получаем цифру около 30 Мб в секунду, то есть хранение одного лишь часа видео (вместе со звуком) без компрессии обойдется в 107 Гб. Для HDTV этот формат подразумевает разрешение
    1920х1080 точек, то есть, при прочих равных условиях, серия кадров, рассчитанных на одну секунду, уже займет 148 Мб (521 Гб в час).

    144
    Кодирование видео – это процесс преобразования цифровых видео- файлов из одного формата в другой. Кодирование также известно, как
    «перекодирование» или «преобразование видео». Во время записи устройство предоставляет видео-файл в определенном формате и других спецификациях.
    Кодирование видеоизображений основано на разложении видеоряда в виде последовательности отдельных изображений (кадров). На этом, в частности, основано телевидение (25 кадров в секунду для Европы и 30 кадров с секунду для Японии и США) и кинотехника (24 кадра в секунду). То есть кодирование видеоряда заключается в кодировании каждого из составляющих его кадров как отдельного изображения, с последующей записью последовательности кадров.
    Цифровая запись видеоизображений имеет две особенности:
    1. Кодирование данных и их запись рассматриваются порознь и определяются разными стандартами.
    2. Запись видеоизображений обычно сопровождается записью звука, то есть речь идет о синхронной записи как минимум двух потоков данных.
    Контейнер – основополагающий файл, служащий для сохранения в цифровом виде преобразованной аналоговой информации (т.е. то, что мы видим и слышим в реальной жизни). Как правило, такая сохраненная аудио и видеоинформация занимает большой объем, поэтому ее сжимают, используя различные аудио и видео кодеки.
    Кодек – сокращение от английского coder/decoder – программа, позволяющая преобразовать записанную информацию так, чтобы она занимала меньше места. При этом расширение файла может не меняться, т.е. основная структура контейнера не изменится, изменится представление в нем аудио и видеоданных, но, чтобы воспроизвести такой файл,
    «зашифрованный» при помощи какого-либо кодека, необходимо, чтобы он был установлен на компьютере.

    145
    Рис. 7.1 Структура контейнера
    Примеры контейнеров: AVI, MP4, 3GP, FLV, Matroska (Матрешка) и др.
    7.1 Стандарты сжатия MPEG
    Слово MPEG является сокращением от Moving Picture Expert Group – названия экспертной группы ISO (международной организации по стандартизации) по кодированию и сжатию видео- и аудиоинформации. Так же называются и стандарты, разработанные этой группой.
    MPEG
    1 предназначен для записи синхронизированных видеоизображений (обычно в формате SIF 352x288) и звукового сопровождения на CD-ROM (VideoCD) со скоростью считывания до 1,5
    Мбит/с. Качество MPEG 1 примерно соответствует обычному VHS-видео.
    MPEG 2 поддерживает более высокие разрешения, поскольку поток данных в этом стандарте намного больше (до 40 Мбит/с), транслируется через телевизионные спутники.
    Формат MPEG 4 первоначально создавался для использования в мультимедийных приложениях, использующих узкие каналы связи, например, видеоконференции, проводимые через Интернет, и не предназначался для хранения видео. По качеству изображения он занимает промежуточное место между MPEG 1 и MPEG 2. За счет этого достигается высокая степень сжатия информации. Работа с MPEG 4 требует достаточно большой вычислительной мощности от всех компонентов компьютера.
    Неожиданное применение алгоритм сжатия MPEG 4 получил в качестве средства преобразования DVD-фильмов (формата MPEG 2) с целью

    146 их записи на обычные CD-ROM гораздо меньшей, чем DVD, емкости.
    Модификация MPEG 4 с таким предназначением носит название DivX и обеспечивает вполне приемлемое качество видеоматериалов.
    Стандарт MPEG 7 является еще одним представителем семейства
    MPEG и предназначен для детального описания разнородного мультимедийного материала. На его основе, например, можно создавать цифровые мультимедийные библиотеки, осуществлять поиск мультимедийного материала и мультимедийное редактирование. MPEG 7 позволит вести мультимедийный поиск во «всемирной паутине» так же, как и текстовый, на основе предложенных в качестве образцов мультимедийных фрагментов. Кроме того, можно проводить фильтрацию поступающей информации, вырезая из нее, скажем, рекламу.
    Таким образом, лишь стандарт MPEG 1 можно считать устаревшим, так как его основной целью являлось обеспечение возможности работы на слабых компьютерах. Остальные же стандарты не конкурируют друг с другом, поскольку имеют различные области применения.
    Таблица 7.1 Характеристики стандартов MPEG
    MPEG-1
    MPEG-2
    MPEG-4
    MPEG-7
    MPEG-21
    Стандарт
    ISO/IEC
    11172
    ISO/IEC
    13818
    ISO/IEC 14496
    ISO/IEC
    15938
    ISO/IEC
    21000
    Назначение
    Кодирова ние аудио и видео
    Кодирование аудио и видео
    Низкоскоростно е кодирование аудио и видео
    Интерфейс описания мультимед ийного контента
    Открытая структура доступа к средствам мультимедиа
    Скорость
    1,5
    Мбит/с.
    От 4 до 80
    Мбит/с.
    От 16 до 4000 кМбит/с.


    Год разработки
    1992 994 998 2001 2001
    7.2 Стандарт сжатия MPEG-1
    Части MPEG-1
    1. Синхронизация и мультиплексирование аудио и видео (MPEG-1
    Program Stream).

    147 2. Кодек для видео с прогрессивной разверткой (MPEG-1 Video).
    3. Кодек для звука. Стандарт MPEG-1 определяет три уровня сжатия звука:
    MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1);
    MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2);
    MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3).
    4. Процедуры тестирования производительности.
    5. Эталонное ПО (Reference software).
    Отличия от более ранних стандартов:
    1. Для вычисления среднего цвета точек фрагментов каждого кадра используются более сложные функции, чем у предыдущих форматов. Они позволяют получить более точное значение цвета.
    2. Предыдущие форматы кодирования видео просто записывали друг за другом массивы данных, кодирующие отдельные кадры. Каждый такой массив содержал полное описание кадра.
    Принцип работы MPEG
    Каждый кадр (frame) в MPEG может быть следующего вида:
    1. I (Intra) – исходный (ключевой) кадр, который кодируется как обыкновенная картинка. I-кадры играют роль опорных при восстановлении остальных изображений;
    2. P (Predicted) – предсказанные кадры, описывающие различия между текущим и предыдущим кадрами (типа I или P);
    3. B (Bidirectional) – интерполированные в двух направлениях (вперед и назад) кадры, содержащие лишь указатели на предыдущие или последующие кадры типа I или P.
    Последовательности I-, P-, B-кадров объединяются в фиксированные по длине и структуре группы кадров - GOP (Group of Pictures). Каждая GOP обязательно начинается с I и с определенной периодичностью содержит P- кадры. Ее структуру описывают как M/N, где M – общее число кадров в группе, а N – интервал между P-кадрами. Так, типичная для Video-CD и

    148
    DVD,
    IPB группа
    15/3 имеет следующий вид:
    «IBBPBBPBBPBBIBBPBBPB...».
    Здесь каждый B кадр восстанавливается по окружающим его P-кадрам
    (в начале и конце группы – по I и Р), а в свою очередь каждый Р-кадр – по предыдущему Р- (или I-) кадру. В то же время I-кадры самодостаточны и могут быть восстановлены независимо от других, но являются опорными для всех P- и тем более B-кадров группы. Соответственно, у I и P наименьшая степень компрессии, у В – наибольшая. Установлено, что по размеру типичный Р-кадр составляет 1/3 от I, а B – 1/8 часть.
    В результате, MPEG последовательность IPPP (GOP 4/1) обеспечивает
    2-кратное уменьшение требуемого потока данных (при том же качестве) по сравнению с последовательностью только из I-кадров, а использование GOP
    15/3 позволяет достичь 4-кратного сжатия.
    Нужно заметить, что прежде чем декодировать B-кадр, требуется декодировать два I- или P-кадра. Существуют разные стандарты на частоту, с которой должны следовать I-кадры (приблизительно 1–2 в секунду), соответствующие стандарты есть и для P-кадров (каждый третий кадр должен быть P-кадром).
    Для большего сжатия в B- и P-кадрах используется алгоритм предсказания движения, на выходе которого получается:
     вектор смещения (вектор движения) блока, который нужно предсказать относительно базового блока;
     разница между блоками (которая затем и кодируется). Так как не любой блок можно предсказать основании информации о предыдущих, в P- и
    B-кадрах могут находиться I-блоки (блоки без предсказания движения).
    Метод кодировки блоков (либо разницы, получаемой при методе предсказания движения) основывается на дискретном косинусном преобразовании (ДКП). ДКП предусматривает разбиение кадра на блоки по
    64 (8>8) отсчета, называемые сигнальными матрицами. Суть здесь в том, что в результате исходная сигнальная матрица преобразуется в матрицу частотных коэффициентов такого же размера. Она уже не имеет прямой

    149 геометрической связи с положением отсчетов сигнала в растре, а просто является удобной формой математической записи, в которой частотные коэффициенты дискретного косинусного преобразования можно рассматривать как двумерный спектр изображения в горизонтальном и вертикальном направлениях. ДПК-спектр очень удобен для сжатия данных.
    Одной из его особенностей является то, что основной «вес» его составляющих концентрируется в небольшой области вблизи нулевых частот, а амплитуды высокочастотных составляющих или очень малы, или равны нулю. При этом передаются только те коэффициенты, которые превышают пороговую величину, а остальные считаются нулевыми.
    Введение порога, естественно, приводит к потерям информации и, соответственно, к снижению качества восстановленного изображения, однако при оптимальном выборе величины порога такое ухудшение окажется практически незаметным. Что касается звука, то форматы его кодирования, существующие в MPEG, делятся на три части: Layer I, Layer II, Layer III
    (который сейчас еще называют как mp3 или mpeg3, что, в общем-то, неверно). Layer III обеспечивает самое большое сжатие и требует больших ресурсов для кодирования. Принципы кодирования звука основаны на том факте, что человеческое ухо несовершенно, и на самом деле в несжатом звуке с качеством аудио компакт-диска (16 бит, 44,1 кГц) передается много избыточной информации. Принцип сжатия использует эффект маскировки некоторых звуков для человека (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц уже не будет слышен человеку, также будет ослаблена чувствительность человеческого уха в периоды в 100 мс после и 5 мс до возникновения сильного звука).
    Психоаккустическая модель, используемая в MPEG, разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки, не воспринимаемые человеком. Аудиопараметры
    MPEG-1 включают поддержку частот дискретизации: 48, 44,1, 32 кГц; сигналы могут быть следующих типов – singlechannel (моно), dual channel
    (два моноканала), stereo (стерео), intensity stereo (интенсивное стерео), joint

    150 stereo (разновидность стерео). Последним ключевым моментом сжатия видео- и аудиоданных является синхронизация. Видеопоток содержит заголовок, затем несколько групп картинок (заголовок и несколько картинок необходимы для того, чтобы обеспечить произвольный доступ к картинкам в группе вне зависимости от их порядка). Звуковой поток состоит из пакетов, каждый из которых состоит из заголовка и нескольких звуковых кадров. Для синхронизации в третий, системный поток, встраивается таймер, работающий с частотой 90 кГц – метка, по которой происходит увеличение временного счетчика в декодере, и метка начала воспроизведения
    (Presentation Data Stamp). «Метка начала» вставляется в картинку или в звуковой кадр, чтобы объяснить декодеру, когда их воспроизводить. К несчастью, MPEG-1 обеспечивал качество видеоизображения более низкое, чем даже аналоговое видео, передаваемое по телевизионному стандарту.
    Поэтому вскоре на смену ему пришел более совершенный MPEG-2.
    Характеристики формата MPEG-1:
    MPEG-1 Video:
     кодирование с потерями;
     размер кадра – до 4095х4095 пикселов (стандартными являются соотношения 352x240x30 и 352x288x25);
     битрейт – до 100 Мбит/с (стандартным является битрейт порядка 1.5
    Мбит/с);
     поддержка как постоянного, так и переменного битрейта.
    Достоинства MPEG-1 Video:
     отличное качество видео и очень высокая степень сжатия (на момент создания);
     сравнительно прост в аппаратной реализации;
     содержит преобразования, поддерживаемые на аппаратном уровне большим количеством видеокарт;
     низкие аппаратные требования (в настоящее время).
    Недостатки MPEG-1 Video:

    151
     высокие аппаратные требования (на момент создания);
     плохая поддержка видео с размерами кадра, большими, чем 352х240 пикселов;
     поддержка только прогрессивной развертки;
     невысокая степень сжатия (в настоящее время).
    7.3 Стандарт сжатия MPEG2
    После завершения работы в 1993 г. над MPEG-1 была начата работа над MPEG-2, в задачу которого входило описание потока данных со скоростью от 3 до 10 Мбит/с. Практически в то же время была начата работа над MPEG-3, который был предназначен для описания потоков 20-40 Мбит/с.
    Однако вскоре выяснилось, что алгоритмические решения для MPEG-2 и
    MPEG-3 принципиально близки и можно безболезненно расширить рамки
    MPEG-2 до потоков в 40 Мбит/с. В результате работа над MPEG-3 была прекращена.
    Первая редакция (First Edition) MPEG-2 появилась в 1995 г. Доработки продолжались до 2000 г., в котором вышла Вторая редакция (Second Edition).
    Последние изменения в стандарт были внесены в 2011 г.
    Компрессия по стандарту MPEG-2 кардинально изменила положение вещей. Суть его работы основана на том, что более 97% цифровых данных, представляющих видеосигнал, дублируются, то есть являются избыточными и могут быть сжаты без ущерба для качества изображения. Алгоритм MPEG-
    2 анализирует видеоизображение в поисках повторений, называемых избыточностью. В результате процесса удаления избыточности формат
    MPEG-2 обеспечивает превосходное видеоизображение при более низкой скорости передачи данных. По этой причине современные средства поставки видеопрограмм, такие, как цифровые спутниковые системы и DVD, используют именно стандартMPEG-2. По сравнению с MPEG-1 изменения произошли как в звуковой, так и в видеочасти.
    Основные изменения в видео:

    152
     поддержка стандартов цветности 4:4:4 и 4:2:2;
     разрешение кадра до 16383>16383;
     возможность кодирования видео с чересстрочной разверткой;
     наличие режимов масштабирования.
    Изменения в звуке:
     поддержка частот дискретизации 16, 22,05 и 24 кГц;
     поддержка многоканального звука (возможность иметь 6 полноценных каналов: левый, правый, центральный, два задних и низко- частотный);
     введен механизм AAC (Advanced Audio Coding) – стандарт обеспечивает очень высокое качество звука на скорости 64 кбит/сна канал
    (допускается от 8 до 96 кбит/с), возможно использование 48 основных каналов, 16 низкочастотных каналов для звуковых эффектов, 16 многоязыковых каналов и 16 каналов данных. Сегодня цифровое телевидение немыслимо без стандарта MPEG-2. Можно сказать, что оно вообще смогло выйти за порог студий лишь благодаря методам компрессии, основанным на
    «схожести» последовательных изображений и несовершенстве нашего зрения. Для цифрового телевещания алгоритмы сжатияMPEG-2 позволяют без заметной потери качества снизить первоначальную скорость передачи приблизительно в 20 раз. Если жене предъявлять высоких требований к качеству, то скорость можно снизить в 50 и даже 100 раз. Что касается DVD, видеосигнал, хранящийся на DVD-диске, получается сжатием студийного видеосигнала CCIR-601 так же по алгоритму
    MPEG-2. Если изображение сложное или быстро изменяется, возможны заметные на глаз дефекты сжатия вроде дробления или размытости изображения. При скорости 3,5 Мбит/с дефекты сжатия иногда бывают заметны. При скорости 6 Мбит/с сжатый сигнал почти не отличается от оригинала.

    153
    1   ...   8   9   10   11   12   13   14   15   ...   37


    написать администратору сайта