Главная страница
Навигация по странице:

  • B – Bi-directional-кадры

  • Компоненты и пара- метры сигнала Обозначения Частоты дискретизации и ско- рости передачи

  • Профиль Характеристика Формат цветовой дискретизации

  • Учебное пособие елец 2008 удк ббк з


    Скачать 1.64 Mb.
    НазваниеУчебное пособие елец 2008 удк ббк з
    Дата06.11.2018
    Размер1.64 Mb.
    Формат файлаdocx
    Имя файлаelsu60-converted.docx
    ТипУчебное пособие
    #55554
    страница14 из 15
    1   ...   7   8   9   10   11   12   13   14   15

    Сжатие видеосигналов


    Первичная видеоинформация всегда избыточна. Поэтому преобразование её в цифровой формат приводит к необходимости передачи по каналам связи очень большого объёма информации. Для решения этой задачи требуются ка- налы связи с очень широкой полосой пропускания. Поэтому при разработке цифровых систем перед специалистами стояла задача сокращения объёма пе- редаваемой информации. Это задача получила название «сжатие» («компрес- сия») информации.

    Самое высокое качество у некомпрессированного цифрового видеосигнала, но для этого необходимо передавать очень большое количество данных (де- сятки Мб/сек). Эффективное сжатие видеоинформации основано на двух ос- новных идеях:

    • подавление несущественных для визуального восприятия мелких дета- лей пространственного распределения отдельных кадров;

    • устранение временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии.



    Способы сокращения избыточности цифрового сигнала.


    При использовании параллельного кода количество разрядов передаваемо- го слова N определяет число проводов, по которым передаётся цифровой сиг- нал. При последовательном коде большое количество разрядов кодового сло- ва требует высоких скоростей передачи информации. Скорость передачи ин- формации определяется количеством элементарных символов (бит), переда- ваемых за 1 секунду. При первоначальной обработке сигнала в АСК исполь- зуется параллельное кодирование. При этом кодируется вся информация без исключения. Передача информации в таком первоначальном виде, как уже говорилось, требует очень высокой скорости обработки и, кроме того, весьма широкополосного канала связи. Поэтому в цифровом телевидении стремятся по возможности сократить разрядность передаваемых слов. Эта операция но- сит название «сжатие информации». Однако простое уменьшение разряд- ности приводит к ухудшению ТВ-изображения и, следовательно, недопусти- мо.

    В настоящее время существует ряд способов по сокращению величины N.

    Они связаны со специальной обработкой сигнала, называемой кодированием цифрового сигнала.

    Под кодированием цифрового сигнала в общем случае понимается замена одной кодовой комбинации новой кодовой комбинацией в соответствии с оп- ределёнными правилами с целью решения ряда инженерных задач: сокраще- ние избыточности цифрового сигнала, повышение скрытности и помехоза- щищённости передачи и т. п.

    Одним из способов сокращения избыточности (разрядности) цифрового сигнала является кодирование с предсказанием. Наличие сильных корре- ляционных* связей между близко расположенными элементами пространст- венной дискретизации изображения позволяет не передавать полную инфор- мацию о каждом элементе.

    (*Корреляциястатистическаязависимостьмеждуявлениямиилипроцессами.Корре- ляционная зависимость отличается от функциональной тем, что в ней возможные по- следствиякаких-либособытиймогутбытьизмеренылишьприблизительно.Такимобра-
    зом, при корреляционной зависимости переменная величина соответствует изменениям другой величины лишь с определённой степенью вероятности, называемой коэффициен- том корреляции. Корреляционный анализ применяется в радиоастрономии, радиолока- ции, гидроакустике, сейсмологии и т.д. при решении задач обнаружения слабых, замаски- рованных шумами сигналов. Он используется также для определения спектральных ха- рактеристик сигналов и выявления их идентичности, что необходимо в ряде исследова- ний, связанных с измерением очень слабых сигналов.)
    Можно ограничиться передачей ряда элементов, а остальные элементы предсказать, т.е. вычислить их с помощью специальных технических уст- ройств. Однако предсказание сигнала по предыдущим отсчётам всегда будет нести некоторую ошибку е(nТ). На рис.10.9 показана структурная схема сис- темы передачи цифрового сигнала, использующая метод предсказания.



    Рис.10.9. Структурная схема передачи цифрового сигнала, использую- щая метод предсказания: ПС-1, ПС-2 – предсказатели
    Чтобы сформировать сигнал ошибки, на передающем конце системы уста- навливается устройство предсказания ПС-1. Чаще всего используются линей- ные предсказатели. В этом случае предсказанное значение отсчёта U'(nT) оп- ределяется как

    L

    U'(nT) = Σ ak ·U{(n – k)T},

    k=1

    где ak – постоянные коэффициенты, величина которых определяется особенностями сигнала U(nT), поступающего на вход преобразова- теля;

    U{(n – k)T} – предыдущие отсчёты сигнала, по которым осуществля- ется предсказание;

    L – количество отсчётов, используемых для предсказания.
    Чтобы сформировать сигнал ошибки e(nT), из сигнала U(nT) вычитается предсказанный сигнал U'(nT).

    На приёмной стороне имеется предсказатель ПС-2, аналогичный предска- зателю ПС-1. Поскольку процедуры предсказания на приёмной и передающей сторонах идентичны, предсказанные отсчёты сигнала U''(nT) могут быть ис- пользованы для восстановления значения сигнала, поступающего на вход сис- темы передачи цифрового сигнала. Для этого к вычисленным отсчётам U''(nT) добавляют переданный по каналу связи сигнал ошибки.

    В рассмотренной системе предсказания по каналу связи передаётся сигнал ошибки e(nT), который изменяется в значительно меньшем диапазоне по сравнению с сигналом U(nT), а значит, и количество разрядов, необходимое для передачи этого сигнала, оказывается меньшим.

    При кодировании с предсказанием вычисляется разность между истинным и предсказанным значением отсчёта. Затем эта разность квантуется по уров- ню. От точности предсказания зависит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяци- онным. В этом случае (его часто называют «предсказанием вперёд») по предшествующим значениям отсчётов ТВ-сигнала оцениваются последующие отсчёты. Интерполяционное (двунаправленное) предсказание означает, что оценка среднего по положению отсчёта ТВ-сигнала выполняется по из- вестным значениям предшествующих и последующих отсчётов. Такое пред- сказание наиболее точно оценивает текущие отсчёты. Однако стремление к точности приводит к возрастанию объёма вычислений и, соответственно, па- мяти, необходимой для реализации этой точности.

    Другой способ предсказания – межкадровое «предсказание вперёд». В этом случае текущий отсчёт оценивается по отсчёту с теми же координатами, но предыдущего кадра. Это очень эффективный метод предсказания для непод- вижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменяется в целом. В этом случае отсчёты, при- надлежащие однотипным элементам изображения, от кадра к кадру будут
    смещаться. Возникает разностная информация, даже если в остальном ника- ких изменений не происходит. Этот эффект можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы переме- щения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение кодируе- мого отсчёта в новом кадре (скомпенсировать его перемещение) и, таким об- разом, сохранить высокую точность предсказания.

    Известен ещё один способ сокращения избыточности информации, кото- рый носит название кодирования с преобразованием. Он основан на спек- тральном преобразовании цифрового сигнала.

    Известно, что дискретному периодическому сигналу соответствует дис- кретный периодический спектр (рис.10.10).



    Рис.10.10. Спектр периодического сигнала

    а – дискретный периодический сигнал; б – спектр дискретного периодиче- ского сигнала; ТС – период следования сигнала; FД – частота дискретизации.
    Телевизионный сигнал может рассматриваться как квазипериодический с периодом, равным длительности строки ТС.

    Между отсчётами сигнала U(nT) и спектром этого сигнала S(k∆f) сущест- вует взаимно-однозначное соответствие. Эта связь устанавливается прямым и обратным преобразованием Фурье. Поэтому вместо отсчётов сигнала по ка- налу связи можно передать отсчёты дискретных составляющих спектра. Но передавать все составляющие спектра нет необходимости, потому что по со- ставляющим спектра, примыкающим к нулевой частоте, практически можно
    восстановить весь спектр. Следовательно, по каналу связи достаточно переда- вать только эти составляющие.

    Структурная схема системы передачи цифрового сигнала, использующей этот принцип, изображена на рис.10.11.



    Рис.10.11. Структурная схема передачи цифрового сигнала, использующая метод кодирования с преобразованием:

    1 – преобразователь; 2 – селектор; 3 – квантователь и кодер; 4 – канал свя- зи; 5 – декодер; 6 – блок обратного преобразования.

    Преобразователь (1) – осуществляет вычисление спектральных состав- ляющих S(k∆f) дискретного сигнала U(nT).

    Селектор (2) – производит фильтрацию спектральных составляющих

    S(k∆f), значимых для рассматриваемого класса изображения.

    Квантователь и кодер (3) – осуществляют квантование и кодирование от- фильтрованных спектральных составляющих.

    На приёмной стороне после декодирования и обратного преобразования восстанавливается дискретный сигнал U(nT).

    Описанная система кодирования позволяет уменьшить число кодовых слов, передаваемых по каналу связи и одновременно с этим уменьшить раз- рядность этих слов. Это связано с особенностью спектра периодического дис- кретного сигнала. Во-первых, в этом спектре количество спектральных со- ставляющих на интервале частот 0 ÷ FД равно количеству отсчётов сигнала на интервале времени ТС. А так как составляющие спектра в диапазоне от

    FД / 2 до FД могут быть восстановлены по составляющим спектра интервала частот 0 ÷ FД / 2, то количество спектральных составляющих, подлежащих пе- редаче, оказывается в два раза меньше, чем количество отсчётов сигнала на интервале времени ТС. Во-вторых, наибольшими по уровню оказываются со- ставляющие спектра S(k∆f), расположенные в окрестности нулевой частоты.
    Эти составляющие в основном определяют дискретный сигнал U(nT). Поэто- му составляющие малого уровня могут не передаваться. Для передачи остав- шихся составляющих шаг квантования может быть увеличен, т.к. уровень их достаточно велик и, следовательно, разрядность кодового слова можно уменьшить.

    В рассмотренных алгоритмах работы предсказателя и преобразователя ис- пользуются сигналы, полученные в точках пространственной дискретизации, которые расположены вдоль телевизионной строки (рис.10.5). На практике используются более сложные системы кодирования (так называемые двумер- ные системы). В таких системах операции преобразования и предсказания осуществляются по сигналам, полученным в точках пространственной дис- кретизации, расположенным внутри небольшой поверхности. Выбор формы поверхности и её размеров зависят от назначения ТВ-системы и характера пе- редаваемого изображения.

      1. Стандарт сжатия движущихся изображенийMPEG-2

    В 1988 году для разработки методов сжатия и восстановления цифрового видеосигнала была организована специальная группа экспертов – Motion PicturesExpertGroup(MPEG).Результатом исследований этой группы яви- лось создание международных стандартов для сжатия цифрового телевизион- ного сигнала, также получивших название MPEG. Специально для кодирова- ния сигналов вещательного телевидения был разработан стандарт MPEG-2.

    Он позволяет получить высокую чёткость ТВ изображения, обеспечивая 576 активных строк в кадре и 720 отсчетов в активной части строки (горизонталь- ная четкость). Применение этого стандарта в вещательном телевидении по- зволяет значительно снизить объём передаваемых в единицу времени видео- и звуковых данных и за счёт этого передавать несколько цифровых программ в полосе частот одного стандартного радиоканала эфирного, кабельного или спутникового телевизионного вещания. Например, в системах спутникового телевизионного вещания сжатие ТВ-сигнала в стандарте MPEG-2 позволяет
    передавать по одному каналу до пяти цифровых программ, при профессио- нальном качестве видеосигнала.

    Концепция сжатия видеосигналов в MPEG достаточно проста – опреде- лить, какая именно информация в потоке повторяется хотя бы в течение како- го-то отрезка времени и принять меры к исключению дублирования этой ин- формации. Наиболее ценное достоинство MPEG-кодирования, особенно удобное для передачи по различным сетям, – возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приёма/передачи цифрового телевидения по различным сетям.

    Невозможно однозначно оценить качество кодирования какими-либо при- борами и измерениями. Единственный критерий здесь – способность человека воспринимать сжатую информацию. Поэтому правила сжатия видеоданных при MPEG-кодировании вырабатывались на основе модели восприятия чело- веком видеоизображений (HVS - Human Visual Sense).

    Избыточность изображения, согласно HVS, определяется по трём основным критериям: временная, пространственная и цветовая.

    Устранениевременнойизбыточностиизображения,учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.

    Устранениепространственнойизбыточностиизображенияпутём по- давления мелких деталей сцены, несущественных для визуального воспри- ятия человеком.

    Устранениецветовойизбыточностиизображенияпутём использование более низкого цветового разрешения при YRB-представлении изображений (Y — яркостный сигнал, R и B — цветоразностные сигналы). Опытным путём установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.

    Техника сжатия кодированных изображений основывается на сокращении этих видов избыточности. Основная идея сжатия MPEG состоит в том, что из
    всего потока полностью передаются только избранные (опорные) кадры, для остальных же передаются их изменения по отношению к опорным. Действи- тельно, в подвижном изображении от кадра к кадру в большинстве случаев меняется только его часть. Например, при выступлении диктора в «Новостях» меняется только его мимика. Полная же смена кадра происходит относитель- но редко, только когда очередной кадр нельзя восстановить как изменение предыдущего (в этом случае проще передать сам кадр).

    По этой причине в MPEG определены три типа кадров:

    I-кадры (Intra frames);

    P-кадры (Predictive frames);

    B-кадры (Bidirectional frames).

    I-кадры несут полноценное неподвижное изображение и, кроме того, исполь- зуются для построения P- и B-кадров. I-кадры играют роль опорных при вос- становлении остальных изображений и размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между I-кадрами, претерпевают изменения, и именно эта разница сохраняется при сжатии. P-кадры, то есть "предсказанные", строятся на базе последнего принятого I- или P-кадра. Если же предсказанный Р-кадр сильно отличается от предыдущего (например, произошла смена плана), то он коди- руется как I-кадр.

    Для удобства кодирования видеоданных весь видеопоток разбивается на группы изображений называемые GOP (Group of Pictures). Например, группа из 10 кадров строится так, как показано на рис. 10.12.

    Все типы кадров группируются в последовательности. Таким образом, при частоте 25 кадров в секунду, новый I-кадр приходит максимум через 10х(1/25)=0,4 секунды. Вместе с ним восстанавливается полная идентичность передаваемого и принимаемого изображения.


    . Группы (GOP) видеопотока.

    Рис.10.12. Группы (GOP) видеопотока

    На этом рисунке показаны:

    I – Intra-кадры, которые обычно называются «опорными» и содержат всю информацию об изображении. Без этих кадров MPEG- последовательно- сти быть не может в принципе. При компрессии I-кадров происходит удале- ние только пространственной избыточности.

    P – Predictive-кадры, "предсказанные" кадры, при формировании кото- рых используется метод предсказания изображения на следующем кадре с учётом компенсации движения от последнего I- или P-кадра перед форми- руемым. P-кадр также служит для дальнейшего предсказания изображения. P- кадр создаётся с помощью межкадровой компрессии, уменьшающей как про- странственную, так и временную избыточность. Изображение P-кадра вычи- тается из следующего изображения, эта разница кодируется и вместе с векто- ром движения добавляется к сжатым данным. Вектор движения представляет собой двумерный вектор, показывающий смещение координат восстанавли- ваемого объекта в текущем кадре, по сравнению с координатами объекта в предыдущем кадре.

    B – Bi-directional-кадры, «двунаправленные»кадры. Они названы так

    потому, что хранят наиболее существенную информацию окружающих их I- и P-кадров. B-кадры имеют наивысшую степень компрессии, но требуют пре- дыдущего и последующего изображения для компенсации движения объектов на изображении.
    Такую структуру MPEG-потока обычно описывают в виде дроби M/N, для которой M сообщает общее число кадров в GOP, а N - каким по счету будет очередной P-кадр после предыдущего. Таким образом, GOP- последователь- ность, изображённая на рис.10.12, может быть записана как 10/3.

      1. Принципы кодированияизображений

    При преобразовании цветового ТВ-сигнала из аналоговой в цифровую форму согласно рекомендации МСЭ-Р (Международного Союза Электросвя- зи) используются частоты дискретизации и формируются цифровые потоки, приведенные в табл.10.1.
    Таблица 10.1.

    Некоторые основные показатели при кодировании ТВ-сигнала


    Компоненты и пара- метры сигнала

    Обозначения

    Частоты дискретизации и ско- рости передачи

    Сигнал яркости

    Y

    13,5 МГц

    (8 бит×13,5= 108 Мбит/с)

    Цветоразностный сигнал R – Y

    CR

    6,75 МГц

    (8 бит×6,75 = 54 Мбит/с)

    Цветоразностный сигнал B- Y

    CB

    6,75 МГц

    (8 бит×6,75 = 54 Мбит/с)

    Полное число отсчётов

    в секунду

    S

    13,5 + 6,75 + 6,75 =

    =27 М-отсчётов/с

    Требуемая полоса

    частот канала

    BN

    135 МГц


    Эти данные показывают, что в результате аналогово-цифрового преобразо- вания цветового ТВ-сигнала результирующие потоки битов и требуемые для их передачи полосы частот очень велики, и потому требуется сокращение из- быточности (сжатие сигнала). Общепринятым методом сжатия в настоящее время являются алгоритмы стандарта МРЕG-2, позволяющие снизить ско- рость передачи кодированного сигнала до 5 ÷ 10 Мбит/с.

    Структурная схема кодирующего устройства показана на рис.10.13.


    Рис.10.13. Структурная схема кодера изображений

    В кодере MPEG-2 вначале обрабатываются фрагменты изображения (блоки) размером 8 × 8 пикселей, несущие информацию о яркости или цвет- ности. Яркостные блоки объединяются в макроблоки, состоящие из четырёх блоков и имеющих размер 16 × 16 пикселей. Если с каждым макроблоком свя- заны по одному блоку цветоразностных сигналов (СR и СB), то такой формат цветовой дискретизации обозначается 4:2:0. Если же число цветовых блоков равно четырём (по два блока для каждого из цветоразностных сигналов СR и СB), то имеет место формат цветовой дискретизации 4:2:2. Смежные макро- блоки группируются вместе и образуют слайс (вырезку из данных массива).

    Первичной кодированной единицей изображения является кадр, состоя- щий из группы слайсов, составляющих активную область изображения. Для сокращения пространственной избыточности в пределах одного кадра при ко- дировании создаётся I -кадр, содержащий всю информацию, необходимую для декодирования изображения. В случае сбоя в работе или помех в канале передачи I -кадры позволяют возобновить процесс правильного декодирова- ния. Для повышения степени сжатия I -кадры передаются примерно один раз в 12 кадров. В остальное время передаются Р-кадры и В -кадры, значения ко- торых предсказуемы: для Р -кадров – исходя из значений, предшествующих I-
    и Р -кадров, а для В -кадров – исходя из значений предшествующих и после- дующих I-кадров и P-кадров.

    Чтобы декодер мог правильно восстановить информацию, требуется пере- давать также дополнительную служебную информацию. Для этого каждый кадр снабжается заголовком, а ряд взаимосвязанных I-, Р- и В-кадров объеди- няется в группукадров(GOP),которая также снабжается заголовком. Полу- ченная структура данных называется элементарнымпотокомданных. В по- следовательности GОР вначале следуют I- и Р-кадры, а затем В-кадры (рис.10.12), которые реконструируются декодером из ранее принятых I- и Р- кадров. Поскольку последовательность передачи кадров не совпадает с по- следовательностью их воспроизведения, то на уровне пакетированногоэле- ментарного потока добавляются временные метки декодирования (DTS) и представления (PTS), которые несут информацию о необходимых моментах времени декодирования и отображения кадров.

    Таким образом, в процессе кодирования создаётся сложная шестиуровне- вая иерархическая структура: блокмакроблокслайскадргруппа кадров – последовательность кадров(рис.10.13).



    Рис.10.13. Иерархическая структура кодирования МРЕG-2

      1. Компенсация движения и дискретно-косинусноепреобразование

    Эффективное сжатие видеоинформации основано на двух основных идеях: подавление несущественных для визуального восприятия мелких деталей пространственного распределения отдельных кадров и устранения временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии.

    Пространственная компрессия использует экспериментально установлен- ную малую чувствительность человеческого восприятия к искажениям мел- ких деталей изображения. Глаз быстрее замечает неоднородность равномер- ного фона, чем искривление тонкой границы или изменение яркости и цвета малого участка. Из математики известно два эквивалентных представления изображения: привычное человеку пространственное распределение яркости и цвета и так называемое частотное распределение, связанное с пространст- венным дискретно-косинусным преобразованием (ДКП). Теоретически они равнозначны и обратимы, но сохраняют информацию о структуре изо- бражения совершенно по-разному: передачу плавных изменений фона обес- печивают низкочастотные (центральные) значения частотного распределения, а за мелкие детали пространственного распределения «отвечают» высокочас- тотные коэффициенты. Это позволяет использовать следующий алгоритм сжатия. Кадр разбивается на макроблоки размером 16х16 (размеру 720х576 соответствует 45х36 макроблоков в кадре), каждый из которых ДКП перево- дит в частотную область. Затем соответствующие частотные коэффициенты подвергаются квантованию (округлению значений с задаваемым интервалом). Если само по себе ДКП не приводит к потере данных, то квантование коэф- фициентов, очевидно, вызывает огрубление изображения. Операция кванто- вания выполняется с переменным интервалом – наиболее точно передаётся низкочастотная информация, в то время как многие высокочастотные коэф- фициенты принимают нулевые значения. Это обеспечивает значительное сжатие потока данных, но приводит к снижению эффективного разрешения и возможному появлению незначительных ложных деталей (в частности, на
    границе блоков). Очевидно, что чем более грубое квантование используется, тем больше степень сжатия, но и тем ниже качество результирующего сигна- ла.

    Временная компрессия использует высокую избыточность информации в изображениях, разделённых малым интервалом. Действительно, между смеж- ными изображениями обычно меняется только малая часть сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полную информацию о сцене нужно сохранять выборочно – только для опорных изображений. Для остальных достаточно передавать только разностную информацию: о положении объекта, направле- нии и величине его смещения, о новых элементах фона (открывающихся за объектом по мере его движения). Причём, эту разностную информацию мож- но формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта от- крывается часть фона, ранее скрытая за объектом). Математически наиболее сложным элементом является поиск смещающихся, но мало изменяющихся по структуре макроблоков (16х16) и определение соответствующих векторов их смещения. Однако это элемент наиболее существенен, так как позволяет существенно уменьшить объём требуемой информации. Именно эффективно- стью выполнения этого "интеллектуального" элемента в реальном времени и отличаются различные MPEG-кодеры.

      1. Профили и уровни стандартаMPEG-2

    Нормы стандарта МРЕG-2 для кодирования ТВ-сигнала образуют семейст- во систем с упорядоченными свойствами унифицированности и совместимо- сти. Каждому семейству систем соответствуют различные сочетания парамет- ров кодированного сигнала. Такие группы параметров, объединяющие пока- затели качества сжатого сигнала и требуемых скоростей передачи, получили название профилей и уровней МРЕG-2.
    Профиль – это определённый поднабор полного синтаксиса МРЕG-2, или инструментальный набор (например, формат цветовой дискретизации 4:2:2; использование только I/P-кадров при предсказании; дискретно-косинусное преобразование – ДКП).

    Каждый более высокий профиль является более сложным и последова- тельно добавляет дополнительные возможности к предыдущему профилю. Однако для пользователя это улучшение качества влечёт определённую плату за сложность декодера.

    Каждый профиль МРЕG-2 предлагает набор инструментальных средств для сжатия, которые все вместе составляют определённую систему кодирования.

    Простой профиль это профиль, в котором используется наименьшее число функциональных операций по компрессии видеоданных. В нём при компрессии используется компенсация движения изображения и гибридное дискретно-косинусное преобразование.

    Основной профильсодержит все инструментальные средства простого

    профиля плюс ещё одно, называемое двунаправленным предсказанием. Для той же самой скорости передачи он обеспечивает максимальное качество по сравнению с простым профилем, но требует больших аппаратных затрат. Де- кодер основного профиля декодирует изображения, кодированные с парамет- рами основного и простого профилей. Аналогично обратная совместимость имеет место для всех профилей.

    Масштабируемые профили добавляют инструментальные средства, ко- торые позволяют улучшать или шумовые параметры (масштабируемость по соотношению сигнал/шум), или разрешающую способность (пространствен- ная масштабируемость) за счёт обмена одних показателей на другие. Основ- ной смысл этого профиля – повышение устойчивости цифрового телевидения и сохранение работоспособности при неблагоприятных условиях приёма.

    Операция масштабирования позволяет в рассматриваемом случае повысить устойчивость системы за счёт некоторого снижения требований к допустимо- му уровню отношения сигнал/шум в воспроизводимом ТВ-изображении.
    При масштабировании поток видеоданных разделяют на две части. Одна из них несёт наиболее значимую часть информации – её называют основным сигналом. Вторую часть, несущую менее значимую информацию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить ТВ-изображение с пониженным отношением синал/шум. Одновременное декодирование основного и дополнительного сигналов по- вышает отношение сигнал/шум до исходного значения. Помехоустойчивое кодирование требует введения дополнительных бит, что увеличивает общий поток информации. Задача упрощается, когда более мощная защита применя- ется только к части информации и тем самым соблюдается баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приёма (например, при низкой напряжённости электромагнитного поля, при приёме на комнатную антенну и т.п.) сохраняется возможность ус- тойчивого декодирования более защищённого основного сигнала, а неустой- чиво воспринимаемый дополнительный сигнал просто отключается. Это ве- дёт к некоторому росту уровня шума, зато система остается работоспособной.

    Высокийпрофильвключает все инструментальные средства более низких профилей плюс способность одновременного кодирования цветоразностных сигналов.

    Профессиональный профиль является разновидностью высокого про- филя и специально предназначен для оптимизации видеомонтажных операций в студийных центрах за счёт сокращения времени задержки из-за прохожде- ния больших групп кадров.

    Характеристики профилей МРЕG-2 приведены в табл.10.2.

    Таблица 10.2.

    Характеристики профилей МРЕG-2


    Профиль

    Характеристика

    Формат цветовой дискретизации

    Простой

    Без двунаправленных

    кадров

    Только 4:2:0

    Основной

    Без масштабируемости

    Только 4:2:0

    Масштабируемый по соот-

    ношению сигнал/шум

    Масштабируемый по со-

    отношению сигнал/шум

    Только 4:2:0

    Пространственно-

    -масштабируемый

    Пространственно-

    -масштабируемый

    Только 4:2:0

    Высокий 4:2:2

    (профессиональный 4:2:2)

    Масштабируемый в про-

    странстве и времени

    4:2:2 и 4:2:0


    Уровень – это определённый набор ограничений, накладываемых на пара- метры сигнала изображения и соответствующего ему передаваемого потока битов в пределах конкретного профиля (например, максимальный размер изо- бражения, частота кадров, максимальная скорость битов, максимальный раз- мер буфера декодера). Уровни связаны с исходным форматом сигнала изо- бражения, обеспечивая ряд значений его потенциального качества – от низкой (ограниченной) чёткости до высокой чёткости.

    Низкий уровеньопределяет формат изображения, составляющий четверть

    обычного формата, определённого рекомендацией МСЭ (Международного Союза Электросвязи). Низкому уровню соответствует новый класс качества ТВ-изображения, которое вводится в стандарте MPEG-2, – телевидение огра- ниченной чёткости. В этом случае в кадре ТВ-изображения содержится 288 активных строк (в два раза меньше, чем в телевидении обычной чёткости)

    на 352 отсчёта в строке.

    Основной уровень соответствует формату кадра 576 активных строк на 720 отсчётов в строке. Это соответствует кодированию сигналов телевидения обычной чёткости.

    Высокий-1440уровеньимеет формат высокой чёткости с 1440 отсчётами в строке.
    Высокийуровеньимеет формат высокой чёткости с 1920 отсчётами в строке.

    В обоих «высоких» уровнях кадр ТВ-изображения содержит 1152 актив- ные строки (вдвое больше, чем в телевидении обычной чёткости).

    Численные характеристики уровней MPEG-2 приведены в табл.10.3.
    Таблица 10.3.

    Численные характеристики уровней MPEG-2


    Уровень


    Формат кадра

    Скорость битов в по- токе на выходе коде- ра, не более

    Мбит/с

    Низкий

    352 × 288

    4

    Основной

    720 × 576

    15

    Высокий -1440

    1440 × 1152

    60

    Высокий

    1920 × 1152

    80


    Комплект инструментальных средств МРЕG-2 принято подразделять на ряд комбинаций (согласованных точек) профилей и уровней. В настоящее время в стандарте МРЕG-2 пять профилей и четыре уровня. Качество изобра- жения и сложность его обработки характеризуются сочетанием профиля и уровня, что обычно отражается в виде таблицы (табл.10.4).
    Таблица 10.4.

    Профили и уровни стандарта МРЕG-2



    Уровни

    Простой

    (SP)

    (основной без В- кадров)

    4:2:0

    Основной

    (МР)

    (В-кадры) 4:2:0

    Масштаби- руемый

    по с/ш

    (SNR)

    4:2:0

    Простран- ственно масштаби- руемый (Spatial)

    4:2:0

    Профес- сиональ- ный (НР) 4:2:2

    Высокий

    (HL) 1920×1152


    ×


    80 Мбит/с


    ×


    ×


    100 Мбит/с

    Высокий-

    -1440

    (H-14) 1440×1152


    ×


    60 Мбит/с


    60 Мбит/с


    60 Мбит/с


    80 Мбит/с

    Основной

    (МL) 720×576


    15 Мбит/с


    15 Мбит/с


    15 Мбит/с


    15 Мбит/с


    20 Мбит/с




    Низкий

    (LL) 352×288

    ×

    15 Мбит/с

    4 Мбит/с

    4 Мбит/с

    ×

    Примечание: × - недопустимая комбинация.

    1   ...   7   8   9   10   11   12   13   14   15


    написать администратору сайта