Главная страница
Навигация по странице:

  • 2.4.2. Некоторые особенности процесса речеобразования, учитываемые в вокодерах

  • 2.4.3. Метод линейного кодирования с предсказанием

  • 3. Цифровые методы передачи видеоизображений 3.1. Основные характеристики цифрового видео

  • 3.2. Свойства системы зрения человека

  • 3.3. Межкадровая и внутрикадровая избыточность изображения

  • 3.3. Алгоритмы сжатия цифровых сигналов при передаче видеоизображений

  • Примеры форматов цифрового видео

  • 4. Телекоммуникационные каналы 4.1. Свойства физических каналов

  • 4.1.1. Кабели на витой паре

  • телекоммуникации. 1. элементы теории передачи информации информация, сообщение, сигнал Понятие информация


    Скачать 1.36 Mb.
    Название1. элементы теории передачи информации информация, сообщение, сигнал Понятие информация
    Дата29.03.2019
    Размер1.36 Mb.
    Формат файлаdoc
    Имя файлателекоммуникации.doc
    ТипДокументы
    #71939
    страница4 из 10
    1   2   3   4   5   6   7   8   9   10

    2.3.2. Дифференциальная импульсно-кодовая модуляция (ДИКМ)

    Обычно между двумя соседними отсчетами сигнала существует определенная взаимосвязь, которую в радиотехнике обозначают термином корреляция. Это справедливо для всех сигналов за исключением так называемого белого шума, отсчеты которого некоррелированы. Степень корреляции между отсчетами возрастает с ростом частоты дискретизации. Наличие корреляции указывает на наличие избыточности в сигнале.

    Учитывая корреляцию между отсчетами, можно сжать сигнал по сравнению с обычной ИКМ. Самый распространенный метод кодирования, основанный на учете корреляции между отсчетами, - ДИКМ-кодирование.

    При ДИКМ кодируют и передают по каналу не сам отсчет (как в ИКМ), а разность (или ошибку) между текущим отсчетом и предварительной оценкой (предсказанным значением) этого отсчета, полученной из анализа предыдущих отсчетов

    ε(n)=s(n)-sпредск.(n). (2.8)

    Чем точнее осуществляется предсказание очередного отсчета, тем меньше по величине разностный сигнал и, следовательно, тем меньшее количество разрядов потребуется для его кодирования в цифровом виде. В качестве сигнала предсказания можно использовать либо предыдущий отсчет s(n-1), либо M предшествующих отсчетов, что позволяет повысить точность предсказания:

    , (2.9)

    где ci – коэффициенты. Типовой вариант реализации метода ДИКМ приведен на рис.2.5. .
    На приемной стороне (рис.2.5,б) восстановление исходного сообщения осуществляется на основе соотношения

    s*(n) = ε*(n)+ s*предск.(n).
    Эффективность метода ДИКМ может быть повышена путем перехода к адаптивной дифференциальной импульсно-кодовая модуляции (АДИКМ). При этом производится автоматическое регулирование величины шага квантования сигнала ошибки предсказания, а также автоматическая подстройка коэффициентов ciв (2.9) в соответствии с изменением текущего спектра передаваемого сообщения. Для этого как в передающее, так и в приемное устройства вводятся дополнительные цепи автоматической регулировки усиления и подстройки параметров предсказателя на основе статистического оценивания параметров передаваемого сообщения.. Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 32 кбит/с. Алгоритм АДИКМ был принят в качестве международного стандарта G.726 в 1984 г.

    2.4. Вокодеры

    2.4.1. Принципы вокодерного кодирования

    В
    окодеры
    предназначены для кодирования исключительно речевого сигнала. При их построении максимально учитывают особенности образования речи и ее восприятия человеком. Форма восстановленного сигнала при этом может радикально отличаться от формы исходного сигнала. В качестве примера на рис. 2.6 приведены осциллограммы двух сигналов, внешне весьма различных. Тем не менее, при их воспроизведении человек не заметит разницы. Дело в том, что спектральный состав обоих сигналов одинаков: они являются суммой синусоиды и ее третьей гармоники. Различны лишь значения начальной фазы третьей гармоники. Органы слуха человека не реагируют на фазовые соотношения.

    Рис. 2.6.

    Задача ИКМ, ДИКМ, АДИКМ и других аналогичных им методов - максимального точно передать информацию о форме сигнала. Именно поэтому эти методы кодирования называют кодированием формы. Задача вокодерной обработки другая - обеспечить, чтобы восстановленный сигнал звучал как можно более сходно с исходным сигналом.

    Принципиальное отличие вокодерного кодирования от кодирования формы состоит в том, что по каналу связи передают не сам сигнал, а параметры модели его образования. На приемном конце восстановленный сигнал синтезируют.

    Существует большое число идей построения вокодеров. Например, в канальных или полосовых вокодерах спектр речи делят на 7 - 20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большее число каналов дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор и фильтр низких частот. На приемный конец раз в 20 мс передают информацию об уровне сигнала в каждом канале. Синтезатор речи представляет собой набор синусоидальных генераторов и регулируемых аттенюаторов, устанавливающих требуемые соотношения между амплитудами колебаний разных частот. Передача информации об уровне сигнала в каждом канале возможна в аналоговом или цифровом виде.

    В фонемных вокодерах используют тот факт, что речь передается ограниченным числом слогов - фонем. Например, русский язык использует 42 фонемы. Выполняя фонемный анализ речи, можно периодически (например один раз в 20 мс) передавать на приемный конец номер соответствующей фонемы, закодированный 6 битами, а также информацию об уровне сигнала (еще 6 бит). Таким образом, скорость цифрового потока составит (6+6)/20=0,6 кбит/c. На приемном конце синтезатор воспроизводит соответствующую фонему, извлекая ее из памяти. Известны и другие принципы вокодерного кодирования. Хотя первые вокодеры были предложены в 30-е годы, до начала 80-х годов качество восстанавливаемой речи было крайне низким. Область применения вокодеров ограничивалась линиями командной связи, речевого управления и говорящими автоматами информационно-справочных служб. При этом достигалась низкая скорость передачи (порядка 0,6 - 4 кбит/c).

    Прогресс вокодеров в 80-е и 90-е годы непосредственно связан с новыми возможностями цифровой обработки сигналов и микропроцессорной техники. С другой стороны, он явился ответом на потребности быстро развивающегося рынка массовых цифровых систем подвижной радиосвязи, в частности сотовых систем.

    Вокодеры используют достаточно сложные алгоритмы обработки речевых сигналов и по этой причине выполняются на основе цифровых сигнальных процессоров (ЦСП). Производительность ЦСП обычно оценивают в миллионах операций в секунду. Вокодеры, использующие ЦСП, способные выполнять 15 млн. операций в секунду, относятся к низкопроизводительным, если указанный параметр превышает 30 млн. операций в секунду, то такие вокодеры считаются выскопроизводительными.

    2.4.2. Некоторые особенности процесса речеобразования, учитываемые в вокодерах

    Рассмотрим особенности процесса речеобразования. При разговоре грудная клетка сжимается и расширяется, поток воздуха проходит из легких через трахею и гортань в полости глотки, рта и носа. Голосовой тракт простирается от голосовой щели (отверстия между голосовыми складками в гортани) до губ. В процессе речеобразования его форма меняется.

    Если произносятся звонкие звуки (гласные, носовые, звонкие согласные), голосовые складки в гортани смыкаются и размыкаются с той или иной частотой, которая называется частотой основного тона. Получается последовательность импульсов воздушного потока, которые возбуждают полости голосового тракта. Говоря, человек меняет геометрические размеры этих полостей, соответственно меняются и их резонансные частоты, которые называют формантами. Звонкие звуки называются также вокализованными.

    Частота основного тона обычно находится в интервале от 50 до 400 Гц. На рис. 2.7 приведены временная зависимость и спектр, соответствующие гласному звуку "и". Хорошо виден периодический характер сигнала; в спектре ярко выражены основной тон и форманты.



    Рис. 2.7.

    При произнесении глухих (невокализованныx) звуков голосовые складки расслаблены. Проходя по суженному голосовому тракту, воздух создает турбулентный поток. Полости рта и носа возбуждаются при этом шумоподобным сигналом. На рис. 2.8 показаны временная зависимость и спектр, соответствующие глухому согласному звуку "с". Сигнал не содержит периодических составляющих и подобен шуму; в спектре отсутствуют форманты и основной тон.



    Рис. 2.8.

    Взрывные (смычные) звуки получаются путем кратковременного выхлопа - полного перекрытия речевого тракта, нагнетания давления и внезапного открытия тракта. Взрывные звуки бывают звонкие (б, д, г) и глухие (п, т, к), то есть могут образовываться с участием голосовых складок и без них.

    Органы речи обладают инерционностью: на интервале 20 - 30 мс параметры речи можно считать постоянными.

    2.4.3. Метод линейного кодирования с предсказанием

    Многие из методов вокодерного кодирования берут свое начало от изобретенного довольно давно метода LPC (Linear Predictive Coding). В качестве входного сигнала в LPC используется та же последовательность цифровых значений амплитуды, однако этот метод применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и ряд других. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере. Подчеркнем, что задержка в передаче речи при использовании этого метода связана не только с необходимостью обработки цифрового сигнала (эту задержку можно уменьшать, увеличивая мощность процессора), а непосредственно следует из характера метода сжатия. Этот метод позволяет, вообще говоря, достигать очень больших степеней сжатия, которым соответствует полоса пропускания 2,4 или 4,8 кбит/с, однако качество звука здесь сильно страдает. Поэтому в коммерческих приложениях он не используется, а применяется в основном для ведения служебных переговоров.
    2.5. Гибридные кодеры

    Более сложные методы сжатия речи основаны на применении LPC в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сличает результат с исходным сигналом, после чего начинает варьировать параметры кодировки, добиваясь наилучшего совпадения. Достигнув такого совпадения, аппаратура передает полученный код по линиям связи; на противоположном конце происходит восстановление звукового сигнала. Ясно, что для использования такого метода требуются еще более серьезные вычислительные мощности.

    Одной из наиболее распространенных разновидностей описанного метода кодирования является метод LD-CELP (Low-Delay Code-Excited Linear Prediction). Этот метод позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 кбит/с; он был стандартизован Международным союзом электросвязи (International Telecommunications Union - ITU) в 1992 году как алгоритм кодирования речи G.728 [3]. Алгоритм применяется к последовательности цифр, получаемых в результате аналого-цифрового преобразования голосового сигнала с 16-разрядным разрешением.

    Пять последовательных цифровых значений кодируются одним 10-битовным блоком - это и дает те самые 16 кбит/с. Для применения этого метода требуются очень большие вычислительные мощности, в частности, для прямолинейной реализации G.728 необходим процессор с быстродействием 44 млн. операций в секунду..

    В марте 1995 года ITU принял новый стандарт G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт является частью более общего стандарта H.324, описывающего подход к организации таких видеоконференций, при этом целью является обеспечение видеоконференций с использованием обычных модемов. Основой G.723 является метод сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания.

    В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 кбит/с. Структура алгоритма позволяет на основе программного обеспечения изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс.

    Как показали испытания, проведенные ведущими американскими и европейскими телекоммуникационными компаниями, качество голоса, получаемое при сжатии методом MP-MLQ до уровня 6,4 кбит/с, не ниже того, что дает ADPCM при сжатии до 32 кбит/с.
    3. Цифровые методы передачи видеоизображений
    3.1. Основные характеристики цифрового видео
    Цифровое видео характеризуется четырьмя основными факторами [1]:

    - частотой кадров

    - экранным разрешением

    - глубиной цвета

    - качеством изображения.

    Частота кадров. Вследствие инерционности процесса восприятия изображения человеческий глаз интерпретирует последовательность быстро сменяющих друг друга кадров не как отдельные изображения, а как непрерывно протекающий процесс. Это происходит при смене кадров с частотой 16-25 Гц. С учетом данной особенности стандартная скорость воспроизведения видеосигнала телевизионных системах - 25 кадров/с (в США и Японии – 30 кадров/с). Но даже при частоте 25 кадров/с может появляться эффект мелькания изображения. Для гарантированного устранения данного недостатка в телевизионных системах каждый кадр разбивается на 2 полукадра, каждый из которых прорисовывается либо по четным, либо по нечетным строкам изображения. Эти полукадры передаются поочередно с частотой 50 Гц каждый. И хотя на самом деле частота смены кадров полного изображения составляет 25 кадров/с, глаз воспринимает изображение при чересстрочной развертке как смену кадров 50 раз в секунду.

    Монитор компьютера для формирования изображения на экране использует метод прогрессивного сканирования, при котором строки кадра формируются последовательно, сверху вниз, а полный кадр прорисовывается 30 раз каждую секунду или даже более часто. В этом заключается основное отличие между компьютерным и телевизионным методом формирования видеосигнала.

    Глубина цвета. Этот показатель является комплексным и определяет количество цветов, одновременно отображаемых на экране. Компьютеры обрабатывают цвет в RGB-формате (красный-зеленый-синий), в то время как видео использует и другие методы. Одна из наиболее распространенных моделей цветности для видеоформатов – YUV. Здесь Y обозначает яркостный сигнал, а сигналы цветности определяются по следующим формулам:

    U=B-Y,

    V=R-Y.

    Разностные сигналы U и V формируют вместе с сигналом Y полный видеосигнал.

    Каждая из моделей RGB и YUV может быть представлена разными уровнями глубины цвета (максимального количества цветов).

    Для цветовой модели RGB обычно характерны следующие режимы глубины цвета: 8 бит/пиксел (256 цветов), 16 бит/пиксел (65535 цветов) и 24 бит/пиксел (16,7 млн. цветов).

    Экранное разрешение. Данным термином обозначают количество точек, из которых состоит изображение на экране. В современных мониторах может применяться разрешение 800х600 пикселов, 1024х768 пикселов и выше.

    Телевизионный стандарт NTSC предусматривает разрешение 768 на 484. Стандарт PAL распространенный в Европе, имеет несколько большее разрешение - 768 на 576 точек.

    Качество изображения. Последняя, и наиболее важная характеристика - это качество видеоизображения. Требования к качеству зависят от конкретной задачи. Иногда достаточно, чтобы картинка была размером в четверть экрана с палитрой из 256-ти цветов (8 бит), при скорости воспроизведения 15 кадров/с. В других случаях требуется полноэкранное видео (768 на 576) с палитрой в 16,7 млн. цветов (24 бит) и полной кадровой разверткой (25 или 30 кадров/с).


    3.2. Свойства системы зрения человека
    Очень часто окончательную оценку изображения делает человек. Исследование системы зрения человека показывает, что она обладает нелинейной характеристикой, а ее отклик не является абсолютно верным. Рассмотрим указанные особенности подробнее.

    Одной из характеристик системы зрения человека является способность восприятия яркости света. Эксперименты по определению восприятия людьми минимально различимых градаций яркости света, поступающего от калиброванного источника, показали, что яркость света воспринимается глазом нелинейно [2]. Если начертить график зависимости величины этой минимально различимой градации яркости от эталонной яркости, то при изменении яркости в пределах нескольких порядков этот график имеет логарифмический характер. Такие субъективные экспериментальные результаты согласуются с объективными данными, полученными в экспериментах на животных, в которых установлено, что светочувствительные клетки сетчатки и оптический нерв возбуждаются с частотой, пропорциональной логарифму интенсивности подводимого к ним света. По вполне понятным причинам подобные объективные измерения на людях не проводились.

    Другой отличительной особенностью системы зрения человека является ее пространственно-частотный отклик. Точная форма частотной характеристики глаза исследовалась с помощью ряда психовизуальных экспериментов. Было показано, что глаз подавляет низкие и ослабляет высокие пространственные частоты. В определенном смысле пространственно-частотный отклик имеет полосовой характер.

    Наконец, для системы зрения человека характерна способность к насыщению, т.е. к ограничению отклика при очень больших или очень малых интенсивностях наблюдаемого светового потока.

    Рассмотренные особенности были учтены при разработке методов сокращения избыточности изображений, рассматриваемых ниже.
    3.3. Межкадровая и внутрикадровая избыточность изображения
    Избыточность изображения проявляется в высокой степени взаимной статистической прогнозируемости элементов изображения. В радиотехнике такую связь сигналов характеризуют понятием корреляция. Конечной целью операции сжатия видеоинформации является устранение этой статистической прогнозируемости, т.е. необходимо в максимально возможной степени уменьшить коррелированность отсчетов, полученных при дискретизации видеосигналов.

    Типичное изображение содержит очень много избыточной информации. Межкадровая избыточность изображений связана с необходимостью передавать изображение с достаточно высокой частотой. При этом изменение либо целого изображения, либо отдельных его участков от кадра к кадру может быть или небольшим или даже отсутствовать. Такой эффект имеет место, например, когда в телевидении передается статическая заставка экрана. Поэтому одним из способов уменьшения избыточности передаваемых сигналов изображения является передача не абсолютных значений сигналов, соответствующих определенным элементам изображений в различных кадрах, а их изменения от кадру к кадру.

    Внутрикадровая избыточность обусловлена высокой степенью однородности изображения на малых участках изображения в пределах одного кадра. Размер этого участка можно оценить, вычисляя коэффициент корреляции между яркостями точек изображения, находящихся на различном расстоянии от точки, выбранной в качестве опорной. Расстояние, при котором коэффициент корреляции становится меньше некоторой заданной величины (обычно 5-10% от максимального значения), и есть искомый размер. Анализ показал, что для большинства изображений размер участка, в пределах которого проявляется взаимосвязь яркостей точек изображения, составляет 16х16 точек [2].

    3.3. Алгоритмы сжатия цифровых сигналов при передаче видеоизображений
    Для того, чтобы оценить, насколько актуальной является проблема компрессии цифровых сигналов при передаче видеоизображений, определим скорость цифрового потока, которая получится при преобразовании изображения размером 800х600 пикселов, следующего с частотой 25 кадров/секунду (напомним, что это минимальная частота, которая требуется для устранения эффекта мелькания при смене кадров), при глубине цвета 24 бит/пиксел:
    W=800х600х25х24=288 Мбит/с.
    Еще сравнительно недавно в середине 90-х годов ХХ столетия не существовало телекоммуникационных технологий, с помощью которых такой цифровой поток в нескомрессированном виде можно было бы передать по линиям связи. Другая проблема заключается в том, что при сохранении нескомпрессированных сигналов видеоизображений в компьютере объем его дискового пространства может оказаться сравнительно быстро исчерпанным. Ну и конечно же рассмотренный выше пример показал, что проблема компрессии цифровых сигналов при передаче по телекоммуникационным линиям связи сигналов видеоизображений является намного более актуальной, чем при передаче аудио сигналов.

    Эффективность процесса компрессии сигналов видеоизображений оценивают с помощью коэффициента сжатия. Коэффициент сжатия - это цифровое выражение соотношения между объемом сжатого и исходного видеоматериала. Для примера, коэффициент 200:1 означает, что если принять объем полученного после компрессии ролика за единицу, то исходный оригинал занимал объем в 200 раз больший. Обычно, чем выше коэффициент сжатия, тем хуже качество видео. Но многое, конечно, зависит от используемого алгоритма.

    При определении необходимой степени сжатия сигналов видеоизображений следует исходить из разумной достаточности. При этом необходимо учитывать, как четыре характеристики (частота кадра, экранное разрешение, глубина цвета и качество изображения) влияют на объем и качество видео. Очень важно иметь представление, какую цену придется заплатить за качественное изображение. Чем больше глубина цвета, выше разрешение и лучше качество, тем более высокая производительность компьютера потребуется, не говоря уж о громадных объемах дискового пространства, необходимого под цифровое видео. Учитывая эти характеристики, можно выбрать оптимальный коэффициент сжатия. Надо отметить, что в профессиональном видео действует простое правило - чем ниже коэффициент сжатия, тем лучше.

    Различают сжатие в режиме реального времени, симметричное или асимметричное, с потерей качества или без потери, сжатие видеопотока или покадровое сжатие.

    Сжатие в режиме реального времени. Термин real-time (реальное время) имеет много толкований. Применительно к сжатию данных используется его прямое значение, т. е. работа в реальном времени. Многие системы оцифровывают видео и одновременно сжимают его, иногда параллельно совершая и обратный процесс декомпрессии и воспроизведения. Для качественного выполнения этих операций требуются очень высокопроизводительные специальные процессоры, поэтому некоторые платы ввода/вывода видео для персональных компьютеров не способны оперировать с полнометражным видео и часто пропускают кадры.

    Симметричное и асимметричное сжатие. Этот признак классификации связан с соотношением способов сжатия и декомпрессии видео. Симметричное сжатие предполагает возможность проиграть видеофрагмент с разрешением, например, 640 на 480 пикселов при скорости в 30 кадров/с, если оцифровка и запись его выполнялась с теми же параметрами. Асимметричное сжатие - это процесс обработки одной секунды видео за значительно большее время. Степень асимметричности сжатия обычно задается в виде отношения. Так цифры 150:1 означают, что сжатие одной минуты видео занимает примерно 150 минут реального времени. Асимметричное сжатие обычно более удобно и эффективно для достижения качественного видео и оптимизации скорости его воспроизведения. К сожалению, при этом кодирование полнометражного ролика может занять слишком много времени, вот почему подобный процесс выполняют специализированные компании, куда отсылают исходный материал на кодирование (что увеличивает материальные и временные расходы на проект).

    Сжатие с потерей или без потери качества. Чем выше коэффициент сжатия, тем больше уменьшается качество видео. Почти все методы сжатия видно приводят к потере качества. Даже если это не заметно на глаз, всегда есть разница между исходным и сжатым материалом.

    Сжатие видеопотока или покадровое сжатие. Покадровый метод подразумевает сжатие и хранение каждого видеокадра как отдельного изображения. Сжатие видеопотока основано на следующей идее: не смотря на то, что изображение все время претерпевает изменения, задний план в большинстве видеосцен остается постоянным -- отличный повод для соответствующей обработки и сжатия изображения. Создается исходный кадр, а каждый следующий сравнивается с предыдущим и последующим изображениями, а фиксируется лишь разница между ними. Этот метод позволяет существенно повысить коэффициент сжатия, практически сохранив при этом исходное качество.
    Примеры форматов цифрового видео

    AVI (Audio Video Interleave)
    Разработанный фирмой Microsoft метод сжатия, записи и воспроизведения движущих изображений (Live Video) и звука на компьютере с использованием только программных средств. Файлы, созданные с использованием этого метода, имеют расширение AVI.

    AVI может иметь или не иметь звуковые дорожки. При создании AVI файлов, включающих звуковое сопровождение, важным является правильная синхронизация звука с видеоизображением. Для этого используется технология чередования видеокадров и звука, которой, собственно, и определяется аббревиатура AVI (Audio Video Interleaved). Разные по типу видео и аудиоданные записываются в один файл на диске следующим образом: все информационные потоки разбиваются на множество равных частей (chunks) и затем записываются в один файл друг за другом по очереди. Например, сначала записывается заголовок; затем - 1-я часть видео; затем - 1-я часть звука; затем - 2-я часть видео; затем - 2-я часть звука и т.д.

    Motion-JPEG
    Стандарт компрессии JPEG был разработан объединенной группой экспертов по фотографии (JPEG - Joint Photographic Expert Group) международной организации стандартов (ISO). Как ясно уже из названия, схема компрессии была разработана для неподвижных изображений. Так как телевидение, в сущности, и есть последовательность неподвижных изображений, то JPEG кодирование может применяться и для компрессии видеоизображений. Иногда этот стандарт называют "динамический" JPEG.

    В основе схемы компрессии JPEG лежит дискретное косинусное преобразование (DCT). К преимуществам JPEG относится тот факт, что каждый кадр сжимается независимо от остальных и для восстановления исходного изображения не нужно задействовать информацию из соседних кадров. Такое построение сжатых данных позволяет осуществлять произвольный доступ, коммутацию и монтаж видеофрагментов проще, чем при использовании других методов кодирования. Недостатком данного формата является сравнительно невысокое значение коэффициента компрессии, а также высокие требования к производительности процессора, от которого требуется декодировать каждый кадр скомпрессированного изображения за 1/25 долю секунды. Различные варианты Motion-JPEG позволяют получить значение коэффициента компрессии от 5:1 до 100:1, однако следует подчеркнуть, что уже при значении коэффициента компрессии 20:1 качество изображения в большинстве случаев становится неудовлетворительным.

    MPEG
    В январе 1992 года группа экспертов в области движущихся изображений MPEG (Motion Picture Experts Group) представила первую часть стандарта для сжатия цифрового видео и звука - MPEG phase 1, или просто MPEG-1 (ISO 11172). Стандарт определяет методы компрессии и воспроизведения видео- и аудиоданных. Комитет MPEG также определил ряд других форматов для сжатого видео- и аудиоматериала. Форматы MPEG различаются по качеству результатов и скорости передачи данных:

    MPEG-1: оригинальный формат для хранения и воспроизведения видео- и аудиоданных на мультимедиа носителях данных (компакт-дисках). Потенциально поддерживает телевизионное качество видео. Однако, при скорости передачи данных в диапазоне 150 - 255 Кбайт/сек. качество сопоставимо с видеозаписью VHS (разрешение 352 х 228 (PAL) или 320 x 240 (NTSC) при частоте 25 или 30 кадров в секунду соответственно).

    MPEG-2: более новый стандарт (утвержден в ноябре 1994 г.). Разработан как дополнение к стандарту MPEG-1. Поддерживает передачу высококачественного видео по высокоскоростным цифровым каналам. Интенсивность потока данных от до 2 до 15 Мбит/сек. Разрешение 720х480 и 1280х720, частота 60 кадров в секунду со звуковыми данными CD-качества. Подходит для всех стандартов телевидения и даже систем телевидения высокой точности (High Definition Television). Используется при записи DVD дисков.

    MPEG-4: предназначен для передачи видео и аудиоданных по низкоскоростным линиям. Этот формат расчитан для применения в системах видеотелефонии, мультимедийной электронной почте, электронных информационных изданиях и т.п.. Базируется на формате файлов QuickTime. MPEG-4, версия 1 одобрен в октябре 1998 г. Стандарт ориентирован на разрешение 174х144 пиксела при 10 кадрах в секунду и позволяет передавать данные со скоростью от 4800 до 64000 бит/сек.
    MPEG-1 и MPEG-2 признаны международными стандартами для сжатия видео.

     

    Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности (как это происходит при сжатии видео с помощью алгоритмов Motion-JPEG), а анализируется динамика изменений видеофрагментов и устраняются избыточные данные. Поскольку в большинстве моментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, алгоритм MPEG начинает сжатие с создания исходного (ключевого) кадра. Играя роль опорных при восстановлении остальных изображений, они размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между ними, претерпевают изменения, и именно эта разница сохраняется при сжатии. Таким образом, MPEG-последовательность содержит три типа кадров:

    Intro frames (кадры типа "I") – опорные кадры, которые компрессируются без обращения к другим кадрам, кадры данного типа имеют самый большой размер;

    Predictedframes (кадры типа "P") - кадры данного типа компрессируются на основе обращения к предшествующему кадру типа "I" или предыдущему кадру типа "Р" с целью предсказания динамики изменений видеофрагментов и формирования разностного сигнала;

    Bi-directional interpolated frames (кадры типа "В" -двунаправленные кадры), сжатие которых осуществляется при обращении к одному предшествующему и одному последующему кадру типа Р, имеют минимальный размер из рассматриваемых типов кадров.

    Последовательность кадров, которая передается по телекоммуникационному каналу, в соответствии с рекомендациями стандарта MPEG, имеет вид:

    I B B P B B P B B P В В Р В В I ...

    Отдельные изображения состоят из структурных единиц - макроблоков, соответствующих участку изображения размером 16Х16 пикселов. Компьютер анализирует изображения и ищет идентичные или похожие макроблоки, сравнивая базовые и последующие кадры. В результате сохраняется только данные о различиях между кадрами, называемые вектором смещения (vector movement code) .

    Макроблоки, которые не претерпевают изменений или претерпевают сравнительно небольшие изменения, при формировании разностного сигнала практически не вносят вклад, так что количество данных для реального сжатия и хранения существенно снижаются. В результате при использовании MPEG-технологии можно достигнуть рабочего коэффициента более чем 200:1, хотя это приводит к некоторой потере качества.

     

    4. Телекоммуникационные каналы
    4.1. Свойства физических каналов
    В разделе 1.3 было введено понятие телекоммуникационного канала (канала связи) как совокупности технических устройств и линии связи, необходимых для передачи сигнала между пунктами связи. Линию связи, представляющую собой физическую среду, в которой распространяется сигнал, называют физическим каналом. Классификация физических каналов приведена на рис. 4.1.



    Рис. 4.1.
    4.1.1. Кабели на витой паре

    Витая пара представляет собой два изолированных медных провода, скрученных вместе. Скрутка проводов позволяет уменьшить индуктивность проводов, приводящую к ограничению технической скорости. Кроме того, скрутка проводов способствует уменьшению электрических помех, наводимых соседними парами (перекрестные помехи), а также внешними источниками, например, двигателями, реле и т.п. Все провода в кабеле обычно имеют один и тот же диаметр, хотя в специальных кабелях встречаются провода разных диаметров. В таких кабелях провода с большим диаметром часто используются для передачи высокочастотного сигнала, поскольку потери сигнала снижаются при увеличении диаметра проводника.

    Кабель на витой паре характеризуется исключительной простотой монтажа и ремонта повреждений. К недостаткам такого кабеля относятся низкий уровень защищенности от электромагнитных помех, сравнительно большой уровень собственных излучений, способствующих затуханию сигнала, а также возможности "прослушивания" передаваемых сигналов. Для уменьшения недостатков на практике (в том числе и в локальных вычислительных сетях) иногда используют экранированный кабель (Shielded Twisted Pair, STP) - несколько витых пар, помещенных в защитную оболочку, которая заземляется. Неэкранированный кабель на витой паре (Unshielded Twisted Pair, UTP) также широко используется в качестве среды передачи в локальных вычислительных сетях. Кроме того, он применяется в телефонных сетях.

    Типичные значения диаметра проводов- 0,4; 0,5; 0,63 и 0,9 мм (это диаметр самого провода). Провода покрываются изоляционным материалом, поэтому общий диаметр каждого провода с изоляцией больше и обычно в два раза превышает диаметр самого провода. До 60-х гг. ХХ века применялась бумажная изоляция. Затем в качестве изоляционного материала стали использовать поливинилхлорид (ПВХ) или полиэтилен. Тип и толщина слоя изоляционного материала определяют емкость между проводами в паре. ПВХ обычно используется для внутренних кабелей, а полиэтилен – для внешних. Следует иметь в виду, что при горении ПВХ выделяет хлорный газ и другие вредные для здоровья людей вещества. Это привело к необходимости разработки специального изоляционного материала, который не выделяет вредных веществ при горении, а кабель, в котором он используется, получил название "кабель с малодымной изоляцией".

    Провода в кабеле имеют определенный цвет изоляции, и поэтому пользователю легко выбрать провода, которые он собирается подключать. Провода с бумажной изоляцией маркировались цветными полосками через определенные интервалы вдоль провода. Современное пластмассовое покрытие провода кодируется цветом в соответствии с установленным стандартом. Каждый провод имеет два цвета: основной и вторичный, который используется либо при нанесении продольной волосы вдоль провода, либо для полос вокруг провода, наносимых через определенные интервалы.

    Телекоммуникационные кабели могут содержать от 2 до 3000 витых пар. Число пар в кабелях внутренней проводки не превышает 200.

    Входное полное сопротивление (импеданс) витой пары можно смоделировать двумя последовательно включенными сопротивлениями, параллельно одному из которых включена емкость (рис.4.2).


    320 Ом

    1050 Ом







    а) б)
    Рис.4.2.
    На рис.4.2а представлена эквивалентная схема замещения полного входного сопротивления телефонной линии для диапазона звуковых частот. На рис. 4.2б показана высокочастотная эквивалентная схема замещения полного входного сопротивления телефонной линии для частот выше звукового диапазона.

    В диапазоне звуковых частот входное полное сопротивление витой пары имеет емкостный характер, но с увеличением частоты реактивная составляющая постепенно уменьшается и входное полное сопротивление можно считать активным. Так, например, на частоте 100 кГц входное полное сопротивление витой пары имеет активный характер и равно 100 Ом. Зависимость входного полного сопротивления витой пары с проводом диаметром 0,5 мм от частоты показана на рис. 4.3. Учитывая, что в диапазоне звуковых частот входное полное сопротивление витой пары изменяется в несколько раз от значения 1500 Ом на частоте 300 Гц до значения приблизительно 250 Ом на частоте 3,4 кГц, при расчетах трансформаторов и других элементов линейного тракта в звуковом диапазоне частот его принимают равным постоянному значению 600 Ом, которое имеет место только на фиксированной частоте 1200 Гц. Это сделано для того, чтобы упростить процесс расчетов и измерений характеристик линий на витой паре, а также иметь опорную точку отсчета для сравнения этих характеристик.


    Рис.4.3.

    Затухание сигнала в кабеле на витой паре сильно зависит от частоты передаваемого сигнала. Затухание возрастает пропорционально частоте, но в определенных частотных полосах затухание остается практически постоянным (рис.4.4).


    Рис. 4.4.

    Характеристики кабелей на витой паре регламентируются в стандарте EIA/TIA 568, который был разработан усилиями нескольких организаций: Американского национального института стандартов ANSI, Ассоциации электронной промышленности EIA, Ассоциации телекоммуникационной промышленности TIA и лаборатории Underwriters Labs (UL). Этот стандарт включает 5 категорий неэкранированных кабелей на витой паре [1]:

    категория 1

    традиционный телефонный кабель, по которому можно передавать только речь, передача данных не допускается;

    категория 2

    кабель, предназначенный для передачи данных со скоростью 4 Мбит/с, состоит из 4-х витых пар;

    категория 3

    кабель, предназначенный для передачи данных со скоростью 10 Мбит/с;

    категория 4

    кабель, предназначенный для передачи данных со скоростью 16 Мбит/с;

    категория 5

    кабель, предназначенный для передачи данных со скоростью 100 Мбит/с.

    Максимальная длина сегмента кабеля типа UTP в локальных вычислительных сетях составляет 100 м. Затухание сигнала на частоте 10 МГц составляет около 1,0-3,0 дБ/км, а задержка сигнала не превышает 8-12 нс/м [2].

    Экранированный кабель на витой паре также нашел применение в компьютерных сетях. Он применяется в ЛВС, реализованных на основе технологии Token Ring. Экранированный кабель делится по своим характеристикам на 9 типов: Type 1, Type 2, …, Type 9. Электрические параметры кабеля Type 1 примерно соответствуют параметрам кабеля UTP категории 5. Однако ввиду того, что один из важных параметров кабеля – волновое сопротивление – у этих двух типов кабелей имеет заметно отличающиеся значения (у UTP категории 5 - 100 Ом, у STP типа 1 – 150 Ом), они не являются взаимозаменяемыми, так как это скажется на работе сетевых адаптеров – специальных устройств, с помощью которых компьютеры подключаются к линии связи.

    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта