ВидеостандартыСигналы, форматы, стыкиВ. Л. Штейнберг Содержание 2Видеостандарты
Скачать 1.79 Mb.
|
Видеостандарты Сигналы, форматы, стыки В.Л.Штейнберг Содержание 2 Видеостандарты Сигналы, форматы, стыки В.Л.Штейнберг Д-р Виктор Штейнберг в настоящее время является главным научным сотрудником фирмы Snell & Wilcox, Великобритания. После окончания Московского Энергетического Института в 1969 году он с 1974 года работал заведующим сектором видеосистем во Всесоюзном Научно- Исследовательском Институте Телевидения и Радиовещания в Москве и занимал пост Председателя Координационной Группы по Терминологии ОИРТ Д-р Штейнберг является автором 3 книг (на русском языке) и более 100 статей (на русском и английском языках) по тематике вещательного телевидения. Имеет авторские свидетельства СССР и патенты Великобритании Engineering with Vision 3 ПРЕДИСЛОВИЕ По мере постоянного роста коммуникационных потоков, международный обмен видеоинформацией становится обычным повседневным явлением. Поэтому производители оборудования стремятся поставить на рынок все больше многостандартных устройств. Однако этому процессу препятствует некоторая недоговоренность соответствующих документов. Впервые, материалы по всем важнейшим стандартам и форматам сигналов собраны в одном справочном пособии. Здесь описаны и классифицированы аналоговые и цифровые, компонентные и композитные стандарты и форматы, как обычного ТВ, так и ТВЧ. Для полноты картины в книгу включены также форматы компьютерных файлов для ТВ стоп- кадров. Содержание 4 СОДЕРЖАНИЕ Cтр. РАЗДЕЛ 1 - ВВЕДЕНИЕ В ВИДЕОСТАНДАРТЫ 7 1.1 Исторический очерк 7 1.2 Карта ТВ вещания во всем мире 8 1.3. Организации, занимающиеся стандартизацией 9 РАЗДЕЛ 2 - СТРУКТУРА СТАНДАРТА 10 2.1. Составные части видеостандарта 10 2.2. Стандарты разложения 12 2.3. Форматы кадра 14 2.4 Представление и кодирование цветовой информации 16 2.5 Уровни, напряжения, коды, единицы измерения 19 2.6 Звуковое сопровождение 21 РАЗДЕЛ 3 - СПРАВОЧНЫЕ ДАННЫЕ 23 3.1 Общие сведения 24 3.2 Аналоговые видеосигналы и стыки 24 3.2.1 Параметры развертки и синхронизации 24 3.2.2 Формирование и уровни сигнала яркости 25 3.2.3 Аналоговый компонентный стык YPrPb (YsPrPb) 26 3.2.4 Цветовые поднесущие и цветовая синхронизация 27 3.2.5 Система нумерации строк 29 3.2.6 Обработка сигнала яркости 32 3.2.7 Обработка сигнала цветности 33 NTSC 33 PAL 34 SECAM 35 3.2.8 Аналоговый компонентный стык Y/C 36 3.2.9 Система PALplus 37 3.2.10 Сигналы вертикального гасящего интервала 38 Вертикальный временной код 38 Испытательные строки 40 Опорные строки 42 Строки данных 42 Строка управления широкоэкранными системами (WSS - Wide Screen Signalling) 43 Содержание 5 3.3 Цифровые компонентные видеосигналы (Формат 4:2:2) 45 3.3.1 Дискретизация и квантование 45 3.3.2 Мультиплексирование данных Y и Cr,Cb 49 3.3.3 Предфильтрация и постфильтрация 50 Канал яркости: 51 Канал цветоразностных сигналов: 51 3.4 Цифровые композитные видеосигналы 52 3.5 Цифровые видеостыки 57 3.5.1 Параллельный цифровой видеостык 57 3.5.2 Цифровой последовательный видеостык 58 3.5.3 Обнаружение и обработка ошибок (EDH) 62 3.6 Сжатие цифровых потоков 64 Что такое MPEG? 64 Что такое DVB? 65 Почему требуется сжатие сигналов? 66 Как MPEG-2 сжимает цифровой поток? 66 Межкадровое предсказание 66 Предсказание с компенсацией движения 67 Кадры типа I, P и B 67 Структура группы видеокадров GOP 67 Дискретное косинусное преобразование 68 ДКП для любителей математики 68 ДКП для тех, кто не любит математики 69 Квантование 70 Кодирование длин серий (VLC - Variable-length coding) 70 Регулирование заполнения буфера 70 Как же выглядит все в целом? 72 Формирование цифрового потока 73 Предполагаемые параметры отображения 73 Кодер и декодер MPEG-2 74 Если алгоритм представляется чрезмерно простым, то ... 75 Сжатие звукоданных MPEG-2 75 Системный уровень 75 Цифровые потоки MPEG 76 Коммутация и редактирование сжатых потоков 76 Уровни и профили 76 Профиль 4:2:2 77 Повышенные профили 77 Профиль, масштабируемый по отношению сигнал-шум 77 Стыки MPEG-2 78 3.7 Системы производства программ Телевидения Высокой Четкости 83 3.7.1. Сигналы и уровни сигналов 85 3.7.2. Параметры развертки и синхронизации 87 3.7.3. Стыки ТВЧ 90 Содержание 6 3.8. Форматы файлов стоп-кадров 91 3.9. Сигналы цветных полос 92 3.9.1 Аналоговый компонентный формат YPrPb [Спецификация EBU] 94 3.9.2 Цифровой компонентный формат YCbCr 95 3.9.3 Аналоговые композитные форматы 96 NTSC-M (США), PAL-M 96 NTSC-M (Япония) 97 PAL, PAL-N 99 SECAM 100 РАЗДЕЛ 4 - СПИСОК ИСПОЛЬЗОВАННЫХ СТАНДАРТОВ 101 Стандарты МОС (ISO Standards) 101 Рекомендации МСЭ-Р (ITU-R Recommendations) 101 Рекомендации МСЭ-Т (ITU-T Recommendations) 101 Стандарты СМПТЕ (SMPTE Standards) 102 Рекомендации СМПТЕ (SMPTE Recommended Practices) 102 Технические Руководства СМПТЕ (SMPTE Engineering Guidelines) 102 Европейские Стандарты Электросвязи (European Telecommunication Standards) 103 Введение в видеостандарты 7 РАЗДЕЛ 1 - ВВЕДЕНИЕ В ВИДЕОСТАНДАРТЫ 1.1 Исторический очерк Слово "video" в латинском языке означает "я вижу". Строго говоря, видеосигнал - это любой сигнал, переносящий информацию об отображаемом объекте. Например, видеосигналом является сигнал факсимильного аппарата. Можно привести и другие примеры. Сигнал радиолокатора также бесспорно принадлежит к славной семье видеосигналов. Тем не менее, здесь речь пойдет только о видеосигналах вещательного ТВ. В области ТВ вещания из первоначального термина было произведено немало полезных производных, например "цветоразностный видеосигнал" или "композитный видеосигнал" (в англоязычной литературе он часто обозначается сокращением CCVS, по-немецки FBAS, по- русски ПЦТВС). Когда это ясно из контекста, слово "видео" часто опускается, поэтому "цветоразностный сигнал" также является вполне правильным термином. С другой стороны, в мире компьютеров слово "видео" подчас использовалось как антоним к "нормальному", тем самым подчеркивая, что такой сигнал - пришелец из чуждого компьютерам ТВ мира. Зачастую, общий термин "видеосигнал" некорректно используют вместо частного "композитный сигнал". Пришествие эры мультимедиа потребовало гармонизации как технологии, так и терминологии этих двух миров. Стандарт можно определить как набор правил или характеристик, описывающих определенную систему или изделие. Некоторые стандарты обязательны к применению, однако большинство из них, в том числе ТВ стандарты, применяются на добровольной основе. В давние времена черно-белого ТВ международные обмены сигналами были исключительно редки. Поэтому, с точки зрения жителей какой-либо отдельной страны существовал всего один стандарт, который так просто и назывался "Телевизионный Стандарт". Однако, где-то за океаном, был еще другой, совершенно несовместимый "Телевизионный Стандарт", в котором число строк, частота кадров и даже число уравнивающих импульсов были не такими. Тогда это вообще имело очень малое значение, а несовместимость рассматривалась политиками даже как благо. В редчайших случаях, когда надо было показывать "их" программы, на помощь приходили старшие братья из кинематографа. У них-то все было в порядке, - и ширина пленки во всем мире составляла 35 мм и шаг перфораций почти всегда одинаков. По мере прогресса техники жизнь обитателей ТВ мира становилась все менее спокойной. Один за другим возникали новые стандарты, а затем появились три весьма различные системы цветного телевидения. Развитие спутниковой связи облегчило трансконтинентальные обмены и несовместимость стандартов стала серьезной проблемой. Теперь в процесс создания ТВ программ вовлечено такое количество форматов и стандартов, что, как сказал когда-то один великий человек, - " и не сразу в голову возьмешь". Напрасно ученые мужи и международная бюрократия пытались установить какое-то подобие порядка. Стандарт, пышно наименованный "Единый Мировой Цифровой Телевизионный Стандарт" (хорошо известный по Рекомендации 601 МККР и своему подварианту 4:2:2, а также по соответствующему формату цифровой видеозаписи "Digital-1" - D1), оказался первым, но далеко не последним. Появились форматы D2, D3 и даже D5. Необходимо признать, что все попытки глобальной унификации не удались и мир распался на множество "миров". Сейчас в ходу такие выражения, как "в среде компонентных сигналов" или "для аппаратных D2". Соседи с несовместимыми стандартами теперь не только где-то в туманной дали, они совсем рядом. А общаться с соседями приходится: то соли попросить, то спичек, а то и просто узнать, как они там живут. Мосты между "мирами" существуют, да уж больно узки и плата за проезд высока. На помощь многострадальным обитателям смежных ТВ миров поспешили многие, но первой среди равных несомненно следует считать фирму Snell & Wilcox Ltd. Организации, занимающиеся стандартизацией 8 1.2 Карта ТВ вещания во всем мире В мире существуют три основные системы цветного телевидения - это NTSC [National Television Standard Committee], PAL [Phase Alternating Lines] и SECAM [SЙquence de Couleur А Mйmoire]. В русскоязычной литературе используются также фонетические транскрипции этих названий: НТСЦ, ПАЛ, СЕКАМ. Однако, если взглянуть на карту ТВ вещания, то можно увидеть гораздо большее число оттенков. Дело в том, что стандарт ТВ вещания описывает не только параметры видеосигнала, но и многие другие параметры, такие как полярность модуляции радиочастотной несущей, разнос несущих изображения и звука, и т.д. Принято обозначать стандарт ТВ вещания путем прибавления латинской буквы к наименованию системы цветного телевидения. Уже использованы почти все буквы алфавита, однако во многих случаях различия между стандартами минимальны, например они различаются соотношением мощностей несущих звука и изображения. Некоторые другие стандарты ТВ вещания применяются только определенными службами. Например, стандарт D2-MAC и цифровой стандарт со сжатием потока MPEG-2 применяются в ограниченном масштабе для непосредственного спутникового вещания. Рис. 1.2.1 Системы ТВ вещания Характеристики излучаемых сигналов черно-белого и цветного телевидения (радиочастотные параметры вещания) основных мировых ТВ стандартов приведены в следующей таблице: Система ТВ вещания Параметр M, N B G, H I D, K, K1 L Полоса видеочастот, Гц 4.2 5 5 5.5 6 6 Модуляция несущей изображения негативная негативная негативная негативная негативная позитивная Разнос несущих звука и изображения, МГц 4.5 5.5 5.5 5.9996 6.5 6.5 Модуляция звука ЧМ ЧМ ЧМ ЧМ ЧМ АМ Ширина частотного канала, МГц 6 7 8 8 8 8 Организации, занимающиеся стандартизацией 9 1.3. Организации, занимающиеся стандартизацией Существует много организаций, занимающихся стандартизацией на глобальном, региональном и национальном уровнях. В области ТВ вещания одной из наиболее важных организаций является бывший МККР - Международный Консультативный Комитет Радиосвязи (CCIR - International Radio Consultative Committee). Этот комитет являлся отделением Международного Союза Электросвязи (ITU - International Telecommunication Union), который, в свою очередь, является органом Организации Объединенных Наций. В 1993 году МККР был переименован в ITU-R (Radiocommunication Sector of the ITU). В ITU- R телевидением занимается, прежде всего, 11-я Исследовательская Комиссия (Study Group 11). Этот орган выпускает важнейшие документы, а именно Рекомендации и Отчеты. Они содержат исчерпывающую информацию, даваемую однако в весьма обобщенном виде, оставляя достаточно свободы для различных вариантов практической реализации. Документы ITU-R, относящиеся к вещательному ТВ имеют префикс "BT" (аббревиатура от слов Broadcast Television). ITU-T (ITU Telecommunication Standardisation Sector) также является постоянным органом МСЭ. Он занимается вопросами технологии, эксплуатации и тарификации и публикует собственные Рекомендации, применяемые во всем мире. Международная Организация по Стандартизации (ISO - International Organisation on Standardisation) занимается в основном стандартизацией параметров аппаратуры. Через свои Комиссии, такие как МЭК - Международная Электротехническая Комиссия (IEC), Международная Светотехническая Комиссия (CIE), и т.д., эта организация выпускает Публикации , содержащие, например, подробное описание процессов магнитной записи, колориметрические координаты люминофоров для цветных кинескопов и т.п. В соответствии с регламентом МОС публикация Международного Стандарта требует его одобрения не менее чем 75 % от числа представленных в МОС национальных администраций. На региональном (азиатском, европейском и т.д.) уровне стандартизацией занимаются международные союзы вещания. В частности, Европейский Союз Вещания (EBU - European Broadcasting Union) выпускает собственные Технические Рекомендации, которые фактически обязательны для его членов. Созданный первоначально для стран Западной Европы, этот союз в январе 1993 году слился с восточно-европейской Международной Организацией по Телевидению и Радиовещанию (OIRT - International Radio and Television Organisation) и сейчас представляет большинство ведущих вещательных организаций Европы. Имея в своем составе 63 полноправных участников из 48 стран Европы и Средиземноморья плюс 52 ассоциированных члена из 30 стран Африки, Азии и Америки, ЕСВ сейчас является крупнейшим в мире профессиональным объединением вещательных организаций. ЕСВ сотрудничает с Европейским Институтом Стандартизации Электросвязи (ETSI), выпускающим Европейские Стандарты по Электросвязи (European Telecommunication Standards). Общество Кино и ТВ Инженеров (SMPTE - Society of Motion Pictures and Television Engineers) было первоначально североамериканским, но затем выросло до международной организации, в которой уникальным образом объединены вещательные компании, изготовители аппаратуры, ученые-исследователи и ученые-педагоги. Эта организация также выпускает свои Рекомендации, Стандарты и Технические Руководства. Картину завершают национальные правительственные организации, такие как Федеральная Комиссия Связи США (FCC - Federal Communications Commission) и существующие практически во всех развитых странах национальные Институты (Комитеты или Министерства) Стандартизации. Они также выпускают важные документы, например описания испытательных строк (VITS - Vertical Interval Test Signals или ITS - Insertion Test Signals) и опорных строк (VIRS - Vertical Interval Reference Signals). Все упомянутые организации стараются скорее сотрудничать, нежели конкурировать, поэтому часто они просто присоединяются к стандарту, подготовленному другой стороной. Таким образом, тексты многих документов фактически совпадают. Например, знаменитая Рекомендация 601 МККР эквивалентна Рекомендации SMPTE 125M, Рекомендации EBU Tech. 3246-E и Рекомендации 106 OIRT. Составные части видеостандарта 10 РАЗДЕЛ 2 - СТРУКТУРА СТАНДАРТА 2.1. Составные части видеостандарта Структура видеостандарта весьма сложна, поскольку он содержит весьма детальное описание видеосигнала совместимого с предполагаемым (идеальным) приемником. Строго говоря, любой стандарт ТВ вещания представляет собой техническое описание метода радиочастотной передачи изображения и звукового сопровождения. Однако, при производстве ТВ программ радиочастотные параметры обычно не имеют значения, а звуковое сопровождение может формироваться множеством различных методов, поэтому более подходящим термином является видеостандарт. Видеостандарт можно подразделить на несколько важнейших разделов: Стандарт разложения определяетпроцесс дискретизации изображения в пространстве и во времени, в частности число строк в кадре, структуру расположения строк и число кадров в секунду. Только преобразование видеосигналов с различными стандартами разложения, например преобразование сигналов NTSC в PAL или обратное преобразование, может быть названо преобразованием стандартов. Формат кадра определяет, каким образом изображение располагается в пределах экрана данной формы. Формат сигнала представляет собой какой-либо общепринятый способ упаковки информации с целью ее передачи или записи. Здесь мы имеем дело с множеством измерений и степеней свободы: • Цифровой или аналоговый • Компонентный или композитный • Последовательный или параллельный • Со сжатием или без сжатия • Диск или лента • и т.п. и т.д. Видеоформаты часто путают с видеостандартами. Приведенные ниже примеры помогают понять в чем состоит различие между ними. Например, формат D1 определяет каким образом видеомагнитофон упаковывает данные, представляющие цифровой компонентный видеосигнал. С другой стороны, формат D1 обеспечивает запись в любом из двух стандартов разложения 525/59.94/2:1 и 625/50/2:1. На профессиональном жаргоне оборудование для обработки сигналов 4:2:2 иногда называют и даже маркируют как "оборудование формата D1", вместо правильного "оборудование, совместимое с D1". Строго говоря, только цифровой видеомагнитофон может называться "оборудованием формата D1". Однако D1 - это короткое, удобное и весьма популярное название, к тому же с ним связаны такие хорошие термины как "преобразователь D1-D2" взамен длинного, скучного и не вполне ясного "преобразователь цифрового компонентного сигнала в цифровой композитный сигнал" или краткого (но весьма двусмысленного) термина "цифровой кодер". Последовательный цифровой стык SDI (Serial Digital Interface) описан как формат. При этом через такой стык можно передавать цифровые компонентные сигналы (с форматом кадра как 16:9, так и 4:3), либо оцифрованные сигналы PAL или NTSC. В цифровой области передача сигналов различного рода через один и тот же стык не представляет труда. Через последовательный цифровой стык можно передавать сигналы 4:2:2, 10 бит [D1] со скоростью 270 Mбит/с, цифровые сигналы PAL [D2, D3] со скоростью 177 Mбит/с, цифровые сигналы NTSC [D2, D3] со скоростью 143 Mбит/с, или даже цифровые сигналы 5.3333:2.6666:2.6666 [D5H] со скоростью 360 Mбит/с. Сейчас появляются новые форматы со сжатием сигнала. Очевидными примерами являются форматы MPEG-1 и MPEG-2. В рамках этих форматов все еще сохраняются различия в стандартах разложения, например MPEG-2/50 не совместим с MPEG-2/59.94. Не только назначение, но и параметры формата, часто оказываются не вполне четко определенными. Простой пример - аналоговые компонентные видеосигналы RGB. Формат Составные части видеостандарта 11 стыка RGB существует в трех вариантах: а) с синхросигналом в зеленом канале (Sync on Green, иногда этот вариант обозначают RGsB), б) с синхросигналом во всех трех каналах R, G, B, и в) с синхросигналом в отдельном четвертом кабеле (этот вариант обычно обозначается RGBS). Уровни видеосигнала играют особенно важную роль в аналоговых блоках, поскольку они определяют ожидаемую реакцию приемника на данное электрическое напряжение. С другой стороны, в цифровых устройствах весьма важно соблюсти стандартное соотношение между цифровыми кодами и аналоговыми напряжениями. Представление и кодирование цветовой информации - это та часть формата, которая определяет способ передачи информации о цвете. Здесь главная линия раздела проходит между компонентными форматами, применяемыми прежде всего при производстве программ, и композитными форматами, традиционно применяемыми для целей вещания. Преобразование из компонентного формата в композитный называется кодированием, а обратное преобразование - декодированием. Композитные форматы подразделяются в соответствии с системами цветного телевидения на NTSC, PAL и SECAM. Здесь вновь следует подчеркнуть различие между стандартом разложения и системой цветного телевидения. Например, система PAL может применяться как со стандартом 525/59.94 так и со стандартом 625/50. Частный случай преобразования системы цветного телевидения без изменения стандарта разложения принято называть транскодированием. Примерами транскодирования являются преобразования PAL - SECAM или NTSC - PAL-M. На рис 2.1.1 показаны различные форматы, применяемые в производстве ТВ программ. Аналоговые Цифровые Композитные Компонентные NTSC PAL SECAM D2, D3 [143 или 177 Мбит/с] RGB VGA YPrPb Y/C D1, D5 [4:2:2, 270 Мбит/с] 4:2:2:4 [YCrCbK] D5H [360 Мбит/с] Рис. 2.1.1 Форматы видеосигналов Стандарты разложения 12 2.2. Стандарты разложения Стандарт разложения определяет в каком порядке изображение разбивается на элементы с целью его передачи в виде сигнала. Тремя основными параметрами при этом являются: число строк в кадре, частота кадров, и коэффициент чересстрочности. Частота строк и частота полей являются производными от этих основных параметров. Разложение без чересстрочного перемежения последовательно по пространственно смежным строкам кадра имеет специальное название - прогрессивная развертка. В этом случае коэффициент чересстрочности составляет 1:1. При чересстрочной развертке кадр разбивается на отдельные поля - например, на четные и нечетные. Частота полей получается путем умножения частоты кадров на коэффициент чересстрочности. Стандарт разложения обычно записывают в краткой форме как три числа, разделенных косой чертой: число строк в кадре/частота кадров/коэффициент чересстрочности, - например "625/50/2:1". Часто последнюю часть или даже две последние части опускают, подразумевая их известными из контекста, например "625/50" или просто "625". Для передачи двух ТВ программ по одному каналу связи некоторые вещательные организации используют метод Vidiplex, по которому два разных видеосигнала передаются по очереди в четных и нечетных полях чересстрочной последовательности. Необходимо подчеркнуть, что Vidiplex не является ни стандартом, ни форматом, поскольку он может применяться к любой паре видеосигналов при условии, что они относятся к одному стандарту. Исторически (и технически) несовместимость различных видеостандартов в наибольшей степени проявляется в различии кадровых частот. На заре черно-белого ТВ была принята весьма разумная мера, а именно: частота полей была связана с частотой сети электропитания (в случае чересстрочности 2:1, частота кадров вдвое ниже частоты полей). Эта мера обеспечивала неподвижность горизонтальной полосы, вызываемой помехами от сети электропитания на экране телевизора. Когда началась эра цветного телевидения, в котором все частоты задаются кварцевыми резонаторами, а качество фильтрации электропитания гораздо лучше, эта связь оказалась, в общем-то, ненужной. Последним аргументом в пользу такой связи остается снижение заметности неприятных низкочастотных биений между частотами питания студийного освещения и частотами полей передающих камер. К сожалению, экономическая необходимость так называемой обратной совместимости не позволила и не позволяет сколько-нибудь существенно изменять частоты полей и кадров. Поэтому мы имеем сейчас группу стран, применяющих частоту 50 Гц, и другую группу стран, применяющих частоту 60 Гц (строго говоря, эта частота составляет не 60 Гц, а 59.94 Гц). Наиболее распространенные стандарты разложения показаны на следующей диаграмме: 525 625 1125 1050 1250 Число строк в кадре 50 29.9 25 30 Частота кадров, Гц Коэффициент чересстрочности 2:1 1:1 1125/60/2:1 625/50/1:1 60 525/59.94/2:1 625/50/2:1 Рис. 2.2.1 Стандарты разложения Стандарты разложения 13 Связь между двумя основными стандартами разложения и основными стандартами ТВ вещания иллюстрирует следующая таблица: 525/59.94/2:1 NTSC (-M), NTSC-4.43, PAL-M 625/50/2:1 PAL (-B,-D,-G,-I-,K), PAL-N, SECAM (-B,-D,-G,-K,-L) Следует отметить, что система NTSC-4.43 применяется только для воспроизведения бытовых видеокассет NTSC на модифицированных аппаратах PAL, но не для вещания. Телевидение Высокой Четкости (ТВЧ) - это термин, которым принято обозначать ТВ системы с числом строк в кадре существенно превышающим обычное ТВ, например более 1000. Аппаратура ТВЧ работает преимущественно с чересстрочной разверткой 2:1, хотя имеются предложения относительно прогрессивной развертки. Термин ТПЧ (Телевидение Повышенной Четкости, EDTV - Extended Definition TeleVision) используется для обозначения ТВ систем с расширенной полосой частот и/или улучшенным кодированием, но при сохранении существующих параметров развертки. Преобразование стандартов с различным числом строк, но одинаковыми частотами кадров и коэффициентами чересстрочности, называется повышающим или понижающим преобразованием стандартов (Up-Conversion или Down-Conversion). Если изменяется частота кадров, то говорят о перекрестном преобразовании (Cross-Conversion). Сочетание этих вариантов дает соответственно повышающее перекрестное преобразование (Up Cross- Conversion) и понижающее перекрестное преобразование (Down Cross-Conversion). Наибольшее распространение получили такие стандарты ТВЧ, как 1125/60 (США, Япония и некоторые другие страны) и 1250/50 (Европа). Некоторые модели оборудования стандарта 1125/60 способны работать и в стандарте 1125/59.94, что позволяет осуществлять понижающее преобразование в стандарт 525/59.94 гораздо легче благодаря совпадению частот полей. Оборудование стандарта 1125/60 известно по торговой марке фирмы Sony "HDVS - High Definition Video System", а также под названием "Hi-Vision". Привлекательность стандарта 1250/50 (известного также по проекту "Eureka") для европейцев состоит не только в большем числе строк, но и в простой связи между стандартами 625/50 и 1250/50, поскольку не требуется перекрестное преобразование. По той же причине в США имеется некоторое количество оборудования, работающего в стандарте 1050/59.94. Для специальных применений иногда используются весьма экзотические стандарты. Например, преимуществом стандарта отображения 937/75/2:1 является существенное снижение таких дефектов ТВ отображения, как видность строчной структуры, мерцания больших площадей и межстрочные мерцания, в сочетании с экономически оправданной частотой строк - всего 35.15625 кГц. Поэтому данный стандарт очень выгоден для видеопоказа на большом экране. Разумеется, для подобного отображения видеосигнал должен быть предварительно обработан в специальном повышающем преобразователе стандартов. На уровне производства ТВ программ имеются специфические стандарты производства, например 625/50/1:1 или 1125/60/2:1. Все большее распространение получает многостандартное производство. Например, видеосигнал от камер ТВЧ сразу же подвергается понижающему преобразованию, записывается на цифровой видеомагнитофон, после чего обрабатывается и монтируется в пониженном (обычном) стандарте. Форматы кадра 14 2.3. Форматы кадра Геометрически говоря, формат - это отношение ширины объекта к его высоте, выражаемое обычно либо в виде пары чисел (например, 4:3) либо одним числом (например, 1.333). Не следует смешивать формат экрана (screen aspect ratio) и формат изображения (picture aspect ratio). В новых системах ТВЧ и ТПЧ формат экрана увеличен по сравнению с обычным ТВ, где он составляет 4:3. В кинематографе он варьирует от 1.333 для старых фильмов до 2.35 в новых фильмах формата CinemaScope и даже 2.77 в широкоэкранном формате Dynavision 3D. Из таблицы видно, как различные комбинации формата экрана и формата изображения проводят к различным форматам отображения (viewed picture formats) Формат отображения Формат экрана Формат изображения Использование высоты экрана, % Обычный 4:3 4:3 100 Широкоэкранный 16:9 16:9 100 Letterbox-B 4:3 14:9 85.7 Letterbox-A 4:3 16:9 75 Анаморфотный 4:3 16:9 100 Формат кадра практически не зависит от параметров разложения, поэтому вполне возможно формирование видеосигналов с различным форматом кадра, но с одинаковыми стандартами разложения. Рис. 2.3.1 иллюстрирует некоторые термины, касающиеся формата кадра. Обычный 4:3 Широкоэкранный 16:9 Анаморфотный Letterbox-B 14:9 Letterbox-A 16:9 Рис. 2.3.1 Форматы отображения Расположение широкого ТВ изображения в пределах узкого экрана приводит к анаморфотному формату. Видимое изображение на экране формата 4:3 геометрически деформируется (сжимается по горизонтали). Назначение анаморфотного формата состоит в достижении полного использования высоты экрана при эксплуатации существующего студийного оборудования. Для отображения видеоматериалов 16:9 на экранах формата 4:3 используется принцип "Letterbox". При таком заниженном формате отображения ширина экрана используется полностью, а высота нет, т.е. сверху и снизу от полезного изображения имеются бесполезные черные полосы. В варианте "Letterbox-A" разрешающая способность существенно снижена вследствие меньшего размера объектов на ТВ экране. Вариант "Letterbox-B" представляет собой популярный компромисс, позволяющий снизить высоту черных полос ценой потери некоторой части изображения на левом и правом краях. Широкоэкранное цифровое видеопроизводство в формате 16:9 создает проблему выбора частоты дискретизации. При работе в формате 4:3, использование стандартного числа отсчетов в цифровой активной части строки (720 при частоте отсчетов 13.5 МГц) позволяет обеспечить примерно равную четкость по вертикали и по горизонтали. Чтобы сохранить этот баланс в формате 16:9 число отсчетов следует пропорционально увеличить до 960 (при частоте 18 МГц). Хотя документ еще формально не принят, но подготовленный расширенный вариант Рекомендации ITU-R BT.601 позволит производителям ТВ программ работать как с частотой 18 МГц, так и с частотой 13.5 МГц. Тем самым, имеющая уже солидный возраст Рекомендация 601, применительно к работе с форматом 4:3 станет называться Рекомендация Форматы кадра 15 601 (часть A), а новый широкоэкранный вариант станет называться Рекомендация 601 (часть B). Уже выпускается достаточно большее количество видеооборудования, способного работать с переключаемым форматом кадра и/или частотой дискретизации. О нем можно говорить "соответствует Рекомендации 601, части A и B" (Rec. 601 Part A & B compliant). Очевидно, преобразование формата кадра является важным свойством понижающих преобразователей стандартов ТВЧ. Как показано на рис. 2.3.2 имеется несколько вариантов такого преобразования. Режим "окна" Источник ТВЧ 16:9 Заниженный режим Панорамный режим Результат понижающего преобразования: Рис. 2.3.2 Режимы понижающего преобразования Если общий вид важнее, чем потеря мелких деталей, то наилучшим является заниженный режим преобразования ("Letterbox" - метод "без кашетирования"). Кроме того, при этом не требуется оперативно изменять параметры преобразования в зависимости от содержания изображения. Однако, если потеря важных деталей в какой-либо части входного ТВЧ изображения недопустима, то остается выбор между режимами "окна" (Zoom) и горизонтального панорамирования с кашетированием (PanScan). Режим окна требует непрерывного управления от оператора, но дает максимум свободы в выборе изобразительного решения и, в принципе, позволяет сохранить все важные детали изображения. Панорамный режим полностью использует высоту экрана и требует от оператора только более легкого управления горизонтальным смещением. Недавно началось вещание по широкоэкранной системе PALplus. Эта система обеспечивает обратную совместимость с телевизорами существующей системы 4:3 PAL и полное использование площади экранов новых телевизоров 16:9 PALplus. Для производства программ используется анаморфотный формат, который затем преобразуется в формат Letterbox-A для вещания, совместимого с обычной системой PAL. В системе PALplus черные полосы над и под изображением заняты специальным вспомогательным сигналом (helper signal), несущим ту информацию о вертикальных деталях изображения, которая была потеряна при понижающем преобразовании. В телевизоре PALplus эта информации используется для восстановления четкости путем повышающего преобразования. Представление и кодирование цветовой информации 16 2.4 Представление и кодирование цветовой информации Цветовые видеосигналы обычно формируются первоначально в виде компонентных сигналов основных цветов RGB, которые кое-кто предпочитает называть GBR только потому, что синхросигнал обычно замешивается в зеленый канал. При производстве программ из соображений экономии и монохромной совместимости чаще используют не сигналы RGB, а другой набор компонентных сигналов, - сигнал яркости и два цветоразностных сигнала. Параллельный аналоговый компонентный стык YPrPb прост и удобен, но называют его по-разному. Довольно часто его называют стыком Y, R-Y, B-Y, а иногда даже YUV, несмотря на то, что все эти выражения означают различные уровни сигналов. Хорошо, если бы только называли по разному, лишь бы фактические уровни были одинаковы, но и это требование не всегда соблюдается. В стандартном стыке YPrPb размахи цветоразностных сигналов Pr и Pb совпадают с размахом сигнала яркости Y и размахом сигналов первичных цветов R, G, B, т.е. равны 700 мВ на нагрузке 75 Ом. Отсюда легко вычислить масштабные коэффициенты: Pr = 0.71327 (R-Y) и Pb = 0.56433 (B-Y). Термин "сигнал яркости" и символ "Y" для его обозначения тоже не вполне однозначны. Они могут означать как сигнал без синхроимпульсов (S), так и сигнал черно-белого телевидения, содержащий синхроимпульсы. Обозначение "Ys" гораздо лучше, но, к сожалению, используется не всегда. Необходимо пояснить, что, несмотря на обратимость линейного матричного преобразования сигналов RGB в YPrPb, сигналы RGB, восстановленные из записанных сигналов YPrPb, не являются точной копией исходных, прежде всего из-за ограничения полосы частот в каналах Pr и Pb. Композитные видеосигналы систем NTSC, PAL и SECAM были изобретены для целей наземного вещания. В этих системах цветного телевидения сигнал цветности (модулированная цветовая поднесущая) добавляется к сигналу яркости, совместимому с черно-белым (монохромным) ТВ, с целью совместной передачи всех компонентов цветного изображения в одном частотном канале. Представление и кодирование цветовой информации 17 Цветность Вспышка Композитный сигнал Уровень 50 % синхроимпульсов Начало строки 0h Яркость Строчный гасящий интервал Активная часть [строки] Уровень синхроимпульсов Уровень гашения 50% уровень серого Задняя площадка Передняя площадка Строчный синхроимпульс Опорный уровень белого Рис. 2.4.1 Структура композитного видеосигнала Существуют и другие форматы, применяемые в ТВ студиях. Например, формат видеозаписи S-VHS принес с собой популярный полупрофессиональный формат стыка Y/C, где C - это обычный сигнал цветности NTSC или PAL, но передаваемый по отдельному кабелю. Тем самым исключаются перекрестные искажения, и декодированное изображение выглядит почти столь же хорошо, как при передаче компонентных сигналов YPrPb. В студиях SECAM был популярен "двухсигнальный" компонентный стык Y, Dr/Db. Сигнал Dr/Db представляет собой строчно-поочередную последовательность сигналов Dr = -1.902 (R- Y) и Db = 1.505 (B-Y). Еще один двухсигнальный компонентный стык Y, CTCM применяется для перезаписи видеофонограмм формата Betacam. При этом сигнал CTCM представляет собой результат масштабирования и временной компрессии сигналов Pr и Pb, т.е. строка каждого из них становится половиной строки сигнала CTCM. Представление и кодирование цветовой информации 18 В некоторых странах, например в России, вещание по системе SECAM по-прежнему требует наличия сигналов вертикальной цветовой синхронизации, которые по ГОСТ 21879 называются СЦС, а в англоязычном жаргоне именуются "бутылками". Однако, в студийных аппаратных и при международном обмене программами те строки вертикального гасящего интервала, которые отведены для этих сигналов, теперь заняты множеством других служебных сигналов, таких как телетекст и т.п. Отсюда появление обозначения варианта системы SECAM - SECAM-H, где H означает построчную, т.е. горизонтальную (H - Horizontal) цветовую синхронизацию. В этом случае СЦС отсутствуют и для цветовой синхронизации служат пакеты немодулированных поднесущих на задней площадке строчного гасящего интервала. Напротив, SECAM-V означает возможность вертикальной синхронизации, т.е. в составе сигнала имеются СЦС. Обозначение SECAM-ME (ME в данном случае означает Middle-East, т.е. Ближний Восток!) говорит лишь о том, что видеокассета формата VHS записана с применением метода понижающего гетеродинирования ЧМ сигнала цветности, аналогично тому, как это делается для VHS кассет PAL и NTSC. При этом способ цветовой синхронизации может быть любым - SECAM-H или SECAM-V. Во Франции широко используется иная (несовместимая) система записи VHS, в которой сигнал цветности SECAM переносится вниз методом деления частоты. Кассеты, записанные по этой системе часто некорректно маркируются просто "SECAM" или "SECAM-L". Уровни, напряжения, коды, единицы измерения 19 2.5 Уровни, напряжения, коды, единицы измерения Любой видеосигнал представляет собой результат временного уплотнения двух весьма различных составляющих: активного видеосигнала и служебных сигналов, введенных в интервалы его гашения. Длительность активной части ТВ строки, когда передается информация об изображении, равна периоду строки минус строчный интервал гашения. Активная часть кадра образуется как совокупность активных частей всех активных строк, т.е. не включает вертикальный гасящий интервал. В цифровой и аналоговой областях длительности и содержание гасящих интервалов различны. Цифровые активные части немного продолжительнее, поскольку к ним добавлено слева и справа по несколько элементов изображения с целью предотвращения искажения аналоговой активной части при фильтрации. Традиционно, уровень видеосигнала в интервале гашения служит опорным уровнем, от которого отсчитываются все остальные уровни. Для композитного сигнала - это уровень на передней и задней площадках. Горизонтальные (строчные) и вертикальные (полевые) интервалы гашения могут содержать синхроимпульсы, испытательные и другие вспомогательные сигналы. Уровни таких составляющих, например синхроимпульсов или вспышек цветовой поднесущей, вполне четко определены и могут быть легко измерены. Что же касается уровней в активной части видеосигнала, то здесь можно говорить лишь о пределах вариации сигнала, определенных стандартом. На практике, измерение уровней "живого" видеосигнала - далеко не простое и не самоочевидное дело. Пиковый уровень черного определен как уровень видеосигнала, соответствующий участку изображения с наименьшей яркостью. Аналогично, пиковый уровень белого соответствует участку изображения с наибольшей яркостью. Эти уровни стандартом не определены и зависят от содержания изображения, настройки аппаратуры и т.п. Стандарт определяет только номинальный уровень черного и номинальный уровень белого. Считается, что номинальный уровень черного - это наименьший допустимый пиковый уровень черного, а номинальный уровень белого соответствует участкам изображения с номинальной яркостью белого. Номинальные уровни различны в различных системах цветного телевидения. Номинальный уровень белого обычно служит опорным уровнем 100 % при калибровке усиления видеотракта и измерительной аппаратуры. Недавно появилось понятие легальных уровней видеосигнала. Легальными являются такой цвет или такая комбинация уровней сигналов Y, Cr, Cb, для которых значения всех трех сигналов R, G, B находятся в пределах между номинальным уровнем черного и номинальным уровнем белого. Нелегальные цвета могут получаться из легальных, например при обработке сигналов 4:2:2. Концепция легальности цветов прямо связана с колориметрическими координатами первичных цветов данной ТВ системы, поэтому преобразование стандартов, например из системы NTSC в систему PAL потенциально чревато получением нелегальных цветов. Желательно обрабатывать такие сигналы специальным цветовым легализатором. Единицы измерения уровней видеосигналов также не универсальны. Много лет назад номинальный размах черно-белого композитного сигнала был установлен равным 1 В (1000 мВ). Просто и элегантно. Однако, отношение уровней синхросигнала и видеосигнала было установлено равным 3:7 в Европе и 4:10 в Америке. Это различие привело к различию номинальных (опорных) уровней белого, т.е. расстояний между уровнями белого и гашения. В Европе оно оказалось 700 мВ, а в Америке 10000/14 = 714.285714 мВ. Последнее число трудно назвать легким для запоминания и практического применения, поэтому североамериканский Институт Радиоинженеров (IRE) ввел специальную единицу измерения, которую так и назвали - единица IRE. Один IRE определен равным 7.14 мВ, разница уровней белого и гашения составляет 100 IRE, а размах композитного сигнала равен 140 IRE. Уровни, напряжения, коды, единицы измерения 20 По стандарту NTSC-M и национальному стандарту США уровень черного композитного сигнала не совпадает с уровнем гашения и поднят на пьедестал высотой 7.5 единиц IRE (53.6 мВ). 0 В - 0.3 В PAL 0.7 В 0 IRE - 40 IRE (- 0.286 В) NTSC-США 100 IRE (0.714 В) Пьедестал 7.5 IRE Рис. 2.5.1 Уровни композитных сигналов NTSC и PAL Однако, в японском варианте системы NTSC-M пьедестал не используется (он равен нулю), что приводит к существенным различиям уровней как сигналов яркости, так и сигналов цветности. В цифровой области роль напряжений выполняют кодовые комбинации, которые тоже должны регламентироваться стандартом. При этом приходится учитывать различие в размахах компонентных и композитных сигналов. Размах композитных сигналов возрастает вследствие добавления сигнала модулированной поднесущей (цветности), тогда как размах цифрового сигнала в компонентном стыке дополнительно снижается из-за того, что синхроимпульсы не кодируются. В результате одному шагу квантования соответствуют четыре различных приращения уровней аналоговых видеосигналов в зависимости от того, какой сигнал кодирован - NTSC, PAL, Y или Cb/Cr. Цифровые опорные уровни черного также зависят от формата сигнала. Звуковое сопровождение 21 2.6 Звуковое сопровождение Как известно, - "лучше один раз увидеть, чем...". Тем не менее, слышать иной раз даже важнее. Другими словами, производство ТВ программ невозможно без звукового сопровождения, поэтому целесообразно кратко рассмотреть звуковые стандарты, особенно принимая во внимание возможность передачи так называемого интегрированного звука (embedded audio) через последовательный цифровой стык путем временного уплотнения потока видеоданных. Есть два основных формата звукового производства: аналоговый и цифровой. Аналоговый звукостык (моно и стерео) определен достаточно четко. К счастью, во всем мире почти повсеместно применяется один основной тип соединителя (XLR) и уровень 0 дБ везде понимается одинаково. Тем не менее, имеются некоторые хорошо известные сложности с импедансом линии, который может варьировать от 110 Ом до 600 Ом, и с симметрично- асимметричным согласованием. Кроме того, следует помнить, что стереозвук существует в двух стандартных форматах: Левый/Правый (L/R) и Сумма/Разность (M/S). Переход от одного формата к другому требует применения матрицирующего преобразователя. Широко применяемый цифровой звукостык AES/EBU был стандартизирован по итогам совместной работы Звукотехнического Общества (AES) и Европейского Союза Вещания (EBU). Исходный документ AES называется: AES3 (ANSI 4.40) "Рекомендация AES по цифровой звукотехнике - Формат последовательной передачи двухканальных линейно кодированных звукоданных". Этот стандарт предоставляет большую свободу вариантов. Например, для различных применений можно иметь разные длины кодовых слов. Стык AES/EBU поддерживает кодовые слова от 16 до 24 бит с целью обеспечения необходимого динамического диапазона и отношения сигнал/шум. Существует простая формула для расчета результирующего отношения сигнал/шум: SNR = 6n, где SNR - отношение сигнал/шум в децибелах,n - число бит на отсчет. На практике отношение сигнал/шум оказывается существенно ниже этой величины вследствие необходимости иметь запас по динамическому диапазону и из-за некоторых других факторов. В формате AES/EBU каждый отсчет звука передается в составе субкадра, содержащего: 20 бит звукоданных, 4 бита вспомогательных данных (которые можно занять, например для расширения кодового слова до 24 бит), 4 бита данных и 4-битовую преамбулу. Два субкадра образуют кадр, содержащий по одному отсчету в каждом из двух звуковых каналов. Кадры группируются в блоки по 192. Сигнал AES/EBU включает также данные состояния канала, содержащие следующую информацию: • включение/выключение предыскажений • частота дискретизации • режим канала (стерео, моно, и т.д.) • использование вспомогательных битов (расширение до 24 бит или другой вариант использования) • контрольную сумму (CRC - cyclic redundancy code) для обнаружения ошибок. Поддерживаются несколько фиксированных частот дискретизации: 32, 44.1 и 48 кГц, причем частота дискретизации может оперативно переключаться. Первоначально стык AES/EBU был ориентирован на 110-омные кабели с разъемами XLR. Относительно высокие частоты сигналов в стыке AES/EBU не позволяют передавать их по витым парам на расстояния более нескольких сотен метров. Недавно был стандартизирован также и вариант с использованием несимметричных 75-омных коаксиальных кабелей и пониженным размахом сигнала (1 В вместо 3 ... 10 В). В результате цифровой звукосигнал приобрел те же свойства, что и аналоговый видеосигнал, поэтому его можно передавать по имеющимся видеотрактам через обычные видеоусилители-распределители, видеокоммутаторы и т.д. (см. документ SMPTE 267M). В последнее время для передачи как аналоговых, так и цифровых звуковых сигналов, стали все шире использоваться субминиатюрные разъемы компьютерного типа (типа D): Звуковое сопровождение 22 • 9-контактные для 2-канального звука или стереозвука • 25-контактные для 4-канального звука (что соответствует числу каналов интегрированного звука в стыке SDI) Подробнее параметры интегрированного звука описаны в разделе 3.5.2. Общие сведения о разделе "Справочные данные" 23 |