Информатика — курс лекций. Курс лекций для студентов по направлениям 230100. 62 Информатика и вычислительная техника
Скачать 2.08 Mb.
|
Кодирование цвета Цвет — это ощущение, которое испытывает человек при воздействии на его органы зрения электромагнитных волн определенной длины (от 375 нм до 780 нм). Характер этого ощущения таков, что каждой длине электромагнитной волны соответствует условное представление об определённом цвете: (400 нм — фиолетовый; 500 нм — зелёный; 700 нм — красный и т.п.). Электромагнитные излу- чения с длиной волны короче 375 нм или длиннее 780 нм не воспринимаются органами зрения, то есть невидимы. В первом случае их называют ультрафиолетовыми, а во втором случае — инфра- красными. 84 Опытным путём была установлена неравномерность чувствительности здорового глаза к лу- чам света разной длины волны. В диапазоне видимого света были выявлены три максимума, соот- ветствующие синему, зелёному и красному цветам. Это объясняется тем, что глаз имеет рецепторы (они называются «колбочками»), проявляющие повышенную чувствительность к электромагнитным излучениям с длинами волн 450 нм, 550 нм и 600 нм. Кроме колбочек в образовании ощущения цвета важную роль играет центральная нервная система. Поэтому принято говорить не о физиологическом, а о психофизиологическом механизме формирования цвета. Этот механизм имеет важную особенность, которая заключается в трёхцветно- сти зрения. Благодаря свойству трёхцветности любой цвет можно представить в виде суммы трёх не- зависимых цветов и записать тремя числами, выражающими интенсивности трёх составляющих све- товых потоков, например красного, зелёного и синего. Трёхцветность зрения является основой коди- рования информации о цвете. Красный, синий и зеленый цвета играют особую роль. Их называют основными и обозначают первыми буквами английских названий: (Red — красный), (Green — зелёный) и (Blue— синий). Сумма трёх лучей основных цветов, взятых в равной пропорции, даёт луч нейтрального цвета. Из этого соотношения нетрудно вывести обратные зависимости. Эти зависимости надо понимать так, что если из потока нейтрального света вычесть любой основной цвет, то в результате останется поток, окрашенный в цвет, равный сумме двух других ос- новных цветов. Этот «остаточный» цвет тоже имеет важное значение и называется дополнительным. Он получил такое название, потому что дополняет основной цвет до белого (нейтрального). Допол- нительными для красного, зелёного и синего цветов являются, соответственно: голубой ( , Cyan), пурпурный ( , Magenta) и жёлтый ( , Yellow) цвета. Сумма трёх лучей дополнительных цветов точно так же даёт луч нейтрального (белого, серо- го) цвета, как и сумма трёх лучей основных цветов. Соответственно, триаду дополнительных цветов тоже можно использовать для описания произвольного цвета аналогично триаде основных цветов. Цветовое колесо — удобная модель, позволяющая наглядно представить хотя и не сложные, но весьма многочисленные соотношения между основными и дополнительными цветами. В колесе шесть секторов. Начиная с красного ( ), записываем в них основные и дополнительные цвета в по- рядке следования цветов радуги: жёлтый ( ), зелёный ( ), голубой ( ), синий ( ) и пурпурный ( ). 85 У цветового колеса есть два легко запоминающихся свойства. 1. Каждый цвет модели можно получить сложением его соседних цветов. 2. Каждый цвет модели можно получить вычитанием противолежащего цвета из белого. Механизмы образования цвета С помощью модели цветового колеса мы продемонстрировали два механизма получения любого цвета. Механизм, основанный на сложении лучей, называется аддитивным, а механизм, ос- нованный на вычитании цвета из белого, — субтрактивным. Оба механизма равноправны. В повсе- дневной жизни мы пользуемся как тем, так и другим. Аддитивный механизм имеет место, когда изображение формируется сложением световых лучей. В частности, именно так работают телевизоры, мониторы и проекторы. При детальном рас- смотрении на поверхности экрана монитора можно увидеть точки, покрытые люминофором трёх цветов: красного, зелёного и синего. Микропятна люминофора испускают цветные лучи, а наша си- стема зрения суммирует их интенсивности и восстанавливает закодированный цвет. Характерная особенность аддитивного механизма заключается в том, что при взаимодей- ствии лучей их суммарная яркость усиливается. Потому сложение трёх достаточно интенсивных со- ставляющих способно дать яркий белый цвет. Субтрактивный механизм имеет место, когда изображение формируется вычитанием цвета из нейтрального светового потока. Именно так образуется графический образ при просмотре иллю- страций, напечатанных на бумаге. Нейтральный световой поток (условно белый) падает на страницу книг после чего отражается от неё как окрашенный, потому что часть потока захватывается веще- ством красителя. Характерная особенность субтрактивного механизма заключается в том, что при взаимодей- ствии нескольких цветных красителей итоговая яркость отражённого луча уменьшается. Соответ- ственно, наложение на бумагу трёх насыщенных красок способно дать в итоге черный цвет. Теоретические модели RGB и CMY Трёхцветность зрения позволяет выразить любой цвет тремя числовыми значениями, кото- рые можно рассматривать как координаты в воображаемом цветовом пространстве. Заметим, что при этом совершенно всё равно, использовать ли пространство основных цветов или дополни- тельных цветов , поскольку обе триады линейно связаны друг с другом через соотношения цве- тового колеса. Абсолютно все равно, какую триаду считать основной, а какую — дополнительной, потому что они взаимодополнительны. Но какая-то определённость все-таки необходима. Поэтому на практике руководствуются следующими соглашениями: если изображение получено аддитивным механизмом (например, цифровой фотокамерой) или предназначено для воспроизведения аддитивным механизмом (например, монитором), его кодируют и записывают в пространстве основных цветов: , и ; если изображение предназначено для воспроизведения субтрактивным механизмом (пред- полагается его печать и просмотр в отражённом свете), его кодируют в пространстве допол- нительных цветов: , и ; 86 если заранее не известно, для какой цели изображение предназначено, его кодируют в про- странстве основных цветов: , и . Оно значительно шире пространства дополнительных цветов , и это преимущество надо использовать. Практические модели sRGB и CMYK Модель неплохо работает на практике. Телевизоры, питоры, цифровые фото- и видео- камеры, мультимедийные проекторы и множество других устройств выпускают в расчёте на работу с данными именно в этой модели. Есть только одна проблема — совместимость устройств. Так, если фотокамера записала некий цвет как зелёный, необходимо, чтобы устройство воспроизведения тоже сочло его зелёным. Для обеспечения совместимости между разными устройствами из общего пространства цве- тов выбрали некоторое подпространство и назвали его «стандартным» — (standard RGB). Если изображение получено устройством, соответствующим стандарту , его можно смело пере- носить на иные устройства, поддерживающие этот стандарт, — цвета всех точек в достаточной мере сохранятся. Сложнее обстоит дело с моделью , потому что она реализуется не устройствами, а мате- риалами: красками, чернилами и бумагой. Не существует ни идеальных красителей, ни идеальной бумаги. Кроме того, заранее не известно, при каком освещении зритель будет рассматривать изоб- ражение: при солнечном свете, свете ламп накаливания или люминесцентных светильников. Цвето- передача печатных изображений чрезвычайно сильно зависит от условий освещения. Особенно трудно получить чистый чёрный цвет, поэтому модель на практике не приме- няют. В нее вводят дополнительную краску — чёрную ( , blacK) — и применяют четырёхкомпонент- ную модель (читается согласно правилам транслитерации для французского языка: ЦМИК). Своё применение эта модель нашла в полиграфии. Разрядность кодирования цвета Готовые изображения, предназначенные для демонстрации на экране, кодируют в модели по 24-разрядной схеме. В этом случае на каждый канал цвета (из трёх) приходится 8 бит, то есть один байт. Готовые изображения, предназначенные для печати на бумаге, кодируют в модели по 32-разрядной схеме (8 бит на канал цвета). В каждом из четырёх цветовых каналов данные записы- ваются одним байтом со значением от 0 до 100. Для технологического (промежуточного) хранения незавершённых работ могут использовать- ся схемы кодирования с повышенной разрядностью: 12, 14 и даже 16 бит на канал. Повышенная раз- рядность полезна для борьбы с помехами и шумами. Оценка объёма выборки данных Объём выборки данных ( ), которая образуется при кодировании изображения, определяет- ся четырьмя факторами: физическим размером изображения (измеряется в дюймах); оптическим разрешением изображения (измеряется в точках на дюйм, dpi); 87 количество записываемых цветовых каналов — (зависит от использованной модели); принятой глубиной цвета (определяет количество бит данных на каждый канал). Итоговая формула имеет следующий вид: ( ) Кодирование звукозаписей Характерная черта мультимедийной информации состоит в том, что в ходе её кодирования и записи образуются огромные массивы данных. Так, в частности, если не предпринять специальных мер, то звукозапись высшего качества способна за минуту образовать столько же данных, сколько их содержится в ста тысячах машинописных страниц. Ещё больше данных образуется при видеозаписи. Одна минута записи высококачественного видео образует такой же объём данных, как пять миллио- нов страниц машинописного текста. Вот почему человечеству потребовалось полвека развития средств вычислительной техники, чтобы лишь приблизиться к возможности цифровой записи и воспроизведения звука и видео в ре- альном времени. Для этого пришлось создать высокопроизводительные устройства, разработать но- вые принципы и стандарты для кодирования мультимедийной информации с одновременным сжа- тием данных. Средства, позволяющие работать со звукозаписями и видеозаписями, вошли в повсе- дневную практику сравнительно недавно. Это произошло во второй половине 90-х годов XX века. Звук — это ощущение. Оно вызвано локальными изменениями давления воздуха, распро- страняющимися в виде упругих волн. Органы слуха регистрируют перепады давления и передают сигналы в головной мозг. В мозгу происходит реконструкция источника звука: он идентифицируется и определяется его положение в пространстве. Органы слуха человека способны регистрировать не все звуковые волны. Ограничения име- ются как по частоте, так и по амплитуде. Условно считается, что люди различают звуковые сигналы с частотами от 20 Гц до 20 кГц, хотя реальный диапазон немного уже. Звуковые колебания низкой ча- стоты, неразличимые для слуховой системы, называют инфразвуком, а неразличимые колебания вы- сокой частоты — ультразвуком. Разница в амплитуде давления на фронте звуковой волны воспринимается людьми как раз- ница в громкости звуковых сигналов. Звуковое давление измеряют в паскалях (Па). Считается, что органы слуха человека способны без повреждения регистрировать перепады давления от 0,00002 Па до 20 Па (относительный диапазон равен 1 : 1000000). При таком широком диапазоне выражать громкость единицами давления очень неудобно. Поэтому применяют относительные логарифмические единицы — децибелы (дБ). Шаг логарифмиче- ской шкалы, равный 20 дБ, соответствует увеличению звукового давления в 10 раз. Этот приём поз- воляет выразить весь диапазон слышимой громкости одной шкалой со значениями от 0 до 120 дБ. При звуке громкостью 140 дБ (близкий разрыв артиллерийского снаряда) происходит физиче- ское поражение органов слуха, а звук громкостью более 180 дБ смертелен. По энергетике это уже не звуковая волна, а ударная. 88 Цифровое кодирование сигнала Из физической природы звука вытекает наиболее очевидный способ звукозаписи. Он состоит в непрерывной регистрации изменения звукового давления. Действие большинства звукозаписыва- ющих устройств, от первых фонографов Эдисона до современных магнитофонов, основано на этом принципе. Чтобы использовать для работы со звуком вычислительную технику, необходимо перейти от аналогового кодирования к цифровому, то есть выполнить аналого-цифровое преобразование. После него непрерывный аналоговый сигнал преобразуется в последовательность числовых данных — так называемую выборку данных. Аналого-цифровое преобразование происходит в два этапа. Сначала выполняется дискрети- зация сигнала: непрерывный сигнал представляется последовательностью дискретных импульсов. Потом выполняется квантование сигнала: величина каждого импульса представляется целым чис- лом, которое и заносится в выборку данных. Дискретизация сигнала Дискретизация — это один из стандартных приемов моделирования физических процессов. Дискретизация состоит в разбиении модели процесса на различимые элементы, такие, из которых всегда можно восстановить первичную модель с некоей наперёд известной погрешностью. Погрешность, о которой идёт речь, имеет принципиальный и неизбежный характер. Она называется погрешностью дискретизации. Прокомментируем данное здесь определение. Во-первых, речь не идёт о том, чтобы разбить на части процесс или явление, а лишь о разбиении его модели. Если нам надо рассмотреть, как из- менялось давление воздуха на органы слуха в различные моменты времени, мы разбиваем не воз- дух и не время, а модель процесса, например его график. Во-вторых, элементы сигнала должны быть различимы, а это значит, что их минимальная продолжительность определяется используемым оборудованием. В-третьих, речь идёт не о любом разбиении, а только о таком, после которого из полученных элементов можно восстановить первоначальную модель. Это значит, что у каждого элементарного объекта должно быть определенное положение в общей группе, то есть вся группа дискретных эле- ментов представляет собой коллекцию. Полученная коллекция может отличаться от исходной моде- ли, но не более чем на величину, известную заранее. Природа погрешности дискретизации связана с тем, что каждый дискретный импульс имеет определённую продолжительность , отличную от нуля. В течение этого времени давление звуко- вой волны изменяется от начального ( ) до конечного ( ). Принимая на этом участке некоторую усреднённую величину ( ), мы и вносим погрешность. Она предопределена шириной дискретного импульса . Уменьшить погрешность дискретизации можно, уменьшив ширину выборки . С другой стороны, принимать слишком малые значения тоже не всегда практично, ведь при этом увеличивается общее количество различимых импульсов, что ведёт к увеличению резуль- 89 тирующей выборки данных. Таким образом, расплатой за увеличение точности дискретной модели становятся повышенные расходы на хранение данных и операции с ними. Квантование импульсов сигнала Дискретизация непрерывного сигнала позволяет измерить и записать параметры звуковой волны , , , … для каждого импульса. Напомним, что измерение физической величины состоит в её сравнении с предварительно заданной мерой. Результат измерения — действительное число. Действительные числа можно кодировать двоичными разрядами. Однако это не очень эф- фективное кодирование. Если есть возможность, желательно действительными числами не пользо- ваться. Избежать их можно, если перейти к таблично-цифровому кодированию. Этот переход выпол- няют преобразованием, которое называется квантованием по уровню. Квантование состоит в преобразовании непрерывной по значениям величины в величину, способную иметь ограниченный набор фиксированных значений, принадлежащих конечному мно- жеству. Те «разрешённые» значения, которые может принимать регистрируемая величина, называ- ются уровнями квантования. Как и дискретизация, квантование — это один из приёмов, используемых при моделирова- нии. Фактически, при квантовании происходит подмена шкалы, по которой измеряются параметры моделируемого процесса или явления. Вместо непрерывной используется дискретная шкала, в ре- зультате чего вместо действительного числа, характеризующего значение измеряемой величины, получается целое число, характеризующее уровень величины. При целочисленном кодировании различимость результатов физических измерений тем вы- ше, чем больше уровней содержит используемая шкала. Удобной характеристикой числа уровней является количество двоичных разрядов, которым записываются замеренные значения. Оно выра- жает разрядность кодирования. Так, например, 8-разрядное кодирование при звукозаписи позволяет различать 256 значений амплитуд звуковых волн. При таком кодировании удаётся записать сравнительно узкий диапазон громкостей шириной всего лишь в 48 децибел, например от 20 до 68 дБ. Данная величина называет- ся динамическим диапазоном и обозначается буквой . Она в большой степени характеризует каче- ство звукозаписи. Динамический диапазон размером 48 децибел — вполне достаточен для адекватного вос- произведения речи в диапазоне от тихого шёпота до шума толпы. Такое кодирование можно исполь- зовать в цифровых диктофонах и в мобильной телефонной связи, но для записи более широкого диапазона звуков, например для записи музыкальных произведений, 8-разрядного кодирования не- достаточно. Для музыкальной записи используют как минимум 16-разрядное кодирование. Это позволяет регистрировать 65536 различных уровней громкости. Общий диапазон громкостей при этом состав- ляет 96 децибел, например от 20 до 116 дБ. Такая запись сможет адекватно передать как тихий шё- пот, так и рёв взлетающего самолёта. 90 Если судить только по диапазону громкостей сигналов, то шестнадцатиразрядного кодирова- ния вполне достаточно для записи и воспроизведения звука. Однако звукозаписи обычно проходят сложную технологическую обработку. Звукорежиссёры сводят вместе звуки, взятые из разных источ- ников, многократно их записывают и переписывают. При этом накапливаются технологические по- грешности (шумы). Для борьбы с ними в профессиональных системах используют более глубокое кодирование звука (24- и 32-разрядное). С квантованием сигнала связана вторая принципиальная погрешность аналого-цифрового преобразования — погрешность квантования. Как и погрешность дискретизации, погрешность кван- тования неизбежна, потому что образуется из-за самого принципа числового кодирования. Природа погрешности квантования связана с тем, что реальное замеренное значение физи- ческой величины округляется до ближайшего значения уровня квантования. Максимально возмож- ная величина ошибки квантования равна шагу квантования. Так, например, если уровни квантования соответствуют звуковым давлениям 5,0 Па; 5,5 Па; 6,0 Па; 6,5 Па, то замеренное значение 5,6378 Па будет «округлено» до 6,0 Па. Неизбежность ошибки квантования не означает, что с нею нельзя или не нужно бороться. Её нельзя устранить окончательно, но бороться с нею можно увеличением разрядности кодирования. При этом повышается различимость соседних уровней, уменьшается шаг квантования, а вместе с ним уменьшается и предельная величина ошибки. Расплатой за это, как всегда, выступает увеличение общего объёма данных, полученных в результате кодирования. Оценка размера звуковой выборки данных Выборка данных — это числовая последовательность. Она получается после применения ме- тодов дискретизации и квантования к непрерывно изменяющейся физической величине. Выборка данных — это ещё не результат записи данных на носителе, но уже технологическая заготовка для будущей записи. Методы и средства, используемые для записи, зависят от размера полученной вы- борки, поэтому важно уметь оценить его заранее. Размер выборки данных ( ), образующейся при кодировании звука, определяется следую- щими факторами: продолжительностью звукозаписи (измеряется в секундах); частотой выборки (измеряется в герцах); чем чаще производится замер громкости, тем меньше погрешность дискретизации; количеством звуковых каналов ( ); разрядностью квантования (определяет разрядность двоичной записи); чем выше разряд- ность, тем больше различается уровней, тем меньше погрешность квантования. Итоговая формула выглядит так: ( ) Здесь частота выборки — это частота дискретизации — столько раз в секунду производится замер амплитуды сигнала. Обратная величина ( ) равна ширине дискретного импульса . 91 Чем чаще производится замер, тем меньше ширина импульса и меньше погрешность дискре- тизации. Правда, при этом увеличивается объём выборки данных и, соответственно, затраты на хра- нение и обработку данных. А нет ли оптимального значения частоты выборки , при котором и погрешность дискретиза- ции не слишком велика, и объём данных возрастает не чрезмерно? В 1933 году на этот вопрос отве- тил советский ученый В. А. Котельников. Он доказал теорему, впоследствии названную его именем, из которой в качестве следствия вытекает простое правило: при аналого-цифровом преобразовании периодического сигнала частота дискретизации должна превышать частоту самого сигнала не менее чем в два раза. Наши органы слуха различают звуковые частоты до 20 кГц. Удвоив эту величину, мы получа- ем, что при звукозаписи частота дискретизации должна составлять примерно 40 кГц. Когда в 1986 году утверждали международный стандарт для записи музыки на компакт-дисках, была приня- та «с запасом» частота дискретизации 44,1 кГц. Позже, когда утверждали стандарт записи звука на DVD-носителях, «запас» увеличили и приняли значение 48 кГц. Поток данных Размер звуковой выборки данных имеет важное технологическое значение, но не характери- зует напрямую ни продолжительность звукозаписи, ни её качество, а ведь это основные потреби- тельские параметры. Так, например, выборка размером 10 Мбайт может содержать как одну минуту музыки, записанной с высоким качеством, так и целый час речи, записанной с низким качеством. Чтобы различить параметры, отвечающие за продолжительность звукозаписи и за её каче- ство, формулу вычисления размера выборки данных преобразуют следующим образом: ( ) ( ) Здесь параметр определяет продолжительность звукозаписи, а комплекс — её качество. Величина называется потоком данных. Она выражает количество данных, проходящих по инфор- мационному каналу в единицу времени, и измеряется количеством бит в секунду (бит/с). Кодирование видеозаписей Видеоряд представляет собой коллекцию отдельных изображений, называемых кадрами. Каждый кадр — самостоятельный графический объект, имеющий в коллекции определенное поло- жение (порядковый номер). Таким образом, кодирование видеоряда сводится к кодированию кол- лекции кадров. В результате кодирования видеоряда образуется выборка данных. Кроме отдельных выборок данных для каждого из кадров, в неё также входят выборки звуковых данных, потому что современ- ная видеозапись практически всегда сопровождается звукозаписью. Оценка размера выборки видеоданных Размер выборки данных ( ), образующейся при кодировании видео, определяется следую- щими факторами: 92 продолжительностью звукозаписи (с); частотой выборки (1/с); размерами кадра (измеряются в пикселах); глубиной кодирования цвета (измеряется в битах). Если не учитывать размер звуковой выборки данных, то итоговая формула выглядит так. ( ) Поток данных при видеозаписи Как видно из формулы, размер выборки данных, получаемой при кодировании видеоряда, зависит от продолжительности записи и от параметров её качества. Выделим эти составляющие по- рознь, аналогично тому, как мы поступали при рассмотрении звукозаписи. ( ) ( ) Здесь множитель определяет продолжительность видеозаписи, а комплекс — её каче- ство. Эту величину называют потоком данных. Она выражает количество данных, проходящих по информационному каналу в единицу времени, и измеряется количеством бит в секунду. Основной величиной, влияющей на качество видеозаписи, является размер кадра. От него в наибольшей степени зависит поток данных. Сжатие данных при кодировании То, что при переходе к информационному обществу происходит прогрессивное нарастание информационных потоков, — явление закономерное. Общество относится к нему вполне благожела- тельно, пока видит в нём улучшение качества информационных услуг и расширение их ассортимента. Однако на информационные потоки можно взглянуть и иначе. Нельзя забывать, что у инфор- мации есть материальный компонент — данные, а взгляд общества на увеличение потоков данных весьма неоднозначен. В частности, с транспортировкой данных связаны следующие негативные об- стоятельства: уничтожение лесов при производстве бумаги; повреждение почвы при сооружении кабельных линий связи; искажение ландшафтов при создании воздушных линий связи; разрушение экосистем при прокладке подводных линий связи; загрязнение атмосферы при построении космических систем связи. К опасным для человека факторам, имеющим недостаточно изученные последствия, относят- ся электромагнитные излучения, сопровождающие работу мобильных средств связи, устройств бес- проводного доступа к Интернету и высокочастотных установок. Кроме экологических, существуют также негативные экономические последствия. Нарастание потоков данных требует дополнительных расходов сырья, энергии, кадровых ресурсов. Можно 93 утверждать, что по мере перехода к информационному обществу издержки человечества на обеспе- чение информационного обмена прогрессивно, возрастают. Сокращение этих издержек — одна из важнейших задач информатики. Одно из возможных решений, предлагаемых информатикой, — сжатие данных. При этом под «сжатием» понимают такое перекодирование исходной последовательности данных, при котором объём данных уменьшается, а их информационное содержание сохраняется в заданных пределах. Теоретические аспекты сжатия данных Людям важно иметь представление о количестве той информации, которую они создают, хранят, передают и приобретают. При этом они часто руководствуются бытовым, житейским пред- ставлением, что чем больше информации, тем лучше, особенно если она поступает быстро. На самом деле, чтобы объективно говорить о количестве какой-либо сущности, необходимо выделять и различать в ней перечислимые элементы. Для материальных сущностей этим занимается физика. На её уроках мы учимся корректно оперировать количественными параметрами, выражаю- щими физические свойства тел и полей. С информацией дело обстоит сложнее. Информация — сущность не материальная. Выделить в ней составляющие элементы нельзя, и научного аппарата, который позволил бы объективно гово- рить о количестве информации, не существует. Разные люди по-разному оценивают количество од- ной и той же информации. Поэтому, когда надо дать объективную оценку, информацию подменяют данными. Данные, в отличие от информации, объективны, и оценить их объём проще. Данные — это зарегистрированные сигналы, следовательно, они различимы. Кроме того, данные всегда связаны с материальным носителем, следовательно, они объективны. Различимость и объективность позволяют выделять в данных составляющие элементы и подсчитывать их количество. Можно пересчитать количество букв в книге и штрихов в рисунке, замерить количество микровспы- шек света на экране монитора и рассчитать частоту их появления. Как измерить данные? Способ измерения данных зависит от их природы, а она, в свою очередь, зависит от способа кодировании информации. Если, например, изображение закодировано точками, то объём данных определяется количеством точек, а если текст закодирован буквами, то его размер определяется числом букв. Работая с вычислительной техникой, удобно пересчитывать числа. Их мы получаем в качестве элементов данных при цифровом кодировании. Цифровое кодирование имеет ещё и то достоинство, что для него не надо искать минимальный элемент данных. Он хорошо известен: это двоичный раз- ряд, называемый битом. При цифровом кодировании бит является минимальной единицей пред- ставления информации и служит удобной единицей измерения данных. Минимальная выборка данных Одну и ту же информацию можно закодировать множеством способов. При этом разные спо- собы могут давать разные количества данных. Выбирая метод кодирования, можно управлять объё- мом полученных данных. Одну и ту же информацию можно представить большим количеством дан- ных или меньшим. Однако возможности подобного управления не безграничны. Для любой произ- 94 вольной информации в избранной системе кодирования существует некоторая минимальная выбор- ка данных, размер которой уже нельзя уменьшить без потери содержания. Избыточность кодирования В тех случаях, когда размер данных, полученных при кодировании информации, превышает размер соответствующей минимальной выборки, можно говорить о том, что данные обладают избы- точностью. В этом случае данные можно перекодировать так, чтобы величина избыточности умень- шилась. Подобное перекодирование называют «сжатием» или «уплотнением» данных. За тысячелетия развития информационного обмена люди создали и внедрили множество разнообразных систем кодирования. Так, например, любой национальный язык представляет собой сложную систему кодирования образов, чувств и понятий. Системы кодирования можно найти в про- изведениях устного народного творчества, в танцах, костюмах, обрядах. При их создании и отборе исторические сообщества придерживались традиций и руководствовались принципами нравствен- ности и эстетики, но никак не требованиями эффективности кодирования. Надо ли после этого удив- ляться, что большинство традиционных методов кодирования информации создают избыточные данные? До последнего времени избыточность данных в информационном обмене недостатком не считалась. Наоборот, определённая избыточность ценилась. Например, избыточность данных позво- ляет восстанавливать частично утраченную или пропущенную информацию. Поэтому избыточные данные усваиваются проще, ведь для этого требуется меньшая концентрация внимания. А ещё ин- формация, заключённая в избыточных данных, доступнее, потому что для её воспроизведения про- ще подобрать необходимый информационный метод. Отношение к избыточности данных существенно изменилось после перехода к информаци- онному обществу. В результате быстрого нарастания информационных потоков стал заметен основ- ной недостаток избыточных данных: повышенные расходы на их хранение и транспортировку. В тех областях, где с данными работают только люди (образование, культура), эти обстоятельства редко принимаются в расчёт, потому что комфорт и удобство для человека важнее. Но там, где в информа- ционном обмене участвуют автоматические средства вычислительной техники, с избыточностью данных приходится считаться, потому что она снижает производительность систем связи, повышает расходы на хранение, передачу и потребление информации, вносит вклад в загрязнение окружаю- щей среды. Снижение избыточности данных Избыточность данных уменьшают путём их перекодирования (дополнительного, специально- го кодирования). Эту операцию называют сжатием или уплотнением данных. Сжатие данных — это операция преобразования исходной выборки данных в результирую- щую выборку, представляющую адекватную информацию, но имеющую меньший размер. Теоретической основой сжатия данных всегда является их избыточность. Когда в процессе сжатия размер выборки данных уменьшается до размера соответствующей минимальной выборки, возможность дальнейшего сжатия исчерпывается. Существует много методов сжатия данных. В их основе лежат следующие утверждения. 95 1. Любой произвольной выборке данных всегда можно сопоставить метод кодирования, обес- печивающий для данной выборки минимальную избыточность (максимальное уплотнение). 2. Любому произвольному методу сжатия данных всегда можно сопоставить такую выборку данных, для которой данный метод кодирования не обеспечит уплотнения (уменьшения из- быточности). Из этих утверждений вытекают два следствия и два правила. 1. Не существует «абсолютного» метода сжатия — такого, который обеспечил бы максимальную степень уплотнения для любых типов данных. Применять методы сжатия данных следует только в тех условиях, для которых они были разработаны. 2. Последовательная обработка выборки данных двумя методами сжатия даёт тем меньший эффект, чем эффективнее действуют методы. Если данные эффективно сжаты, их дальнейшее уплотнение бессмысленно. Обратимость методов сжатия данных Процедура восстановления исходной выборки данных из сжатой последовательности назы- вается разуплотнением данных. В зависимости от того, что получается после восстановления, разли- чают обратимое и необратимое сжатие. Если выборка, полученная в результате разуплотнения, рав- на исходной выборке данных, значит, метод сжатия обратим. Если же выборки различаются, метод необратим. Обратимые методы сжатия применяют в тех случаях, когда данные имеют документальный характер и их искажение недопустимо. К этой категории относятся текстовые документы, содержи- мое таблиц баз данных, а также числовой код программ. Обычная степень уплотнения данных обра- тимыми методами составляет от 1 : 1,5 до 1 : 10. Необратимые методы сжатия обеспечивают значительно более высокие степени уплотнения (от 1 : 10 до 1 : 200), но при этом вносят в данные неустранимые погрешности. Иногда этими погреш- ностями можно пренебречь, например, когда речь идёт о мультимедийных данных (графика, звук, видео). Вместе с тем, существуют условия, когда необратимые методы сжатия противопоказаны и для мультимедийных данных. В частности, их не применяют, если работа над данными не завершена и предполагается их дальнейшее редактирование. Обратимые методы сжатия данных Существует множество методов обратимого сжатия данных, но в их основе лежит всего два основополагающих принципа: групповое сжатие и сжатие по словарю. В обоих случаях избыточ- ность уменьшается за счёт ликвидации повторов, но происходит это по-разному. В первом случае перекодируются группы повторяющихся элементов, а во втором случае — повторяющиеся группы элементов. Групповое сжатие Наглядный пример использования группового сжатия демонстрирует метод, который назы- вается (Run Length Encoding). Сначала в наборе данных выбираются группы повторяющихся эле- ментов, затем каждая группа заменяется кодом элемента и коэффициентом повтора. 96 Основные достоинства метода : простота вычислительного алгоритма, высокая скорость вычислений и общедоступность. Он доступен, как алгоритм сложения «в столбик» или деления «уголком». Основной недостаток метода — низкая эффективность для большинства типов данных. Поэтому его обычно применяют только для сжатия малоцветных графических изображений, в кото- рых встречается достаточно много повторов. Характерный пример — графические файлы данных в формате . Сжатие по словарю При сжатии по словарю (по шаблону) в исходном наборе выбираются типовые комбинации элементов и заменяются указателем на словарь. При сжатии по словарю кроме результирующей выборки данных образуется некий дополни- тельный набор данных, называемый «словарём», без которого нельзя восстановить данные при разуплотнении. При создании словаря возможны три варианта действий. 1. Словарь можно составить заранее, сделать его общедоступным и не прикладывать к сжатым данным. Такое сжатие называют неадаптивным, потому что словарь никак не адаптируется под конкретный текст. Неадаптивное сжатие обеспечивает очень высокую степень уплотне- ния, но применять его можно лишь в узких областях. Например, сжатие англоязычного текста по русскоязычному словарю не даст ни малейшего эффекта. Разумеется, также, что никакой языковый словарь не подойдет для сжатия графической или музыкальной информации. 2. Полуадаптивное сжатие происходит в два этапа. На первом этапе выборка данных просмат- ривается, и из неё выбираются для словаря наиболее часто встречающиеся группы элемен- тов. На втором этапе элементы исходной выборки данных подменяются краткими ссылками на словарь. При полуадаптивном сжатии словарь подстраивается под конкретный текст, но происходит это в рамках специальной операции. Полуадаптивное сжатие применимо для данных любых типов. Оно обеспечивает высокую степень уплотнения, если объём исходных данных достаточно велик. Основных недостатков два: недостаточная эффективность при ма- лых объёмах данных и сравнительно низкая скорость работы алгоритма. Характерный при- мер — технология сжатия, реализованная в формате . Применение полуадаптивного сжатия ограничено его двухступенчатым характером. Необходимость в дополнительном про- ходе при построении словаря означает, что этот метод можно применять только к заранее сформированной выборке данных. Уплотнять данные, поступающие непрерывным потоком, как это бывает при звукозаписи и видеозаписи, этим методом нельзя. 3. Адаптивное сжатие выполняется за один проход: построение словаря и сжатие данных идут параллельно. Это довольно сложная закрытая технология, защищённая патентами. По эффек- тивности уплотнения она уступает полуадаптивному сжатию, но обеспечивает высокую ско- рость процесса. В частности, она используется в знаменитом алгоритме . Необратимые методы сжатия данных Степень сжатия данных при использовании обратимых методов редко превышает 1 : 5 и лишь в исключительных случаях достигает 1 : 10. Дальнейшее сжатие возможно только при условии, что часть информации, содержавшейся в исходной выборке данных, будет утрачена в результате пере- кодирования. Для такого необратимого сжатия служит особый класс методов. Но прежде чем мы с 97 ними познакомимся, надо выяснить, при каких условиях необратимое сжатие является обоснован- ным, а при каких — нет. Как мы уже знаем, наибольшие потоки данных возникают при записи графической, звуковой и видеоинформации. Именно для этих трёх типов данных, обобщенно называемых мультимедийны- ми, задача сжатия стоит наиболее остро. К счастью, именно для них и возможно применение необ- ратимых методов, позволяющих довести степень сжатия до 1 : 200. Возможность применения необратимых методов для сжатия мультимедийных данных осно- вана на том, что эти типы данных менее других чувствительны к искажению содержания. Эта особен- ность мультимедийных данных связана с тем, что они «от рождения» уже имеют массу погрешно- стей, связанных с их регистрацией и аналого-цифровым преобразованием (АЦП). Если, искажения, вносимые необратимым сжатием выборки данных, сопоставимы по вели- чине с уже имеющимися искажениями, внесенными при её формировании, то с технико- экономической точки зрения их можно считать обоснованными. Необратимое сжатие графики. Технология JPEG Технология (произносится джи-пег) была разработана Международным институтом стандартизации ( ). Её название образовано первыми буквами названия рабочей группы, создав- шей стандарт: Joint Picture Expert Group (Объединённая группа экспертов по записи изображений). Технология предназначена для уплотнения данных при записи многоцветных растро- вых графических изображений. Она позволяет выбрать перед записью значение условного парамет- ра качества. Чем оно выше, тем меньше величина вносимой погрешности, но и тем меньше степень сжатия данных. Для снимков, полученных цифровым фотоаппаратом, приемлемым считается значе- ние параметра качества, равное 40—50 %. Оно позволяет в 5—10 раз уменьшить объём данных и не очень заметно сказывается на субъективном восприятии качества. Для изображений, предназначен- ных для публикации в Интернете, устанавливают параметр качества на уровне 5—20 %. При этом размер выборки данных может уменьшиться в 10—20 раз. Качество полученных изображений при- емлемо для воспроизведения на экране, но для печатного воспроизведения такое сжатие не исполь- зуют. Необратимое сжатие видео. Технология MPEG Наибольшие потоки данный возникают при кодировании видеоизображений, поэтому для видеоданных степень сжатия важна особо. Как и технология , технология (произносится эм-пег) разработана Международным институтом стандартизации. Её название образовано от названия группы, создавшей стандарт: Motion Picture Expert Group (Экспертная группа по записи ди- намических изображений). В основе технологии лежит идея о том, что не обязательно записывать все кадры видеоряда полностью. Обычно соседние кадры различаются мало, поэтому, записав первый кадр, можно вме- сто второго записать лишь его отличия. Так в общей последовательности выявляются опорные и промежуточные кадры. Опорные кадры кодируются целиком. Метод их кодирования похож на . А в промежуточных кадрах кодируются только отличия от соседних кадров или от опорных кадров. 98 В настоящее время наибольшее распространение имеет технология , позволяющая кодировать видеозаписи с разрешением отдельных кадров до точек. Технология используется: для записи видеофильмов на дисках DVD-ROM; в спутниковом телевидении; в цифровом телевидении. Технология обеспечивает степень сжатия исходного видеоряда примерно в 40— 50 раз, что позволяет разместить двухчасовой видеофильм (200 Гбайт) на одном диске DVD-ROM (4,7 Гбайт). Чтобы разместить на обычном компакт-диске (емкость 650—800 Мбайт) хотя бы полуторача- совой видеофильм, необходима степень сжатия порядка 1 : 200. Получить её позволяет технология . От технологии она отличается более сложной математикой, используемой при ко- дировании. В частности, математические процедуры позволяют различать элементы сцены, облада- ющие различной активностью, и кодировать их по-разному. Обычно этот формат сжатия использует- ся для представления видеозаписей в Интернете. Необратимое сжатие звука (технология МР3) Помимо видеозаписей большие объёмы и потоки данных характерны также для звукозапи- сей. Поскольку запись видео практически всегда сопровождается записью звука, стандартом предусмотрена технология эффективного сжатия звуковых данных. Она называется MPEG Layer 3 или, сокращённо, . Для сжатия исходной выборки данных в технологии вводится понятие о психоакустиче- ской звуковой модели. Она учитывает не только свойства звуковых волн, но и особенности централь- ной нервной системы человека. Так, например, в ней учтено, что различимость звуков зависит не только от их громкости и высоты тона, но и от того, с какими другими звуками они сочетаются в дан- ный момент времени. Психоакустическая модель позволяет не учитывать сигналы, вклад которых в общее звучание пренебрежимо мал. Этот приём, получивший название принципа маскирования зву- ка, положен в основу технологии сжатия . Результатом сжатия обычно является уменьшение объема данных в 4—12 раз при допустимой потере качества звучания. |