Символьное кодирование. Кодирование символьное. Кодирование символьной, графической и мультимедийной информации в эвм дельтакодирование
Скачать 54.33 Kb.
|
Кодирование символьной, графической и мультимедийной информации в ЭВМ Дельта-кодирование (англ. Deltaencoding) — способ представления данных в виде разницы (дельты) между последовательными данными вместо самих данных. Пожалуй, наиболее простой пример заключается в сохранении значений байтов как различия (дельты) между последовательными значениями, в отличие от самих значений. Поэтому вместо 2, 4, 6, 9, 7, мы будем сохранять 2, 2, 2, 3, −2. Это не очень полезно в случае, когда используется само по себе, но может помочь в случае дальнейшей компрессии этих данных, в которых часто встречаются повторяющиеся значения. Например, звуковой формат IFF8SVX применяет это кодирование к чистым звуковым данным перед тем, как применять к ним компрессию. Только 8-битные звуковые семплы хорошо сжимаются в случае дельта-кодирования, а в случае 16-битных и выше семплов этот метод работает хуже. Поэтому, алгоритмы компрессии часто выбирают дельта-кодирование только тогда, когда сжатие с ним лучше, чем без него. Однако, в сжатии видео дельта-фреймы могут значительно уменьшать размер фрейма, и используются практически в каждом видеокодеке. Вариация дельта-кодирования, которая кодирует различия между префиксами или суффиксами строк, называетсяинкрементным кодированием. Оно в частности эффективно для отсортированных списков с малыми различиями между строками, такими, например, как список слов из словаря. В дельта-кодированной передаче по сети, где только единичная копия файла доступна на каждом конце коммуникационного канала, используются специальные коды коррекции ошибок для обнаружения того, какие части файла изменились со времени предыдущей версии. Дельта-кодирование применяется как предварительный этап для многих алгоритмов сжатия, к примеру RLE, и винвертированных индексах поисковых программ. Природа данных, которые будут закодированы, значительно влияет на эффективность сжатия. Дельта-кодирование повышает коэффициент сжатия в том случае, когда данные имеют маленькую или постоянную вариацию (как, к примеру, градиент на изображении); для данных, сгенерированных генератором случайных чисел с равномерным распределением, коэффициент сжатия изменится не сильно. Дельта-кодирование делает невозможным произвольный доступ к данным, так как для обращения к элементу массива необходимо просуммировать значения всех предыдущих. Если это все же необходимо, применяется блочный вариант дельта-кодирования, в котором кодируются блоки некоторой заданной длины. Тогда необходимо лишь просуммировать значения с начала блока, которому принадлежит искомый элемент, но не всего файла. Размер блока выбирается в зависимости от приложения, обычно по результатам хронометража. Кодирование и запись информации Большую часть поступающей информации люди используют для управления своими действиями, своим состоянием и мышлением. Однако у информационного обмена есть и вторая задача: передача, приобретение и накопление знаний. Чтобы поступающая информация стала знанием, она должна быть упорядочена и сохранена (запомнена). Информация хранится в форме данных. Поскольку данные представляют собой зарегистрированные сигналы, можно сделать вывод, что сохранение информации заключается в регистрации сигналов. Происходит это во время процесса, который называется записью. В данном случае речь идет о записи как о процессе. Запись данных — это процесс регистрации сигналов. Запись информации — это управляемый процесс регистрации сигналов. Управляемость — очень важная характеристика процесса записи информации. Упущение её из виду позволяет незаметно для непосвященных обосновывать антинаучные концепции и оккультное мировоззрение. На этом, в частности, основываются лженаучные идеи поиска «информации» в «записях» бесконечных чисел типа и √ . Прежде чем выполнять запись, нужно решить три взаимосвязанных вопроса. Чем делать запись? На чём делать запись? Как делать запись? Инструмент и материал записи совместно образуют средство записи. При выборе средства записи следует руководствоваться экономическими, техническими, организационными и моральноэтическими критериями. При выборе учитывают: стоимость и доступность средств записи; режим хранения записи и расчётную продолжительность хранения; режим распространения записи, потребность в её транспортировке, скорость и стоимость транспортировки. Сделанный выбор обязательно проверяют на соответствие морально-этическими правовым нормам. Например, технология записи информации гвоздём на стене очень доступна, но в цивилизованном общении вряд ли допустима. Прежде чем записать информацию, следует определить, как именно информационные объекты должны представляться наборами данных. Информация представляется данными посредством кодирования. Кодирование — это управляемый процесс представления элементов информационных объектов элементами данных. Мы вновь обращаем особое внимание на управляемость. Элементы информационных объектов представляются элементами данных по определенному закону. Кодирование — процесс не случайный. Он происходит согласно избранному информационному методу, который исполняет роль метода кодирования. Метод кодирования информации устанавливает соответствие между элементами записываемого информационного объекта и элементами данных, полученных в результате записи. Выбор метода кодирования информации — важный вопрос технологического раздела информатики. Он должен быть согласован с выбором инструмента и материала записи. Ом также должен удовлетворять критериям, о которых сказано выше. Для удобства изучения методы кодирования информации принято рассматривать по категориям. Роль этих категорий выполняют так называемые схемы кодирования. Существуют три основные схемы кодирования. Это аналоговое, табличное и цифровое кодирование. Схемы аналогового кодирования распространены в живой природе. В ходе развития научнотехнического прогресса общество постепенно адаптировало их под свои нужды. Именно аналоговое кодирование нашло наиболее раннее применение при записи изображений, звука, видео. Схемы табличного кодирования не имеют и не могут иметь реализаций в живой природе — это изобретение общества. Люди пользуются табличным кодированием с того момента как научились на пальцах обозначать предметы, животных, людей. На табличном кодировании основаны все виды письменности. Табличное кодирование обеспечивает большинство потребностей неавтоматизированного общественного информационного обмена. Среди табличных схем кодирования особо выделяют две самостоятельные категории: схемы таблично-символьного кодирования; схемы таблично-цифрового кодирования. Таблично-символьное кодирование широко используют при непосредственном информационном обмене, а схемы табличного и цифрового кодирования применяют, когда информационный обмен между людьми осуществляется с помощью средств вычислительной техники. Например, для обмена письменными сообщениями достаточно схем символьного кодирования. Но если сообщение должно быть отправлено по телеграфу или по электронной почте, то без цифрового кодирования не обойтись. Цифровое кодирование не имеет реализаций ни в живой природе, ни в непосредственном информационном обмене между людьми. Это достижение современного общества. Применяется оно в системах автоматического информационного обмена и действует при сохранении информации или при её передаче между техническими устройствами. Принципы кодирования информации Вопросы, связанные с кодированием информации, относятся к технологическим разделам информатики. В основе каждой технологии преобразования информации в данные лежат свои принципы. Они связаны с избранной схемой кодирования. Аналоговое кодирование Аналоговое кодирование основано на понятии подобия. Цель аналогового кодирования — изменение физической природы последовательности данных. Это бывает полезно для увеличения плотности записи, надёжности хранения, скорости перемещения, удобства воспроизведения и других свойств данных. Аналоговое кодирование — это способ кодирования, основанный на принципе регистрации непрерывной последовательности сигналов определенной физической природы в виде подобной ей последовательности данных другой физической природы. Характерными техническими системами, реализующими аналоговое кодирование, являются: фотографические устройства (кроме цифровых); магнитофоны и видеокамеры (не цифровые); устройства приёма и передачи радиосигналов. Согласно определению, принцип аналогового кодирования имеет две характерные особен- ности: как исходная последовательность сигналов, так и результирующая последовательность данных имеют непрерывный характер; результирующие данные подобны исходным сигналам по избранному критерию подобия. Спринципами непрерывности и подобия связано широкое распространение аналогового кодирования информации в живой природе. Например, при получении визуальной информации человеку важны два фактора: яркость и цвет объекта наблюдения. Яркость определяется амплитудой световой волны, а цвет — её длиной (частотой). Табличное кодирование Табличное кодирование — это информационная технология, основанная на периодическомсравнении элементов сигнала с имеющимися модельными образцами. Поскольку сравнение не непрерывное, а периодическое, по его результатам формируется не непрерывная, адискретнаяпоследовательность данных. Эту последовательность называютвыборкой данных. Выборка данных состоит либо из самих модельных образцов, взятых из справочной таблицы, либо из числовых кодов, указывающих на положение данных образцов в справочной таблице. В первом случае кодирование называется таблично-символьным.Результатом табличносимвольного кодирования является символьная строка — последовательность символов. Во втором случае кодирование называют таблично-цифровым.Результатом этого кодирования тоже является выборка данных, но состоящая не из символов, а из числовых указателей, обозначающих местоположение образцов в справочной таблице (в таблице кодирования). Табличное кодирование — это способ кодирования, основанный на принципе формирования дискретной выборки данных по результатам периодического сопоставления регистрируемого сигнала сэлементами-образцами предварительно заданного набора. К таблично-символьным технологиям кодирования относится хорошо знакомая нам письменность. В её основе лежит, как вы знаете, запись звуков речи (непрерывных аналоговых сигналов) с помощью дискретных символов — букв. Сюда же относится и запись музыки с помощью нот. Примером таблично-цифрового кодирования может служить, например, замена букв группами цифр, выражающими положение этих букв в алфавите или вкакой-либоиной таблице кодирования. Как видите, в основе табличного кодирования лежит не принцип непрерывности, характерный для аналогового кодирования, а принцип дискретной выразительности. Два звука «а…» разной протяжённости, громкости и тональности выражаются дискретно одной и той же буквой — «А». В табличном кодировании не соблюдается также и принцип подобия. Так, например, из того факта, что буква «Б» в азбуке имеет номер вдвое больший, чем номер буквы «А», никоим образом не следует, что при воспроизведении она должна звучать вдвое громче или вдвое дольше. Табличное кодирование очень широко распространено в информационном обмене, обслуживающем общественные отношения. Достаточно сказать, что азбуки всех европейских языков — это таблицы образцов, устанавливающие соответствие между звуками и символами, используемыми для их записи. Вам, конечно, известно, что это соответствие, увы, не всегда бывает однозначным и нередко вызывает появление досадных ошибок в правописании. Поэтому при записи текстов следует руководствоваться не только азбукой, но и правилами орфографии, а также утвержденными словарями. Словари и правила тоже можно рассматривать как разновидности справочных таблиц. Как таблично-символьное,так итаблично-цифровоекодирование всегда основаны на какойто общественной договорённости, ведь таблица кодирования должна быть общеизвестной. Если это не так, значит, имеет место искусственное ограничение информационного обмена, известное какшифрование. И основе любого метода шифрования всегда лежиткакой-тометод кодирования. Договорённости об используемой таблице кодирования часто опираются на общепринятые соглашения или на утверждённые стандарты. Цифровое кодирование У аналогового кодирования есть одно замечательное достоинство: при его использовании соблюдается принцип подобия между записываемым сигналом и данными, полученными в результате записи. В одних случаях это позволяет сделать запись наглядной, а в других — существенно упрощает её воспроизведение и восприятие. В итоге качественные аналоговые записи субъективно воспринимаются людьми как наиболее «естественные». Важное достоинство табличного кодирования — лаконичность и однозначность, а важный недостаток — отсутствие подобия между записываемым сигналом и результатом записи. Из-заотсутствия подобия при воспроизведении записи не удается ограничиться сигнальным уровнем информационного обмена. Приходится задействовать второй и даже третий уровни (уровень распознавания образов и уровень интерпретации содержания). Поэтому воспроизведению записей, выполненных табличным кодированием, надо специально учиться. Продолжительность обучения — вся жизнь. Доколе человек остается в обществе, дотоле он находит новые, незнакомые ранее формальные знаки, символы, условные обозначения и другие средства дискретной выразительности. 68 Совместить принцип подобия, присущий аналоговому кодированию, с принципом дискретной выразительности, присущим табличному кодированию, позволяет так называемое цифровое кодирование. Цифровое кодирование — это способ кодирования, основанный на принципе формирования выборки данных путём периодического измерения величины регистрируемого сигнала и записи числовых значений, пропорциональных результатам измерений. Основное достоинство цифрового кодирования — эффективность. Она связана с широким использованием вычислительной техники для операций с выборками данных. Тот факт, что значения, хранящиеся в выборках, пропорциональны реальным физическим сигналам, позволяет использовать операции арифметики для работы с данными. А тот факт, что значения дискретны, позволяет применять к ним операции математической логики. Благодаря развитию вычислительной техники цифровое кодирование с каждым днём находит всё более широкое применение при записи и передаче звукозаписей, изображений и видео. Аналого-цифровое преобразование Цифровое кодирование, по сравнению с аналоговым, обеспечивает особую эффективность хранения информации. После преобразования аналоговой записи в цифровую обычно удаётся уменьшить объём хранимых данных примерно в десять раз. На одном компакт-дискецифровой звукозаписи, как правило, можно разместить десяток музыкальных альбомов, а на одном частотном канале обычного эфирного телевидения легко размещаются десять каналов телевидения цифрового. Вместе с тем, есть объективные причины, по которым в настоящее время нельзя полностью отказаться от аналоговых схем записи и воспроизведения информации. Вот лишь некоторые из них: нельзя в одночасье заменить во всём мире обширный парк аналоговых технических устройств; в мире накоплены огромные архивы кино-,фото-,видео- и звуковых материалов, записанных в аналоговых форматах, — для их воспроизведения аналоговая техника остаётся необходимой; цифровые схемы кодирования вносят в запись дополнительные погрешности, связанные с самим принципом получения цифровой последовательности данных. При современном уровне развития техники (и технических стандартов) эти погрешности пока остаются достаточно заметными. Из-заних многие потребители пока не готовы отказаться от аналоговых устройств. Необходимость работать одновременно с информацией, записанной разными технологиями, вызывает потребность в специальном классе приборов, выполняющих преобразование данных. Преобразование аналоговых данных в цифровые называется аналого-цифровым преобразованием(АЦП) — его применяют перед цифровой записью или передачей данных.Аналого-цифровойпреобразователь имеется во всех моделях сотовых телефонов стандартаGSM, в цифровых фото- и видеокамерах, в сканирующих устройствах, а также в звуковых адаптерах персональных компьютеров. Обратное преобразование цифровых данных в аналоговый сигнал называетсяцифроаналоговым преобразованием (ЦАП) — его обычно применяют перед воспроизведением данных. Характерный пример — видеоадаптер компьютера. 69 Если аналоговый сигнал был превращен в выборку данных, а затем по ней был вновь построен аналоговый сигнал, то итоговый сигнал неминуемо отличается от исходного. Искажения, вносимые во время аналого-цифровогопреобразования, носят принципиальный характер. Избежать их невозможно, можно только стремиться к их уменьшению. В быту эти искажения часто называют «цифровым шумом». Основы цифрового кодирования Двоичный разряд и его особенности В общественных отношениях мы обычно используем позиционную десятичную систему счисления. В этой системе единица старшего разряда (например, в числе 10) соответствует десяти единицам младшего разряда. Запись чисел производится при помощи десяти разных цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Для представления числовых данных в компьютерах и других электронных вычислительных устройствах используется двоичная система счисления. Основание этой системы равно двум. Соответственно, для записи чисел в этой системе необходимы только два символа: 0 и 1. Если в разряде содержится минимальное число, для которого в системе счисления определён символ, значение этого раз ряда называется пустым. Если в разряде содержится максимальное число, для которого в системе счисления определён символ, значение этого разряда называетсяполным. Важная особенность двоичной системы счисления заключается в том, что двоичные разряды всегда являются либо полными, либо пустыми. Если при записи информации использовано таблично-цифровоеили цифровое кодирование, а запись полученных чисел выполнена в двоичной системе счисления, можно сделать следующие выводы. 1.Поскольку разряд числа, записанного в двоичной системе, всегда либо полон, либо пуст и, в отличие от других систем счисления, не имеет промежуточных состояний, можно утверждать, что неопределённость значения двоичного разряда является минимально возможной и рав- на . В любых иных системах счисления неопределённость значения разряда выше, поскольку вних возможны промежуточные состояния разряда. 2.Поскольку неопределённость состояния разряда двоичного числа теоретически является минимально возможной, можно утверждать, что количество информации, снимающее эту неопределённость, является минимальным регистрируемым количеством информации. 3.Поскольку при записи информации образуются данные, мы можем утверждать, что содержание двоичного разряда является минимальным количеством данных, которым может быть представлено минимальное регистрируемое количество информации при её записи. Из сказанного вытекает, что двоичный разряд можно считать: минимальной единицей измерения количества данных; минимальной единицей представления информации при записи. 70 |