Информатика — курс лекций. Курс лекций для студентов по направлениям 230100. 62 Информатика и вычислительная техника
Скачать 2.08 Mb.
|
Тема 4. Кодирование символьной, графической и мультимедийной информации в ЭВМ Кодирование и запись информации Большую часть поступающей информации люди используют для управления своими действи- ями, своим состоянием и мышлением. Однако у информационного обмена есть и вторая задача: пе- редача, приобретение и накопление знаний. Чтобы поступающая информация стала знанием, она должна быть упорядочена и сохранена (запомнена). Информация хранится в форме данных. Поскольку данные представляют собой зареги- стрированные сигналы, можно сделать вывод, что сохранение информации заключается в регистра- ции сигналов. Происходит это во время процесса, который называется записью. В данном случае речь идет о записи как о процессе. Запись данных — это процесс регистрации сигналов. Запись информации — это управляемый процесс регистрации сигналов. Управляемость — очень важная характеристика процесса записи информации. Упущение её из виду позволяет незаметно для непосвященных обосновывать антинаучные концепции и оккульт- ное мировоззрение. На этом, в частности, основываются лженаучные идеи поиска «информации» в «записях» бесконечных чисел типа и √ . Прежде чем выполнять запись, нужно решить три взаимосвязанных вопроса. Чем делать запись? На чём делать запись? Как делать запись? Инструмент и материал записи совместно образуют средство записи. При выборе средства записи следует руководствоваться экономическими, техническими, организационными и морально- этическими критериями. При выборе учитывают: стоимость и доступность средств записи; режим хранения записи и расчётную продолжительность хранения; режим распространения записи, потребность в её транспортировке, скорость и стоимость транспортировки. Сделанный выбор обязательно проверяют на соответствие морально-этическим и правовым нормам. Например, технология записи информации гвоздём на стене очень доступна, но в цивили- зованном общении вряд ли допустима. Прежде чем записать информацию, следует определить, как именно информационные объ- екты должны представляться наборами данных. Информация представляется данными посредством кодирования. Кодирование — это управляемый процесс представления элементов информационных объ- ектов элементами данных. 66 Мы вновь обращаем особое внимание на управляемость. Элементы информационных объек- тов представляются элементами данных по определенному закону. Кодирование — процесс не слу- чайный. Он происходит согласно избранному информационному методу, который исполняет роль метода кодирования. Метод кодирования информации устанавливает соответствие между элементами записывае- мого информационного объекта и элементами данных, полученных в результате записи. Выбор метода кодирования информации — важный вопрос технологического раздела ин- форматики. Он должен быть согласован с выбором инструмента и материала записи. Ом также дол- жен удовлетворять критериям, о которых сказано выше. Для удобства изучения методы кодирования информации принято рассматривать по катего- риям. Роль этих категорий выполняют так называемые схемы кодирования. Существуют три основные схемы кодирования. Это аналоговое, табличное и цифровое коди- рование. Схемы аналогового кодирования распространены в живой природе. В ходе развития научно- технического прогресса общество постепенно адаптировало их под свои нужды. Именно аналоговое кодирование нашло наиболее раннее применение при записи изображений, звука, видео. Схемы табличного кодирования не имеют и не могут иметь реализаций в живой природе — это изобретение общества. Люди пользуются табличным кодированием с того момента как научи- лись на пальцах обозначать предметы, животных, людей. На табличном кодировании основаны все виды письменности. Табличное кодирование обеспечивает большинство потребностей неавтомати- зированного общественного информационного обмена. Среди табличных схем кодирования особо выделяют две самостоятельные категории: схемы таблично-символьного кодирования; схемы таблично-цифрового кодирования. Таблично-символьное кодирование широко используют при непосредственном информаци- онном обмене, а схемы табличного и цифрового кодирования применяют, когда информационный обмен между людьми осуществляется с помощью средств вычислительной техники. Например, для обмена письменными сообщениями достаточно схем символьного кодирования. Но если сообщение должно быть отправлено по телеграфу или по электронной почте, то без цифрового кодирования не обойтись. Цифровое кодирование не имеет реализаций ни в живой природе, ни в непосредственном информационном обмене между людьми. Это достижение современного общества. Применяется оно в системах автоматического информационного обмена и действует при сохранении информации или при её передаче между техническими устройствами. Принципы кодирования информации Вопросы, связанные с кодированием информации, относятся к технологическим разделам информатики. В основе каждой технологии преобразования информации в данные лежат свои прин- ципы. Они связаны с избранной схемой кодирования. 67 Аналоговое кодирование Аналоговое кодирование основано на понятии подобия. Цель аналогового кодирования — изменение физической природы последовательности данных. Это бывает полезно для увеличения плотности записи, надёжности хранения, скорости перемещения, удобства воспроизведения и дру- гих свойств данных. Аналоговое кодирование — это способ кодирования, основанный на принципе регистрации непрерывной последовательности сигналов определенной физической природы в виде подобной ей последовательности данных другой физической природы. Характерными техническими системами, реализующими аналоговое кодирование, являются: фотографические устройства (кроме цифровых); магнитофоны и видеокамеры (не цифровые); устройства приёма и передачи радиосигналов. Согласно определению, принцип аналогового кодирования имеет две характерные особен- ности: как исходная последовательность сигналов, так и результирующая последовательность дан- ных имеют непрерывный характер; результирующие данные подобны исходным сигналам по избранному критерию подобия. С принципами непрерывности и подобия связано широкое распространение аналогового ко- дирования информации в живой природе. Например, при получении визуальной информации чело- веку важны два фактора: яркость и цвет объекта наблюдения. Яркость определяется амплитудой све- товой волны, а цвет — её длиной (частотой). Табличное кодирование Табличное кодирование — это информационная технология, основанная на периодическом сравнении элементов сигнала с имеющимися модельными образцами. Поскольку сравнение не не- прерывное, а периодическое, по его результатам формируется не непрерывная, а дискретная по- следовательность данных. Эту последовательность называют выборкой данных. Выборка данных со- стоит либо из самих модельных образцов, взятых из справочной таблицы, либо из числовых кодов, указывающих на положение данных образцов в справочной таблице. В первом случае кодирование называется таблично-символьным. Результатом таблично- символьного кодирования является символьная строка — последовательность символов. Во втором случае кодирование называют таблично-цифровым. Результатом этого кодирова- ния тоже является выборка данных, но состоящая не из символов, а из числовых указателей, обозна- чающих местоположение образцов в справочной таблице (в таблице кодирования). Табличное кодирование — это способ кодирования, основанный на принципе формирования дискретной выборки данных по результатам периодического сопоставления регистрируемого сигна- ла с элементами-образцами предварительно заданного набора. 68 К таблично-символьным технологиям кодирования относится хорошо знакомая нам пись- менность. В её основе лежит, как вы знаете, запись звуков речи (непрерывных аналоговых сигналов) с помощью дискретных символов — букв. Сюда же относится и запись музыки с помощью нот. При- мером таблично-цифрового кодирования может служить, например, замена букв группами цифр, выражающими положение этих букв в алфавите или в какой-либо иной таблице кодирования. Как видите, в основе табличного кодирования лежит не принцип непрерывности, характер- ный для аналогового кодирования, а принцип дискретной выразительности. Два звука «а…» разной протяжённости, громкости и тональности выражаются дискретно одной и той же буквой — «А». В табличном кодировании не соблюдается также и принцип подобия. Так, например, из того факта, что буква «Б» в азбуке имеет номер вдвое больший, чем номер буквы «А», никоим образом не следует, что при воспроизведении она должна звучать вдвое громче или вдвое дольше. Табличное кодирование очень широко распространено в информационном обмене, обслу- живающем общественные отношения. Достаточно сказать, что азбуки всех европейских языков — это таблицы образцов, устанавливающие соответствие между звуками и символами, используемыми для их записи. Вам, конечно, известно, что это соответствие, увы, не всегда бывает однозначным и не- редко вызывает появление досадных ошибок в правописании. Поэтому при записи текстов следует руководствоваться не только азбукой, но и правилами орфографии, а также утвержденными слова- рями. Словари и правила тоже можно рассматривать как разновидности справочных таблиц. Как таблично-символьное, так и таблично-цифровое кодирование всегда основаны на какой- то общественной договорённости, ведь таблица кодирования должна быть общеизвестной. Если это не так, значит, имеет место искусственное ограничение информационного обмена, известное как шифрование. И основе любого метода шифрования всегда лежит какой-то метод кодирования. Договорённости об используемой таблице кодирования часто опираются на общепринятые соглашения или на утверждённые стандарты. Цифровое кодирование У аналогового кодирования есть одно замечательное достоинство: при его использовании соблюдается принцип подобия между записываемым сигналом и данными, полученными в резуль- тате записи. В одних случаях это позволяет сделать запись наглядной, а в других — существенно упрощает её воспроизведение и восприятие. В итоге качественные аналоговые записи субъективно воспринимаются людьми как наиболее «естественные». Важное достоинство табличного кодирования — лаконичность и однозначность, а важный недостаток — отсутствие подобия между записываемым сигналом и результатом записи. Из-за отсут- ствия подобия при воспроизведении записи не удается ограничиться сигнальным уровнем информа- ционного обмена. Приходится задействовать второй и даже третий уровни (уровень распознавания образов и уровень интерпретации содержания). Поэтому воспроизведению записей, выполненных табличным кодированием, надо специально учиться. Продолжительность обучения — вся жизнь. Доколе человек остается в обществе, дотоле он находит новые, незнакомые ранее формальные зна- ки, символы, условные обозначения и другие средства дискретной выразительности. 69 Совместить принцип подобия, присущий аналоговому кодированию, с принципом дискрет- ной выразительности, присущим табличному кодированию, позволяет так называемое цифровое ко- дирование. Цифровое кодирование — это способ кодирования, основанный на принципе формирования выборки данных путём периодического измерения величины регистрируемого сигнала и записи чис- ловых значений, пропорциональных результатам измерений. Основное достоинство цифрового кодирования — эффективность. Она связана с широким использованием вычислительной техники для операций с выборками данных. Тот факт, что значения, хранящиеся в выборках, пропорциональны реальным физическим сигналам, позволяет использовать операции арифметики для работы с данными. А тот факт, что значения дискретны, позволяет приме- нять к ним операции математической логики. Благодаря развитию вычислительной техники цифро- вое кодирование с каждым днём находит всё более широкое применение при записи и передаче звукозаписей, изображений и видео. Аналого-цифровое преобразование Цифровое кодирование, по сравнению с аналоговым, обеспечивает особую эффективность хранения информации. После преобразования аналоговой записи в цифровую обычно удаётся уменьшить объём хранимых данных примерно в десять раз. На одном компакт-диске цифровой зву- козаписи, как правило, можно разместить десяток музыкальных альбомов, а на одном частотном ка- нале обычного эфирного телевидения легко размещаются десять каналов телевидения цифрового. Вместе с тем, есть объективные причины, по которым в настоящее время нельзя полностью отказаться от аналоговых схем записи и воспроизведения информации. Вот лишь некоторые из них: нельзя в одночасье заменить во всём мире обширный парк аналоговых технических устройств; в мире накоплены огромные архивы кино-, фото-, видео- и звуковых материалов, записанных в аналоговых форматах, — для их воспроизведения аналоговая техника остаётся необходи- мой; цифровые схемы кодирования вносят в запись дополнительные погрешности, связанные с самим принципом получения цифровой последовательности данных. При современном уровне развития техники (и технических стандартов) эти погрешности пока остаются доста- точно заметными. Из-за них многие потребители пока не готовы отказаться от аналоговых устройств. Необходимость работать одновременно с информацией, записанной разными технологиями, вызывает потребность в специальном классе приборов, выполняющих преобразование данных. Пре- образование аналоговых данных в цифровые называется аналого-цифровым преобразованием (АЦП) — его применяют перед цифровой записью или передачей данных. Аналого-цифровой преоб- разователь имеется во всех моделях сотовых телефонов стандарта GSM, в цифровых фото- и видео- камерах, в сканирующих устройствах, а также в звуковых адаптерах персональных компьютеров. Обратное преобразование цифровых данных в аналоговый сигнал называется цифро- аналоговым преобразованием (ЦАП) — его обычно применяют перед воспроизведением данных. Характерный пример — видеоадаптер компьютера. 70 Если аналоговый сигнал был превращен в выборку данных, а затем по ней был вновь постро- ен аналоговый сигнал, то итоговый сигнал неминуемо отличается от исходного. Искажения, вноси- мые во время аналого-цифрового преобразования, носят принципиальный характер. Избежать их невозможно, можно только стремиться к их уменьшению. В быту эти искажения часто называют «цифровым шумом». Основы цифрового кодирования Двоичный разряд и его особенности В общественных отношениях мы обычно используем позиционную десятичную систему счисления. В этой системе единица старшего разряда (например, в числе 10) соответствует десяти единицам младшего разряда. Запись чисел производится при помощи десяти разных цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Для представления числовых данных в компьютерах и других электронных вычислительных устройствах используется двоичная система счисления. Основание этой системы равно двум. Соот- ветственно, для записи чисел в этой системе необходимы только два символа: 0 и 1. Если в разряде содержится минимальное число, для которого в системе счисления определён символ, значение этого раз ряда называется пустым . Если в разряде содержится максимальное чис- ло, для которого в системе счисления определён символ, значение этого разряда называется пол- ным . Важная особенность двоичной системы счисления заключается в том, что двоичные разряды всегда являются либо полными, либо пустыми. Если при записи информации использовано таблично-цифровое или цифровое кодирование, а запись полученных чисел выполнена в двоичной системе счисления, можно сделать следующие выводы. 1. Поскольку разряд числа, записанного в двоичной системе, всегда либо полон, либо пуст и, в отличие от других систем счисления, не имеет промежуточных состояний, можно утверждать, что неопределённость значения двоичного разряда является минимально возможной и рав- на . В любых иных системах счисления неопределённость значения разряда выше, поскольку в них возможны промежуточные состояния разряда. 2. Поскольку неопределённость состояния разряда двоичного числа теоретически является ми- нимально возможной, можно утверждать, что количество информации, снимающее эту не- определённость, является минимальным регистрируемым количеством информации. 3. Поскольку при записи информации образуются данные, мы можем утверждать, что содержа- ние двоичного разряда является минимальным количеством данных, которым может быть представлено минимальное регистрируемое количество информации при её записи. Из сказанного вытекает, что двоичный разряд можно считать: минимальной единицей измерения количества данных; минимальной единицей представления информации при записи. 71 Бит Полезные особенности двоичного разряда, позволяющие использовать его в качестве едини- цы представления информации и измерения количества данных, были заслуженно отмечены. Он по- лучил индивидуальное название — бит. Бит — это двоичный разряд. В публикациях можно встретить утверждение о том, что «...бит является минимальной еди- ницей информации о системе, вдвое уменьшающей неопределённость состояния этой системы». Надо иметь в виду, что это утверждение справедливо только для закрытых информационных систем, в которых количество возможных состояний конечно и известно заранее. Полной закрытостью обладают только модели. Эти искусственные информационные системы мы создаём специально для решения научных, технических, а иногда учебных задач. Однако боль- шую часть информации люди всё-таки получают из открытых систем, количество возможных состоя- ний которых бесконечно и оценке не подлежит. Поэтому более корректно говорить о том, что бит является не минимальной единицей самой информации, а минимальной единицей её представле- ния. Информационное содержание бита — его целочисленное значение (0 или 1). Иногда в ин- форматике также говорят, что информационным содержанием бита является его состояние (вклю- чён/выключен; полон/пуст; установлен/сброшен). |