Лекция. Цифровое кодирование. Цифровое кодирование, аналоговое кодирование, табличносимвольное кодирование, числовое кодирование, дельтакодирование
Скачать 18.74 Kb.
|
Цифровое кодирование, аналоговое кодирование, таблично-символьное кодирование, числовое кодирование, дельта-кодирование. Информация становится знанием, когда она упорядочена и сохранена. Сохраняется информация в процессе, который называется записью. При этом информация преобразуется в данные. Запись — это управляемый процесс регистрации данных, представляющих информацию. Схемы кодирования В процессе записи информационный объект становится данными. Например, число записывают последовательностью цифр, слово — последовательностью букв, а предложение — последовательностью слов и знаков препинания. Примеры можно продолжать, но вывод уже ясен: чтобы информация стала данными, необходим информационный метод, устанавливающий соответствие между элементами информационного объекта и элементами данных, полученных в ходе записи. Этот информационный метод называется методом кодирования информации, а процесс преобразования элементов информационных объектов в элементы данных называется кодированием информации. Существуют три основные схемы, в которые укладывается большинство методов кодирования информации: аналоговое кодирование, табличное кодирование и числовое кодирование. В рамках табличного кодирования есть свои схемы, например символьное кодирование и цифровое кодирование. Аналоговое кодирование Аналоговое кодирование — это метод регистрации непрерывной последовательности сигналов известной физической природы в виде подобной ей последовательности данных другой физической природы. Характерными системами, реализующими аналоговое кодирование, являются: фотографические устройства (кроме цифровых), магнитофоны, видеокамеры (не цифровые), устройства передачи радиосигналов и другие. Согласно определению, принцип аналогового кодирования имеет две характерные особенности: · как исходная последовательность сигналов, так и результирующие данные имеют непрерывный характер; · результирующие данные подобны исходным сигналам по избранному критерию подобия. Табличное кодирование Схемы табличного кодирования информации не встречаются в живой природе — это изобретение общества. В их основе лежат предварительно созданные таблицы образцов сигналов. Кодируемый сигнал сравнивается с образцами таблицы, из них выбирается ближайший похожий, и записывается не сам сигнал, а его образец. Поскольку при кодировании элемент информации заменяется элементом данных, теоретически всё равно, какую природу имеет этот элемент — он может быть рисунком, символом, комбинацией знаков. Он также может быть записан и комбинацией цифр. Например, мы можем построить таблицу, в которой каждой букве будет соответствовать её порядковый номер в алфавите. Это пример таблично-цифровой схемы кодирования. Подобные схемы очень удобны, когда речь идёт о кодировании информационных объектов, относящихся не к природе, а к обществу, например для кодирования текстов документов и сообщений. Важно обратить внимание на то, что хотя при таблично-цифровом кодировании элементы информации и записываются группами цифр, у полученных групп нет числовой природы - - их природа остаётся символьной. Чтобы подчеркнуть, что результатом таблично-цифрового кодирования являются не числа, а группы цифр, этот вид кодирования называют цифровым кодированием. Числовое кодирование Совместить достоинства аналогового и цифрового кодирования позволяет так называемое числовое кодирование. Согласно этой схеме кодирования элементы информации записываются числами, значения которых пропорциональны величине зарегистрированного сигнала. Данные, образующие числовую запись, очень удобны для автоматической обработки средствами вычислительной техники. Сохранение подобия необходимо для записи информации естественного происхождения, переносимой электромагнитными или упругими волнами. Это предопределяет применение числового кодирования для записи фотографической, звуковой и видеоинформации с целью обработки данных на компьютере. Системы счисления Вопросы, касающиеся записи чисел и действий с ними, относятся к арифметике. Она вводит в этой области следующую систему понятий. • Набор правил представления (изображения) и наименования чисел называется системой счисления. • Знаки, используемые для записи чисел, называют цифрами. • Если значение, описываемое цифрой, зависит от ее положения в записи числа, система счисления называется позиционной. • Положение цифры в записи числа в позиционной системе счисления называют разрядом. Основным параметром, характеризующим ту или иную систему счисления, является её основание. Основание позиционной системы счисления — это множитель, который определяет изменение значения, описываемого цифрой, при переносе её в следующий по старшинству разряд. Следующий по старшинству разряд располагается слева от данного. Основание системы счисления совпадает с количеством разных цифр, используемых в ней для записи чисел. В математике и в быту общепринята позиционная десятичная система счисления. Единица старшего разряда (например, в числе 10) соответствует десяти единицам младшего разряда. Запись чисел производится при помощи десяти разных цифр: О, 1,2,3,4,5,6,7,8,9. Для представления числовых данных в компьютере используется двоичная система счисления. Основание этой системы равно двум. Соответственно, для записи чисел в этой системе используются только два символа (цифры): 0 и 1. Если в разряде числа содержится минимальное число, для которого в системе счисления определён символ, значение этого разряда называется пустым.Если в разряде числа содержится максимальное число, для которого в системе счисления определён символ, значение этого разряда называется полным.Таким образом, особенностью двоичной системы счисления является то, что двоичные разряды всегда являются либо полными, либо пустыми. Если при записи информации использовано числовое кодирование, а запись полученных чисел выполнена в двоичной системе счисления, можно сделать следующие выводы. 1. Поскольку разряд числа, записанного в двоичной системе, всегда либо полон, либо пуст и, в отличие от других систем счисления, не имеет промежуточных состояний, можно утверждать, что неопределённость значения двоичного разряда теоретически является минимально возможной и равна 1/2. В любых иных системах счисления неопределённость значения разряда выше, поскольку в них возможны промежуточные состояния разряда. 2. Поскольку неопределённость состояния разряда двоичного числа теоретически является минимально возможной, можно утверждать, что в закрытой информационной системе (только в закрытой) количество информации, снимающее эту неопределённость, является минимально возможным регистрируемым количеством информации. 3. Поскольку при записи информации образуются данные, мы можем утверждать, что содержание двоичного разряда является минимальным количеством данных, которым может быть представлено минимальное количество информации при её записи.Из сказанного вытекает, что двоичный разряд можно считать: а) минимальной единицей измерения количества данных; б) минимальной единицей представления информации при записи. Полезные особенности двоичного разряда были заслуженно отмечены. Он получил индивидуальное название -- бит. Слово «бит» происходит от английского слова bit, которое, в свою очередь, является производным от словосочетания bynary digit, что на русский язык переводится как двоичная цифра. Бит — это двоичный разряд. Его информационным содержанием является его состояние (полон/пуст). Допустимо также говорить, что бит установлен/сброшен, включён/выключен. Можно говорить и о его числовом значении (1 или 0). В вычислительной технике наиболее устоявшейся является единица, называемая байтом. Байт — это композиция из восьми взаимосвязанных битов. Байт, в отличие от бита, может быть весьма разнообразным по информационному содержанию. Прежде всего, его информационным содержанием являются 256 различимых состояний (28 = 256). При кодировании положительных целых чисел информационным содержанием байта является число от 0 до 255. Но поскольку кодировать можно не только положительные числа, байт может выражать отрицательное число, символ алфавита, цвет точки, высоту звука и многое другое. Обратите особое внимание на то, что байт — это не группа из восьми последовательных битов, а именно композиция.Байт имеет собственное информационное содержание. Байт — это технический термин, связанный с определённым уровнем развития техники. Байт не всегда считался восьмиразрядным. В прошлом существовали компьютеры, в которых данные представлялись семиразрядными и шестиразрядными байтами. В настоящее время представление о байте как о восьмибитовой композиции общепринято, и нет оснований предполагать, что оно может измениться в ближайшем будущем, Производными единицами измерения количества данных являются: килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт), терабайт (Тбайт) и другие. В математике и физике принято считать, что приставка кило- перед обозначением единицы измерения обозначает более крупную единицу измерения, отличающуюся от исходной в тысячу раз (приставка мега — в миллион раз). Однако в информатике используется иной подход. Здесь соответствие между основной единицей измерения и производной устанавливается через масштабный множитель, являющийся степенью двойки. Так, например, 1 Кбайт = 210 байт, то есть, если быть точным, 1Кбайт = 1024 байта. Как видите, отличие от тысячи невелико (менее 3%), и для инженерных задач полученная погрешность вполне приемлема. Но при переходе к более крупным производным единицам точность начинает быстро падать, и это явление приходится учитывать. 1 Кбайт = 2юбайт = 1024 байт 1 Мбайт = 220 байт = 1 048 576 байт 1 Гбайт = 230 байт = 1 073 741 824 байт |