Семинар кодирование информации общие сведения
Скачать 63.47 Kb.
|
Семинар 3. КОДИРОВАНИЕ ИНФОРМАЦИИОбщие сведенияВ ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме. Символы, которые формируются на экране компьютера, получаются путем соединения двух вещей – набора векторных представлений различных знаков (содержатся в файлах со шрифтами) и кода, который позволяет «выдернуть» необходимый символ из этого набора для того чтобы впоследствии поставить его в нужное место экрана. Получается, что за вид представления отвечают шрифты, а за кодирование – операционная система и программа. 4.1.1. Кодировка ASCIIОтправной точкой развития современных кодировок можно считать разработка в 1963 году американскими учеными таблицы ASCII (сокращение от American Standard Code for Information Intercange – американский стандартный код для обмена информацией; 7-ми – разрядная система кодирования). Эта таблица в общем виде представляет собой сопоставление некоторым распространённым печатным и непечатным символам числовых кодов. Таблица ASCII определяет коды для: десятичных цифр; латинского алфавита; знаков препинания; управляющих символов. Таблица кодировки ASCII приведена на рис. 4.1.
Рис. 4.1. Таблица кодов ASCII Таблица состоит из 128 символов и является базовой для множества других кодировок (то есть первые 128 символов «расширенных» кодировок совпадает с кодировкой ASCII). Каждому символу в таблице ставится число. Принято представлять эти числа в шестнадцатеричной кодировке, например символу * соответствует шестнадцатеричное число 2А. Перевод двоичного числа в шестнадцатеричное выполняется очень просто – байт разбивается на 2 части по 4 бита. Каждые 4 бита могут кодировать только 16 значений, каждое из которых можно представить шестнадцатеричным числом. Очевидно, что представленные 128 символов не покрывают всего разнообразия имеющихся символов. В частности в таблице не представлены символы национальных алфавитов. Также следует отметить, что один байт информации, представляющий символ в двоичной системе счисления может иметь не 128 состояний (наборов 0 и 1), а 28=256. Разумно использовать оставшиеся 128 свободных состояний для расширения числа закодированных символов. В настоящее время существует множество таблиц кодировки символов (в том числе расширенная система ASCII), в которых 128 кодов дополнительных символов заменены символами национального алфавита. Так, например, кодировка символов русского языка Windows-1251 используется для компьютеров, работающих под ОС Windows. Другая кодировка для русского языка – это КОИ-8, которая также широко используется в компьютерных сетях и российском секторе Интернет. В настоящее время существует универсальная система UNICODE, основанная на 16 – разрядном кодировании символов. Эта 16 – разрядная система обеспечивает универсальные коды для 65536 различных символов, т.е. в этой таблице могут разместиться символы языков большинства стран мира. |