Семинар кодирование информации общие сведения
Скачать 63.47 Kb.
|
4.1.2. Кодировка KOI-8KOI-8 (или КОИ-8 – код обмена информацией) – восьмибитовая кодировка, широко используемая ранее как одна из основных кодировок в UNIX-совместимых операционных системах. В настоящее время имеет не столь высокую популярность в связи с внедрением кодировки Unicode. Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов. Например, русский алфавит описывается в кодировке KOI-8-R, украинский — в KOI-8-U. KOI-8-R – эта кодировка как и многие другие представляет собой расширение кодировки ASCII символами русского языка и символами псевдографики. Наличие большого числа символов псевдографики связано с тем, что разработка таблицы приходилось на времена, когда графические операционные системы не были распространены как у нас – псевдографика позволяла разнообразить оформление текстов в таких системах. Первые 128 позиций кодировки полностью совпадают с таблицей ASCII. Расширенная ее часть приведена на рис. 4.2.
Рис. 4.2. «Дополнительная» часть таблицы кодов КОI-8 Отличительной особенностью этой кодировки является то, что русские буквы в ней идут не в алфавитном порядке, а расположены симметрично созвучным им буквам латинского алфавита первой части таблицы. Это сделано для того, чтобы можно было легко перейти с русских символов на английские путем отбрасывания первого бита кодировки. Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из-за этого символы кириллицы расположены не в алфавитном порядке. Сперва в кодировке расположены строчные буквы, далее – заглавные. |