Главная страница

Семинар кодирование информации общие сведения


Скачать 63.47 Kb.
НазваниеСеминар кодирование информации общие сведения
Дата06.11.2019
Размер63.47 Kb.
Формат файлаdocx
Имя файлаSeminary_3_4_2019 (1).docx
ТипСеминар
#93844
страница2 из 6
1   2   3   4   5   6

4.1.2. Кодировка KOI-8


KOI-8 (или КОИ-8 – код обмена информацией) – восьмибитовая кодировка, широко используемая ранее как одна из основных кодировок в UNIX-совместимых операционных системах. В настоящее время имеет не столь высокую популярность в связи с внедрением кодировки Unicode.

Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов. Например, русский алфавит описывается в кодировке KOI-8-R, украинский — в KOI-8-U.

KOI-8-R – эта кодировка как и многие другие представляет собой расширение кодировки ASCII символами русского языка и символами псевдографики. Наличие большого числа символов псевдографики связано с тем, что разработка таблицы приходилось на времена, когда графические операционные системы не были распространены как у нас – псевдографика позволяла разнообразить оформление текстов в таких системах.

Первые 128 позиций кодировки полностью совпадают с таблицей ASCII. Расширенная ее часть приведена на рис. 4.2.





. 0

. 1

. 2

. 3

. 4

. 5

. 6

. 7

. 8

. 9

. А

. B

. C

. D

. E

. F

8 .

































9 .


























°

²

·

÷

A .







ё

























B .







Ё

























C .

ю

а

б

ц

д

е

ф

г

х

и

й

к

л

м

н

о

D .

п

я

р

с

т

у

ж

в

ь

ы

з

ш

э

щ

ч

ъ

E .

Ю

А

Б

Ц

Д

Е

Ф

Г

Х

И

Й

К

Л

М

Н

О

F .

П

Я

Р

С

Т

У

Ж

В

Ь

Ы

З

Ш

Э

Щ

Ч

Ъ


Рис. 4.2. «Дополнительная» часть таблицы кодов КОI-8
Отличительной особенностью этой кодировки является то, что русские буквы в ней идут не в алфавитном порядке, а расположены симметрично созвучным им буквам латинского алфавита первой части таблицы. Это сделано для того, чтобы можно было легко перейти с русских символов на английские путем отбрасывания первого бита кодировки.

Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из-за этого символы кириллицы расположены не в алфавитном порядке.

Сперва в кодировке расположены строчные буквы, далее – заглавные.

    1. 1   2   3   4   5   6


написать администратору сайта