Главная страница
Навигация по странице:

  • Рис. 4.3. «Дополнительная» часть таблицы кодов Windows1251

  • Семинар кодирование информации общие сведения


    Скачать 63.47 Kb.
    НазваниеСеминар кодирование информации общие сведения
    Дата06.11.2019
    Размер63.47 Kb.
    Формат файлаdocx
    Имя файлаSeminary_3_4_2019 (1).docx
    ТипСеминар
    #93844
    страница3 из 6
    1   2   3   4   5   6

    4.1.3. Кодировка Windows 1251


    Это более современная версия расширения ASCII, чем KOI-8, разработанная во времена широкого использования графических операционных систем. Таким образом, элементы псевдографики в ней практически отсутствуют. Вместо этого в кодировку включены символы типографики и символы языков, близких к славянским (белорусский, украинский и пр.).

    Буквы русского алфавита расположены в алфавитном порядке с 192 по 255 позиции, за исключением букв Ё и ё, расположенных ранее.

    Первые 128 позиций кодировки полностью совпадают с таблицей ASCII. Другая ее часть приведена на рис. 4.3.





    . 0

    . 1

    . 2

    . 3

    . 4

    . 5

    . 6

    . 7

    . 8

    . 9

    . А

    . B

    . C

    . D

    . E

    . F

    8 .

    Ђ

    Ѓ



    ѓ













    Љ



    Њ

    Ќ

    Ћ

    Џ

    9 .

    ђ




















    љ



    њ

    ќ

    ћ

    џ


    A .




    Ў

    ў

    Ј

    ¤

    Ґ

    ¦

    §

    Ё

    ©

    Є

    «

    ¬




    ®

    Ї

    B .

    °

    ±

    І

    і

    ґ

    µ



    ·

    ё



    є

    »

    ј

    Ѕ

    ѕ

    ї

    C .

    А

    Б

    В

    Г

    Д

    Е

    Ж

    З

    И

    Й

    К

    Л

    М

    Н

    О

    П

    D .

    Р

    С

    Т

    У

    Ф

    Х

    Ц

    Ч

    Ш

    Щ

    Ъ

    Ы

    Ь

    Э

    Ю

    Я

    E .

    а

    б

    в

    г

    д

    е

    ж

    з

    и

    й

    к

    л

    м

    н

    о

    п

    F .

    р

    с

    т

    у

    ф

    х

    ц

    ч

    ш

    щ

    ъ

    ы

    ь

    э

    ю

    я


    Рис. 4.3. «Дополнительная» часть таблицы кодов Windows1251
    Следует отметить, что большое число кодировок у производителей шрифтов и программного обеспечения вызывало сложности, связанные с представлением текста в нечитаемом пользователем формате. Такие проблемы возникали и возникают при отправке/получении писем, работе с сайтами или документами, создаваемыми на других ЭВМ.

    Для исключения проблем, в настоящее время созданы многочисленные таблицы перекодировок, которые, однако, полностью проблему не решают.

    Для решения описанной выше проблемы были предприняты попытки разработки новой универсальной вариации кодирования, которая бы заменила все существующие решения и была пригодна для китайского языка, где число символов более 256.

    Для поставленных выше целей в 1991 году была предложена новая уникальная система кодировки Unicode – UTF8, 16 или 32 (первоначально UTF32). Число после названия указывает число бит, используемых для представления одного символа в кодировке. В итоге размер текстового файла будет увеличен в 4 раза (при использовании кодировок 8 и 32 бита), но в данном представлении возможно закодировать миллиарды символов. Впоследствии пришло осознание, что это представление излишне, была разработана кодировка UTF16, которая была признана более удачной.

    В кодировке возможно представить 216 – 65636 символов.

    Но и это впоследствии было признано избыточным и появилась новая кодировка UTF8, имеющая переменную длину от 1 до 6 байт (на практике до 4). В ней привычные латинские символы кодируются 1 байтом, совпадающим с ASCII. Таким образом, было создано единое кодовое пространство, производители шрифтом могут заполнять его векторными формами.

    1   2   3   4   5   6


    написать администратору сайта