Главная страница
Навигация по странице:

  • Рис. 4.1. Таблица кодов ASCII

  • Семинар кодирование информации общие сведения


    Скачать 63.47 Kb.
    НазваниеСеминар кодирование информации общие сведения
    Дата06.11.2019
    Размер63.47 Kb.
    Формат файлаdocx
    Имя файлаSeminary_3_4_2019 (1).docx
    ТипСеминар
    #93844
    страница1 из 6
      1   2   3   4   5   6
    1. Семинар 3. КОДИРОВАНИЕ ИНФОРМАЦИИ

    Общие сведения


    В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

    Символы, которые формируются на экране компьютера, получаются путем соединения двух вещей – набора векторных представлений различных знаков (содержатся в файлах со шрифтами) и кода, который позволяет «выдернуть» необходимый символ из этого набора для того чтобы впоследствии поставить его в нужное место экрана. Получается, что за вид представления отвечают шрифты, а за кодирование – операционная система и программа.
        1. 4.1.1. Кодировка ASCII


    Отправной точкой развития современных кодировок можно считать разработка в 1963 году американскими учеными таблицы ASCII (сокращение от American Standard Code for Information Intercange – американский стандартный код для обмена информацией; 7-ми – разрядная система кодирования).

    Эта таблица в общем виде представляет собой сопоставление некоторым распространённым печатным и непечатным символам числовых кодов. Таблица ASCII определяет коды для:

    • десятичных цифр;

    • латинского алфавита;

    • знаков препинания;

    • управляющих символов.

    Таблица кодировки ASCII приведена на рис. 4.1.






    . 0

    . 1

    . 2

    . 3

    . 4

    . 5

    . 6

    . 7

    . 8

    . 9

    . А

    . B

    . C

    . D

    . E

    . F

    0 .

    NUL

    SOH

    STX

    ETX

    EOT

    ENQ

    ACK

    BEL

    BS

    HT

    LF

    VT

    FF

    CR

    SO

    SI

    1 .

    DLE

    DC1

    DC2

    DC3

    DC4

    NAK

    SYN

    ETB

    CAN

    EM

    SUB

    ESC

    FS

    GS

    RS

    US

    2 .




    !

    ''

    #

    $

    %

    &

    '

    (

    )

    *

    +

    ,

    -

    .

    /

    3 .

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    :

    ;

    <

    =

    >

    ?

    4 .

    @

    A

    B

    C

    D

    E

    F

    G

    H

    I

    J

    K

    L

    M

    N

    O

    5 .

    P

    Q

    R

    S

    T

    U

    V

    W

    X

    Y

    Z

    [

    \

    ]

    ^

    _

    6 .

    `

    a

    b

    c

    d

    e

    f

    g

    h

    i

    j

    k

    l

    m

    n

    0

    7 .

    p

    q

    r

    s

    t

    u

    v

    w

    x

    y

    z

    {

    |

    }

    -

    DEL


    Рис. 4.1. Таблица кодов ASCII
    Таблица состоит из 128 символов и является базовой для множества других кодировок (то есть первые 128 символов «расширенных» кодировок совпадает с кодировкой ASCII).

    Каждому символу в таблице ставится число. Принято представлять эти числа в шестнадцатеричной кодировке, например символу * соответствует шестнадцатеричное число 2А.

    Перевод двоичного числа в шестнадцатеричное выполняется очень просто – байт разбивается на 2 части по 4 бита. Каждые 4 бита могут кодировать только 16 значений, каждое из которых можно представить шестнадцатеричным числом.

    Очевидно, что представленные 128 символов не покрывают всего разнообразия имеющихся символов. В частности в таблице не представлены символы национальных алфавитов.

    Также следует отметить, что один байт информации, представляющий символ в двоичной системе счисления может иметь не 128 состояний (наборов 0 и 1), а 28=256. Разумно использовать оставшиеся 128 свободных состояний для расширения числа закодированных символов.

    В настоящее время существует множество таблиц кодировки символов (в том числе расширенная система ASCII), в которых 128 кодов дополнительных символов заменены символами национального алфавита.

    Так, например, кодировка символов русского языка Windows-1251 используется для компьютеров, работающих под ОС Windows. Другая кодировка для русского языка – это КОИ-8, которая также широко используется в компьютерных сетях и российском секторе Интернет.

    В настоящее время существует универсальная система UNICODE, основанная на 16 – разрядном кодировании символов. Эта 16 – разрядная система обеспечивает универсальные коды для 65536 различных символов, т.е. в этой таблице могут разместиться символы языков большинства стран мира.

      1.   1   2   3   4   5   6


    написать администратору сайта