Главная страница
Навигация по странице:

  •  текстового сообщения Мы уже касались этого вопроса, рассматривая алфавитный подход к измерению информации.Информационным объёмом

  • Times New Roman

  • § Кодирование графической информации

  • Отнт. А. Ю. Босова Москва бином. Лаборатория знаний 10 класс Базовый уровень Учебник


    Скачать 6.18 Mb.
    НазваниеА. Ю. Босова Москва бином. Лаборатория знаний 10 класс Базовый уровень Учебник
    Дата01.12.2022
    Размер6.18 Mb.
    Формат файлаpdf
    Имя файлаinformatika_10kl_bu_bosovall.pdf
    ТипУчебник
    #823257
    страница11 из 21
    1   ...   7   8   9   10   11   12   13   14   ...   21

    Глава3.представлениеинформациивкомпьютере
    14. Почему множество вещественных чисел, представимых в памяти компьютера, дискретно, конечно и ограничено. Попытайтесь самостоятельно сформулировать основные принципы представления данных в компьютере Кодирование текстовой информации

    Компьютеры третьего поколения научились работать стек- стовой информацией.
    Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов. Для компьютерного представления текстовой информации достаточно) определить множество всех символов (алфавит, требуемых для представления текстовой информации 2) выстроить все символы используемого алфавита в некоторой последовательности (присвоить каждому символу алфавита свой номер 3) получить для каждого символа разрядный двоичный код
    (n ≤ 2
    n
    ), переведя номер этого символа в двоичную систему счисления.
    В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов Кодировка ASCII и е расширения

    Основой для компьютерных стандартов кодирования символов послужил код ASCII (American Standard Code for Information
    Interchange) — американский стандартный код для обмена информацией, разработанный в х годах в США и применявшийся для любых, в том числе и некомпьютерных, способов передачи информации (телеграф, факсимильная связь и т. д. Этот код
    Кодирование текстовой информации
    §14
    7-битовый: общее количество символов составляет 2 7
    = 128, из них первые 32 символа — управляющие, а остальные — изображаемые, те. имеющие графическое изображение. К изображаемым символам в ASCII относятся буквы латинского алфавита прописные и строчные, цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы. Кодировка ASCII приведена в табл. Таблица Кодировка ASCII
    0
    1
    2
    3
    4
    5
    6
    7
    8
    9
    A
    B
    C
    D
    E
    F
    0 NUL SOH STX ETX EOT ENQ ACK BEL BS
    HT LF VT FF CR SO
    SI
    1 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
    2
    !
    "
    #
    $
    %
    &
    '
    (
    )
    *
    +
    ,
    -
    /
    3
    0 1
    2 3
    4 5
    6 7
    8 9
    :
    ;
    <
    =
    >
    ?
    4
    @
    A
    B
    C
    D
    E
    F
    G
    H
    I
    J
    K
    L
    M
    N
    O
    5
    P
    Q
    R
    S
    T
    U
    V
    W
    X
    Y
    Z
    [
    \
    ]
    ^
    _
    6
    `
    a b
    c d
    e f
    g h
    i j
    k l
    m n
    o
    7
    p q
    r s
    t u
    v w
    x y
    z
    {
    |
    }

    Хотя для кодирования символов в ASCII достаточно 7 битов, в памяти компьютера под каждый символ отводится ровно 1 байт
    (8 битов, при этом код символа помещается в младшие биты, а в старший бит заносится Например, 01000001 — код прописной латинской буквы «A»; с помощью шестнадцатеричных цифр его можно записать как Стандарт ASCII рассчитан на передачу только английского текста. Со временем возникла необходимость кодирования и не- английских букв. Во многих странах для этого стали разрабатывать расширения ASCII кодировки, в которых применялись однобайтовые коды символов. При этом первые 128 символов кодовой таблицы совпадали с кодировкой ASCII, а остальные (со го пой) использовались для кодирования букв национального алфавита, символов национальной валюты и т. п. Из- за несогласованности этих разработок для многих языков было создано несколько вариантов кодовых таблиц (например, для русского языка их было создано около десятка

    140
    Глава3.представлениеинформациивкомпьютере
    Впоследствии использование кодовых таблиц было несколько упорядочено каждой кодовой таблице было присвоено особое название и номер. Для русского языка наиболее распространённы- ми стали однобайтовые кодовые таблицы СР-866, Windows-1251 табл. 3.9) и КОИ (табл. 3.10). В них первые 128 символов совпадают с кодировкой, а русские буквы размещены во второй части таблицы. Обратите внимание на то, что коды русских букв в этих кодировках различны.
    Таблица Кодировка Windows-1251
    0
    1
    2
    3
    4
    5
    6
    7
    8
    9
    A
    B
    C
    D
    E
    F
    8
    Ђ
    Ѓ

    ѓ




    € ‰ Љ
    <
    Њ
    Ќ
    Ћ
    Џ
    9
    ђ








    љ
    >
    њ
    ќ
    ћ
    џ
    A
    Ў
    ў
    Ј
    ¤
    Ґ
    ¦
    §
    Ё
    ©
    Є
    «
    ¬
    ®
    Ї
    B
    °
    ±
    І
    і
    ґ
    µ

    ·
    ё

    є
    »
    ј
    Ѕ
    ѕ
    ї
    C
    А
    Б
    В
    Г
    Д
    Е
    Ж
    З
    И
    Й
    К
    Л
    М
    Н
    О
    П
    D
    Р
    С
    Т
    У
    Ф
    Х
    Ц
    Ч
    Ш
    Щ
    Ъ
    Ы
    Ь
    Э
    Ю
    Я
    E
    а б
    в где ж з
    и й
    к л
    м но пр ст уф х
    ц ч
    ш щ
    ъ ы
    ь э
    ю я
    Таблица Кодировка КоИ-8
    0
    1
    2
    3
    4
    5
    6
    7
    8
    9
    A
    B
    C
    D
    E
    F
    8
















    9











    °
    ²
    ·
    ÷
    A



    ё












    B



    Ё











    ©
    C
    ю а
    б ц
    д е
    ф г
    х и
    й кл мн оп яр ст уж в
    ь ы
    з ш
    э щ
    ч ъ
    E
    Ю
    А
    Б
    Ц
    Д
    Е
    Ф
    Г
    Х
    И
    Й
    К
    Л
    М
    Н
    О
    F
    П
    Я
    Р
    С
    Т
    У
    Ж
    В
    Ь
    Ы
    З
    Ш
    Э
    Щ
    Ч
    Ъ
    Кодирование текстовой информации
    §14
    Мы выяснили, что при нажатии на алфавитно-цифровую клавишу в компьютер посылается некоторая цепочка нулей и единиц. Втек- стовых файлах хранятся не изображения символов, а их коды. При выводе текста на экран монитора или принтера необходимо восстановить изображения всех символов, составляющих данный текст, причём изображения эти могут быть разнообразны и достаточно причудливы. Внешний вид выводимых на экран символов кодируется и хранится в специальных шрифтовых файлах. Современные текстовые процессоры умеют внедрять шрифты в файл. В этом случае файл содержит не только коды символов, но и описание используемых в этом документе шрифтов. Кроме того, файлы, создаваемые с помощью текстовых процессоров, включают в себя и такие данные о форматировании текста, как его размер, начертание, размеры полей, отступов, межстрочных интервалов и другую дополнительную информацию стандарт Ограниченность 8-битной кодировки, не позволяющей одновременно пользоваться несколькими языками, а также трудности, связанные с необходимостью преобразования одной кодировки в другую, привели к разработке нового кода. В 1991 году был разработан новый стандарт кодирования символов, получивший название (Юникод), позволяющий использовать в текстах любые символы любых языков мира — это уникальный код для любого символа, независимо от платформы, независимо от программы, независимо от языка В Unicode на кодирование символов отводится 31 бит. Первые
    128 символов (коды 0–127) совпадают с таблицей ASCII. Далее размещены основные алфавиты современных языков они полностью умещаются впервой части таблицы, их коды не превосходят Стандарт Unicode описывает алфавиты всех известных, в том числе им ртвых, языков. Для языков, имеющих несколько алфавитов или вариантов написания (например, японского и индийского, закодированы все варианты. В кодировку Unicode внесены все математические и иные научные символьные обозначения и даже некоторые придуманные языки (например, язык эльфов из трилогии Дж. Р. Р. Толкина Властелин колец

    142
    Глава3.представлениеинформациивкомпьютере
    Всего современная версия Unicode позволяет закодировать более миллиона различных знаков, но реально используется чуть менее 110 000 кодовых позиций.
    Для представления символов в памяти компьютера в стандарте имеется несколько кодировок.
    В операционных системах семейства Windows используется кодировка UTF-16. В ней все наиболее важные символы кодируются с помощью 2 байт (16 бита редко используемые — с помощью байт.
    В операционной системе Linux применяется кодировка UTF-8, в которой символы могут занимать от 1 (символы, входящие в таблицу ASCII) до 4 байт. Если значительную часть текста составляют цифры и латинские буквы, то это позволяет вне- сколько раз уменьшить размер файла по сравнению с кодировкой Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов Информационный объём 
     текстового сообщения
    Мы уже касались этого вопроса, рассматривая алфавитный подход к измерению информации.
    Информационным объёмом текстового сообщения называется количество бит (байт, килобайт, мегабайт и т. д, необходимых для записи этого сообщения путём заранее оговоренного способа двоичного кодирования.
    Оценим в байтах объём текстовой информации в современном словаре иностранных слов из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы).
    Будем считать, что при записи используется кодировка один символ — один байт. Количество символов во всем словаре равно · 60 · 740 = 3 552 000.
    Кодирование текстовой информации
    §14
    Следовательно, объём равен 552 000 байт = 3 468,75 Кбайт ≈ 3,39 Мбайт.
    Если же использовать кодировку UTF-16, то объём этой же текстовой информации в байтах возрастёт в 2 раза и составит
    6,78 Мбайт.
    самое ГЛаВное
    Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов. В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.
    Основой для компьютерных стандартов кодирования символов послужил код ASCII, рассчитанный на передачу только английского текста. Расширения ASCII — кодировки, в которых первые
    128 символов кодовой таблицы совпадают с кодировкой ASCII, а остальные (со го пой) используются для кодирования букв национального алфавита, символов национальной валюты и т. п. В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира. Кодировки позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов. Вопросы и задания 1. Какова основная идея представления текстовой информации в компьютере 2. Что представляет собой кодировка ASCII? Сколько символов она включает Какие это символы 3. Как известно, кодовые таблицы каждому символу алфавита ставят в соответствие его двоичный код. Как, в таком случае, вы можете объяснить вид таблицы 3.8 Кодировка
    ASCII»?

    144
    Глава3.представлениеинформациивкомпьютере
    4. С помощью таблицы а) декодируйте сообщение 64 65 73 6B 74 6F б) запишите в двоичном коде сообщение в) декодируйте сообщение 01100001 01110000 01110100 01101111 01110000 5. Что представляют собой расширения кодировки Назовите основные расширения кодировки, содержащие русские буквы 6. Сравните подходы к расположению русских букв в кодировках и КОИ 7. Представьте в кодировке Windows-1251 текст Знание — сила!»:
    а) шестнадцатеричным кодом;
    б) двоичным кодом;
    в) десятичным кодом 8. Представьте в кодировке КОИ текст Дело в шляпе!»:
    а) шестнадцатеричным кодом;
    б) двоичным кодом;
    в) десятичным кодом 9. Что является содержимым файла, созданного в современном текстовом процессоре. В кодировке Unicode на каждый символ отводится 2 байта. Определите в этой кодировке информационный объём следующей строки:
    Где родился, там и сгодился. Набранный на компьютере текст содержит 2 страницы. На каждой странице 32 строки, в каждой строке 64 символа. Определите информационный объём текста в кодировке
    Unicode, в которой каждый символ кодируется 16 битами. Текст на русском языке, первоначально записанный в битовом коде Windows, был перекодирован в 16-битную кодировку. Известно, что этот текст был распечатан на
    128 страницах, каждая из которых содержала 32 строки по
    64 символа в каждой строке. Каков информационный объём этого текста. В текстовом процессоре MS Word откройте таблицу символов (вкладка Вставка →É Символ É→ Другие символы
    Кодирование графической информации В поле Шрифт установите Times New Roman, в поле из — кириллица (дес.).
    Вводя в поле Код знака десятичные коды символов, декодируйте сообщение 238 240 238 227 243 32 238 241 232 235 232 242 32 232 228 243 249 232 233 46
    § Кодирование графической информации
    Обработка и хранение графической информации требуют значительных вычислительных ресурсов, которые появились только у компьютеров четвёртого поколения

    146
    Глава3.представлениеинформациивкомпьютере
    15.1. общие подходы к кодированию 
     графической информации
    Пространство непрерывно, а это значит, что в любой его области содержится бесконечное множество точек. Чтобы абсолютно точно сохранить изображение, необходимо запомнить информацию о каждой его точке. Иначе говоря, компьютерное представление некоторого изображения (например, полотна В. И. Сурикова Боярыня Морозова») должно содержать информацию о бесконечном количестве точек, для сохранения которой потребовалось бы бесконечно много памяти. Но память любого компьютера конечна. Чтобы компьютер мог хранить и обрабатывать изображения, необходимо ограничиться выделением конечного количества объектов пространства (областей или точек, информация о которых будет сохранена. Информация обо всех остальных точках пространства будет утрачена.
    Пространственная дискретизация — способ выделения конечного числа пространственных элементов, информация о которых будет сохранена в памяти компьютера.
    Цвет и яркость — характеристики, присущие каждому элементу (точке, области) изображения. Их можно измерять, те. выражать в числах. И цвет, и яркость — непрерывные величины, результаты измерения которых следует выражать вещественными числами. Но вам известно, что вещественные числа не могут быть представлены в компьютере точно.
    Квантование — процедура преобразования непрерывного диапазона всех возможных входных значений измеряемой величины в дискретный набор выходных значений.
    При квантовании диапазон возможных значений измеряемой величины разбивается на несколько поддиапазонов. При измерении определяется поддиапазон, в который попадает значение, ив компьютере сохраняется только номер поддиапазона.
    Дискретизация и квантование всегда приводят к потере некоторой доли информации.
    Кодирование графической информации Векторная и растровая графика
    В зависимости от способа формирования графических изображений выделяют векторный и растровый методы кодирования графических изображений.
    Векторное изображение строится из
    рис. 3.6. Аппликация из бумаги отдельных базовых объектов — графических примитивов отрезков, многоугольников, кривых, овалов. Способ создания векторных изображений напоминает аппликацию (рис. Графические примитивы характеризуются цветом и толщиной контура, цветом и способом заливки внутренней области, размером и т. д. При сохранении векторного изображения в память компьютера заносится информация о составляющих его графических примитивах.
    Например, для построения окружности необходимо сохранить такие исходные данные, как координаты её центра, значение радиуса, цвет и толщину контура, цвет заполнения. При этом и большая, и маленькая окружности будут описаны одними тем же набором данных, те. реальные размеры объекта не оказывают никакого влияния на размер сохраняемых он м данных. Фактически векторное представление это описание, в соответствии с которым происходит построение требуемого изображения. Такого рода описания представляются в компьютере как обычная текстовая информация. Растровое графическое изображение состоит из отдельных маленьких элементов пикселей (pixel — аббревиатура от англ. picture element — элемент изображения. Оно похоже на мозаику (рис. 3.7), изготовленную из одинаковых по размеру объектов (разноцветных камешков, кусочков стекла, эмали и др.).
    рис. 3.7. Фрагмент мозаичного полотна на станции московского метро «Маяковская»

    148
    Глава3.представлениеинформациивкомпьютере
    растр — организованная специальным образом совокупность пик- селей, представляющая изображение. Координаты, форма и размер пикселей задаются при определении растра. Изменяемым атрибутом пикселей является цвет.
    В прямоугольном растре пиксели составляют прямоугольную матрицу, её основными параметрами являются количество столбцов и строк, составленных из пикселей.
    Главное преимущество прямоугольных растров заключается в том, что положение каждого пикселя на изображении (или на экране) не надо задавать — его легко вычислить, зная размеры растровой матрицы, плотность размещения пикселей, которую обычно указывают в количестве точек на дюйм (dpi, от англ.
    dots per inch), и правила перечисления пикселей (например, слева направо и сверху вниз сначала слева направо нумеруются все пиксели в верхней строке, затем нумерация продолжается наследующей строке, лежащей ниже, и т. д.).
    Итак, мы выяснили, как происходит пространственная дискретизация, позволяющая выделить конечное число пространственных элементов, информация о которых будет сохранена в памяти компьютера.
    Остаётся рассмотреть вопросы кодирования цвета каждого пространственного элемента Кодирование цвета

    Из курса физики вам известно, что цвет — это ощущение, которое возникает у человека при воздействии на его зрительный аппарат электромагнитного излучения с длиной волны в диапазоне от 380 до 760 нм. В табл. 3.11 показана зависимость цвета от длины волны видимого спектра. Ученым долгое время не удавалось объяснить процесс цветовосприятия. Первые серьёзные результаты в этой области были получены Исааком Ньютоном (1643–1727), который описал составную природу белого света, выделив в его спектре семь основных (наиболее заметных) цветов — красный, оранжевый, жёл- тый, зелёный, голубой, синий, фиолетовый.
    1)
    Нанометр (нм) — единица измерения длины в Международной системе единиц (СИ, равная одной миллиардной части метра тем Кодирование графической информации

    §15
    Таблица Зависимость цвета от длины волны видимого спектра
    Длина волны, нм
    Цвет
    620–760
    красный
    585–620
    оранжевый
    575–585
    жёлтый
    550–575
    жёлто-зелёный
    510–550
    зелёный
    480–510
    голубой (сине-зелёный)
    450–480
    синий
    380–450
    фиолетовый
    Позднее, в 1756 году, выдающийся русский учёный МВ. Ломоносов (1711–1765), исследуя вопросы окрашивания стёкол, обнаружил, что для придания стеклу любого цветового оттенка достаточно использовать всего три основные краски, смешивая их в определённых пропорциях. Спустя столетие эти факты были теоретически обобщены немецким учёным Германом Грассманом (1809–1877), сформулировавшим законы синтеза цвета. Наиболее важными из них для понимания сути цвето- воспроизведения и цветового кодирования являются следующие два закона.
    Закон трёхмерности: с помощью трёх линейно независимых цветов можно однозначно выразить любой цвет. Цвета считаются линейно независимыми, если никакой из них нельзя получить путём смешения остальных.
    Закон непрерывности при непрерывном изменении пропорции, в которой взяты компоненты цветовой смеси, получаемый цвет также меняется непрерывно. На основании законов Грассмана можно сделать вывод, что любому цвету однозначно соответствует определённая точка трёх- мерного пространства. Действительно, каждая цветовая модель задаёт некоторую систему координат, в которой основные цвета модели играют роль базисных векторов, а цвета можно рассматривать как точки или векторы в трёхмерном цветовом пространстве
    150
    1   ...   7   8   9   10   11   12   13   14   ...   21


    написать администратору сайта