Главная страница
Навигация по странице:

  • Отечественные схемы 8-разрядногокодирования текстов

  • Схема кодирования ISO-8859

  • Схема кодирования CP 866

  • Схема кодирования Windows-1251

  • Схема кодирования КОИ-8Р

  • Технология кодирования Unicode

  • Значение стандарта Unicode

  • Механизмы трансформации Unicode

  • Цифровое кодирование изображений

  • Растровая модель компьютерной графики

  • Трёхмерная графическая модель

  • Характеристика графических моделей

  • Кодирование растровых изображений

  • Оптическое разрешение изображения

  • Символьное кодирование. Кодирование символьное. Кодирование символьной, графической и мультимедийной информации в эвм дельтакодирование


    Скачать 54.33 Kb.
    НазваниеКодирование символьной, графической и мультимедийной информации в эвм дельтакодирование
    АнкорСимвольное кодирование
    Дата26.11.2021
    Размер54.33 Kb.
    Формат файлаdocx
    Имя файлаКодирование символьное.docx
    ТипДокументы
    #283427
    страница3 из 4
    1   2   3   4

    Схема кодирования ASCII

    Первая попытка стандартизировать коды символов для ЭВМ состоялась в 1963 г. в США, когда была создана первая версия стандарта ASCII (по-русскипроизносится как «аски»). Система кодирования получилась не совсем удачной, вызвала множество нареканий и вскоре была подготовлена вторая, более успешная версия, принятая в 1968 г. Она используется по сей день. Название стандарта расшифровывается какAmerican Standard Code for Information Interchange — Стандартный код внут-

    реннего информационного обмена США. Его ввёл в действие Национальный институт стандартиза-

    ции США (ANSIAmerican National Standard Institute).

    Таблица ASCII предназначена для семиразрядного кодирования 128 различных символов ( ). Этого достаточно, чтобы представить строчные и прописные буквы английского алфавита, знаки препинания, цифры, знаки математических действий, а также некоторые специальные знаки, например такие, как @, #, § и другие.

    Первые 32 кода таблицы ASCII (от 0 до 31) не представляются печатными знаками. Эта область отведена для размещения специальных символов:

    управляющих кодов (служат для управления удаленными устройствами, например принтерами);

    кодов форматирования (служат для специального оформления сообщений);

    кодов-разделителей(служат для структурирования передаваемых наборов данных).

    Отечественные схемы 8-разрядногокодирования текстов

    Активное внедрение национальных стандартов кодирования текстовых символов относится к 70-мгодам XX века. Эти процессы затронули всю Европу. Не остался в стороне и Советский Союз: были утверждены первые национальные8-разрядныесхемы кодирования.

    При 8-разрядномкодировании на запись символа отводится байт, имеющий 256 различимых состояний. Это позволяет кодировать двуязычные символьные наборы, например английский и русский. Англоязычную часть размещают в нижней части таблицы (коды от 0 до 127), а национальную часть — в верхней (коды от 128 до 255).

    Схема кодирования ISO-8859

    Формально для России эта схема кодирования имеет наивысший приоритет, потому что утверждена Международным институтом стандартизации (ISO International Standard Organization). В стандартеISO-8859 кодированию символов кириллицы (кириллицей называют письменную систему славянских языков) выделена так называемая «пятая кодовая страница», поэтому этот стандарт именуют такжеISO 8859-5.

    Нa практике документы, использующие эту схему, встречаются редко, особенно на компьютерах платформы IBM PC. Эту кодировку чаще можно встретить в документах, выполненных на компьютерах платформыSun. Несмотря на малую распространённость, эта система кодирования имеет

    77

    определенные перспективы. Она наиболее удобна для технических операций с текстовыми данными (поиск, преобразование и т.п.).

    Схема кодирования CP 866

    В 1974 г. Государственный комитет по стандартизации утвердил стандарт двоичного кодирования ГОСТ 19768-74,согласно которому внедрялись сразу две схемы кодирования. Одна из них получила названиеГОСТ-альтернативной.Срок действия стандарта предусматривался до 1980 г.

    Когда в начале 80-хгодов XX в. началась поставка в СССРIBM-совместимыхкомпьютеров, эта схема кодирования была принята для них в качестве основной. Впоследствии корпорацияIBM опубликовала эту схему в своём корпоративном стандарте, и схема получила наименованиеCP 866 (Code page 866).

    В настоящее время данной кодировкой пользуются только устаревшие программы, работающие под управлением операционной системы MS-DOS,поэтому эту кодировку называют такжекодировкой MS-DOS.Таким образом, сегодня мы имеем три разных наименования для одной и той же устаревшей схемы кодирования.

    Схема кодирования Windows-1251

    Схема кодирования Windows-1251 представляет наглядный пример корпоративного стандарта. Ввела её в действие корпорацияMicrosoft, производитель операционных систем и программных продуктов, предназначенных для автоматизации работы с документами. Никакими государственными или международными стандартами данная схема кодирования не поддержана, но, тем не менее, является самой распространённой на компьютерах платформыIBM PC. Она считается основной для документов, созданных в таких программах, какMicrosoft Word,Excel,Access и многих других. Большинстве русскоязычныхвеб-страницв Интернете имеют именно эту кодировку.

    Схема кодирования КОИ-8Р

    Схема кодирования КОИ-8была одной из двух, утверждённых Госстандартом СССР в 1974 г., и в те годы называлась ДКОИ (двоичный код обмена информацией). Она стала основной для сетевых ЭВМ, работающих под управлением операционной системыUNIX. Важную область использования этой схемы представлял международный документооборот социалистических стран, объединённых Советом Экономической Взаимопомощи (СЭВ).

    На персональных компьютерных платформах эту схему стали применять только после внедрения электронной почты Интернета. Это связано с тем, что первое время работа электронной почты обслуживалась ЭВМ под управлением операционной системы UNIX. Сегодня данная схемакодирования называетсяКОИ-8(код обмена информацией, восьмиразрядный). После распада СССР различают отдельные схемы кодирования для России и Украины:КОИ-8РиКОИ-8У.

    Технология кодирования Unicode

    Использование 8-разрядныхтаблиц кодирования заметно сдерживает возможности международного информационного обмена. Даже в одной стране могут одновременно действовать несколько стандартов, что затрудняет информационный обмен. Приходится создавать программы, способные работать с разными таблицами кодирования, а это нерациональные затраты средств.

    78

    Для разработки универсальной системы кодирования в конце 80-хгодов XX века был создан международный консорциумUnicode, который классифицировал национальные письменные системы и изучил их особенности. По результатам этой работы был разработан международный стандарт кодирования. В его основе лежат три положения.

    1.Каждый символ имеет уникальное имя. Символы могут совпадать по начертанию, но не по имени. Так, латинская, русская и греческая буквы «А» выглядят совершенно одинаково, но это разные символы с разными именами и кодами.

    2.Каждый символ имеет уникальный номер, определяющий его позицию в таблице кодирования.

    3.Каждый символ можно представить его позицией, выраженной16-разряднымдвоичным кодом.

    Теоретически, 16 битами можно закодировать 65536 различных символов. Однако на самом деле напрямую кодируется на 2048 символов меньше. Последние 2048 кодов разделены пополам и образуют дополнительную таблицу размером . В ячейках этой таблицы можно разместить ещё более миллиона символов. Эти символы кодируются парами 16-разрядныхзначений, одно из которых выражает номер строки, а другое — номер столбца. Числовые коды этих символов называютсясуррогатными парами. Суррогатные пары представляют собой технологию 32разрядного кодирования.

    Значение стандарта Unicode

    Считается, что современные потребности информационного обмена человечества требуют более 200 тысяч различных символов. Несколько десятков тысяч символов уже каталогизировано и зарегистрировано в основной таблице Unicode. Они в значительной степени охватывают символы алфавитов европейских языков, арабских, индийских и других слоговых систем, а также знаки иероглифических систем Японии, Китая и Кореи. На очереди кодирование знаков «мёртвых» письменных систем, что будет осуществлено с помощью механизма образования суррогатных пар.

    Познакомиться с тем, как закодированы первые десятки тысяч символов, можно на компьютере, работающем в операционной системе Windows XP. Это первая операционная система, полностью поддерживающая стандартUnicode. Запустите стандартную программуТаблица символов И откройте в нейкакой-либосимвольный набор, имеющий форматOpen Туре. Рекомендуется использовать шрифтArial Unicode MS. Сегодня это наиболее полный символьный набор из существующих в мире.

    Механизмы трансформации Unicode

    Наиболее распространённым заблуждением, касающимся схемы кодирования Unicode, является мнение о том, что «согласно этой схеме один символ кодируется двумя байтами». На самом деле стандарт ни слова не говорит о байтах, да и не может этого делать, потому что информационное содержание байта зависит от конкретных программ, которые записывают или воспроизводят данные. Стандарт обходит эту проблему, вообще избегая упоминаний о байтах.

    В то же время, для практических целей надо как-топредставлять данные байтами — этого ждут программы и устройства. Однако оказывается, что преобразовать 16 бит данных в байты можно далеко не единственным способом. Принципы этого преобразования называютсямеханизмами

    79

    трансформации Unicode (Unicode Transformation FormatUTF). Они реализуются конкретными про-

    граммами.

    Механизм UTF-8

    Механизм преобразования UTF-8 служит для обеспечения совместимости с устаревшими программами, не рассчитанными на работу с символами в кодировкеUnicode. Согласно этому механизму 16 бит кода представляются либо одним байтом (символы английского языка), либо двумя байтами (символы других европейских языков, в том числе русского), либо тремя байтами (символы восточных языков).

    Механизм UTF-16

    Этот механизм рассчитан на современные программы, способные работать с символами в кодировке Unicode. Согласно этому механизму все символы, независимо от языковой группы, представляются парами байтов. Однако при этом возникает вопрос о том, какой байт считать старшим, а какой — младшим.

    На компьютерах платформы IBM PC действует механизм преобразования UTF-16 BE(старший байт — последний), а компьютерахMacintosh — механизмUTF-16 LE (младший байт — последний). Если кодировка указана просто какUTF-16,следует полагать, что этоUTF-16 BE.

    Механизм UTF-7

    Механизм преобразования UTF-7 рассчитан на задачи информационного обмена по электронной почте. Он учитывает технические особенности систем обработки электронной почты и делает их работу более эффективной. Согласно механизмуUTF-7 двоичный код символа представляется несколькими байтами, причём для символов, относящихся к разным языкам, количество байтов может быть весьма различным (до шести байтов на символ).

    Цифровое кодирование изображений

    Тысячелетиями тексты служили основным средством информационного обмена в обществе. В текстовой форме передавались знания. Текстовыми документами сопровождались торговые сделки. Текстами записывались государственные законы и межгосударственные соглашения.

    Кроме текстов людям давно знакомы и графические формы представления информации (рисунки, картины, схемы). В сочетании с текстом они обычно выполняют вспомогательную роль поясняющего или иллюстрирующего средства.

    Автоматизация работы с изображением основана на его представлении математической моделью. В настоящее время для этой цели используют несколько классов математических моделей, из которых наиболее известны следующие три:

    растровые модели;

    векторные модели;

    модели трехмерной графики (3D-модели).

    80

    Все модели служат одной цели: представить непрерывное аналоговое графическое изображение дискретной последовательностью чисел. Модели различаются между собой элементарными объектами, а также тем, как свойства элементарных объектов изображений кодируются числами.

    Растровая модель компьютерной графики

    В растровой модели изображение считается прямоугольным с фиксированными размерами по ширине и высоте, состоящим из регулярной последовательности цветных точек (пикселов).

    Изображение, записанное в растровой модели, хранится как последовательность целых чисел, представляющих цвета отдельных точек в порядке развёртывания прямоугольника слева направо и сверху вниз. Растровая модель — базовая для воспроизведения изображений. Храниться они могут в любой модели, но на экране или на принтере всегда воспроизводятся как растровые, потому что физически и экран, и принтер являются растровыми устройствами, формирующими изображение из точек.

    Векторная модель

    В векторной модели изображение представляется коллекцией независимых графических объектов, имеющих различимые свойства. Элементарным объектом векторного изображения является линия (кривая). Она имеет следующие свойства:

    форму (описывается коэффициентами алгебраического уравнения третьего порядка);

    местоположение (описывается числовыми координатами характерных точек);

    параметры контура (выражают толщину и цвет линии);

    замкнутость контура (логическое свойство, имеющее двоичное значение «Да» или «Нет»);

    параметры внутренней заливки контура, если он замкнут (цвет, узор, текстура).

    Изображения, записанные в векторной модели, хранятся как таблицы свойств объектов. Благодаря такой форме хранения они очень экономно расходуют память компьютера, но для их воспроизведения и преобразования требуются весьма сложные процедуры.

    Трёхмерная графическая модель

    Элементом трёхмерного изображения является плоский треугольник (треугольник не может быть не плоским). Если нужно изобразить в пространстве более сложную фигуру, её предварительно разбивают на треугольники. Четырёхугольник делят на два треугольника, пятиугольник — на три и так далее. Объёмные тела сначала представляются коллекциями граней, после чего грани представляются коллекциями треугольников, где каждый треугольник — это коллекция трёх векторов, образующих его стороны, а каждый вектор описывается тремя числовыми значениями, выражающими его координаты относительно точки, принятой за начало отсчёта.

    Адекватность трёхмерной модели зависит от глубины декомпозиции. Чем больше треугольников содержит модель, тем лучше трёхмерная сцена отражает реальность, но тем больше операций требуется для её обработки. На практике количество элементов избирают, руководствуясь принципами экономической целесообразности и коммерческой достаточности. В современном кинематографе применяют объекты, состоящие из десятков тысяч треугольников. В то же время в целом характерные сцены могут насчитывать до нескольких миллионов элементов.

    81

    Перед воспроизведением происходит пересчёт пространственной модели в плоское растровое экранное изображение. Этот процесс называется визуализацией. В ходе визуализации компьютер рассчитывает:

    порядок расположения элементов по оси, направленной к наблюдателю (элементы, скрытые от наблюдателя другими элементами, не должны воспроизводиться на экране);

    какой стороной (лицевой или обратной) элементарные треугольники обращены к наблюдателю (у разных сторон могут быть разные свойства поверхностей);

    как поверхности элементарных треугольников взаимодействуют с лучами света, исходящими от источников освещения. Свет может поглощаться, отражаться, рассеиваться и преломляться. Характер взаимодействия зависит от физико-оптическихсвойств поверхности.

    Характеристика графических моделей

    Растровую модель удобно использовать в тех случаях, когда точность воспроизведения цветовых оттенков важнее точности передачи формы. Каждая точка растра способна иметь собственный цвет, и потому композиция точек может передавать весьма сложные механизмы образования оттенков. Растровую модель используют в цифровой фотографии, а также в полиграфии. В этой модели работают компьютерные мониторы и мультимедийное проекторы.

    Вместе с тем, разбиение изображения на точки (пикселы) при водит к искажению геометрических форм, что заметно при увеличении изображения. Этот дефект называется пикселизацией. Поэтому в тех случаях, когда форма объекта важнее, чем его цвет, используют векторные модели. Характерные примеры: чертежи, схемы, выкройки. Поскольку в векторной дели компьютер хранит не само изображение, а коэффициенты алгебраического уравнения, качество изображения зависит от масштаба его увеличения.

    Трёхмерные модели позволяют передать не только сведения о цвете и форме объектов, но и об их взаимодействии в пространстве сцены. Полностью достоинства трехмерных моделей раскрываются, когда изображение динамически меняется и зритель может управлять воспроизведением. Поэтому трёхмерные изображения либо просматривают с помощью специальных программ, позволяющих управлять углом зрения, их динамическое изменение предварительно записывают в видеоряд. Первый подход применяют в виртуальном моделировании, а второй — в кинематографии.

    Кодирование растровых изображений

    Изображение может храниться и обрабатываться в любой модели, но перед воспроизведением оно всегда преобразуется в растровое. Это связано с конструкцией и принципом действия большинства экранных и печатных устройств. Поэтому в автоматизированном информационном обмене растровые изображения играют особую роль.

    Схема кодирования растровых изображений — табличная. Кодирование выполняется в два этапа: сначала прямоугольное изображение представляется прямоугольной матрицей цветных точек, потом цвет каждой точки записывается числом или группой чисел.

    Оптическое разрешение изображения

    Кодирование растрового изображения начинают с представления его в виде прямоугольной матрицы точек. Параметр, характеризующий частоту следования точек, называется разрешающей

    82

    способностью изображения или оптическим разрешением. Оно измеряется количеством элементов изображения (в данном случае — пикселов), приходящимся на единицу длины изображения.

    Системной единицей измерения длины является, как известно метр (сантиметр, миллиметр). Однако в вычислительной техник традиционно используется внесистемная единица — дюйм, и оптическое разрешение измеряется количеством точек, приходящихся на один дюйм длины изображения — dpi, (dot per inch, англ.). Это грубое отступление от международных стандартов имеет столь прочные корни, что в большинстве случаев целесообразнее принять его к сведению, чем преодолевать. Так, например, максимальное оптическое разрешение технических устройств, выраженное в единицах dpi, является их стандартной технической характеристикой.
    1   2   3   4


    написать администратору сайта