Учебник для спо 4е издание, переработанное и дополненное
Скачать 0.65 Mb.
|
Глава 1. Информация и кодирование кращениях и аббревиатурах с синим — Blue). Данный режим представления графики использует 32 разряда и тоже назы- вается полноцветным (True Color). Если уменьшить количе- ство двоичных разрядов, используемых для кодировки каж- дой точки, в два раза, то можно сократить объем данных, но диапазон цветов при этом уменьшится до 65 536 оттен- ков. Такое кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color. При работе с цветной графикой применяется индексный метод кодирования. Здесь код каждой точки растра хранит не цвет, а только его номер (индекс) в некоей справочной таблице, называемой палитрой, которая должна обязатель- но прикладываться к графическим данным. Графическая информация на экране дисплея формиру- ется из точек (пикселей). Пиксел — от picture element, что означает элемент изображения. В современных компьюте- рах разрешающая способность (количество точек на экране дисплея) зависит от видеоадаптера и может меняться про- граммно. Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65 536 цветов (High Color), 16 777 216 цветов (True Color). Таким образом, например, для режима High Color на один пиксель приходится 16 бит памя- ти и при разрешающей способности экрана 800 600 точек требуемый для хранения его изображения объем видеопамя- ти составит V = 2 байта · 480000 = 960 000 байт = 937,5 Кбайт. Аналогично рассчитывается объем видеопамяти, необходи- мый для хранения битовой карты изображения при других видеорежимах. В видеопамяти компьютера хранится бито- Рис. 1.1. Система RGB в виде цветовых кругов Синий Красный Пурпурный Голубой Белый Желтый Зеленый 30 Глава 1. Информация и кодирование вый план, представляющий собой двоичный код изображе- ния, который считывается в соответствии с частотой кадро- вой развертки и отображается на экране монитора. Кодирование звуковой информации Звук — непрерывный сигнал. При двоичном кодирова- нии аналогового звукового сигнала непрерывный сигнал дискретизируется, т.е. заменяется серией отдельных выбо- рок с заданной периодичностью. Качество двоичного коди- рования зависит от двух параметров: количества распозна- ваемых дискретных уровней сигнала и количества выборок в секунду. Периодичность выборок определяется частотой дискретизации. Оцифрованный звуковой сигнал соответст- вует исходному аналоговому сигналу в том случае, если ча- стота дискретизации не меньше удвоенной частоты наивыс- шей гармоники этого исходного сигнала. Человек слышит звуки в диапазоне от 20 Гц до 20 кГц, поэтому максималь- ная частота дискретизации должна быть не менее 40 кГц. Одновременно с дискретизацией осуществляется кван- тование отсчетов по амплитуде — измерение мгновенных значений амплитуды и преобразование их в цифровой код. Точность измерения зависит от количества разрядов кодо- вого слова. При длине кодового слова 8 бит количество гра- даций амплитуды составляет 256, при 16 битах — 65 536. На рис. 1.2 показан процесс дискретизации и квантования аналогового сигнала 3-разрядными числами. Для стереозвука дискретизация и квантование выполня- ются отдельно и независимо для левого и правого каналов. Для записи и воспроизведения звука в компьютерах исполь- Рис. 1.2. Дискретизация по времени и квантование по уровню аналогового сигнала X A 111 110 101 100 011 010 001 000 У ро ве нь кв ан то ва ни я Исходный аналоговый сигнал Дискретный сигнал 3-разрядное квантование сигнала 1.4. Кодирование информации 31 зуются звуковые карты, которые обеспечивают 8- или 16-бит- ные выборки. Качество звука в дискретной форме может быть плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и доста- точно высоким (качество аудио-CD) при 16 битах и 44 кГц. Объем аудиофайла с длительностью звучания 1 с при хоро- шем качестве звука составит V = 16 бит · 44 000 = 88 Кбайт. Для уменьшения объема хранения аудиоинформации при- меняют методы компрессии (сжатия), уменьшающие объем без ухудшения качества до 20% первоначального. При генерировании звучания различных музыкальных инструментов используются синтезаторы, применяющие такие методы, как метод частотной модуляции (FM-синтез) и таблицы волн (WТ-синтез). Кодирование видеоинформации Видеоинформация формируется в результате организа- ции потокового видео — последовательности «движущихся изображений». Оцифровка видеофрагмента связана с про- блемами обеспечения очень больших скорости обмена и объема данных. Проблема повышения скорости обмена решается путем разработки быстродействующих накопите- лей данных. Для уменьшения объема данных, содержащихся в видеопотоке (до 9 Мб/с), для записи информации в ЭВМ обычно применяют кодирование со сжатием потока данных. Размер файла сжатого дискретного неподвижного изображе- ния зависит от четырех параметров: площади изображения, разрешения, числа битов, необходимых для представления пикселя, и коэффициента сжатия. В видеофильме к этому еще добавляется число образующих его неподвижных изоб- ражений. Выбор коэффициента сжатия — компромисс между пропускной способностью системы и качеством восстанав- ливаемого изображения. Чем выше коэффициент сжатия, тем ниже качество изображения. Поэтому выбор указанных параметров обосновывается технико-экономическим ана- лизом и алгоритмом сжатия. Существует немало технологий сжатия/восстановления изображений. Наиболее популярная предложена объеди- ненной группой экспертов в области фотографии (Joint Photographic Experts Group, JPEG) и позволяет сократить размеры графического файла в 10—12 раз. Для сжатия ви- деоинформации применяют технологию стандарта MPEG Глава 1. Информация и кодирование 32 зуются звуковые карты, которые обеспечивают 8- или 16-бит- ные выборки. Качество звука в дискретной форме может быть плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и доста- точно высоким (качество аудио-CD) при 16 битах и 44 кГц. Объем аудиофайла с длительностью звучания 1 с при хоро- шем качестве звука составит V = 16 бит · 44 000 = 88 Кбайт. Для уменьшения объема хранения аудиоинформации при- меняют методы компрессии (сжатия), уменьшающие объем без ухудшения качества до 20% первоначального. При генерировании звучания различных музыкальных инструментов используются синтезаторы, применяющие такие методы, как метод частотной модуляции (FM-синтез) и таблицы волн (WТ-синтез). Кодирование видеоинформации Видеоинформация формируется в результате организа- ции потокового видео — последовательности «движущихся изображений». Оцифровка видеофрагмента связана с про- блемами обеспечения очень больших скорости обмена и объема данных. Проблема повышения скорости обмена решается путем разработки быстродействующих накопите- лей данных. Для уменьшения объема данных, содержащихся в видеопотоке (до 9 Мб/с), для записи информации в ЭВМ обычно применяют кодирование со сжатием потока данных. Размер файла сжатого дискретного неподвижного изображе- ния зависит от четырех параметров: площади изображения, разрешения, числа битов, необходимых для представления пикселя, и коэффициента сжатия. В видеофильме к этому еще добавляется число образующих его неподвижных изоб- ражений. Выбор коэффициента сжатия — компромисс между пропускной способностью системы и качеством восстанав- ливаемого изображения. Чем выше коэффициент сжатия, тем ниже качество изображения. Поэтому выбор указанных параметров обосновывается технико-экономическим ана- лизом и алгоритмом сжатия. Существует немало технологий сжатия/восстановления изображений. Наиболее популярная предложена объеди- ненной группой экспертов в области фотографии (Joint Photographic Experts Group, JPEG) и позволяет сократить размеры графического файла в 10—12 раз. Для сжатия ви- деоинформации применяют технологию стандарта MPEG Глава 1. Информация и кодирование 32 (Motion Picture Expert Group). Алгоритм MPEG преобразует изображение в поток сжатых данных, учитывая то, что чело- век, видящий движущийся объект, сосредоточивает внимание на нем, а неподвижный фон воспринимает в меньшей степени. Это позволяет выделять меняющиеся и «замороженные» фрагменты в кадре: актер движется, а декорация не меняется, что позволяет экономить на размере информации, основ- ную картинку оцифровать один раз, а далее фиксировать и передавать только изменения. Видеоформат MPEG-1, со- зданный в конце 1980-х гг. и использовавшийся в Video-CD, уступил место более качественному MPEG-2, а новый стан- дарт MPEG-4, разработанный фирмой Microsoft в 1999 г., и его модификация DivX позволили размещать видеофильм хорошего качества на обычном компакт-диске. Мультимедиаинформация — сочетание текстовой, звуко- вой, графической, видеоинформации, представляемой на экране компьютера или мультимедиапроектора. Мультимедиа- информация обладает огромными объемами, поэтому сжима- ется программами сжатия, а перед воспроизведением восста- навливается, как говорят, «на лету» по мере поступления потока данных. Мультимедийные компьютерные программы позволяют формировать параллельные потоки информации: текстовой, визуальной и звуковой. 1.5. Измерение информации Мера информации Измерение информации может рассматриваться как оп- ределение ее количества и объема данных. В зависимости от формы адекватности информации эти параметры имеют разную интерпретацию. Синтаксическая мера информации не выражает смысло- вого отношения к объекту, и объем данных в сообщении из- меряется количеством символов (разрядов) в этом сообще- нии. В двоичной системе количество разрядов измеряется в битах, в десятичной системе счисления — в дитах. Так, со- общение в десятичной системе счисления в виде числа 57 332 имеет объем данных 5 дит, а сообщение в двоичной системе 01101111 — 8 бит. Количество информации на син- таксическом уровне связано с понятием неопределенности состояния системы (энтропии системы), которое было сформулировано К. Шенноном, и измеряется изменением (уменьшением) неопределенности системы. 33 1.5. Измерение информации Для измерения смыслового содержания информации на семантическом уровне применяется тезаурусная мера. Теза- урус — совокупность сведений, которыми располагает поль- зователь или система. Прагматическая мера информации определяет полез- ность информации для достижения пользователем постав- ленной цели. Единицы измерения информации Бит — минимальная единица измерения информации, количество информации, которым описывается состояние «включен» (1) или «выключен» (0). Слово «бит» произо- шло от Binary Digit (двоичная цифра). Именно такое опреде- ление единицы «бит» и дано выше в подразделе «Кодирова- ние чисел». Есть ли электрическое напряжение на выводах схемы, есть ли электрический заряд в ячейке памяти, какое из двух возможных противоположных направлений намаг- ниченности в данной области магнитного носителя, отража- ет ли свет лазерный оптический диск — все это вопросы, требующие ответа Да или Нет, один из которых трактуется как логическая единица, а второй — как логический нуль, поэтому электронный способ счета основан всего на двух цифрах, 0 и 1. Именно данные в формате этих цифр поруча- ется хранить компьютерной памяти и обрабатывать вычис- лительной системе. Байт — единица измерения количества информации, объема памяти и емкости запоминающего устройства. В па- мяти ЭВМ байт — наименьшая адресуемая единица данных, обрабатываемая как единое целое (в первых компьютерах за раз могло обрабатываться число длиной 8 бит), поэтому в качестве единицы измерения объема компьютерной ин- формации выбрана более крупная, чем бит, единица инфор- мации — байт, последовательность 8 бит, т.е. 1 байт = 8 бит. В символьных (текстовых) данных каждый символ ко- дируется (обозначается) одним байтом. Уникальное 8-би- товое обозначение (код) получают заглавные и строчные буквы английского и русского алфавитов, цифры от 0 до 9, знаки препинания, другие символы (процент, номер) и не- которые управляющие коды передачи информации. На од- ной машинописной странице при размещении 50 строк и 60 символов текста в одной строке помещается 3 тыс. симво- лов, следовательно, для хранения такого текста потребуется 3 тыс. байт машинной памяти. 34 Глава 1. Информация и кодирование Для измерения смыслового содержания информации на семантическом уровне применяется тезаурусная мера. Теза- урус — совокупность сведений, которыми располагает поль- зователь или система. Прагматическая мера информации определяет полез- ность информации для достижения пользователем постав- ленной цели. Единицы измерения информации Бит — минимальная единица измерения информации, количество информации, которым описывается состояние «включен» (1) или «выключен» (0). Слово «бит» произо- шло от Binary Digit (двоичная цифра). Именно такое опреде- ление единицы «бит» и дано выше в подразделе «Кодирова- ние чисел». Есть ли электрическое напряжение на выводах схемы, есть ли электрический заряд в ячейке памяти, какое из двух возможных противоположных направлений намаг- ниченности в данной области магнитного носителя, отража- ет ли свет лазерный оптический диск — все это вопросы, требующие ответа Да или Нет, один из которых трактуется как логическая единица, а второй — как логический нуль, поэтому электронный способ счета основан всего на двух цифрах, 0 и 1. Именно данные в формате этих цифр поруча- ется хранить компьютерной памяти и обрабатывать вычис- лительной системе. Байт — единица измерения количества информации, объема памяти и емкости запоминающего устройства. В па- мяти ЭВМ байт — наименьшая адресуемая единица данных, обрабатываемая как единое целое (в первых компьютерах за раз могло обрабатываться число длиной 8 бит), поэтому в качестве единицы измерения объема компьютерной ин- формации выбрана более крупная, чем бит, единица инфор- мации — байт, последовательность 8 бит, т.е. 1 байт = 8 бит. В символьных (текстовых) данных каждый символ ко- дируется (обозначается) одним байтом. Уникальное 8-би- товое обозначение (код) получают заглавные и строчные буквы английского и русского алфавитов, цифры от 0 до 9, знаки препинания, другие символы (процент, номер) и не- которые управляющие коды передачи информации. На од- ной машинописной странице при размещении 50 строк и 60 символов текста в одной строке помещается 3 тыс. симво- лов, следовательно, для хранения такого текста потребуется 3 тыс. байт машинной памяти. 34 Глава 1. Информация и кодирование Для записи чисел короче 8 бит в байтах добавляются слева нули (см. табл. 1.1). Левые нули не меняют двоичное число, но создают единую форму записи чисел — 8 бит на любое число от 0 до 255. В десятичной системе счисления укрупненные единицы измерения обозначаются приставками к названию кило, Мега, Гига, что соответствует увеличению численного зна- чения на множитель десять в степени: 10 3 = 1000 (тысяча), 10 6 =1 000 000 (миллион), 10 9 = 1 000 000 000 (миллиард), т.е. переход к следующей, более крупной, единице сопровож- дается умножением на 1000 (10 3 ). В двоичной системе укруп- ненные единицы измерения тоже обозначаются приставка- ми к названию кило, Мега, Гига, Тера, Пета, Экза, но они увеличивают численное значение на множитель 2 в степени: 2 10 , 2 20 , 2 30 , 2 40 , 2 50 , 2 60 , т.е. переход к следующей, более круп- ной, единице сопровождается умножением на 2 10 = 1024: • 1 Кбайт = 1024 байт = 2 10 байт; • 1 Мбайт = 1024 Кбайт = 2 20 байт; • 1 Гбайт = 1024 Мбайт = 2 30 байт; • 1 Тбайт = 1024 Гбайт = 2 40 байт; • 1 Пбайт = 1024 Гбайт = 2 50 байт; • 1 Эбайт = 1024 Пбайт = 2 60 байт. Передача информации по каналам связи характеризуется скоростью передачи данных: бит в секунду, Кбит/с, Мбит/с и др. Количество переданных бит удобнее считать в десятич- ной системе счисления, поэтому приставки в единицах изме- рения скорости связаны коэффициентом 1000 (10 3 ). Едини- ца измерения скорости передачи данных 1 бит/с называется бодом. Контрольные вопросы и задания 1. Сопоставьте понятия «информация» и «данные». 2. Каковы основные свойства информации? 3. Охарактеризуйте виды и формы представления информации. 4. Сопоставьте аналоговую и цифровую обработку информации. 5. Что называют системой счисления? 6. Что называют основанием системы счисления? 7. Запишите десятичные числа 12345 и 13113 в двоичной сис- теме. 8. Одинаковое или разное количество ячеек памяти необходи- мо для сохранения чисел из задания 7? 9. Запишите десятичные числа 12345, 6789 и 0,0009876543 в нормальной форме и в нормализованном виде. Контрольные вопросы и задания 35 10. В чем различие систем кодирования цвета RGB и CMYK? 11. Размер рисунка на экране монитора уменьшен вдвое по обеим координатам. Является ли такое преобразование неискажа- ющим? 12. Во сколько раз изменится размер файла с уменьшенным рисунком из задания 11? 13. В графическом редакторе Paint можно сохранить рисунок в файл с 24-разрядным представлением. Какому режиму (High Color или True Color) это соответствует? 14. Студент создает 20-минутный видеоролик для демонстра- ции на круглом столе. Каков будет размер несжатого файла, если демонстрация будет проходить на экране с разрешением 1024 768 при режиме в 256 цветов и с частотой обновления кадров 50 Гц? 15. В память каждого из двух компьютеров записано по 4-раз- рядному двоичному числу. Можно ли утверждать, что объем запи- санной информации равен 1 байту? 16. Сопоставьте определения единиц измерения информа- ции — бита и байта. 17. Каковы обозначения и значения укрупненных единиц из- мерения информации в двоичной системе счисления? |