Практическая работа. Дискретное (цифровое) представление текстовой, графической, звуковой информации и видеоинформации
Скачать 34.07 Kb.
|
Практическая работа №3 Тема: Дискретное (цифровое) представление текстовой, графической, звуковой информации и видеоинформации. Цели: Приобрести практические навыки расчета количества информации. Изучить возможные способы кодирования информации. Ученик должен знать: принципы кодирования информации; функции языка как способа представления информации; основные единицы измерения информации; уметь: выполнять кодирование и декодирование информации; решать задачи на определение количества информации. Теоретическое обоснование. 1. Количество информации В вычислительной технике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд. Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28). Широко используются также ещё более крупные производные единицы информации: 1 Килобайт (Кбайт) = 1024 байт = 210 байт, 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт, 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт. В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт, 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт. За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации. 2. Измерение информации. Количество информации, заключенное в сообщении, определяется объемом знаний, который несет это сообщение получающему его человеку. При содержательном подходе возможна качественная оценка информации: полезная, безразличная, важная, вредная… Сообщение, уменьшающее неопределенность знаний человека в два раза, несет для него 1 бит информации. Пусть в некоторое сообщение содержаться сведения о том, что произошло одно из N равновероятностных событий. Тогда количество информации, заключенное в этом сообщении, –Х бит и число N связаны формулой: 2i=N. Пример1. В барабане для розыгрыша лотереи находится 32 шара. Сколько информации содержит сообщение о первом выпавшем номере (например, выпал шар №15) Решение: поскольку вытаскивание любого из 32 шаров равновероятностное, то количество информации об одном выпавшем номере находиться из уравнения: 2i=32. Но 32=25. Следовательно, i=5 бит. Очевидно, ответ не зависит от того, какой именно выпал номер. Алфавитный подход к измерению информации позволяет определить количество информации, заключенной в тексте. Множество символов, используемых при записи текста, называется алфавитом. Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен: I=K*i, где i – информационный вес одного символа в используемом алфавите (количество бит на один символ). Пример 2. Книга, набрана с помощью компьютера, содержит 150 страниц; на каждой странице–40 строк, в каждой строке – 60 символов. Какой объем информации в книге? Решение: мощность компьютерного алфавита равна 256. Один символ равен 1 байт информации. Значит, страница содержит 40*60=240 байт информации. Объем всей информации в книге : 240*150=360000 байт. 360000/1024=351,5625 Кбайт. Пример 3. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байт? Решение: переведем байты в биты: 1125*8=9000. Найдем общее количество символов в заданном тексте: 3*25*60=4500 символов. Далее определим информационный вес одного символа в используемом алфавите (количество бит на один символ) из формулы I=K*i, i=I/K. Подставим известные величины: i=9000/4500 i=2. Если информационный вес одного символа в используемом алфавите (количество бит на один символ)равен 2 , то мощность алфавита составляет 4 символа : 22=4. 3. Дискретное представление информации: кодирование цветного изображения в компьютере (растровый подход). Представление и обработка звука и видеоизображения. Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование. Кодирование– преобразование входной информации в форму, воспринимаемую компьютером, то есть двоичный код. Декодирование– преобразование данных из двоичного кода в форму, понятную человеку. С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента: 0 – отсутствие электрического сигнала; 1 – наличие электрического сигнала. Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных. Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук. Аналоговый и дискретный способ кодирования Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые — зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее. Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно. Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного– изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного–аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью). Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода. Дискретизация– это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов. Кодирование изображений Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования. Кодирование растровых изображений Растровое изображение представляет собой совокупность точек (пикселей) разных цветов. Пиксель– минимальный участок изображения, цвет которого можно задать независимым образом. В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее). Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0). Для четырех цветного – 2 бита. Для 8 цветов необходимо – 3 бита. Для 16 цветов – 4 бита. Для 256 цветов – 8 бит (1 байт). Качество изображения зависит от количества точек (чем меньше размер точки и, соответственно, больше их количество, тем лучше качество) и количества используемых цветов (чем больше цветов, тем качественнее кодируется изображение). Для представления цвета в виде числового кода используются две обратных друг другу цветовые модели: RGB или CMYK. Модель RGB используется в телевизорах, мониторах, проекторах, сканерах, цифровых фотоаппаратах… Основные цвета в этой модели: красный (Red), зеленый (Green), синий (Blue). Цветовая модель CMYK используется в полиграфии при формировании изображений, предназначенных для печати на бумаге. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемых для кодирования цвета точки. Если кодировать цвет одной точки изображения тремя битами (по одному биту на каждый цвет RGB), то мы получим все восемь различных цветов.
На практике же, для сохранения информации о цвете каждой точки цветного изображения в модели RGB обычно отводится 3 байта (то есть 24 бита) - по 1 байту (то есть по 8 бит) под значение цвета каждой составляющей. Таким образом, каждая RGB-составляющая может принимать значение в диапазоне от 0 до 255 (всего 28=256 значений), а каждая точка изображения, при такой системе кодирования может быть окрашена в один из 16 777 216 цветов. Такой набор цветов принято называть TrueColor (правдивые цвета), потому что человеческий глаз все равно не в состоянии различить большего разнообразия. Для того чтобы на экране монитора формировалось изображение, информация о каждой точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов. В современных компьютерах разрешение экрана обычно составляет 1280х1024 точек. Т.е. всего 1280 * 1024 = 1310720 точек. При глубине цвета 32 бита на точку необходимый объем видеопамяти: 32 * 1310720 = 41943040 бит = 5242880 байт = 5120 Кб = 5 Мб. Растровые изображения очень чувствительны к масштабированию (увеличению или уменьшению). При уменьшении растрового изображения несколько соседних точек преобразуются в одну, поэтому теряется различимость мелких деталей изображения. При увеличении изображения увеличивается размер каждой точки и появляется ступенчатый эффект, который можно увидеть невооруженным глазом. Кодирование векторных изображений Векторное изображение представляет собой совокупность графических примитивов (точка, отрезок, эллипс…). Каждый примитив описывается математическими формулами. Кодирование зависит от прикладной среды. Достоинством векторной графики является то, что файлы, хранящие векторные графические изображения, имеют сравнительно небольшой объем. Важно также, что векторные графические изображения могут быть увеличены или уменьшены без потери качества. Графические форматы файлов Форматы графических файлов определяют способ хранения информации в файле (растровый или векторный), а также форму хранения информации (используемый алгоритм сжатия). Наиболее популярные растровые форматы: BMP GIF JPEG TIFF PNG BitMaPimage (BMP)– универсальный формат растровых графических файлов, используется в операционной системе Windows. Этот формат поддерживается многими графическими редакторами, в том числе редактором Paint. Рекомендуется для хранения и обмена данными с другими приложениями. TaggedImageFileFormat (TIFF)– формат растровых графических файлов, поддерживается всеми основными графическими редакторами и компьютерными платформами. Включает в себя алгоритм сжатия без потерь информации. Используется для обмена документами между различными программами. Рекомендуется для использования при работе с издательскими системами. GraphicsInterchangeFormat (GIF)– формат растровых графических файлов, поддерживается приложениями для различных операционных систем. Включает алгоритм сжатия без потерь информации, позволяющий уменьшить объем файла в несколько раз. Рекомендуется для хранения изображений, создаваемых программным путем (диаграмм, графиков и так далее) и рисунков (типа аппликации) с ограниченным количеством цветов (до 256). Используется для размещения графических изображений на Web-страницах в Интернете. PortableNetworkGraphic (PNG)– формат растровых графических файлов, аналогичный формату GIF. Рекомендуется для размещения графических изображений на Web-страницах в Интернете. JointPhotographicExpertGroup (JPEG)– формат растровых графических файлов, который реализует эффективный алгоритм сжатия (метод JPEG) для отсканированных фотографий и иллюстраций. Алгоритм сжатия позволяет уменьшить объем файла в десятки раз, однако приводит к необратимой потере части информации. Поддерживается приложениями для различных операционных систем. Используется для размещения графических изображений на Web-страницах в Интернете. Двоичное кодирование звука Использование компьютера для обработки звука началось позднее, нежели чисел, текстов и графики. Звук– волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон. Звуковые сигналы в окружающем нас мире необычайно разнообразны. Сложные непрерывные сигналы можно с достаточной точностью представлять в виде суммы некоторого числа простейших синусоидальных колебаний. Причем каждое слагаемое, то есть каждая синусоида, может быть точно задана некоторым набором числовых параметров – амплитуды, фазы и частоты, которые можно рассматривать как код звука в некоторый момент времени. В процессе кодирования звукового сигнала производится его временная дискретизация– непрерывная волна разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина амплитуды. Таким образом непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность уровней громкости. Каждому уровню громкости присваивается его код. Чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание. Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации. Частота дискретизации– количество измерений уровня сигнала в единицу времени. Количество уровней громкости определяет глубину кодирования. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. При этом количество уровней громкости равно N = 216 = 65536. Представление видеоинформации В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы. Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные. Казалось бы, если проблемы кодирования статической графики и звука решены, то сохранить видеоизображение уже не составит труда. Но это только на первый взгляд, поскольку, как показывает разобранный выше пример, при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой. Достаточно очевидное усовершенствование состоит в том, чтобы первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять лишь отличия от начального кадра (разностные кадры). Существует множество различных форматов представления видеоданных. В среде Windows, например, уже более 10 лет (начиная с версии 3.1) применяется формат VideoforWindows, базирующийся на универсальных файлах с расширением AVI (AudioVideoInterleave – чередование аудио и видео). Более универсальным является мультимедийный формат QuickTime, первоначально возникший на компьютерах Apple. Ход работы: Изучить теоретическое обоснование. Выполнить практические задания по вариантам. Ответить на контрольные вопросы по указанию преподавателя. Оформить отчет. Практические задания: Задание №1. Используя таблицу символов, записать последовательность десятичных числовых кодов в кодировке Windows для своих ФИО, названия улицы, по которой проживаете. Таблица символов отображается в редакторе MSWord с помощью команды: вкладка Вставка→Символ→Другие символы В поле Шрифт выбираете TimesNewRoman, в поле из выбираете кириллица. Например, для буквы «А» (русской заглавной) код знака– 192. Пример:
Выполнение задания №1
Задание №2. Используя стандартную программу БЛОКНОТ, определить, какая фраза в кодировке Windows задана последовательностью числовых кодов и продолжить код. Запустить БЛОКНОТ. С помощью дополнительной цифровой клавиатуры при нажатой клавише ALT ввести код, отпустить клавишу ALT. В документе появиться соответствующий символ. Выполнение задания №2
Вариант 1 Сообщение о том, что из коробки достали один карандаш несет 6 бит информации. Сколько карандашей в коробке? При угадывании целого числа в некотором диапазоне получено 9 бит информации. Сколько чисел содержит диапазон? Подсчитать в килобайтах количество информации в тексте, если текст состоит из 800 символов, а мощность используемого алфавита – 128 символов. Сколько символов в тексте, если мощность алфавита – 64 символа, а объем информации, содержащейся в нем – 1,5 Кбайта? Объем оперативной памяти компьютера содержит 163 840 машинных слов, что составляет 0,625 Мбайт. Сколько бит содержит каждое машинное слово? Определите объем памяти необходимый для размещения следующей информации (в кодах ASCII).«Каталоги низких уровней вкладываются в каталоги более высоких уровней и являются для них вложенными. Верхним уровнем вложенности иерархической структуры является корневой каталог.» Используя правило двоичного кодирования, определите минимальную длину данной последовательности символов в битах 123$$333122321$$1 13Мб в байты 128Мб в гигабайты 0,12Мб в биты 0,01Гб в килобайты 40960 бит в килобайты Вариант 2 1. Группа школьников пришла в бассейн, в котором 8 дорожек для плавания. Тренер сообщил, что группа будет плавать на дорожке номер 5. Сколько информации получили школьники из этого сообщения? 2. Сообщение о том, что ваш друг живет на 9 этаже, несет 5 бит информации. Сколько этажей в доме? 3. Информационное сообщение объемом 1/512 част Мбайта содержит 2048 символов. Сколько символов содержит алфавит, с помощью которого было записано это сообщение? 4. Сколько символов содержит сообщение записанное с помощью 32-х символьного алфавита, если объем его составил 1/128 част Мбайта? 5. В рулетке общее количество лунок равно 128. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок? 6. Используя правило двоичного кодирования, определите минимальную длину данной последовательности символов в битах. ()*&(((())))^&&&*$( 7. Определите объем памяти необходимый для размещения следующей информации (в кодах ASCII). «Каталогом называется специальный файл, в котором регистрируются другие файлы. Если файл зарегистрирован в каталоге, это означает, что в последнем содержится вся характеризующая файл информация и сведения о том, в каком месте диска файл расположен.» 8. 25Кб в биты 512Кб в гигабайты 0,5Мб в байты 0,075Гб в мегабайты 81920 бит в килобайты Вариант 3 В рулетке общее количество лунок равно 32. Какое количество информации мы получаем в сообщении об остановке шарика на номере 16. При угадывании целого числа в некотором диапазоне было получено 7 бит информации. Сколько чисел содержит диапазон? Для записи текста использовался 256 символьный алфавит. Какое количество информации в битах содержит сообщение, содержащее 3072 символа. Сколько символов в тексте содержащем 2 Кбайта информации, если мощность алфавита равна 128 символа. Объем оперативной памяти компьютера составляет 1/8 часть Мбайта. Сколько машинных слов составляют оперативную память, если одно машинное слово содержит 64 бита. Используя правило двоичного кодирования, определите минимальную длину данной последовательности символов в битах. ****???!!$$**!$?*?? Определите объем памяти необходимый для размещения следующей информации (в кодах ASCII). «Файловая система определяет способы организации и средства обслуживания файловой структуры, преобразуя FAT-таблицы в иерархическую структуру для обеспечения быстрого и удобного доступа к данным, простого и понятного пользователю способа задания адреса данных.» 8. 256Мб в гигабайты 12,8Мб в байты 0,12Мб в килобайты 0,001Гб в байты 73728 бит в килобайты Содержание отчета: Тему, цель. Таблица кодировки. Решение практических заданий по вариантам. Вывод. Контрольные вопросы: Опишите способ измерения информации при содержательном подходе. Опишите способ измерения информации при алфавитном подходе. Чем отличается непрерывный сигнал от дискретного? Что такое частота дискретизации и на что она влияет? В чем суть метода кодирования звука? Какие звуковые форматы вы знаете? Какие этапы кодирования видеоинформации вам известны? Какие форматы видео файлов вы знаете? Литература Основные источники (ОИ): Таблица 2б
Дополнительные источники (ДИ): Таблица 2в
|