Кодирование информации. Кодирование информации Общие сведения о кодировании информации Кодирование числовой информации
Скачать 0.81 Mb.
|
Кодирование информации
Кодирование и декодированиеДля обмена информацией с другими людьми человек использует естественные языки. Наряду с естественными языками были разработаны формальные языки для профессионального применения их в какой-либо сфере. Представление информации с помощью какого-либо языка часто называют кодированием.Код — набор символов (условных обозначений) для представления информации.Код — система условных знаков (символов) для передачи, обработки и хранения информации(со общения).Кодирование — процесс представления информации (сообщения) в виде кода.Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.Способы кодирования информацииДля кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств.Если надо записать текст в темпе речи — используем стенографию; если надо передать текст за границу — используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, — записываем его по правилам грамматики русского языка.«Добрый день, Дима!»«Dobryi den, Dima»Способы кодирования информацииВыбор способа кодирования информации может быть связан с предполагаемым способом ее обработки.Покажем это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число «сорок семь". Используя же алфавит арабской десятичной системы счисления, пишем «47». Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: " сорок семь умножить на сто двадцать пять" или «47x 125"? Очевидно — вторая.Шифрование сообщенияВ некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа.В таком случае секретный текст шифруется.В давние времена шифрование называлось тайнописью.Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование —процесс обратного преобразования, при котором восстанавливается исходный текст.Шифрование — это тоже кодирование, но с засекреченным методом, известным только источнику и адресату.Методами шифрования занимается наука под названием криптография.Оптический телеграф ШаппаВ 1792 году во Франции Клод Шапп создал систему передачи визуальной информации, которая получила название «Оптический телеграф».В простейшем виде это была цепь типовых строений, с расположенными на кровле шестами с подвижными поперечинами, которая создавалась в пределах видимости одно от другого. Шесты с подвижными поперечинами — семафоры — управлялись при помощи тросов специальными операторами изнутри строений. Шапп создал специальную таблицу кодов, где каждой букве алфавита соответствовала определенная фигура, образуемая Семафором, в зависимости от положений поперечных брусьев относительно опорного шеста.Система Шаппа позволяла передавать сообщения на скорости два слова в минуту и быстро распространилась в Европе. В Швеции цепь станций оптического телеграфа действовала до 1880 года.Первый телеграфПервым техническим средством передачи информации на расстояние стал телеграф, изобретенный в1837 году американцем Сэмюэлем Морзе.Телеграфное сообщение — это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату.Изобретатель Сэмюель Морзе изобрел удивительный код(Азбука Морзе, код Морзе, «Морзянка»), который служит человечеству до сих пор. Информация кодируется тремя «буквами»: длинный сигнал (тире), короткий сигнал (точка) и отсутствие сигнала (пауза) для разделения букв. Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.Самым знаменитым телеграфным сообщением является сигнал бедствия "SOS" (Save Our Souls - спасите наши души). Вот как он выглядит: «• • • – – – • • •»Азбука Морзе
Азбука Морзе
Первый беспроводной телеграф (радиоприемник)7 мая 1895 года российский ученый Александр Степанович Попов на заседании Русского Физико-Химического Общества продемонстрировал прибор, названный им "грозоотметчик", который был предназначен для регистрации электромагнитных волн. Этот прибор считается первым в мире аппаратом беспроводной телеграфии, радиоприемником. В 1897 году при помощи аппаратов беспроводной телеграфии Попов осуществил прием и передачу сообщений между берегом и военным судном.В 1899 году Попов сконструировал модернизированный вариант приемника электромагнитных волн, где прием сигналов (азбукой Морзе) осуществлялся на головные телефоны оператора.В 1900 году благодаря радиостанциям, построенным на острове Гогланд и на российской военно-морской базе в Котке под руководством Попова, были успешно осуществлены аварийно-спасательные работы на борту военного корабля "Генерал-адмирал Апраксин", севшего на мель у острова Гогланд. В результате обмена сообщениями, переданным методом беспроводной телеграфии, экипажу российского ледокола Ермак была своевременно и точно передана информация о финских рыбаках, находящихся на оторванной льдине.Телеграфный аппарат БодоРавномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце XIX века. В нем использовалось всего два разных вида сигналов. Не важно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. Длина кода всех символов одинаковая и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов — это знак текста. Поэтому пропуск не нужен.Код называется равномерным, если длина кода всех символов равна.Код Бодо — это первый в истории техники способ двоичного кодирования, информации. Благодаря этой идее удалось создать буквопечатающий телеграфный аппарат, имеющий вид пишущей машинки. Нажатие на клавишу с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передаетсяпо линии связи.В честь Бодо была названа единица скорости передачи информации — бод.В современных компьютерах для кодирования текста также применяется равномерный двоичный код.Представление (кодирование) чиселДвоичное кодирование в компьютереВся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр: 0 и 1. Эти два символа принято называть двоичными цифрами или битами.С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.Почему двоичное кодированиеС точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:0 – отсутствие электрического сигнала;1 – наличие электрического сигнала.Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.Система счисленияДля записи информации о количестве объектов используются числа. Числа записываются с помощью набора специальных символов.Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.Виды систем счисленияСИСТЕМЫ СЧИСЛЕНИЯ ПОЗИЦИОННЫЕ НЕПОЗИЦИОННЫЕ В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе. XXI В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции). 2011 Непозиционные системы счисленияКаноническим примером фактически непозиционной системы счисления является римская, в которой в качестве цифр используются латинские буквы:I обозначает 1, V - 5, X - 10, L - 50, C - 100, D - 500, M -1000.Натуральные числа записываются при помощи повторения этих цифр.Например, II = 1 + 1 = 2, здесь символ I обозначает 1 независимо от места в числе.Для правильной записи больших чисел римскими цифрами необходимо сначала записать число тысяч, затем сотен, затем десятков и, наконец, единиц.Пример: число 2988. Две тысячи МM, девять сотен CM, восемьдесят LXXX, восемь VIII. Запишем их вместе: MCMLXXXVIII.МMCMLXXXVIII = 1000+1000+(1000-100)+(50+10+10+10)+5+1+1+1 = 2988Для изображения чисел в непозиционной системе счисления нельзя ограничится конечным набором цифр. Кроме того, выполнение арифметических действий в них крайне неудобно.Древнеегипетская десятичная непозиционная система счисления.
Алфавитные системы счисления.
Древнерусская алфавитная система счисления Позиционные системы счисленияВ позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции).Например, 11 – это одиннадцать, а не два: 1 + 1 = 2 (сравните с римской системой счисления). Здесь символ 1 имеет различное значение в зависимости от позиции в числе.Первые позиционные системы счисленияСамой первой такой системой, когда счетным "прибором" служили пальцы рук, была пятеричная.Некоторые племена на филиппинских островах используют ее и в наши дни, а в цивилизованных странах ее реликт, как считают специалисты, сохранился только в виде школьной пятибалльной шкалы оценок.Двенадцатеричная система счисленияСледующей после пятеричной возникла двенадцатеричная система счисления. Возникла она в древнем Шумере. Некоторые учёные полагают, что такая система возникала у них из подсчёта фаланг на руке большим пальцем. Широкое распространение получила двенадцатеричная система счисления в XIX веке. На ее широкое использование в прошлом явно указывают названия числительных во многих языках, а также сохранившиеся в ряде стран способы отсчета времени, денег и соотношения между некоторыми единицами измерения. Год состоит из 12 месяцев, а половина суток состоит из 12 часов. Элементом двенадцатеричной системы в современности может служить счёт дюжинами. Первые три степени числа 12 имеют собственные названия: 1 дюжина = 12 штук; 1 гросс = 12 дюжин = 144 штуки; 1 масса = 12 гроссов = 144 дюжины = 1728 штук.Английский фунт состоит из 12 шиллингов.Следующая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр!В более позднее время использовалась арабами, а также древними и средневековыми астрономами. Шестидесятеричная система счисления, как считают исследователи, являет собой синтез уже вышеупомянутых пятеричной и двенадцатеричной систем.Какие позиционные системы счисления используются сейчас?В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления.Двоичная, восьмеричная (в настоящее время вытесняется шестнадцатеричной) и шестнадцатеричная система часто используется в областях, связанных с цифровыми устройствами, программировании и вообще компьютерной документации.Современные компьютерные системы оперируют информацией представленной в цифровой форме.Десятичная система счисленияДесятичная система счисления — позиционная система счисления по основанию 10.Предполагается, что основание 10 связано с количеством пальцев рук у человека.Наиболее распространённая система счисления в мире.Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.Двоичная система счисленияДвоичная система счисления — позиционная система счисления с основанием 2.Используются цифры 0 и 1.Двоичная система используется в цифровых устройствах, поскольку является наиболее простой и удовлетворяет требованиям:
Алфавит десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления
Соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления
Количество используемых цифр называется основанием системы счисления. При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе: 12310 — это число 123 в десятичной системе счисления; 110112 — то же число, но в двоичной системе. Двоичное число 1111011 можно расписать в виде: 110112 = 1*24 + 1*23 + 0*22 + 1*21 + 1*20. Перевод чисел из одной системы счисления в другуюПеревод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.Переведем десятичное число 9910 в двоичную систем счисления (основание системы счисления p=2). В итоге получили 10000112=9910Числа в компьютереЧисла в компьютере хранятся и обрабатываются в двоичной системе счисления. Последовательность нулей и единиц называют двоичным кодом.Специфической особенности представления чисел в памяти компьютера рассмотрим на других уроках по теме «системы счисления».
Международная кодировка ASCIIКодировка КОИ8-РКодировка CP1251Двоичное кодирование графической информацииЧеловек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые — зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее. Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.Приведем пример аналогового и дискретного представления информации.Положение тела на наклонной плоскости и на лестнице задается значениями координат X и У.При движении тела по наклонной плоскости его координаты могут принимать бесконечное множество непрерывно изменяющихся значений из определенного диапазона, а при движении по лестнице — только определенный набор значений, причем меняющихся скачкообразно.ДискретизацияПримером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного — изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью). Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.Виды компьютерных изображенийСоздавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования. Кодирование растровых изображенийРастровое изображение представляет собой совокупность точек (пикселей) разных цветов. Пиксель - минимальный участок изображения, цвет которого можно задать независимым образом.В процессе кодирования изображения производится его пространственная дискретизация.Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее). Качество изображения зависит от количества точек (чем меньше размер точки и, соответственно, больше их количество, тем лучше качество) и количества используемых цветов (чем больше цветов, тем качественнее кодируется изображение).Цветовые моделиДля представления цвета в виде числового кода используются две обратных друг другу цветовые модели: RGB или CMYK.
Цветовая модель RGBЦветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемых для кодирования цвета точки.Если кодировать цвет одной точки изображения тремя битами (по одному биту на каждый цвет RGB), то мы получим все восемь различных цветов.True ColorНа практике же, для сохранения информации о цвете каждой точки цветного изображения в модели RGB обычно отводится 3 байта (т.е. 24 бита) - по 1 байту (т.е. по 8 бит) под значение цвета каждой составляющей. Таким образом, каждая RGB-составляющая может принимать значение в диапазоне от 0 до 255 (всего 28=256 значений), а каждая точка изображения, при такой системе кодирования может быть окрашена в один из 16 777 216 цветов.Такой набор цветов принято называть True Color (правдивые цвета), потому что человеческий глаз все равно не в состоянии различить большего разнообразия.Кодирование векторных изображенийВекторное изображение представляет собой совокупность графических примитивов (точка, отрезок, эллипс…). Каждый примитив описывается математическими формулами. Кодирование зависти от прикладной среды.Достоинством векторной графики является то, что файлы, хранящие векторные графические изображения, имеют сравнительно небольшой объем.Важно также, что векторные графические изображения могут быть увеличены или уменьшены без потери качества.Графические форматы файловФорматы графических файлов определяют способ хранения информации в файле (растровый или векторный), а также форму хранения информации (используемый алгоритм сжатия).Наиболее популярные растровые форматы:
Графические форматы файлов
Двоичное кодирование звука. Представление видеоинформацииКодирование звукаИспользование компьютера для обработки звука началось позднее, нежели чисел, текстов и графики.Звук – волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.Звуковые сигналы в окружающем нас мире необычайно разнообразны. Сложные непрерывные сигналы можно с достаточной точностью представлять в виде суммы некоторого числа простейших синусоидальных колебаний. Причем каждое слагаемое, то есть каждая синусоида, может быть точно задана некоторым набором числовых параметров – амплитуды, фазы и частоты, которые можно рассматривать как код звука в некоторый момент времени.Временная дискретизация звукаВ процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина амплитуды.Таким образом непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность уровней громкости.Частота дискретизации – количество измерений уровня сигнала в единицу времени.Количество уровней громкости определяет глубину кодирования. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. При этом количество уровней громкости равно N = 2I = 216 = 65536.Представление видеоинформацииВ последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы. Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные.Представление видеоинформацииКазалось бы, если проблемы кодирования статической графики и звука решены, то сохранить видеоизображение уже не составит труда.Но это только на первый взгляд, поскольку при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой.Достаточно очевидное усовершенствование состоит в том, чтобы первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять лишь отличия от начального кадра (разностные кадры).Некоторые форматы видеофайловСуществует множество различных форматов представления видеоданных.
МультимедиаМультимедиа (multimedia, от англ. multi - много и media - носитель, среда) - совокупность компьютерных технологий, одновременно использующих несколько информационных сред: текст, графику, видео, фотографию, анимацию, звуковые эффекты, высококачественное звуковое сопровождение. Под словом «мультимедиа» понимают воздействие на пользователя по нескольким информационным каналам одновременно. Можно еще сказать так: мультимедиа – это объединение изображения на экране компьютера (в том числе и графической анимации и видеокадров) с текстом и звуковым сопровождением.Наибольшее распространение системы мультимедиа получили в области обучения, рекламы, развлечений.Вопросы:
Задания:
|