Главная страница

10u-2a_Кодирование-I. Кодирование информации


Скачать 2.23 Mb.
НазваниеКодирование информации
Дата28.10.2022
Размер2.23 Mb.
Формат файлаppt
Имя файла10u-2a_Кодирование-I.ppt
ТипДокументы
#759279

Кодирование информации





§ 4. Дискретное кодирование
§ 5. Равномерное и неравномерное кодирование
§ 6. Декодирование
§ 7. Алфавитный подход к измерению количества информации

Кодирование информации


§ 4. Дискретное кодирование




Вспомним известное





Кодирование — это представление информации в форме, удобной для её хранения, передачи и автоматической обработки.
Код — это правило, по которому сообщение преобразуется в цепочку знаков.
Язык — это система знаков и правил, используемая для записи и передачи информации.
Формальный язык — это язык, в котором однозначно определяется значение каждого слова, а также правила построения предложений и придания им смысла.

Знаковые системы





Знак — это «заменитель» объекта, вызывает в сознании объект.
– пиктограмма
Символ — это знак, о значении которого люди договорились.
§ – параграф – рубль
Знаковая система определяется алфавитом (набором используемых знаков) и правилами выполнения операций с этими знаками.


Знаковая система в компьютерах?


?


010101

Аналоговые сигналы и устройства





Аналоговый сигнал — это сигнал, который в любой момент времени может принимать любые значения в заданном диапазоне.


Аналоговые компьютеры


невозможно «очистить» сигнал от помех при измерении сигнала вносится ошибка при копировании аналоговая информация искажается

Дискретные (цифровые) сигналы





1


0


1


1


0


время


U


0


U1


U0


T


2T


3T


4T


Дискретный сигнал — это последовательность значений, каждое из которых принадлежит некоторому конечному множеству.


Свойства:
сигнал изменяется только в отдельные моменты времени (дискретность по времени);
принимают только несколько возможных значений (дискретность по уровню).

Дискретность





Цель – максимально точно передавать сообщения при сильных помехах.


Pacta sunt servanda.


•— — •— ••• •—•—


01000011001


Компьютеры могут хранить и обрабатывать только дискретную информацию!


!


… закодированную с помощью конечного количества знаков некоторого алфавита.


Все виды информации нужно перевести в дискретный вид!


!

Дискретизация





Дискретизация — это представление единого объекта в виде множества отдельных элементов.


π


3,14


3,15


3,13


π

Дискретизация





дискретизация


36,6


36,4


36,8


9


12


15


18


21


24


время





6


аналоговая информация


время





36,6


36,4


36,8


9


12


15


18


21


24


6


6 ч. 36,7°
9 ч. 36,8°
12 ч. 36,9°
15 ч. 36,7°
18 ч. 36,5°
21 ч. 36,5°
24 ч. 36,6°


дискретная информация


При дискретизации есть потеря информации!


!


Как уменьшить потери?


?





0


1


2


3


4


5


6


V


аналоговые данные


дискретные данные


V


Дискретность — это свойство не информации, а её представления.


!





При увеличении точности дискретизации свойства аналоговой и дискретной информации практически совпадают!


!

Кодирование информации


§ 5. Равномерное и неравномерное кодирование




Вспомним известное





Алфавит — это набор знаков, который используется в языке.
Мощность алфавита — это количество знаков в алфавите.
Равномерный код — это код, в котором все кодовые слова имеют одинаковую длину.
Неравномерный код — это код, в котором кодовые слова имеют различную длину.
Двоичное кодирование — это кодирование с помощью двух знаков.
1 бит — это одна двоичная цифра (один знак сообщения, записанного в двоичном коде).





Если алфавит языка состоит из M символов (имеет мощность M), количество различных сообщений длиной L знаков равно


N = M L


Сколько
возможных 7-битовых двоичных кодов?
возможных 5-буквеных слов в русском языке?
возможных 3-буквеных слов в английском языке?


335


263


Для двоичного кода: N = 2L


27





Сколько
различных чисел можно закодировать в 8-битовой ячейке?
различных чисел можно закодировать в 8-разрядной ячейке троичного компьютера (-1, 0, 1)?
сколько битов нужно выделить для хранения номера спортсмена от 1 до 1000?
512 = 29 < 1000  210 = 1024
сколько битов нужно выделить для хранения температуры от –50 до 80?
128 = 27 < 131  28 = 256


10


8


28


38

Правило умножения





Если в сообщении длиной L на позиции i может стоять один из Mi символов, количество различных сообщений равно


N = M1 M2 … ML


Задача 1. Сколько существует различных сообщений длины 5 в алфавите {A, B, C, Х}, если буква «Х» может появляться только на первом или на последнем месте?


4


4


3


3


3


M1


M5


M2


M3


M4


4 ∙ 3 ∙ 3 ∙ 3 ∙ 4 = 432

Правило умножения





Задача 2. Сколько существует 5-значных десятичных чисел, все цифры в которых различны?


9


6


9


8


7


M1


M5


M2


M3


M4


9 ∙ 9 ∙ 8 ∙ 7 ∙ 6 = 27216


Не может быть 0!

Неравномерные коды





можно уменьшить длину закодированного сообщения


не всегда однозначно декодируется


А


Г


Р


00


01


10


ГАГАРА


→ 010001001000


Равномерный код:


А


Г


Р


0


01


10


ГАГАРА


→ 010010100


Неравномерный код:


12 бит


9 бит


010010100


→ 010010100


→ 010010100


ГАГАРА


АРАРРА

Правило сложения





Задача 3. Сколько существует двоичных кодов длиной от 2 до 5 битов?


L = 2: N2 = 22 = 4


Правило сложения!


!


L = 3: N2 = 23 = 8


L = 4: N4 = 24 = 16


L = 5: N5 = 25 = 32


N = N2 + N3 + N4 + N5


N = 4 + 8 + 16 + 32 = 60

Правила умножения и сложения





Задача 4. Сколько существует различных 3-буквенных слов в алфавите {К, Р, О, Т}, в которых буква К встречается ровно 1 раз?


К


*


*


1 ∙ 3 ∙ 3 = 9


1


3


3


К


*


*


3 ∙ 1 ∙ 3 = 9


К


*


*


3 ∙ 3 ∙ 1 = 9


9 + 9 + 9 = 27

Задачи





Сколько существует в коде Морзе различных последовательностей из точек и тире, длина которых от 4 до 6 символов?
Вася и Петя передают друг другу сообщения, используя синий, красный и зелёный фонарики. Это они делают, включая по одному фонарику на одинаковое короткое время в некоторой последовательности. Количество вспышек в одном сообщении — 3 или 4, между сообщениями — паузы. Сколько различных сообщений могут передавать мальчики?

Задачи





Шахматная доска состоит из 8 столбцов и 8 строк. Какое минимальное количество битов потребуется для кодирования координат одной шахматной фигуры?
Для кодирования значений температуры воздуха (целое число в интервале от –50 до 40) используется двоичный код. Какова минимальная длина двоичного кода?
Дорожный светофор подаёт шесть видов сигналов (непрерывные красный, жёлтый и зелёный, мигающие жёлтый и зелёный, мигающие красный и жёлтый одновременно). Подряд записано 100 сигналов светофора. Определите информационный объём этого сообщения в битах.

Задачи





Автомобильный номер длиной 6 символов составляется из заглавных букв (всего используется 12 букв) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством битов, а каждый номер — одинаковым и минимально возможным количеством байтов. Определите объём памяти, необходимый для хранения 32 автомобильных номеров.

Кодирование информации


§ 6. Декодирование




Декодирование





Декодирование — это восстановление сообщения из последовательности кодов.


•— — •— ••• •—•—


ВАСЯ


Когда разделитель не нужен?


?


А


Б


В


Г


Д


000


10


01


110


001


A


0


корень


1


0


1


0


1


В


Б


0


1


Д


0


1


Г


Все кодовые слова заканчиваются на листьях дерева!

Декодирование





A


0


корень


1


0


1


0


1


В


Б


0


1


Д


0


1


Г


1100000100110


110


Г


000


01


001


10


А


В


Д


Б


Префиксный код — это код, в котором ни одно кодовое слово не совпадает с началом другого кодового слова (условие Фано). Сообщения декодируются однозначно.

Задачи





Для передачи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код:
A = 0, Б = 10, В = 110.
Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное декодирование?
Для передачи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код:
A = 0, Б = 100, В = 101.
Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное декодирование?

Постфиксные коды





Постфиксный код — это код, в котором ни одно кодовое слово не совпадает с окончанием другого кодового слова. Сообщения декодируются однозначно (с конца!).


А


Б


В


Г


Д


000


01


10


011


100


011000110110


10


01


011


100


01


Б


Д


Г


Б


В

Неоднозначное декодирование





А


Б


В


Г


Д


01


010


011


11


101


АБАГД


АБВГА


010100111101


Выполняются ли условия Фано?


?


Декодирование может быть неоднозначным…


Может быть, что условия Фано не выполнены, а декодирование однозначно (см. учебник)!


!

Задача





А


Б


В


0


11


010


*Докажите, что все сообщения, закодированные этим кодом, декодируются однозначно.


01000011001011110000100

Кодирование информации


§ 7. Алфавитный подход к измерению количества информации




Алфавитный подход





Количество информации в битах определяется длиной сообщения в двоичном коде.


10101100


8 битов


вперёд назад вправо влево


Сколько битов?


?


00


01


10


11


00101010010111


14 битов

Другие единицы измерения





1 байт (bytе) = 8 бит
1 Кбайт (килобайт) = 1024 байта
1 Мбайт (мегабайт) = 1024 Кбайт
1 Гбайт (гигабайт) = 1024 Мбайт
1 Тбайт (терабайт) = 1024 Гбайт
1 Пбайт (петабайт) = 1024 Гбайт


210

Алфавитный подход





определяем мощность алфавита M;
определяем количество битов информации i, приходящихся на один символ, — информационную ёмкость (объём) символа:
количество информации в сообщении:
где L – количество символов в сообщении.


M, символов


2


4


8


16


32


64


128


256


512


1024


i, битов информации


1


2


3


4


5


6


7


8


9


10


I = L·i

Алфавитный подход





каждый символ несёт одинаковое количество информации частота появления разных символов (и сочетаний символов) не учитывается количество информации определяется только длиной сообщения и мощностью алфавита смысл сообщения не учитывается

Задача





Определить количество информации в 10 страницах текста (на каждой странице 32 строки по 64 символа) при использовании алфавита из 256 символов.


информационная ёмкость символа:
256 = 28  i = 8 бит = 1 байт количество символов на странице:
32·64 = 25 ·26 = 211
общее количество символов:
L = 10·211
информационный объём сообщения:
I = L·i = 10·211·1 байтов = 20 Кбайт

Задача





Пароль длиной не более 11 символов (цифры и 12 различных букв, как строчные, так и прописные. Посимвольное равномерное кодирование, для хранения пароля отводится минимально возможное целое количество байт. Сколько байт нужно для 60 паролей?


мощность алфавита M = 10 + 12 + 12 = 34
информационная ёмкость символа:
25 < 34  26  i = 6 бит на один пароль:
6 · 11 = 66 бит = 8,…  9 байт на 60 паролей:
I = 60 · 9 байтов = 540 байт


округление вверх

Конец фильма





ПОЛЯКОВ Константин Юрьевич
д.т.н., учитель информатики
ГБОУ СОШ № 163, г. Санкт-Петербург
kpolyakov@mail.ru
ЕРЕМИН Евгений Александрович
к.ф.-м.н., доцент кафедры мультимедийной дидактики и ИТО ПГГПУ, г. Пермь
eremin@pspu.ac.ru

Источники иллюстраций





http://overhealth.ru
https://ufhealth.org
http://wmposters.com
http://www.ulmart.ru
http://all-graphic.net
http://123rf.com
http://made-in-china.com
http://megamaster.biz
http://evrobass.ru
http://blendercontest.com
http://ru.wikipedia.org
авторские материалы



написать администратору сайта