10 класс 3-4 урок (2). Алфавитный подход к измерению информации
Скачать 0.53 Mb.
|
Алфавитный подход к измерению информацииДостаточно ли места на носителе, чтобы разместить нужную нам информацию? Сколько времени потребуется, чтобы передать информацию по имеющемуся каналу связи? Величина, которая нас в этих случаях интересует, называется объемом информации. Алфавитный (объёмный) подход к измерению информацииПрименяется в цифровых (компьютерных) системах) хранения и передачи информации Для определения количества информации имеет значение лишь размер (объём) хранимого и передаваемого кода 2i=N2i=N i – информационный «вес» символа N – мощность алфавита (количество символов в алфавите)
Английский алфавит: 26 букв + знаки препинания=32 символа 32=25 Все символы можно закодировать пятиразрядными двоичными кодами от 00000 до 11111 В двоичном коде каждая двоичная цифра несет одну единицу информации, которая называется 1 бит Бит является основной единицей измерения информации Длина двоичного кода, с помощью которого кодируется символ алфавита, называется информационным весом символа Информационный вес символа в английском алфавите равен 5 битам складывается из информационных весов всех составляющих текст символов Английский текст из 1000 символов в телеграфном сообщении будет иметь информационный объём 5000 битов Алфавит русского языка: 33 буквы + знаки препинания = 39 символов для двоичного кодирования символов 5-разрядного кода недостаточно, нужен 6-разрядный код 26=64, остается резерв для 25 символов Информационный вес символа в расширенном русском алфавите равен 6 битам Текст из 1000 символов будет иметь объём 6000 битов I=K*i(битов) I-информационный объём текста i-информационный объём символа алфавита К – количество символов в тексте Андрей Николаевич Колмогоров (1903-1987) Количество информации, содержащееся в тексте, определяется минимально возможной длиной двоичного кода, необходимого для представления этого текста Ряд целых степеней двойки
Пример. Определить информационный вес символа алфавита, включающего в себя все строчные и прописные русские буквы (66), цифры (10), знаки препинания, скобки, кавычки (10). Всего 86 символов 26<86<27 i=7 битов Двоичное представление текстов в компьютереИспользуется восьмиразрядный код 28=256 Кодовая таблица ANSI1байт = 8 битов Информационный объём текста в памяти компьютера измеряется в байтах. Он равен количеству символов в записи текста 1 Кб (килобайт) = 210 байтов = 1024 байта 1 Мб (мегабайт) = 210 Кб = 1024 Кб 1 Гб (гигабайт) = 210 Мб = 1024 Мб 1 Тб (терабайт) = 210 Гб = 1024 Гб В компьютере любые виды информации: тексты, числа, изображения, звуки – представляются в форме двоичного кода Объём информации любого вида, выраженный в битах, равен длине двоичного кода, в котором эта информация представлена Индивидуальное заданиеСтраница 7 |