ен1Лекция-2. Информация. Единицы измерения информации. Обработка информации
Скачать 27.01 Kb.
|
Лекция №2 Тема: «Информация. Единицы измерения информации. Обработка информации» Цель: Сформировать знания у студента о единице измерения информации. Носители информации. Сбор, обработка, хранение и передача информации. Выбор способа хранения информации. Обработка информации. Изменение способа представления информации План лекции: Информация. Представление и кодирование информации Единицы измерения информации Обработка информации Представление и кодирование информации Информация — это сведения об объектах и явлениях окружающего мира, уменьшающие степень неопределённости знаний об этих объектах или явлениях. Информация не существует сама по себе. Всегда имеется источник, который производит информацию, и приемник, который её воспринимает. В роли источника или приемника может быть любой объект материального мира: человек, устройство, животное, растение. То есть информация всегда предназначена конкретному объекту. Источник информации — это объект, порождающий информацию и представляющий её в виде сообщения. Приемник информации — это объект, принимающий сообщение и способный правильно его интерпретировать. Кодирование информации — это процесс преобразования информации из одной формы представления в другую. Декодирование — это воспроизведение закодированной информации. В ЭВМ информация может быть представлена в двух формах: аналоговой и цифровой. Аналоговая форма представляет непрерывный сигнал, который меняется пропорционально изменению информации, т. е. информация кодируется изменяющимся во времени напряжением или током. Такое представление информации используется в аналоговых вычислительных машинах (АВМ). Однако эти машины не получили дальнейшего развития в основном из-за невысокой точности вычислений. Цифровая форма представления информации используется в цифровых вычислительных машинах (ЦВМ). В этих машинах информация кодируется цифрами. В виде цифр представляются различные виды информации: числа, буквы, звук, изображения. В ЦВМ применяется двоичная система счисления. В этой системе используются только две цифры: 0 и 1. Имеются и другие системы счисления: восьмеричная, десятичная, шестнадцатеричная и др. Но двоичная система отличается от них высокой надежностью представления информации. Распознать два состояния (0 или 1) значительно проще, чем, например, 10 состояний. В живых системах также для передачи информации используется двоичное кодирование информации в виде потенциала покоя и потенциала действия, биологические 0 и 1. В двоичной системе счисления можно выполнять все математические действия, как и в привычной нам десятичной системе счисления. В ЦВМ для кодирования двоичных знаков используются два уровня напряжения. Обычно, единица — это высокий уровень напряжения, порядка 5 В, а низкий уровень (меньше 0,8 В) — ноль. Имеются специальные устройства для преобразования аналоговой формы в цифровую, и наоборот. Такие устройства называются соответственно аналого-цифровым преобразователем (АЦП) и цифро-аналоговым преобразователем (ЦАП). Процесс преобразования непрерывных сигналов в цифровую форму состоит из трех этапов: дискретизации, квантования и кодирования. Дискретизация — это процесс разбиения сигнала на отдельные составляющие, взятые через равные промежутки времени, величины которых зависят от частоты дискретизации (рис. 1.2, а). Квантование — измерение дискретной величины сигнала в моменты времени t 1 , t 2 , t 3 и т. д. и представление их с определенной точностью. Точность определяется уровнями квантования, т. е. количеством уровней разбиения величины сигнала у. Кодирование — перевод значения уровня квантования в двоичную систему счисления. Полученная цифровая информация называется дискретной. В ЦАП происходит обратное преобразование информации — из цифровой формы в аналоговую (рис. 1.2, б). Под словом «кодирование» понимают процесс представления информации, удобный для её хранения и/или передачи. Следовательно, запись текста на естественном языке можно рассматривать как способ кодирования речи с помощью графических элементов (букв, иероглифов). Записанный текст является кодом, заключающим в себе содержание речи, т. е. информацию. Код — система условных знаков (символов), предназначенных для представления информации в соответствии с определенными правилами. Кодирование — переход от одной формы представления информации к другой, наиболее удобной для её хранения, передачи или обработки. Декодирование — процесс по восстановлению первоначальной формы представления информации, т. е. операция, обратная кодированию. При кодировании ставятся разные цели и, соответственно, применяются различные способы кодирования. Наиболее распространенные цели кодирования: 1) экономность (сократить запись); 2) надежность (засекретить информацию); 3) удобство обработки или восприятия. Чаще всего кодированию подвергаются тексты на естественных языках (русском, английском и пр.). Существуют три основных способа кодирования текста: 1) графический — с помощью специальных рисунков или значков; 2) числовой — с помощью чисел; 3) символьный — с помощью символов того же алфавита, что и исходный текст. Процесс чтения текста — это обратный по отношению к письму процесс, при котором письменный текст преобразуется в устную речь. Чтение можно назвать декодированием письменного текста. А теперь обратим внимание на то, что может существовать много способов кодирования одного и того же текста на одном и том же языке. Русский текст мы привыкли записывать с помощью русского алфавита. Но то же самое можно сделать, используя латинский алфавит. Иногда так приходится поступать, отправляя SMS по мобильному телефону, на котором нет русских букв, или электронное письмо на русском языке за границу, если у адресата нет русифицированного программного обеспечения. Например, фразу «Здравствуй, дорогой Саша!» приходится писать так: «Zdravstvui, dorogoiSasha!». Существует множество способов кодирования. Например, стенография — быстрый способ записи устной речи. Ею владеют лишь немногие специально обученные люди — стенографисты. Они успевают записывать текст синхронно с речью выступающего человека. В стенограмме один значок обозначает целое слово или сочетание букв. Скорость стенографического письма превосходит скорость обычного в 4-7 раз. Расшифровать (декодировать) стенограмму может только сам стенографист. Для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Обсудим это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число «тридцать пять». Используя же алфавит арабской десятичной системы счисления, пишем:35. Пусть нам надо произвести вычисления. Скажи, какая запись удобнее для выполнения расчётов: «тридцать пять умножить на сто двадцать семь» или «35х127»? Очевидно, что для перемножения многозначных чисел вы будете пользоваться второй записью. Заметим, что две эти записи, эквивалентные по смыслу, используют разные языки: первая — естественный русский язык, вторая — формальный язык математики, не имеющий национальной принадлежности. Переход от представления на естественном языке к представлению на формальном языке можно также рассматривать как кодирование. Человеку удобно использовать для кодирования чисел десятичную систему счисления, а компьютеру — двоичную систему. Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование — процесс обратного преобразования, при котором восстанавливается исходный текст. Шифрование — это тоже кодирование, но с засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука криптография. Шифрование — медот защиты любой информации от несанкционированного доступа, просмотра, а также её использования, основанный на преобразовании данных в зашифрованный формат. Криптография — это наука о методах и принципах передачи и приема зашифрованной с помощью специальных ключей информации. Ключ — секретная информация, используемая криптографическим алгоритмом при шифровании/расшифровке сообщений. Единицы измерения информации. Для информации существуют свои единицы измерения информации. Если рассматривать сообщения информации как последовательность знаков, то их можно представлять битами, а измерять в байтах, килобайтах, мегабайтах, гигабайтах, терабайтах и петабайтах. Давайте разберемся с этим, ведь нам придется измерять объем памяти и быстродействие компьютера. БитЕдиницей измерения количества информации является бит – это наименьшая(элементарная) единица. 1бит – это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо. БайтБайт – основная единица измерения количества информации. Байтом называется последовательность из 8 битов. Байт – довольно мелкая единица измерения информации. Например, 1 символ – это 1 байт. Производные единицы измерения количества информации1 байт=8 битов 1 килобайт (Кб)=1024 байта =210 байтов 1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220 байтов 1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230 байтов 1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240 байтов Запомните, приставка КИЛО в информатике – это не 1000, а 1024, то есть 210 . Методы измерения количества информацииИтак, количество информации в 1 бит вдвое уменьшает неопределенность знаний. Связь же между количеством возможных событий N и количеством информацииI определяется формулой Хартли: N=2i. Алфавитный подход к измерению количества информацииПри этом подходе отвлекаются от содержания (смысла) информации и рассматривают ее как последовательность знаков определенной знаковой системы. Набор символов языка, т.е. его алфавит можно рассматривать как различные возможные события. Тогда, если считать, что появление символов в сообщении равновероятно, по формуле Хартли можно рассчитать, какое количество информации несет в себе каждый символ: I=log2N. Вероятностный подход к измерению количества информацииЭтот подход применяют, когда возможные события имеют различные вероятности реализации. В этом случае количество информации определяют по формуле Шеннона: где I – количество информации, N – количество возможных событий, Pi – вероятность i-го события. Если подбросить монету и проследить, какой стороной она упадет, то мы получим определенную информацию. Обе стороны монеты “равноправны”, поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит. Задача 1.Шар находится в одной из четырех коробок. Сколько бит информации несет сообщение о том, в какой именно коробке находится шар. Имеется 4 равновероятных события (N=4). По формуле Хартли имеем: 4=2i. Так как 22=2i, тоi=2. Значит, это сообщение содержит 2 бита информации. Задача 2.Чему равен информационный объем одного символа русского языка? В русском языке 32 буквы (буква ёобычно не используется), то есть количество событий будет равно 32. Найдем информационный объем одного символа.I=log2N=log232=5 битов (25=32). Примечание. Если невозможно найти целую степень числа, то округление производится в большую сторону. Представление информации в различных системах счисления Система счисления - это знаковая система, в которой числа записываются по определенным правилам с помощью символов некоторого алфавита, называемых цифрами. В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные. В позиционной системе счисления значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) она записана. Например, меняя позицию цифры 2 в десятичной системе счисления, можно записать разные по величине десятичные числа, например: 2; 20; 2000; 0,02 и т. д. Позиция цифры в числе называется разрядом. Разряд числа возрастает справа налево, от младших разрядов к старшим. В непозиционной системе счисления цифры не изменяют своего значения при изменении их расположения в числе. Примером непозиционной системы может служить римская система, в которой независимо от местоположения одинаковый символ имеет неизменное значение (например, символ X в числе XXV). В римской непозиционной системе счисления для каждого числа используется некоторый набор базовых символов (I,V,X,L,C,D и M), соответствующих числам 1,5,10,50,100,500 и 1000. Остальные значения чисел получаются из базовых путем их сложения (например, XVII=17) или вычитания (например, IX=9). Количество (р) различных символов, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления. Основание показывает, во сколько раз изменяется количественное значение цифры при перемещении ее в младший или старший разряд. Набор символов, используемый для обозначения цифр, называется алфавитом. Так, например, алфавит двоичной системы счисления содержит всего два символа: 0 и 1, а алфавит шестнадцатеричной системы - 16 символов: десять арабских цифр и шесть латинских букв (0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F). Любое число N в позиционной системе счисления можно представить в следующем виде: Np=±(ak−1⋅pk−1+ak−2⋅pk−2+...+a0⋅p0+a−1⋅p−1+...+a−m⋅p−m) Такой вид записи числа называют развернутой формой записи числа, где р - основание системы счисления; ai - цифры, принадлежащие алфавиту данной системы счисления; k - количество разрядов в целой части числа; m - количество разрядов в дробной части числа. Нижние индексы определяют местоположение цифры в числе (разряд): - положительные значения индексов - для целой части числа; - отрицательные значения индексов - для дробной части числа. Свернутой формой записи числа называется запись в виде: N=(ak−1ak−2...a1a0,a−1a−2...a−m)p Например: - при р=10 в записи числа 2466,67510 в десятичной системе счисления k=3, m=3; - при р=2 в записи числа 1011,112 в двоичной системе k=3, m=2. Свернутой формой записи чисел мы и пользуемся в повседневной жизни, ее называют естественной или цифровой. Основанием позиционной системы счисления может быть любое натуральное число (например, 5, 21, 37). Во избежание путаницы справа от числа нижним индексом приписывают основание: 1011012, 3678, 3B8A16, 3AO37. Десятичная система счисления Основание: p=10. Алфавит: 0,1,2,3,4,5,6,7,8,9. Десятичная система счисления наиболее распространенная система счисления в мире. Используется при повседневном счете. Для записи чисел используются арабские цифры (0, 1, 2, 3, 4, 5, 6, 7, 8, 9). Число в десятичной системе счисления записывается в виде суммы числового ряда степеней основания (в данном случае 10), в качестве коэффициентов которых выступают цифры данного числа. Пример: 765,34510=7⋅102+6⋅101+5⋅100+3⋅10−1+4⋅10−2+5⋅10−3 Двоичная система счисления Основание: p=2. Алфавит: 0,1. Двоичную систему счисления широко применяют в вычислительной технике. К ее достоинствам относятся: - возможность использования наиболее простой элементной базы микроэлектроники - всего с двумя устойчивыми состояниями; - возможность использования аппарата булевой алгебры для выполнения логических преобразований информации; - возможность использования простейших правил арифметики. Основной недостаток двоичной системы - быстрый рост количества разрядов, необходимых для записи чисел. По этой, а также по некоторым другим причинам в вычислительной технике, кроме двоичной, применяются также восьмеричная и шестнадцатеричная системы счисления. Число в двоичной системе счисления записывается в виде суммы числового ряда степеней основания (в данном случае 2), в качестве коэффициентов которых выступают цифры данного числа. Пример: 1011,012=1⋅23+0⋅22+1⋅21+1⋅20+0⋅2−1+1⋅2−2 Восьмеричная система счисления Основание: p=8. Алфавит: 0,1,2,3,4,5,6,7. Восьмеричная система чаще всего используется в областях, связанных с цифровыми устройствами. Характеризуется лёгким переводом восьмеричных чисел в двоичные и обратно, путём замены восьмеричных чисел на триады (группы по 3 разряда) двоичных. Ранее широко использовалась в программировании и вообще компьютерной документации, однако в настоящее время почти полностью вытеснена шестнадцатеричной. Число в восьмеричной системе счисления записывается в виде суммы числового ряда степеней основания (в данном случае 8), в качестве коэффициентов которых выступают цифры данного числа. Пример: 567,128=5⋅82+6⋅81+7⋅80+1⋅8−1+2⋅8−2 Шестнадцатеричная система счисления Основание: p=16. Алфавит: 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F. Здесь только десять цифр из шестнадцати имеют общепринятое обозначение 0,1,...,9. Для записи остальных цифр (10,11,12,13,14 и 15) обычно используются первые шесть букв латинского алфавита. Шестнадцатеричная система счисления, на сегодняшний день является наиболее популярным средством компактной записи двоичных чисел. Очень широко используется при разработке и проектировании цифровой техники. Число в шестнадцатеричной системе счисления записывается в виде суммы числового ряда степеней основания (в данном случае 16), в качестве коэффициентов которых выступают цифры данного числа. Пример: 10FC16=1⋅163+0⋅162+F⋅161+C⋅160 Помимо рассмотренных выше позиционных систем счисления, существуют и другие, например: - троичная (0,1,2); - пятеричная (0,1,2,3,4) - двенадцатеричная (0,1,2,3,4,5,6,7,8,9,A,B) - тринадцатеричная (0,1,2,3,4,5,6,7,8,9,A,B,C). В системах счисления с основанием больше 10 для представления чисел после цифр 0,1,2,…,9 используют латинские буквы в алфавитном порядке: А (10), В (11), С (12) и т. д. Вопросы к лекции №2. Виды информации, воспринимаемые человеком. Виды информации, воспринимаемые компьютером. Информационный процесс - … Перечислить известные информационные процессы, выделить основные. Что такое информационный объем сообщения? Что изучает наука информатика? Перечислить все единицы измерения информации в порядке возрастания. Наименьшая единица измерения информации |