Лекция 1. Рассказ о дисциплине Информация
Скачать 61.76 Kb.
|
Лекция.1 Основные понятия информации. Представление информации. Системы счисления. Приветствие Знакомство Рассказ о дисциплине Информация Все, что делает человек, так или иначе связано с получением и использованием информации. Читая книгу, разглядывая фотографию, мы запоминаем и накапливаем информацию. Пишем ли мы письмо, разговариваем ли по телефону - мы передаем информацию адресату или собеседнику. Решая любую задачу, мы обрабатываем информацию: начиная с информации, заключенной в условии задачи, приходим к ее решению. Информация - это настолько общее и глубокое понятие, что ему нельзя дать краткое определение или объяснить одной фразой. Вы будете знакомиться с этим понятием постепенно в течение всего курса, на первых порах используя интуитивное представление об информации, которое у вас уже есть. Говоря об информации, часто употребляют выражения "передавать информацию", "хранить информацию", "обрабатывать информацию". Передача, накопление и обработка информации - это важнейшие процессы и явления, связанные с информацией. Информация является первичным и неопределяемым в рамках науки понятием. Особенность этого понятия в том, что оно используется во всех сферах: в философии, в естественных и гуманитарных науках, в технике и экономике, и, конечно, в повседневной жизни. Поэтому конкретное толкование элементов, связанных с понятием "информация", зависит от метода конкретной науки. Понятие "информация" первоначально было связано исключительно с социальной сферой, с коммуникативной деятельностью людей. Этот вывод опирается на результаты исследования значений слова "информация", которое впервые зародилось в латинском языке; в русском языке, точнее древнерусском, его ранее не было. В России оно впервые появляется, по-видимому, в петровскую эпоху. Ученые считают, что это слово перешло в русский язык от польского "informacia". В то время слово информация в русском языке употреблялось в смысле "идея, наука". Вплоть до начала XX в. слово "информация" не встречается практически ни в одном словаре. И только в "Толковом словаре русского языка" (ред. Д.Н. Ушакова), изданном в 1935 г., оно определяется как сообщение, осведомление о положении дел или чьей-либо деятельности, как сведения о чем-либо. Наука второй половины XX в. внесла существенные коррективы в понимание информации. Начиная с 20-х гг, делаются первые попытки изучения понятия "информация" вначале в русле социально-гуманитарных наук. Однако бурное развитие коммуникаций привело к тому, что возникла потребность к изучению не только в содержательных, но и количественных характеристик информации. Логическое и математическое уточнение понятия информации произошло в конце 40-х гг главным образом в теории передачи информации и кибернетики. История теории информации начинается с 1948 г, когда была опубликована основополагающая статья К.Э. Шеннона "Математическая теория связи", в которой было дано вероятностно статистическое определение понятия количества информации. В теории Шеннона под информацией понимались не любые сообщения, которыми обмениваются между собой люди, а только те, которые уменьшают неопределенность у получателя информации. Неопределенность же существует лишь тогда, когда происходит выбор одной из нескольких возможностей. Например, выбор и соответственно уменьшение неопределенности существует при розыгрыше лотереи. Если вам сообщают, что интересующий вас абитуриент поступил в вуз, то тем самым такое сведение снимет неопределенность, ибо из двух возможных исходов (поступил, не поступил) реализуется один. Существует классическое определение информации Шеннона: информация - это то, что сокращает степень неопределенности у ее адресата о каком-либо объекте. Тем самым в теории Шеннона информация выступает в качестве снимаемой, уменьшаемой неопределенности, а количество информации измеряется посредством вероятности как отношение выбираемых элементов ко всей их совокупности. Однако помимо вероятностно-статистической появились и другие варианты определения количества информации. Широкий распространение получил комбинаторный подход к определению количества информации. Наиболее развитым в математическом отношении является такой вариант комбинаторного подхода в теории информации, как эпсилон-энтропия (А.Н. Колмогоров, В.М. Тихомиров, А.Г. Витушкин и др.) Информация — осознанные сведения об окружающем мире, которые являются объектом хранения, преобразования, передачи и использования. Сведения — это знания, выраженные в сигналах, сообщениях, известиях, уведомлениях и т. д. Каждого человека в мире окружает море информации различных видов. 'Информация (informatio — осведомление, разъяснение, изложение) — в широком смысле абстрактное понятие, имеющее множество значений, в зависимости от контекста. В узком смысле этого слова — сведения (сообщения, данные) независимо от формы их представления. В настоящее время не существует единого определения термина информация. С точки зрения различных областей знания, данное понятие описывается своим специфическим набором признаков. Информация — совокупность данных, зафиксированных на материальном носителе, сохранённых и распространённых во времени и пространстве. Сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальным устройством. Сообщения, осведомляющие о положении дел, о состоянии чего-нибудь. (Научно-техническая и газетная информации, средства массовой информации — печать, радио, телевидение, кино). Информация и ее свойства являются объектом исследования целого ряда научных дисциплин, таких как теория информации (математическая теория систем передачи информации), кибернетика (наука о связи и управлении в машинах и животных, а также в обществе и человеческих существах), семиотика (наука о знаках и знаковых системах), теория массовой коммуникации (исследование средств массовой информации и их влияния на общество), информатика (изучение процессов сбора, преобразования, хранения, защиты, поиска и передачи всех видов информации и средств их автоматизированной обработки), информодинамика (наука об открытых информационных системах), информациология (наука о получении, сохранении и передаче информации для различных множеств объектов) и т. д. Информация содержится везде. Дерево содержит собственную генетическую информацию, и только благодаря этой информации от семечки берёзы вырастает только берёза. Для деревьев источником информации является воздух, именно по состоянию воздуха дерево может определить время распускания почек. Перелётные птицы знают свой маршрут перелёта, и каждая стая идёт только своим заданным в генах маршрутом. Стремление зафиксировать, сохранить надолго свое восприятие информации было всегда свойственно человеку. Мозг человека хранит множество информации и использует для хранения её свои способы, основа которых — двоичный код, как и у компьютеров. Человек всегда стремился иметь возможность поделиться своей информацией с другими людьми и найти надёжные средства для её передачи и долговременного хранения. Для этого в настоящее время изобретено множество способов хранения информации на внешних (относительно мозга человека) носителях и её передачи на огромные расстояния. Основные виды информации по её форме представления, способам её кодирования и хранения, что имеет наибольшее значение для информатики, это: графическая или изобразительная — первый вид, для которого был реализован способ хранения информации об окружающем мире в виде наскальных рисунков, а позднее в виде картин, фотографий, схем, чертежей на бумаге, холсте, мраморе и др. материалах, изображающих картины реального мира; звуковая (акустическая) — мир вокруг нас полон звуков и задача их хранения и тиражирования была решена с изобретением звукозаписывающих устройств в 1877 г. её разновидностью является музыкальная информация — для этого вида был изобретен способ кодирования с использованием специальных символов, что делает возможным хранение её аналогично графической информации; текстовая — способ кодирования речи человека специальными символами — буквами, причем разные народы имеют разные языки и используют различные наборы букв для отображения речи; особенно большое значение этот способ приобрел после изобретения бумаги и книгопечатания; числовая — количественная мера объектов и их свойств в окружающем мире; особенно большое значение приобрела с развитием торговли, экономики и денежного обмена; аналогично текстовой информации для её отображения используется метод кодирования специальными символами — цифрами, причем системы кодирования (счисления) могут быть разными; видеоинформация — способ сохранения «живых» картин окружающего мира, появившийся с изобретением кино. Существуют также виды информации, для которых до сих пор не изобретено способов их кодирования и хранения — это тактильная информация, передаваемая ощущениями, органолептическая, передаваемая запахами и вкусами и др. Для передачи информации на большие расстояния первоначально использовались кодированные световые сигналы, с изобретением электричества — передача закодированного определенным образом сигнала по проводам, позднее — с использованием радиоволн. Создателем общей теории информации и основоположником цифровой связи считается Клод Шеннон (Claude Shannon). Всемирную известность ему принес фундаментальный труд 1948 года — «Математическая теория связи» (A Mathematical Theory of Communication), в котором впервые обосновывается возможность применения двоичного кода для передачи информации. С появлением компьютеров (или, как их вначале называли в нашей стране, ЭВМ — электронные вычислительные машины) вначале появилось средство для обработки числовой информации. Однако в дальнейшем, особенно после широкого распространения персональных компьютеров (ПК), компьютеры стали использоваться для хранения, обработки, передачи и поиска текстовой, числовой, изобразительной, звуковой и видеоинформации. С момента появления первых персональных компьютеров — ПК (80-е годы 20 века) — до 80 % их рабочего времени посвящено работе с текстовой информацией. Хранение информации при использовании компьютеров осуществляется на магнитных дисках или лентах, на лазерных дисках (CD и DVD), специальных устройствах энергонезависимой памяти (флэш-память и пр.). Эти методы постоянно совершенствуются, изобретаются и носители информации. Обработку информации (воспроизведение, преобразование, передача, запись на внешние носители) выполняет процессор компьютера. С помощью компьютера возможно создание и хранение новой информации любых видов, для чего служат специальные программы, используемые на компьютерах, и устройства ввода информации. Особым видом информации в настоящее время можно считать информацию, представленную в глобальной сети Интернет. Здесь используются особые приемы хранения, обработки, поиска и передачи распределенной информации больших объемов и особые способы работы с различными видами информации. Постоянно совершенствуется программное обеспечение, обеспечивающее коллективную работу с информацией всех видов. Свойства информации С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр. Объективность информации. Информация в любом своём проявлении объективна, она отображает объективную действительность. Например фраза "На улице тёплая погода" означает, что человек её произнесший считает погоду на улице тёплой, т.е. информацией в данном случае будет являться то, что определённый человек произнёс фразу следующего содержания. Достоверность информации. Информация достоверна, если она отражает истинное положение дел. Достоверная информация помогает принять нам правильное решение. Недостоверной информация может быть по следующим причинам: преднамеренное искажение (дезинформация) или непреднамеренное искажение субъективного свойства; искажение в результате воздействия помех («испорченный телефон») и недостаточно точных средств ее фиксации. Полнота информации. Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению. Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т. п. Актуальность информации — важность для настоящего времени, злободневность, насущность. Только вовремя полученная информация может быть полезна. Полезность (ценность) информации. Полезность может быть оценена применительно к нуждам конкретных ее потребителей и оценивается по тем задачам, которые можно решить с ее помощью. Самая ценная информация — полезная. При этом следует учитывать, что и недостоверная информация (например, художественная литература), имеет большую значимость для человека. В художественной литературе полезная информация представлена неявным образом. Социальная (общественная) информация обладает еще и дополнительными свойствами: имеет семантический (смысловой) характер, то есть понятный, так как именно в понятиях обобщаются наиболее существенные признаки предметов, процессов и явлений окружающего мира. имеет языковую природу (кроме некоторых видов эстетической информации, например изобразительного искусства). Одно и то же содержание может быть выражено на разных естественных (разговорных) языках, записано в виде математических формул и т. д. С течением времени количество информации растет, информация накапливается, происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и кумулированием информации. (Кумуляция — от лат. cumulatio — увеличение, скопление). Старение информации заключается в уменьшении ее ценности с течением времени. Старит информацию не само время, а появление новой информации, которая уточняет, дополняет или отвергает полностью или частично более раннюю. Научно-техническая информация стареет быстрее, эстетическая (произведения искусства) — медленнее. Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации. Система счисления — символический метод записи чисел, представление чисел с помощью письменных знаков. Число — некоторая абстрактная сущность, мера для описания количества чего-либо. Цифры — знаки, используемые для записи чисел. Цифры бывают разные: самыми распространёнными являются арабские цифры, представляемые знаками от нуля (0) до девяти (9); менее распространены римские цифры, их можно встретить на циферблате часов или в обозначении века (XIX век). Поскольку чисел гораздо больше чем цифр, то для записи числа обычно используется набор (комбинация) цифр. Только для небольшого количества чисел — для самых малых по величине целых чисел — бывает достаточно одной цифры. Существует много способов записи чисел с помощью цифр, называемых системой счисления. Величина числа может зависеть от порядка цифр в записи, а может и не зависеть. Это свойство определяется системой счисления и служит основанием для простейшей классификации таких систем, что позволяет все системы счисления разделить на четыре класса (группы): позиционные; непозиционные; смешанные. унарные. Позиционные системы счисления подробно рассмотрены ниже, после краткого обзора смешанных и непозиционных систем. Денежные знаки — это пример смешанной системы счисления. Сейчас в России используются монеты и купюры следующих номиналов: по 5, 10, 50 копеек и по 1, 2, 5, 10, 50, 100, 200, 500, 1000, 2000, 5000 рублей. Чтобы получить некоторую сумму в рублях, нужно использовать некоторое количество денежных знаков различного достоинства. Предположим, что пылесос стоит 6379 рублей. Для покупки можно использовать шесть купюр по тысяче рублей, три купюры по сто рублей, одну пятидесятирублёвую купюру, две десятки, одну пятирублёвую монету и две монеты по два рубля. Если записать количество купюр или монет начиная с 1000 руб. и заканчивая пятью копейками, заменяя нулями неиспользуемые номиналы, то получится число 600312120000. Если перемешать цифры в числе 600312120000, оно представит ложную цену пылесоса. Следовательно, такая запись относится к позиционным системам. В непозиционных системах счисления величина числа не зависит от положения цифр в записи. Если к каждой цифре приписать знак номинала, то такие составные знаки (цифра + номинал) уже можно перемешивать, то есть такая запись является непозиционной. Примером «рафинированной» непозиционной системы счисления является римская система. Позиционные системы счисления — это системы счисления, в которых значение цифры напрямую зависит от её положения в числе. Например, число 01 обозначает единицу, 10 — десять. Позиционные системы счисления позволяют легко производить арифметические расчёты. Представление чисел с помощью арабских цифр — самая распространённая позиционная система счисления, она называется «десятичной системой счисления». Десятичной системой она называется потому, что использует десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8 и 9. Заметьте: максимальная цифра (9) на единицу меньше количества цифр (10). Для составления машинных кодов удобно использовать не десятичную, а двоичную систему счисления, содержащую только две цифры, 0 и 1. Обратите внимание, что в двоичной системе максимальная цифра 1. Программисты для вычислений также пользуются ещё восьмеричной и шестнадцатеричной системами счисления. Количество цифр, используемых в системе счисления, называется её «основанием». В десятичной системе основание равно десяти, в двоичной системе — двум, ну а в восьмеричной и шестнадцатеричной — соответственно, восьми и шестнадцати. То есть в ручной системе счисления количество цифр равно р и используются цифры от 0 до р-1. Зависимость плотности записи информации от основания системы счисления Удельная натурально логарифмическая плотность записи числа зависит от основания системы счисления х и выражается функцией y=ln(x)/x. Эта функция имеет максимум при x=e=2,718281828…. То есть система счисления с наибольшей плотностью записи имеет не целочисленное основание. Из целочисленных систем счисления наибольшей плотностью записи информации обладает троичная система счисления, то есть система с основанием равным трём. Эту задачу решали ещё во времена Непера, в результате для уменьшения таблиц и числа вычислений перешли к таблицам натуральных логарифмов с основанием равным числу Эйлера е=2,718281828… . Шестидесятеричная система счисления То, как мы представляем время на часах, это пример шестидесятеричной позиционной системы счисления. В представлении времени используется три позиции: для часов, минут и секунд; так как для каждой позиции приходится использовать 60 цифр, а у нас только десять цифр, то для каждой шестидесятиричной позиции используется две десятичные цифры (00, 01, 02, …, 59), а позиции разделяются двоеточием. h: m: s Пирог нужно печь в духовке 45 минут, сколько это будет в секундах? Нужно испечь десять пирогов, сколько потребуется времени? Чтобы производить вычисления в шестидесятеричной системе счисления нужно знать таблицу сложений и умножений шестидесятеричных чисел. Каждая таблица очень большая, она размером 60х60 ячеек, мы то обычную таблицу умножения еле запомнили, а уж выучить шестидесятиричную таблицу умножения нам врядли окажется по силам. Чтобы решить эти задачи можно посчитать всё в десятичной системе, а потом результат перевести назад в шестидесятиричную систему. Приступим. Чтобы перевести 45 минут в количество секунд, нужно просто, подставить числа в верхнюю формулу: h равняется нулю, m равняется 45 и s — нулю, получаем Ответ на первый вопрос: пирог нужно печь в духовке 2700 секунд. Чтобы узнать сколько потребуется времени чтобы испечь десять пирогов нужно время готовки умножить на количество пирогов, то есть на десять. {\displaystyle 2700\cdot 10=27000} , но это время в секундах, а нам бы хотелось получить время в привычных нам часах, минутах и секундах, для этого воспользуемся стандартным способом перевода из одной системы счисления в другую, делением на основание системы счисления. Приступим: Ответ на второй вопрос: чтобы испечь десять пирогов потребуется 7 часов 30 минут и 0 секунд. Двоичная система счисления В компьютерной технике очень часто используется двоичная система счисления. Такую систему очень легко реализовать в электронике (полупроводниковые транзисторы и микросхемы), так как для неё требуется всего два устойчивых состояния (0 и 1). Двоичная система счисления может быть непозиционной и позиционной системой. В ней используется две цифры: 0 и 1. В реальном устройстве это может быть реализовано присутствием какого-либо физического явления или его отсутствием. Например: есть электрический заряд или его нет, есть напряжение или нет, есть ток или нет, есть сопротивление или нет, отражает свет или нет, намагничено или не намагничено, есть отверстие или нет и т.п. Мы уже знаем, как переводить числа в различные системы счисления. Посмотрим, как это происходит с двоичной системой счисления. Переведём число из двоичной системы счисления в десятичную. Вы это можете проверить на программе-калькуляторе Он умеет производить расчёты в двоичной, восьмеричной и шестнадцатиричной системах счисления. Теперь вы знаете, как он это проделывает. Если вы захотите посвятить свою жизнь программированию, то вам часто придётся работать со степенями двойки. Ниже представлена таблица:
Произведём обратное преобразование. Чтобы преобразовать число в десятичном виде к двоичному, нам нужно будет делить всё время на два и смотреть на остаток от деления. Возьмём число 33. 33 : 2 = 16 остаток 1; 16 : 2 = 8 остаток 0; 8 : 2 = 4 остаток 0; 4 : 2 = 2 остаток 0; 2 : 2 = 1 остаток 0; 1 : 2 = 0 остаток 1; Получили {\displaystyle 100001_{2}} . Возьмём число 55. Посмотрим, что получится. 55 : 2 = 27 остаток 1; 27 : 2 = 13 остаток 1; 13 : 2 = 6 остаток 1; 6 : 2 = 3 остаток 0; 3 : 2 = 1 остаток 1; 1 : 2 = 0 остаток 1. Ниже приведены ещё примеры со сложением, вычитанием, умножением и делением. Сложение: 1001 1010 ---- 10011 Вычитание: 1110 0101 ---- 1001 Умножение: 1110 0101 ---- 1110 0000 1110 0000 ------- 1000110 Деление: 1000110|101 101 ----- ---- 0001110 111 101 --- 101 101 --- 00 Троичная система счисления Из целочисленных систем счисления обладает наибольшей плотностью записи информации. Первая троичная ЭВМ «Сетунь» была построена в 1958 году Н. П. Брусенцовым в МГУ. Четверичная система счисления Обладает такой же плотностью записи, как и двоичная система счисления. Таблица такая же, как и для двоичной системы счисления. Восьмеричная и шестнадцатеричная системы счислений Компьютерам очень удобно оперировать двоичными числами, но люди не привыкли работать с большим количеством цифр. Например, чтобы представить в двоичном виде число 1234 потребуется больше 10 двоичных цифр (10011010010). Поэтому были придуманы восьмеричная и шестнадцатеричная системы счислений. Они удобны как и десятичные числа тем, что для представления числа требуется меньшее количество разрядов. А по сравнению с десятичными числами, перевод в двоичное представление очень простой. Это как будто мы двоичное число разбили на группы по три или четыре разряда и каждой двоичной комбинации придумали значок. Вот таблица для восьмеричных цифр:
А вот таблица для шестнадцатеричных цифр:
Перевод произвести очень просто, посмотрим на примере числа 010011010010. Разбиваем его на группы по три цифры: 010 011 010 010. И по таблице Чтобы перевести число в шестнадцатеричное представление разбиваем двоичное число на группы по четыре цифры: 0100 1101 0010. И по таблице С помощью калькулятора Windows мы можем убедиться, что всё проделано верно. В программистских кругах шестнадцатеричные числа принято предварять значком 0x (например, 0x4D2), такое написание пошло от языка программирования C, либо значком $ (например, $4D2), такая нотация произошла от языка программирования Pascal. Иногда в литературе используют буквы «h» (от англ. hexadecimal) и «b» (от англ. binary) для обозначения соответственно шестнадцатеричных и двоичных чисел (например, FFh или 1011b).
|