Банковские ИС. Лекция 2 (по гл2) Элементы теор.информации. Лекция 2 элементы теории информации информация различные подходы к этому понятию
Скачать 278 Kb.
|
2.4.2. Алфавитный (объемный) подход к измерению информации Под алфавитом какого-либо языка в информатике понимается не только совокупность букв, но и знаки препинания, цифры, скобки, а также пробел (промежуток между словами). Множество используемых в тексте символов называется алфавитом. Полное число символов алфавита принято называть мощностью алфавита Мощность алфавита обозначим через букву N. Например, мощность алфавита из русских букв и дополнительных символов равна 54. Чем меньше знаков в используемом алфавите, тем длиннее сообщение. Так, например, в алфавите азбуки Морзе всего три знака (точка, тире, пауза), поэтому для кодирования каждой буквы нужно использовать несколько знаков, следовательно, текст, закодированный по Морзе, будет намного длиннее, чем при обычной записи. Представим, что текст к нам поступает последовательно (по одному знаку), причем каждый появляющийся символ с одинаковой вероятностью может быть любым символом алфавита. Каждый символ текста несёт количество информации, которое можно определить по формуле (2.2). Оно называется информационным весом одного символа. Для русского языка (N=54) информационный вес одного символа составляет 5,755 бит. Теперь, для того, чтобы найти количество информации во всём тексте, написанном на русском языке, нужно посчитать число символов в нём и умножить на 5,755. Например, фраза «что такое информация?» включает 21 символ, следовательно, содержится 120,855 бит информации. Таким образом, при алфавитном подходе к измерению информации ее количество от смысла не зависит, а определяется объёмом текста, т.е. числом знаков в тексте (отсюда второе название этого подхода к измерению информации – объемный) и от мощности алфавита. Отсюда следует, например, что нельзя сравнивать информационные объёмы текстов, написанных на разных языках, только по количеству символов, поскольку у них отличаются информационные веса одного символа, вследствие различия мощностей алфавитов. Как отмечалось, именно применение такого подхода к измерению удобно, прежде всего, при использовании технических средств работы с информацией (компьютеров), поскольку он является объективным способом измерения количества информации I. Если быть точным, то в этом случае измеряется количество данных, но для них имеется специальный термин – объем данных Vд, то есть в данном случае I=Vд. Если необходимо определить объем данных(в битах, байтах и т.д.), то, при использовании формулы (2.2) с учетом мощности алфавита N и количества символов n в сообщении, он равен: . (2.6) Объем данных при использовании алфавитного подхода к измерению информации равен произведению информационного веса одного символа на количество символов. Такой подход наиболее полно соответствует задаче, например, инженера связи, который должен передать все данные, содержащиеся в передаваемой телеграмме, вне зависимости от ценности информации для адресата, т.е. передающей системе важно одно: передать нужный объем данных за определенное время. В этом случае теряют смысл понятия «новые» или «устаревшие» сведения, «важная» или «неважная» информация др. Точно также, при архивации, при записи на носители и многих других видах обработки информации с помощью компьютеров смысл информации значения не имеет. Причем, отметим, что данные измеряются в тех же единицах, что и информация. 2.5. Свойства информации. Показатели качества информации 2.5.1. Свойства информации Согласно атрибутивной концепции информации, наряду с веществом и энергией в окружающем нас мире имеется информация, поэтому она должна обладать некоторыми свойствами, которые могут быть отличными от свойств первых двух сущностей окружающего нас мира. К таким свойствам информации можно отнести базовые свойства: запоминаемость, неисчерпаемость, трансформируемость, преобразуемость, передаваемость, а также зависимые от базовых свойства: копируемость, стираемость. Запоминаемость информации Это свойство является важным. Оно говорит, что информация в форме данных обязательно фиксируется объектом, только в этом случае ее можно использовать, в частности, хранить. Обязательно нужно иметь в виду, что запоминающая ячейка обязательно занимает определенное место в пространстве и для запоминания требуется время. Неисчерпаемость информации Информация может иметь неограниченное число пользователей, использоваться неограниченное число раз и при этом оставаться неизменной. Это свойство существенно отличает информацию от материи и энергии, поскольку при взаимодействии объектов, если, например, сколько-то материи исчезло в одном месте, то такое же её количество появилось в другом или произошло её преобразование в энергию. Трансформируемость информации Это свойство означает, что информация может менять форму своего существования при неизменном содержании. Например, сообщение о погоде вы можете прочитать в газете (форма в виде знаков на бумаге, т.е. текста), или услышать по радио (форма в виде звуков). Важным частным случаем трансформируемости является кодирование информации, т.е. смена знаковой системы представления информации без изменения её содержания. Например, при вводе в компьютер с помощью клавиатуры какого-нибудь слова происходит кодирование каждой его буквы в определённую последовательность нулей и единиц, поскольку это необходимо для работы процессора компьютера. В компьютерной технике часто используется сжатие (архивирование) информации без потери содержания, что является разновидностью трансформирования. Преобразуемость информации Это болееобщее свойство, чем трансформируемость, при котором может изменяться и форма и содержание информации. При преобразовании информации содержательная составляющая может, как уменьшаться, так и возрастать. Например, при изложении сложной физической теории в школьном учебнике происходите её упрощение, сопровождающееся снижением содержательной стороны представленной информации, т.к. многие моменты опускаются. Другой пример: вы получаете сообщение, что поезд пришел в 14.00, но вы знаете, что он по расписанию должен прийти в 12 часов, поэтому (после преобразования информации в вашей голове) сверх полученного сообщения вы будете иметь информацию, что поезд опоздал. Фактически, свойство преобразования информации говорит о возможности получения новой информации из первичной, что лежит в основе многих процессов развития. Отметим, что преобразовывать можно и материю и энергию (например, на электростанциях механическая энергия вращения ротора генератора преобразуется в электрическую), но имеется существенное отличие, заключающееся в том, что преобразование материи и энергии связано с переходом одной формы (первичной) в другую форму (вторичную), т.е. с исчезновением первичной. При преобразовании же информации первичная форма может и не исчезнуть. Например, в вышеупомянутом примере с введением обычного слова в компьютер можно представить, что вы сделали это, перепечатывая какой-либо текст, который никуда не пропал, т.е. информация, которую он несет, не исчезла. Копируемость информации Важным следствием трансформируемости и преобразуемости информации является свойство копирования информации, когда не меняется ни ее форма, ни содержание, т.е. получение новой информации, тождественной первичной. При этом количество информации не изменяется. Следует отметить, что тождественность при копировании информации достигнута только при использовании компьютерной техники: вы можете сделать сколько угодно копий какого-либо файла и эти копии ничем (!) не будут отличаться от исходного файла (оригинала), т.е. стирается грань между копией и оригиналом. Ранее процесс копирования соответствовал процессу приближения копии к оригиналу, но тождества достигнуть было невозможно, поскольку любая копия отличалась от оригинала. Например, даже при самой искусной перерисовке картин известных художников эксперты всегда определят, где оригинал, а где копия. Стираемость информации Частным случаем преобразуемости информации является также свойство стираемости, когда количество информации при преобразовании становится равным нулю, причем никаких «следов» стертой информации не остается. Материя же или энергия исчезнуть не могут, они могут преобразовываться в другую форму или друг в друга. Передаваемость информации Свойство передаваемости информации на расстояние (в пространстве и времени) не является базовым, поскольку при передаче информации она преобразуется (трансформируется) в подходящую для этого форму (данные в виде сигналов). Также обстоит дело с хранением информации, которое можно рассматривать как её передачу только во времени: это следствие трансформируемости информации, когда выбирается подходящий для этого тип данных (книги, наскальные рисунки и др.). 2.5.2. Показатели качества информации Качество информации – совокупность показателей, отражающих степень пригодности данной информации для достижения определенных целей и решения конкретных задач, стоящих перед пользователем. То есть, в отличие от рассмотренных выше свойств информации, которые характеризуют информацию как таковую (безотносительно ее потребителя), показатели качества оцениваются с точки зрения потребителя, поэтому качество одной и той же информации для реализации разных проектов будет различным. В состав основных показателей, задающих качество информации, входят: доступность, актуальность, достоверность, полезность (практическая ценность), объективность и субъективность, точность, достоверность, адекватность, достаточность (полнота) и избыточность. Рассматривая их, мы также затронем такие показатели качества информации, как истинность и ложность, избыточность, помехозащищенность. Доступность информации Это мера возможности получить ту или иную информацию. Например, часто информация в книге более доступна, чем на жестком диске компьютера. Другой пример: информация на родном языке более доступна, чем на иностранном. Актуальность информации Она определяется степенью её нужности для текущего момента времени. Неактуальной информация может быть по двум причинам: она может быть устаревшей (например, программа передач недельной давности) – временной фактор, либо незначимой, ненужной (например, сообщение о температуре в Антарктиде для жителей Европы). Полезность (практическая ценность) информации Она характеризует пригодность для решения поставленных задач.Любая ценность информации проверяется на практике. Одна и та же информация может быть ценной для одного потребителя, и совершенно бесполезной для другого. Практическая ценность информации тесно связана с актуальностью, т.к. ценность неактуальной информации (например, устаревшей) резко снижается. Но не всякая устаревшая информация является неактуальной, поскольку она может использоваться для выявления причин неэффективности ранее принятых решений с целью корректировки последующих действий. Примером может служить история, когда из произошедших ранее событий извлекаются уроки для настоящего. Объективность и субъективность информации Информация может быть объективной или субъективной. Объективная информация отражает положение дел в объективном мире, в то время как субъективная информация – в мире внутренних представлений конкретного человека. То есть, в отличие от объективных сообщений, субъективные информационные сообщения сообщают нечто о внутренней психологической реальности человека. Примеры объективной информации: «Москва – столица России»; «Озеро Байкал – самое глубокое». Примеры субъективной информации: «Я верю, что выиграю турнир»; «Я думаю, что студент Иванов знает физику лучше, чем студент Петров». Объективную информацию можно получить с помощью исправных датчиков и измерительных приборов. Проходя через сознание конкретного человека, информация становится субъективной: она преобразовывается в зависимости от мнения, суждения, опыта, знаний конкретного субъекта, а также его ощущений. «На улице 10ºС» - объективная информация, отражающая событие объективного мира. Реагируя на эту температуру, человек говорит: «На улице тепло». Это уже субъективная информация. Часто объективность информации отождествляют с истинностью, а субъективность - с ложностью. Это неправильно. Объективная информация может быть и истинной и ложной, так же как и субъективная. Например, та же информация: «на улице 10ºС», являясь объективной (она отражает положение в объективном мире), будет в то же время ложной, если потерян знак «минус» (на самом деле на улице минус 10 градусов). А субъективная информация «на улице тепло» является истинной, если человек действительно испытывает ощущение тепла, и ложной – если он обманывает и ему на самом деле прохладно. Отметим, что субъективность информации это не есть плохое качество, например, в искусстве субъективность отражения мира играет важнейшую роль. Точность информации Часто о точности информации идет речь, когда имеют в виду числовые характеристики каких-либо процессов: скорость ветра, результат матча, количество игроков на поле, время прибытия поезда и др. Например, информация о скорости движения объекта может быть разной (будет разной и точность информации), в зависимости от уровня погрешностей используемого измерительного прибора. Поэтому точность информации определяется степенью ее близости к реальному состоянию объекта или процесса (источника информации) в количественном отношении. Дело в том, что в процессах передачи и обработки информации неизбежно возникают искажения информации (погрешности), т.е. происходит снижение точности отражения реального состояния объекта вследствие действия различных помех. Таким образом, имеют место истинные числовые значения каждой из составляющих информационного процесса (если, естественно, такое возможно, поскольку не всё может быть выражено на языке цифр), характеризующие реальное состояние источника информации, и есть полученные каким-либо образом числовые оценки этих показателей, которые могут иметь различную точность (имеет место различная степень близости к реальному состоянию). Часто вместо термина «точность» используют термин «погрешность». Например, если относительная погрешность равна 1%, то точность будет равна 99%. Может возникнуть вопрос, а как определить реальное состояние? Он решается различным образом, например, при измерении физических величин можно воспользоваться приборами более высокого класса точности (образцовыми приборами), которые имеют малые погрешности измерений, с последующим сравнением их показаний с показаниями рабочих приборов, причем показания образцовых приборов принимаются в качестве истинного значения. Задача получения точной информации о различных процессах часто стоит перед наукой, в частности, перед такими важными дисциплинами, как метрология и измерительная техника. Достоверность информации Этот показатель качества в сфере информационных технологий используется широко, но является непростым понятием, поэтому рассмотрим его более подробно. В обычном (бытовом) понимании достоверная информация – такая, истинность и необходимая точность которой не вызывает сомнений. Если человек уверен, что он получил информацию без искажений, то она достоверная (т.е. ей можно доверять). Заметьте, что здесь слово «достоверность» связано со словом «верить». Очевидно, что эта вера зависит от внутренних стимулов человека, получившего информацию, от его отношения к источникам этой информации, от уровня значимости и важности полученной информации для человека и т.д. Соответственно, одна и та же информация для разных субъектов может быть по-разному достоверной, т.е. уровень достоверности информации всегда субъективен с позиции получателя информации. Есть известные правила повышения достоверности информации, в частности: ее подтверждение из нескольких независимых источников; сопоставление полученной информации с уже известной по данной тематике; проверка достоверности полученной информации у авторитетных источников; обработка информации математическими методами. При научном подходе дело с достоверностью информации обстоит следующим образом. Данные возникают в момент регистрации сигналов, но не все сигналы являются «полезными» - всегда присутствует какой-то уровень посторонних сигналов (помех), в результате чего полезные данные сопровождаются определенным уровнем «информационного шума». Если полезный сигнал зарегистрирован более четко, чем посторонние сигналы, достоверность информации может быть более высокой. При увеличении уровня шумов достоверность информации снижается. В этом случае для передачи того же количества информации требуется использовать либо большие данных, либо более сложные методы их обработки. Иногда недостоверные данные могут давать достоверную информацию, например, когда заранее известна степень их недостоверности (можно ввести поправку). В науке известны методы обработки недостоверных данных с целью получения более достоверной информации. Эти методы основываются, например, на фильтрации (отсеве) и на статистическом анализе данных. Как правило, в таких случаях, чем больше исходных данных мы имеем, тем выше достоверность полученного результата. В итоге, достоверность информации – это вероятность того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах точности, необходимой для решения конкретной задачи. Эта вероятность носит название доверительной и принимает значения от 0 до 1, т.е. и достоверность лежит в этих пределах. Поскольку абсолютной точности достигнуть невозможно, даже более того: она не всегда нужна, то достоверность определяет допустимый (при решении конкретной задачи) уровень искажения информации, при котором сохраняется, в частности, эффективность функционирования системы. Но очень часто используются граничные значения достоверности: 1 и 0. Если достоверность равна 1, то событие является истинным, а при нулевом значении – ложным. Соответствие с бытовым пониманием достоверности (достоверность различна для разных субъектов) здесь заключается в том, что необходимая точность для субъектов, решающих одну и ту же задачу, может быть различной, что также приводит к различным значениям достоверности. Адекватность информации Мы иногда слышим такие высказывания: «Неадекватное поведение», «неадекватный поступок». Это означает, что действия субъекта не соответствуют тем объективным обстоятельствам, в которых эти действия производятся. Например, во время футбольного матча неадекватным будет стремление болельщика выбежать на поле. Или, наоборот, стремление поддержать свою команду с трибуны является адекватным. Также и информация может быть адекватной или нет. Под адекватностью понимают степень соответствия информации, полученной потребителем, тому содержанию, которое вложил в неё источник информации. Например, если учитель математики ученикам пятого класса задаст пример на вычисление производной, то эти данные можно рассматривать как неадекватные, поскольку учебной программой не предусмотрено знание такого материала в пятом классе и автор учебника не рассчитывал на его чтение пятиклассниками. Если же такой пример будет задан в 11 классе, то данные будут адекватными, т.к. по программе этот материал уже пройден. Адекватность информации нельзя путать с вышерассмотренными показателями точности и достоверности. Информация может быть адекватной, но недостоверной (неточной); неадекватной, но достоверной; а может быть и адекватной и достоверной. Например, человек рассказал анекдот на вечеринке: информация в нем может быть адекватной, имеющей развлекательный характер, но недостоверной, поскольку события в нём совершенно не соответствуют объективной реальности и даже являются Достаточность (полнота) и избыточность информации Достаточность (полнота) информации означает, что набор ее показателей является минимальным, но достаточным для принятия правильного решения. Альтернативой достаточности является избыточность информации, которая иногда снижает качество информации и эффективность принимаемых потребителем решений, поскольку отвлекает внимание на ее дополнительный анализ. Например, если турист отправляется в поход, то его интересует такой набор показателей как температура воздуха, скорость ветра и его направление, возможность осадков. Но если известен прогноз температуры на день и на ночь, то прогноз температуры на каждый час будет избыточным, также как и прогноз об атмосферном давлении, поскольку имеется информация о возможных осадках. Но этот вопрос на самом деле весьма непростой, поскольку избыточность часто играет и положительную роль. Известно, что обычный текст в книге, визуальная информация, получаемая с помощью органов зрения, имеют существенную избыточность. Например, если отбросить каждую третью букву в тексте на русском языке, то такой текст можно прочитать, получив всю информацию, но придется больше напрягаться. Поэтому напрашивается вывод, что избыточность информации повышает помехозащищенность информации при возможных ошибках в передаче данных, а также способствует расслаблению и отдыху, например при просмотре кинофильмов или чтении художественной литературы. В информатике постоянно приходится искать компромисс между необходимостью снижения избыточности данных (которая приводит к увеличению объемов хранения, повышению стоимости оборудования и снижению скорости обработки информации), и поиском эффективных программных методов обработки данных (которые часто основаны, наоборот, на избыточности данных). Это связано с тем, что одной из основных задач информатики, как отмечалось в первой главе, является не просто получение результата, а его достижение с минимальными затратами всех видов ресурсов (материальных, информационных, финансовых). |