диплом. диплом методы сжатия. Методы сжатия цифровой информации
Скачать 218 Kb.
|
1.2. Виды информации и ее кодированиеВиды информации. Обычно для классификации объектов одной природы используется то или иное свойство либо набор свойств объектов. Нас интересует классификация информации в плане автоматизации основных информационных процессов. Первоначально вычислительные машины применялись только для обработки числовой информации, однако довольно быстро выяснилось, что их возможности не ограничиваются только работой с числами. Далеко не вся информация окружающего нас мира может быть обработала компьютером, ведь пока не придумали такого компьютера, который мог бы чувствовать или наслаждаться произведениями искусства. Поэтому, говоря об информации, необходимо выделить тс се вилы, которые компьютер воспримет и позволит человеку использовать свои ресурсы для обработки, хранения и передачи такой информации. Компьютер может работать с текстовой, числовой, табличной, графической информацией, а также со звуковой, анимационной и видеоинформацией. Также компьютер воспринимает специальную двоичную информацию. В настоящее время практически все компьютерные технологии ограничиваются обработкой перечисленных видов информации. С развитием компьютерной техники увеличиваются объемы перерабатываемой информации. И хотя современные компьютеры могут делать очень много, все же их возможности не безграничны. Наибольший эффект от применения компьютера будет там, где оправдано его применение. Кодирование информации — это преобразование одной последовательности сигналов в другую. Под кодированием данных понимается выражение данных одного типа через данные другого типа. Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления, поэтому обычно используется прием кодирования [7]. Человеческий язык — это система кодирования понятий для выражения мыслей посредством речи. Азбуки — системы кодирования компонентов языка с помощью графических символов. Своя системы существует и в вычислительной технике. Она называется двоичным кодированием и основана на представлении данных последовательностью всего двух цифр: 0 и 1. Для представления дискретной информации в компьютере применяется алфавитный способ, основанный на использовании фиксированного конечного набора символов (алфавита). Примерами алфавитов могут служить алфавиты естественных человеческих языков, совокупность десятичных цифр, любая другая упорядоченность знаков, предназначенная для образования и передачи сообщений. Символы из набора алфавита называются буквами, а любая конечная последовательность букв — словом в этом алфавите. При этом не требуется, чтобы слово обязательно имело языковое смысловое значение. Процесс преобразования информации часто требует представлять буквы одного алфавита средствами (буквами, словами) другого алфавита. Такое представление и называется кодированием. Процесс обратного преобразования информации относительно ранее выполненного кодирования называется декодированием. Предыстория кодирования информации. Люди общаются в основном с помощью сказанных или написанных слои. Эта система норм&1ьно работает, когда пес участники находятся поблизости друг от друга (в пределах слышимости или видимости), А если мы хотим связаться с удаленным собеседником? С древних времен до XIX в. для этой цели использовались курьеры с устными или письменными сообщениями. Такая связь работала неплохо, хотя часто слишком медленно; к тому же сообщение или курьер до адресата порой не доходили. Шло время, развивались технологии, и люди изобретали различные коммуникационные приспособления. В доиндустриальную эпоху для передачи сообщений на большие расстояния использовали устройства наподобие маяков. Индейцы Северной Америки применяли дымовые сигналы, в армиях для передачи сообщений использовали флаги и зеркала. Создавались и хитроумные механизмы для передачи сообщений на все увеличивающиеся расстояния. Техническая революция сопровождалась распространением электричества и телеграфа, позволявшего мгновенно передавать сообщения на очень большие расстояния по одному проводу. Теперь уже не нужно было видеть человека на другом конце провода или посылать к нему посредника-почтальона. Телеграф и дымовые сигналы имеют одно общее свойство — им требуется некоторый код, чтобы перевести человеческий язык в форму, которую мог бы передать механизм или телеграфный аппарат. На принимающем конце этот код необходимо перевести обратно па человеческий язык. Уже в ранних коммуникационных устройствах сформировались две идеи, которые легли в основу современных компьютеров [12]: 1)цифровой (digital), т.е. дискретный, код, основанный па двух состояниях (включено—выключено, или 0 и I); 2)специализированный машинный язык (обычно цифровой), используемый машиной для обработки данных. Телеграф и первые радиостанции применяли для передачи сообщений специальный кол — азбуку Морзе, названную но имени ее создателя Сэмюэла Ф. Б. Морзе. В ней с каждой буквой алфавита сопоставлена комбинация точек (коротких импульсов) и тире (длинных импульсов). Импульсы передаются по проводам в определенной последовательности, которую оператор на принимающем устройстве переводит обратно в буквы и слова. Как правило, оператор использует справочник по кодам, но опытные операторы знают код настолько хорошо, что могут расшифровывать каждый символ по памяти. Современные компьютеры похожи на ранний телеграф, ведь они передают информацию по проводам в цифровой форме, используя специальный код. Но если основная задача телеграфа передавать информацию на далекие расстояния, то компьютер перелает данные внутри себя. При этом компьютер использует другой кодовый язык и несколько проводов, а не один, как телеграф. Кодирование данных двоичным кодом. На современном языке телеграф можно назвать устройством для цифровой последовательной связи. Связь является цифровой, потому что в ней используется дискретный (включено—выключено) код; последовательной, потому что элементы языка (точки и тире) отправляются последовательно один за другим. Если мы разработаем код, в котором каждая буква алфавита будет представлена комбинацией из восьми элементов (0 или 1), и будем отправлять их один за другим, то мы создадим цифровое последовательное устройство. При наличии единственного провода такой способ связи работает прекрасно, но медленно (ведь нам приходится посылать но очереди восемь единиц информации, чтобы передать одну букву). А если вместо одного у нас было бы восемь проводов? Тогда мы могли бы передать все восемь элементов сразу, или параллельно. Именно так данные передаются в компьютере. Кодирование может производиться без потери и с потерями информации. Так, преобразование принципиально различных видов информации — непрерывной в дискретную (аналого-цифровое преобразование (АЦП)) и дискретной в непрерывную (цифро-аналоговое преобразование (ЦАП)) — возможно только с потерей информации. К кодированию можно отнести и сжатие (архивацию) информации. Сжатие — это устранение избыточности информации, например за счет упрощения кодов путем исключения из них постоянных битов. Другой разновидностью кодирования является введение избыточной информации, что широко применяется в криптографии. Примерами такого кодирования могут служить электронный сертификат, цифровая подпись и шифрование [15]. |