информатика. Вопрос Понятие, структура и задачи информатики
Скачать 6.17 Mb.
|
Вопрос 3. Представление информации в ЭВМ.Компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видеоинформацию. Вся информация в ЭВМ представлена в виде двоичных кодов. Как известно (из предыдущего раздела), 1 бит – это наименьшая единица информации для обозначения одного двоичного разряда, способного принимать значение 0 или 1. Биты нумеруются справа налево, начиная с нулевого разряда. С помощью набора битов можно представить любой символ (число, букву или знак). Однако отражать данные в такой форме не совсем удобно, и биты группируются в пакеты по 8 бит. Поэтому обычно информация представляется байтами. Комбинируя возможные комбинации из 8 бит (байт), можно получить 256 (28) различных кодов. Для кодирования символов в ЭВМ используют кодовые таблицы. На сегодняшний день стандартом де-факто является таблица ASCII (American Standard Code for Information Interchange — американский стандартный код для обмена информацией), в котором каждый символ закодирован десятичным числом (от 0 до 255): коды 0…31 — для специальных (управляющих) клавиш; коды 32…127 — для цифр, латинских букв и стандартных знаков; коды 128…255 — для букв национальных алфавитов и специальных знаков. Кодировка согласно таблице ASCII (код принят в 1963 г.) используется в операционных системах семейства Windows, и ее часто называют кодировкой CP-1251 (Code Page — кодовая страница). Также существуют кодировки CP-866 (для DOS) и КОИ-81 (для Unix). В настоящее время широко распространилась альтернативная кодовая таблица (в стандарте Unicode), позволяющая представить большее количество символов. В ней на каждый символ отводится 2 байта, поэтому можно закодировать 65 536 (216) различных символов. Графическая информация (в отличие от текстовой) представляется на экране в виде растрового изображения, которое формируется из определенного количества строк, содержащих определенное количество точек (пикселей), имеющих свой цвет, заданный специальным кодом. В процессе кодирования изображения производится его пространственная дискретизация — построение изображения из большого количества отдельных цветных точек. Иначе кодируется звуковая информация. Любая звуковая волна имеет непрерывно меняющиеся частоту и амплитуду. При увеличении амплитуды сигнала усиливается громкость звука, а при увеличении его частоты повышается тональность. Для обработки в ЭВМ звуковая (аналоговая) информация кодируется в виде последовательности цифровых импульсов в процессе дискретизации звука. Дискретизация — это преобразование непрерывных звуков (или изображений) в набор дискретных значений в закодированной форме. Для представления числовой информации используется двоичная система счисления. В ЭВМ применяются две формы представления чисел: 1) в естественной форме (с фиксированной запятой) все числа изображаются в виде последовательности цифр с постоянным положением запятой, отделяющей целую часть от дробной, например, 12 345,6789. Эта форма наиболее проста, естественна, но имеет небольшой диапазон представления чисел и поэтому не всегда применима при вычислениях; 2) в вещественной форме (с плавающей запятой) каждое число изображается в виде двух групп цифр: мантиссы (абсолютная величина которой должна быть меньше 1) и порядка (целое число). Например, числу 2 000 000 в естественной форме соответствует число 0,2Е7 в вещественной форме, где 0,2 — мантисса числа, а 7 — порядок числа (степень, в которую надо возвести основание системы счисления (в нашем примере – 10) для получения исходного числа – 0,2 · 107 = 2 000 000). Эта форма представления имеет огромный диапазон отображения чисел и является основой в современных ЭВМ. В персональном компьютере могут обрабатываться поля постоянной и переменной длины. Размеры полей постоянной длины: полуслово — 1 байт; слово — 2 байта; двойное слово — 4 байта; расширенное слово — 8 байт. Числа с фиксированной запятой чаще всего имеют формат полуслова или слова, числа с плавающей запятой — формат двойного или расширенного слова. Поля переменной длины могут иметь любой целый размер от 1 до 256 байт. Для измерения «емкости» памяти используются биты и байты. В современных ЭВМ используются производные единицы измерения информации: 1 килобайт (КБайт — КБ) = 210 байт = 1024 байта; 1 мегабайт (МБайт — МБ) = 220 байт = 1024 KБ = 1 048 576 байт; 1 гигабайт (ГБайт — ГБ) = 230 байт = 1024 МБ; 1 терабайт (ТБайт — ТБ) = 240 байт = 1024 ГБ; 1 петабайт (ПБайт — ПБ) = 250 байт = 1024 ТБ; 1 экзабайт (ЭБайт — ЭБ) = 260 байт = 1024 ПБ; 1 зеттабайт (ЗБайт — ЗБ) = 270 байт = 1024 ЭБ; 1 йоттабайт (ЙБайт — ЙБ) = 280 байт = 1024 ЗБ. В физике термин «кило» означает 1000, а в информатике — 1024, так как это число более естественно для вычислительных машин, которые в основе своей арифметики используют число 2 (как человек применяет 10). Поэтому числа 10, 100, 1000 и т.д. удобны для человека, а числа 2, 4, 8, 16, …, 1024 (210) и т.д. «удобны» для ЭВМ. Например, одна страница стандартного машинописного текста формата А4 содержит примерно 3 KБ информации, а цветная фотография размером 10 см х 15 см – около 8 МБ (в несжатом виде). |