Учебник_Информатика. Стандарт третьего поколениян. В. Макарова, В. Б. Волков

Название	Стандарт третьего поколениян. В. Макарова, В. Б. Волков
Анкор	Учебник_Информатика.pdf
Дата	26.04.2017
Размер	14.49 Mb.
Формат файла
Имя файла	Учебник_Информатика.pdf
Тип	Документы #5919
страница	28 из 48

1 ... 24 25 26 27 28 29 30 31 ... 48

Справка. Исторически, для обозначения двоичного разряда употребляли слово
сочетание двоичная цифра (binary digit).
В 1948 г. американский математик Джон Уайлдер Таки Qohn Wilder Tukey)
предложил заменить это словосочетание более коротким. После недолгого вы
бора между сокращением «bigit» и «binit», он пришел к слову bit (бит), которое
не только хорошо сокращало «binary digit», но и имело значение в английском
языке (bit — маленький кусочек, самая малая часть чего-либо). На самом деле
бит — это самая малая мера информации и самая малая величина, при помощи
которой информацию можно перевести в данные.
В течение одного такта генератора тактовой частоты центральный процессор может обратиться к одному, двум, четырем или восьми байтам информации. Ко
личество байтов информации, одновременно доступных центральному процессору, определяется количеством разрядов шины данных компьютера. Соответственно,

312
Глава 11. Представление данных в компьютере про компьютеры говорят — 8-, 16-, 32- или 64-разрядный. На сегодняшний день среди персональных компьютеров большинство 32-разрядных, и в настоящее время происходит переход от 32-разрядных к 64-разрядным моделям.
Представление сигналов в любом другом, не двоичном, виде потребовало бы реализации ячеек для хранения информации, в которых каждый разряд обладал бы тремя состояниями и более. В этом случае недостаточно было бы распознавать только факт наличия или отсутствия тока (потенциала). Необходимо было бы еще измерять его уровень, что намного удорожало бы технологию производства таких вычислительных машин.
Технологические особенности производства электронных компонентов, дела
ющие двоичную элементную базу более дешевой, чем троичная, на долгое время отодвинули троичные машины на задний план. Возможно, в будущем компьютеры на троичной логике займут главенствующее положение в технологиях, однако се
годня об этом говорить не приходится. Однако можно с уверенностью утверждать, что представление данных в бинарном коде в недрах ЭВМ — не единственный вариант, и бинарность — всего лишь технологическая, а не информационная не
обходимость.
Таким образом, у всех современных компьютеров данные на физическом уровне представлены в двоичном (бинарном) виде.
Современные компьютеры способны при помощи специального оборудования воспринимать, преобразовывать в данные, хранить и воспроизводить следующие
виды информации:
□ числовую;
□ символьную (текст);
□ звуковую, или аудио (голос, музыку, шумы);
□ графическую (рисунки, фотографии, чертежи, сканированные изображения);
□ видео (фильмы, видеозаписи).
Если сравнивать этот перечень с типами сигналов, которые могут воспринимать органы чувств человека, то вкус, запах и все, что называется «кинестетическими ощущениями» (ощущения веса, давления, положения в пространстве, прикосно
вения, боли), пока не получило соответствующего места в ряду обрабатываемой компьютером информации. Однако сегодня в этом направлении ведутся активные научные и технические разработки, и тот день, когда компьютер сможет хранить, обрабатывать и воспроизводить данные, несущие в себе кинестетическую инфор
мацию, не так уж далек.
11.1.2. Числовые данные
Числовые данные в компьютере представляются двумя подмножествами: це
лыми и действительными числами (числами с плавающей запятой). В отличие от символов, ввод числовых данных не может происходить прямым преобразованием и записью кодов, передаваемых с клавиатуры. С клавиатуры мы передаем последо
вательность символов. Эта последовательность затем программным образом пре
образуется в числа. Для того чтобы полученное число было выведено на экран, оно

11.1. Форма представления данных в компьютере
313
снова программным путем преобразуется в последовательность символов. В памяти компьютера число хранится в виде двоичного представления.
Целые числа, в зависимости от типа данных, хранятся в памяти компьютера, за
нимая один, два, четыре и более байта. Каждый бит в байте — это один двоичный разряд. В случае, когда число должно иметь знак, один из разрядов используется для хранения знака. В табл. 11.1 показаны варианты целочисленных представлений с разным числом байтов.
Таблица 11.1. Представление целых чисел
Количество
байтов
Знак
Диапазон
1
Без знака
0... 255 1
Со знаком
-128 ...127 2
Без знака
0... 65535 2
Со знаком
-32768... 32767 4
Без знака
0... 4294967295 4
Со знаком
-2147483648 ...2147483647 8
Без знака
0... 18446744065119617025 8
Со знаком
-9223372032559808513... 9223372032559808512
Как видите, даже 32-разрядного целочисленного представления, как со знаком, так и без, вполне достаточно для решения большинства задач.
Теоретически в памяти компьютера представление отрицательного целого числа может храниться в прямом, обратном или дополнительном коде. Предположим, нам надо представить в двоичном виде целое число 7. Без знака оно поместится в 8-разрядную ячейку следующим образом:
0 0
0 0
0 1
1 1
Если это десятичное число - 7 (минус семь), то его прямое представление будет выглядеть так:
1 0
0 0
0 1
1 1
То есть старший бит призван показать, что это число со знаком «минус».
Однако на практике отрицательные числа не хранятся в виде прямого кода, а всегда приводятся к дополнительному коду. Этот код получается из прямого следующим образом: все разряды, кроме знакового, инвертируются (то есть вме
сто единиц подставляются 0, вместо нулей — единицы). Так число превращается в обратный код. Затем к результату прибавляется единица, и код становится до
полнительным. Вот так будет выглядеть дополнительный код для числа -7:
1 1
1 1
1 0
0 1

314
Глава 11. Представление данных в компьютере
Дополнительный код используется для уменьшения количества циклов, за которые процессор выполняет арифметические операции над этими числами, по
скольку позволяет заменить операцию вычитания операцией сложения.
Действительные числа состоят из двух частей: мантиссы и порядка. Ман
тисса — это целое число, содержащее только значащие цифры исходного числа, а порядок — это позиция запятой, разделяющей целую и дробную части числа.
Например, если в памяти надо сохранить число 00313,560, то записаны будут два целых числа: 31356 и 3.
При хранении действительных чисел возникает проблема: некоторые действия над числами приводят к потере точности.
Пример. При делении 1 на 3 результатом является бесконечная иррациональная
дробь: 0,3333... Поскольку место в памяти, отведенное под запись этого числа,
не бесконечно, то в определенном месте повторение троек придется остановить
и записать в память округленное число. Это, в свою очередь, значит, что при
умножении такой дроби на три уже не получится результат, равный единице, то
есть происходит потеря точности.
11.1.3. Символьные данные
Символьные данные, которые несут в себе текстовую информацию, попадают в компьютер наиболее простым из всех известных способов: после нажатия клави
ши на клавиатуре генерируется один байт данных, который записывается в память компьютера. Каждой клавише компьютера соответствует одно определенное со
четание битов в байте. Поскольку битов в байте 8, то общее количество сочетаний, которое может быть получено в результате различных комбинаций нулей и единиц внутри байта, равно 256 (28). Например, 10 нажатий клавиш создает в памяти ком
пьютера последовательность из 10 заполненных байтов. Таков процесс поступления в компьютер и хранения в компьютере простого текста.
Любая из комбинаций битов в байте может рассматриваться как число, за
писанное в двоичном коде. Соответствие числа, которое при нажатии клавиши записывается в память компьютера, и символа, который появляется на экране при воспроизведении данного числа в символьном виде, называется кодовой таблицей.
По мере развития компьютерной техники потребность во все более полном ото
бражении символьной (текстовой) информации возрастала. Вначале казалось, что для кодирования символов при помощи чисел с избытком хватит 127 байт. Первое по порядку 31 десятичное число было отдано под служебные символы (перевод строки, перевод каретки, звонок, пустой символ) (табл. 11.2). Следующие по по
рядку числа (от 32 до 127) кодировали символы алфавита (табл. 11.3).
Этой таблицы символов вполне хватило для ввода символьной информации на английском языке, и она стала стандартом ASCII (American Standard Code for
Information Interchange — американский стандартный код для обмена информа
цией).

11.1. Форма представления данных в компьютере
315
Таблица 11.2. Коды управляющих символов (0-31)
Код
Обозначение
Клавиша
Значение
Отображаемый символ
0
nul
Нуль
1
Soh
AA
Начало заголовка
О
2
Stx
ЛВ
Начало текста
Ф
3
Etx лс
Конец текста
V
4
Eot
AD
Конец передачи
♦
5
Enq
AE
Запрос
*
6
Ack
AF
Подтверждение
Ф
7
Bel
AG
Сигнал (звонок)
•
8
Bs
AH
Забой (шаг назад)
D
9
H t
AI
Горизонтальная табуляция
О
10
Lf
AJ
Перевод строки
■
11
Vt
AK
Вертикальная табуляция
12
Ff
AL
Новая страница
9 13
Cr
AM
Возврат каретки
X
14
So
AN
Выключить сдвиг л
15
Si
A0
Включить сдвиг
*
16
Die
AP
Ключ связи данных
►
17
del
AQ
Управление устройством 1
■4
18
dc2
AR
Управление устройством 2
I
19
dc3
AS
Управление устройством 3
п
20
dc4
A y
Управление устройством 4
К
21
nak
AU
Отрицательное подтверждение
§
22
syn
AV
Синхронизация
—
23
etb
AW
Конец передаваемого блока
J
24
can
AX
Отказ t
25
em
AY
Конец среды
1 26
sub
AZ
Замена
-
27
esc л[
Ключ
«-
28
fs л\
Разделитель файлов
L
29
gs л]
Разделитель группы
30
rs
A A
Разделитель записей
А
31
us л_
Разделитель модулей
▼

316
Глава 11. Представление данных в компьютере
Таблица 11.3. Символы с кодами (0-31)
Код
Символ
Код
Символ
Код
Символ
Код
Символ
32
пробел
56 8
80
Р
104
Н
33
!
57 9
81
Q
105
I
34
“
58 82
R
106
J
35
#
59
;
83
S
107
К
36
$
60
<
84
т
108
L
37
%
61
=
85
и
109
m
38
&
62
>
86
V
110
п
39
•
63
?
87
W
111
о
40
(
64
@
88
X
112
Р
41
)
65
А
89
Y
113
q
42
*
66
В
90
Z
114
г
43
+
67
С
91
[
115
S
44
,
68
D
92
\
116
t
45
-
69
Е
93
]
117
U
46 70
F
94 118
V
47
/
71
G
95 119
W
48 0
72
Н
96
'
120
X
49 1
73
I
97
А
121
У
50 2
74
J
98
b
122
Z
51 3
75
•
К
99
с
123
{
52 4
1&
L
100
d
124 1
53 5
11
М
101
е
125
}
54 6
78
N
102
f
126
-
55 7
79
О
103
g
127
del
Для кодирования символов, отличных от символов английского алфавита, была использована вторая часть из 256 комбинаций, числа от 128 до 256. Эта часть полу
чила название расширенной таблицы ASCII и может содержать в себе символы того или иного национального алфавита. При этом если первая часть таблицы ASCII сформирована один раз и не меняется, то вторая ее часть изменяется в зависимости от того, в какой операционной системе вы работаете. Буквы алфавита остаются теми же самыми, а связанные с ними числа меняются. Так, только для русского язы ка появились кодировки CP-866 (M S-D O S), CP-1251 (W indows), KOI8-R
(UNIX и Linux). Именно наличие нескольких кодовых таблиц для одного и того же языка является причиной появления на интернет-страницах потоков странных иероглифов вместо обычного текста: программа просмотра Интернета не всегда способна определить, какую кодовую таблицу выбрать.

11.1. Форма представления данных в компьютере
317
Даже если отвлечься от проблем с путаницей между разными кодовыми табли
цами одного и того же языка, кодирование многоязыковых текстов наталкивается на еще одно препятствие: Что делать, если в одном тексте встречаются фрагменты, написанные на разных языках? Что делать, если текст необходимо совместить с математическими или химическими формулами? Для решения этой проблемы способ кодирования символов еще раз изменили — один символ стали кодировать не одним, а двумя байтами данных. Так появился способ кодирования UNICODE.
Теперь в одном байте можно было хранить код символа, а во втором указывать, из какой кодовой таблицы этот символ извлекать.
Таким образом, текстовая информация в компьютере может быть представлена как однобайтной последовательностью, когда каждый символ кодируется одним байтом в памяти компьютера, так и двухбайтной, требующей вдвое больше памяти для хранения, но зато более универсальной и гибкой.
11.1.4. Мультимедийные данные
Графика
Графические изображения, как и любые другие данные, представлены в компью
тере в виде двоичных чисел. Однако в зависимости от природы этих изображений
(графического формата) числа играют разную роль. Существует два типа графи
ческих форматов, векторный и растровый.
Изображение в растровом формате в памяти компьютера представлено сово
купностью точек, каждая из которых имеет атрибуты (такие как цвет или маска).
Если каждая точка вместе с атрибутами кодируется 32-битным кодом (4 байта), то нетрудно посчитать, что рисунок размером 320 на 200 точек потребует для хране
ния 320 х 200 х 4 = 256 000 байт. Таким образом, растровый формат хранения изо
бражений является весьма ресурсоемким. В то же время, с учетом того, что каждая точка изображения хранится отдельно, имеется возможность ее отредактировать и скорректировать. Таким образом, там, где важно достоверно воспроизвести или откорректировать сохраненную графическую информацию, например, фотоизо
бражение, растровый формат незаменим.
Изображение в векторном формате представляет собой графический объект, составленный из примитивов, а именно: точек, отрезков, прямых, дуг, окружностей, прямоугольников, кривых. Эти примитивы могут быть описаны математическими формулами и выражены числами, обозначающими координаты точек начала и кон
ца отрезка, опорных узлов кривых, радиусом и координатой центра окружности, и т. д. Даже если добавить к этим описаниям несколько чисел, кодирующих цвет, толщину и тип линий, все равно очевидно, что в сравнении с растровым форматом такого рода изображения можно хранить гораздо более компактно. Тот же самый рисунок размером 320 на 200 точек, содержащий на первый взгляд очень сложный чертеж, может в памяти компьютера занимать мало места. Например, изображение машины (рис. 11.2) в векторном формате занимает 41 Кбайт, а в растровом формате
TIF — 395 Кбайт. Разница почти в 10 раз.

318
Глава 11. Представление данных в компьютере а)
б)
н н п
в
Рис. 11.2. Графическое изображение: а) векторный формат; б) растровый формат
Источником графических данных в векторном формате всегда являются вектор
ные графические редакторы или системы автоматизированного проектирования'.
В любом случае это информация, создаваемая человеком в процессе рисований
(черчения). Источниками же графических данных в растровом формате обычнб являются цифровые фотоаппараты или сканеры, которые напрямую воспринима
ют сигналы внешнего мира и переводят их в форму цифровых данных (цифровая фотография или сканированное изображение).
Звуковые данные
Различные звуки и музыка, чтобы превратиться в данные компьютера, должны пройти ряд преобразований. Вначале некоторое устройство (обычно микрофон) должно воспринять звуковой сигнал и преобразовать его в сигнал электрический.
Затем непрерывный (аналоговый) электрический сигнал при помощи другого устройства должен быть преобразован в двоичные числа (в цифровой вид), которые сохраняются в памяти компьютера. Устройство, преобразовывающее аналоговый электрический сигнал в цифровую форму называется АЦП (аналого-цифровой преобразователь). Этапы преобразования сигнала иллюстрирует рис. 11.3.
10001101 00001101 00011001
J
00101100 00111100
_
00101000
С
з
)
00011111
W
10000111
Рис. 11.3. Преобразование звукового сигнала в двоичные числа
На этапе, обозначенном цифрой 1, происходит преобразование звукового сигнала в аналоговый электрический сигнал, на этапе 2 электрический сигнал поступает на вход АЦП, где происходит его дискретизация. Это значит, что с за
данной частотой измеряется уровень электрического сигнала. На этапе 3 получен
ные значения уровней записываются в память компьютера в двоичном виде. Чем на большее количество уровней разбивается весь диапазон аналогового сигнала

11.1. Форма представления данных в компьютере
319
и с чем большей частотой эти уровни замеряются, тем точнее звуковая информация преобразуется в цифровой вид и с тем большей достоверностью она потом будет восстановлена.
С момента, когда звуковой сигнал приводится к цифровому виду, он уже не
обратимо искажается, однако звуковая информация не теряется. Если частота дискретизации выбрана высокой (в несколько раз выше, чем 22 ООО Гц — частота, которую может различить человеческое ухо), а динамический диапазон (то есть количество уровней в каждой точке) достаточно велик, то при восстановлении не
возможно будет различить аналоговый сигнал, записанный на аналоговый носитель
(виниловый диск), и данные, сохраненные на цифровой носитель (компакт-диск).
Чем выше качество сохраняемого в компьютере звука, тем больше для него необходимо места в памяти. Для получения сигнала с гарантированно высоким качеством нужно задать достаточно большое количество уровней и высокую ча
стоту дискретизации.

1 ... 24 25 26 27 28 29 30 31 ... 48