Главная страница

Лидовский. Учебное пособие написано на основе односеместрового 108 часового курса лекций и материалов для практических занятий, используемых автором в учебной работе со


Скачать 0.89 Mb.
НазваниеУчебное пособие написано на основе односеместрового 108 часового курса лекций и материалов для практических занятий, используемых автором в учебной работе со
АнкорЛидовский.pdf
Дата20.03.2019
Размер0.89 Mb.
Формат файлаpdf
Имя файлаЛидовский.pdf
ТипУчебное пособие
#26169
КатегорияИнформатика. Вычислительная техника
страница10 из 11
1   2   3   4   5   6   7   8   9   10   11

(dot per inch, точек на дюйм) или лазерный принтер с разрешением dpi, таки на типографскую аппаратуру с разрешением 2400 имея гарантии, что изображение будет наилучшего качества, возможного на выбранной аппаратуре. Возможности PostScript перекрывают возможности DVI, поэтому некоторые системы при компиляции документов производят сразу файлы в формате PostScript или Файлы PostScript можно вручную корректировать, но из-за сложности языка — это очень непросто, особенно если используются символы, не входящие в ASCII. Фактически эти файлы можно рассматривать как только для чтения и использовать для распространения информации, не подлежащей изменению. Комментарии в PostScript, как ив, начинаются знаком % и заканчиваются концом строки. Первая строчка программы обычно содержит точное название формата файла. Собственно программа начинается в файле с символов и заканчивается символами %%EOF. программы кроме собственной системы шрифтов могут использовать шрифты True Type фирм Apple и Различают уровни (levels) языка PostScript. Уровень 1 может поддерживать только черно-белую графику. Уровень 2 может работать с цветом. Уровень 3 — это современное состояние языка.
Данные из файла PostScript можно показывать по мере их поступления, что удобно для использования в Internet. Однако есть две причины, по которым документы PostScript сравнительно редко включаются в страницы) они весьма велики по размерам (этот недостаток снимается программами сжатия, работающими в реальном времени) они могут содержать в себе шрифты, защищенные авторскими правами (шрифты их владелец может использовать при печати, ноне распространять).
Файлы в формате PDF лишены двух означенных недостатков они сжаты и из них сложно извлечь отдельные шрифты, — поэтому они стали фактическим стандартом Internet для обмена документами, не подлежащими изменению. Программы для просмотра файлов доступны бесплатно. Наиболее используемая из них — это Adobe Acrobat
Reader. Первая строчка файла в формате PDF начинается со знака за которым следует идентификационная запись версии формата используемой в этом файле. Далее, как правило, идут бинарные данные.
Расширение имени файла — Между документами PostScript и PDF можно осуществлять взаим- но-однозначное преобразование, хотя PDF в отличие от PostScript это не язык программирования, а скорее язык описания документа
Приложение А. Ответы на все упражнения. 87 и 119.
2. 24 КГц. 8192.
4. x = 5.
5. HX = 0.9 + log
2 5 − 0.3 log
2 3 ≈ 2.75 бит/сим.
6. I(Y, X
1
) = 0.5 бит/сим.
7. I(Z, X
1
) = I(X
1
, X
1
) = HX
1
= 1 бит/сим, те полностью определяет и, следовательно, X
1
— это функцией от Z. HZ = 2
бит/сим.
8. I(X
1
, X
2
) = (5 − 3 log
2 3)/3 ≈ 0.08 бит/сим.
9. I(X
1
, Y ) = (10 − 3 log
2 3)/8 ≈ 0.66 бит/сим, HX
1
= 2 бит/сим,
HY = (26 − 3 log
2 3)/8 ≈ 2.65 бит/сим.
10. I(Z, X
1
) = (22 − 3 log
2 3)/16 ≈ 1.08 бит/сим, HZ = (54 −
3 log
2 3)/16 ≈ 3.08 бит/сим.
11. I(X
1
, Y ) = (3 log
2 3 − 2)/9 ≈ 0.31 бит/сим, I(X
2
, Y ) = (3 log
2 3 +
4)/9 ≈ 0.97 бит/сим, HX
1
= HX
2
= log
2 3 ≈ 1.58 бит/сим, HY =
(12 log
2 3 − 2)/9 ≈ 1.89 бит/сим.
12. HX = 7/4 = 1.75 бит/сим, HY = (24 − 3 log
2 3 − 5 log
2 5)/8 ≈
0.95 бит/сим, HZ = (328 − 12 log
2 3 − 35 log
2 5 − 17 log
2 17)/64 ≈ 2.47
бит/сим, I(Z, Y ) = (216 − 12 log
2 3 − 35 log
2 5 − 17 log
2 17)/64 ≈ 0.72
бит/сим.
13. M L1(X) = 3 бит/сим, M L2, 3, 4(X) = 2.2 бит/сим, HX =
log
2 5 − 0.2 ≈ 2.12 бит/сим.
14. code(0) = 10, code(1) = 0, code(2) = 11 — это один из вариантов кодирующей функции. M L(X) = HX = 1.5 бит/сим.
15. code(2
n
) = 1 · · · 1
n−1 0 или code(2
n
) = 0 · · · 0
n−1 1. HX =

n=1
n/2
n
=
M L(X) = 2 бит/сим.
16. M L(X)
HX ≈ 3.25 бит/сим.
17. inf (s1) = 1, cont(s1) = 2, inf (s2) = 0.5, cont(s2) = 0.75.
18. 1.56 бит/сим.
19. HX ≈ 2.17 бит/сим, код Хаффмена M L(X) ≈ 2.22 бит/сим,
код Шеннона-Фэно M L(X) ≈ 2.28 бит/сим.
20. Шеннона-Фэно, Хаффмена: M L
1
(X
1
) = 2 бит/сим., M L
1
(X
2
) =
2.25 бит/сим., M L
1
(X
3
) = 2.7 бит/сим., M L
1
(X
4
) = 2 13
/
60
бит/сим.
Арифметический: M L
1
(X
1
) = 1 5
/
6
бит/сим., M L
1
(X
2
) = 2.05 бит/сим.,
M L
1
(X
3
) = 2.3 бит/сим., M L
1
(X
4
) = 2 1
/
60
бит/сим.
21. L
Хаффмена
= 3 бита, арифметический 4 бита. 010001011, 01011111.
23. 81, враз. Считая, что код генерирутся д.с.в. X с распределением P (X =
A) = 2/3, P (X = B) = 1/3, можно получить наилучшие коды, для которых L
Хаффмена-1
(ABAAAB) = 6 бит, L
Хаффмена-2
(ABAAAB) = бит, L
Хаффмена-3
(ABAAAB) = 5 бит, арифметический) = 1 бит. ’B’10’C’1101 26. code(AABCDAACCCCDBB) = ’A’10’B’00’C’000’D’00011001111 100110011001, L(AABCDAACCCCDBB) = 62 бит, длина исходного сообщения бит. КИБЕРНЕТИКИ) = КИБЕР 100’Н’1111000’Т’100110111, КИБЕРНЕТИКИ) = 85 бит, длина исходного сообщения — 88 бит. СИНЯЯ СИНЕВА СИНИ) = СИНЯ ’101001011100’Е’11000’В’10100’А’1010101101101111,
L(СИНЯЯ СИНЕВА СИНИ) = 114 бит, длина исходного сообщения —
136 бит. Распакованное сообщение — AFXAFFXFXAXAFFA, его длина 120 бит, длина сжатого кода — 52 бит. 01000010111001.
29. AABCDAACCCCDBB, LZ77: 0,0,’A’
11,1,’B’
0,0,’C’
0,0,
’D’
7,2,’C’
11,2,’C’
5,2,’B’
0,0,’B’ , длина 8 ∗ 15 = 120 бит LZSS:
0’A’1 11,1 0’B’0’C’0’D’1 7,2 1 8,1 1 11,1 1 10,2 1 5,1 1 3,1 1 11,1 , длина бит LZ78: 0,’A’
1,’B’
0,’C’
0,’D’
1,’A’
3,’C’
6,’D’
0,’B’
0,’B’ , длина 9 ∗ 12 = 108 бит LZW: 0’A’0’A’0’B’0’C’0’D’
256 0’C’ 262 259 0’B’0’B’, длина 11 ∗ 9 = 99 бит. КИБЕРНЕТИКИ,
LZ77:
0,0,’К’
0,0,’И’ , 0,0,’Б’
0,0,’Е’
0,0,’Р’
0,0,’Н’
9,1,’Т’
5,1,’К’
0,0,’И’ , длина 9 ∗ 15 = 135 бит LZSS: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’
1 9,1 Т 5,1 1 5,2 , длина 3 ∗ 7 + 7 ∗ 9 = 84 бит LZ78: 0,’К’
0,’И’
0,’Б’
0,’Е’
0,’Р’
0,’Н’
4,’Т’
2,’К’
0,’И’ , длина 9 ∗ 12 = бит LZW: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’0’Е’0’Т’0’И’ 256 , длина 10 ∗ 9 =
90 бит. СИНЯЯ СИНЕВА СИНИ, LZ77: СИНЯ ’
6,3,’Е’
0,0,’В’
0,0,’А’
5,4,’И’ , длина 9 ∗ 15 = бит LZSS: СИНЯ 11,1 0’ ’ 6,3 ЕВА 5,4 1 10,1 , длина бит LZ78: СИНЯ ’
1,’И’
3,’Е’
0,’В’
0,’А’
0,’ НИ , длина 12 ∗ 12 = 144 бит СИНЯЯ ’ 256 НЕВА 261 257 И, длина ∗ 9 = 126 бит. Нет. Это следует из очевидного неравенства для длин кодов log
2
(L
D
+ 256) < log
2
(L
D
) + 8, где L
D
— это размер словаря. Во всех случаях сообщение — AFXAFFXFXAXAFFA, длина кода LZ77 — 105 бит, LZSS — 62 бит, LZ78 — 108 бит, LZW — 99 бит. 2000 бод. 1) 8000/3 ≈ 2666.67 сим/сек; 2) ≈ 2523 сим/сек; 3) 2000 сим/сек.
34. Пусть X — д. св, определяющая передатчика д. с. в.,
определяющая приемник. Тогда P (Y = 00/X = 00) = pp, P (Y =
00/X = 01) = pq, . . ., P (Y = 00/X = 11) = qq, . . .
86

35. C
5 14
p
9
q
5
,
4
i=0
C
i
14
p
14−i q
i
,
4
i=0
C
i
14
= 1471.
36. ≈ 0.3%, ≈ 7.7%; ≈ 0.004%, ≈ 0.797%.
37. r = 6, 11
r
16.
38. r
2, r
9.
39. E
1
: 1. 00 → 00000, 01 → 01110, 10 → 10101, 11 → 11011;
2. min d = 3, P
необнаружения ошибки 2p
2
q
3
+ pq
4
, код исправляет или обнаруживает все ошибки кратности соответственно доили 10000 11110 00101 01011 00011 01101 10110 11000 10010 11100 00111 01001;
4. правильной передачи p
5
+ 5p
4
q + 2p
3
q
2
, код исправляет все ошибки кратности 1 и 2 из 10 ошибок кратности 2; 5. 10001 → 10, 01110 →
01, 10101 → 10. E
2
: 1. 000 → 0000, 001 → 0010, 010 → 0101, 011 →
0111, 100 → 1001, 101 → 1011, 110 → 1100, 111 → 1110; 2. min d =
1, P
необнаружения ошибки p
3
q + 3p
2
q
2
+ 3pq
3
, код не исправляет и не обнаруживает все ошибки никакой кратности. 0000 0010 0101 0111 1001 1011 1100 1110 0001 0011 0100 0110 1000 1010 1101 1111;
4. правильной передачи p
4
+p
3
q, код исправляет 1 из 4 ошибок кратности 5. 1001 → 100, 0110 → 011, 1101 → 110.
40. нет, т.к.
2
i=0
C
i
14
= 2 8
41. 55 10
= 001010101 → 0001001010111, 200 10
→ 100011001000,
1000001000001 → 000100101, 1100010111100 → 001011101.
42. 0100 → 01100010100, 10001101 → 110011101111001, 11110 →
10001110110.
43. Первое — нет, второе — да. g(x) = 1 + x + x
2
+ x
4
+ x
5
+ x
8
+ x
10 45. 1000, 1111.
46. ПТУРХЧЧЮНФЫ.
47. 22: A отправляет B 58, B возвращает 94, A окончательно отправляет отправляет A 135, A возвращает 15, B окончательно отправляет 143.
48. 53, 51; 247.
49. для a = 33 α = 237.
50. α = 21, 124.
51. H1 A name=”2” /A Глава 2 /H1 .
87
Приложение Б. Управляющие коды ASCII
Код
Полное имя кода в Unicode
10-й
16-й
Клавиатурный
(краткое имя в Перевод имени кода — описание использования кода.
Выше представлен шаблон для следующей далее таблицы управляющих символов. Под клавиатурным кодом подразумевается комбинация двух клавиш, Ctrl (Control, в таблице это знаки приводимой, одновременное нажатие которых должно производить соответствующий код 00
^@
NULL (Пусто — этот код используется как завершающий в представлении строк многими системами программирования, например, Си, поэтому его использование в текстовых файлах крайне нежелательно 01
^A
START OF HEADING (Начало заголовка — практически не используется 02
^B
START OF TEXT (Начало текста — практически не используется 03
^C
END OF TEXT (Конец текста — в Unix и MS-DOS ввод этого символа с клавиатуры служит сигналом для прекращения выполнения программы 04
^D
END OF TRANSMISSION (Конец передачи — в Unix и PostScript означает конец вводимых данных 05
^E
ENQUIRY (Кто там — практически не используется 06
^F
ACKNOWLEDGE (Подтверждение, да — практически не используется 07
^G
BELL (Звонок — при его печати на консоли MS-DOS или Unix должен производиться звуковой сигнал 08
^H
BACKSPACE (Возврат на шаг — означает, что следующий символ следует печатать с предшествующей позиции 09
^I
HORISONTAL TABULATION (Горизонтальная табуляция — переход наследующую позицию табуляции (Подача новой строки — переход на новую строку. В текстовых файлах и Microsoft Windows с сохранением текущей горизонтальной позицию. В текстовых файлах Unix с переходом на первую горизонтальную позицию

11 0B
^K
VERTICAL TABULATION (Вертикальная табуляция — используется очень редко, как правило, принтерами 0C
^L
FORM FEED (Подача новой формы — для консоли, как правило, означает очистку экрана, для принтера — завершение печати на текущем листе и запрос нового 0D
^M
CARRIAGE RETURN (Возврат каретки — переход на первую горизонтальную позицию строки. В текстовых файлах MS-DOS и Microsoft Windows с сохранением текущей строки, а в текстовых файлах Macintosh OS с переходом на новую строку. В текстовых файлах Unix не используется 0E
^N
SHIFT OUT (Выход — используется очень редко, как правило, принтерами 0F
^O
SHIFT IN (Вход — используется очень редко, как правило, принтерами 10
^P
DATA LINK ESCAPE (DLE)
Авторегистр 1 — практически не используется 11
^Q
DEVICE CONTROL ONE (Используется некоторыми телекоммуникационными протоколами как байт X-ON.
18 12
^R
DEVICE CONTROL TWO (Практически не используется 13
^S
DEVICE CONTROL THREE (Используется некоторыми телекоммуникационными протоколами как байт X-OFF.
20 14
^T
DEVICE CONTROL FOUR (Практически не используется 15
^U
NEGATIVE ACKNOWLEDGE (Нет — практически не используется 16
^V
SYNCHRONOUS IDLE (Синхронизация — практически не используется 17
^W
END OF TRANSMISSION BLOCK (Конец блока — практически не используется 18
^X
CANCEL (Аннулирование — используется очень редко, как правило, принтерами (Конец носителя — практически не используется 1A
^Z
SUBSTITUTE (Замена — в MS-DOS, Macintosh OS и CP/M — это маркер конца текстового файла

27 1B
^[
ESCAPE (ESC)
Авторегистр 2 — указывает на то, что некоторое количество кодов после него ион сам образуют группу, рассматриваемую как один код С SEPARATOR (Разделитель файлов — практически не используется 1D
^]
GROUP SEPARATOR (Разделитель групп — практически не используется 1E
^^
RECORD SEPARATOR (Разделитель записей — практически не используется 1F
^
UNIT SEPARATOR (Разделитель элементов — практически не используется 7F
DELETE (Забой — удаление последнего видимого знака печатаемой строки.
В чисто текстовых (plain text) файлах допустимы только управляющие символы, отмечающие концы строки, как правило, переходы на позиции табуляции (код 9). Маркер конца строки в Unix — это код, в Macintosh OS — 13, в CP/M, MS-DOS и Microsoft Windows последовательность 13, 10.
90
Приложение В. Кодировка видимых символов ASCII
Код
Символ
Имя символа
10-й
16-й в Unicode 3.2 32 20
SPACE
33 21
!
EXCLAMATION MARK
34 22
"
QUOTATION MARK
35 23
#
NUMBER SIGN
36 24
$
DOLLAR SIGN
37 25
%
PERCENT SIGN
38 26
&
AMPERSAND
39 27
´
APOSTROPHE
40 28
(
LEFT PARENTHESIS
41 29
)
RIGHT PARENTHESIS
42 2A
*
ASTERISK
43 2B
+
PLUS SIGN
44 2C
,
COMMA
45 2D
-
HYPHEN-MINUS
46 2E
FULL STOP
47 2F
/
SOLIDUS
48 30 0
DIGIT ZERO
49 31 1
DIGIT ONE
50 32 2
DIGIT TWO
51 33 3
DIGIT THREE
52 34 4
DIGIT FOUR
53 35 5
DIGIT FIVE
54 36 6
DIGIT SIX
55 37 7
DIGIT SEVEN
56 38 8
DIGIT EIGHT
57 39 9
DIGIT NINE
58 3A
:
COLON
59 3B
;
SEMICOLON
60 3C
<
LESS-THAN SIGN
61 3D
=
EQUALS SIGN
62 3E
>
GREATER-THAN SIGN
63 3F
?
QUESTION MARK
91

Код
Символ
Имя символа
10-й
16-й в Unicode 3.2 64 40
@
COMMERCIAL AT
65 41
A
LATIN CAPITAL LETTER A
66 42
B
LATIN CAPITAL LETTER B
67 43
C
LATIN CAPITAL LETTER C
68 44
D
LATIN CAPITAL LETTER D
69 45
E
LATIN CAPITAL LETTER E
70 46
F
LATIN CAPITAL LETTER F
71 47
G
LATIN CAPITAL LETTER G
72 48
H
LATIN CAPITAL LETTER H
73 49
I
LATIN CAPITAL LETTER I
74 4A
J
LATIN CAPITAL LETTER J
75 4B
K
LATIN CAPITAL LETTER K
76 4C
L
LATIN CAPITAL LETTER L
77 4D
M
LATIN CAPITAL LETTER M
78 4E
N
LATIN CAPITAL LETTER N
79 4F
O
LATIN CAPITAL LETTER O
80 50
P
LATIN CAPITAL LETTER P
81 51
Q
LATIN CAPITAL LETTER Q
82 52
R
LATIN CAPITAL LETTER R
83 53
S
LATIN CAPITAL LETTER S
84 54
T
LATIN CAPITAL LETTER T
85 55
U
LATIN CAPITAL LETTER U
86 56
V
LATIN CAPITAL LETTER V
87 57
W
LATIN CAPITAL LETTER W
88 58
X
LATIN CAPITAL LETTER X
89 59
Y
LATIN CAPITAL LETTER Y
90 5A
Z
LATIN CAPITAL LETTER Z
91 5B
[
LEFT SQUARE BRACKET
92 5C
\
REVERSE SOLIDUS
93 5D
]
RIGHT SQUARE BRACKET
94 5E
^
CIRCUMFLEX ACCENT
95 5F
LOW LINE
92

Код
Символ
Имя символа
10-й
16-й в Unicode 3.2 96 60

GRAVE ACCENT
97 61
a
LATIN SMALL LETTER A
98 62
b
LATIN SMALL LETTER B
99 63
c
LATIN SMALL LETTER C
100 64
d
LATIN SMALL LETTER D
101 65
e
LATIN SMALL LETTER E
102 66
f
LATIN SMALL LETTER F
103 67
g
LATIN SMALL LETTER G
104 68
h
LATIN SMALL LETTER H
105 69
i
LATIN SMALL LETTER I
106 6A
j
LATIN SMALL LETTER J
107 6B
k
LATIN SMALL LETTER K
108 6C
l
LATIN SMALL LETTER L
109 6D
m
LATIN SMALL LETTER M
110 6E
n
LATIN SMALL LETTER N
111 6F
o
LATIN SMALL LETTER O
112 70
p
LATIN SMALL LETTER P
113 71
q
LATIN SMALL LETTER Q
114 72
r
LATIN SMALL LETTER R
115 73
s
LATIN SMALL LETTER S
116 74
t
LATIN SMALL LETTER T
117 75
u
LATIN SMALL LETTER U
118 76
v
LATIN SMALL LETTER V
119 77
w
LATIN SMALL LETTER W
120 78
x
LATIN SMALL LETTER X
121 79
y
LATIN SMALL LETTER Y
122 7A
z
LATIN SMALL LETTER Z
123 7B
{
LEFT CURLY BRACKET
124 7C
|
VERTICAL LINE
125 7D
}
RIGHT CURLY BRACKET
126 7E


TILDE
93
Приложение Г. Кодировка букв русского алфавита
В настоящее время наиболее широко используются пять (!) различных таблиц кодировки для формального представления русских букв. ISO 8859-5 — международный стандарт. Кодовая страница 866 (Microsoft CP866) — используется в MS-
DOS;
III. Кодовая страница 1251 (Microsoft CP1251) для Microsoft Windows;
IV. На базе ГОСТ КОИ, koi8-r — применяется в мире Unix;
V. Unicode — используется в Microsoft Windows, Unix и клонах Основная кодировка ГОСТ (государственный стандарт СССР) от года создана на основе рекомендаций ISO ив дальнейшем стала основой для представления знаков русских букв в Unicode. В ней ив кодировках II, III и V все буквы кроме е и Е расположены в алфавитном порядке. На практике эту кодировку можно встретить только на старых IBM PC совместимых компьютерах ЕС-1840 ив некоторых принтерах. Internet браузеры обычно поддерживают ее наряду с кодировками Кодировка CP866, разработанная на основе альтернативной кодировки ГОСТ, создана специально для ОС MS-DOS, в которой часто используются символы псевдографики. В этой кодировке эти символы имеют те же коды, что ив стандартном IBM PC совместимом компью- тере.
Альтернативная кодировка ГОСТ, которая имеет два варианта,
совпадает с CP866 по позициям для букв русского алфавита и знакам псевдографики. Основная кодировка ГОСТ совпадает столько по всем знакам русских букв, кроме загланой буквы ¨
Е.
Использование CP1251 обусловлено почти исключительно влиянием на компьютерные технологии разработок фирмы Microsoft. В ней наиболее полно по сравнению с I, II, IV представлены такие символы как c ,
, №, различные виды кавычек и тире и т. п.
Кодировка koi8-r основана на стандартах по обмену информацией, используемых на компьютерах под управлением ОС Unix, CP/M и некоторых других с середины х. Вона стандартизирована в документом Кодировка Unicode опирается на каталог символов UCS (Univer- sal Character Set) стандарта ISO 10646. UCS может содержать до 2 различных знаков. Коды UCS-2 — 2-байтные, UCS-4 — 4-байтные. Используются также коды переменной длины UTF-8 (Unicode Transfer
1   2   3   4   5   6   7   8   9   10   11


написать администратору сайта