Лидовский. Учебное пособие написано на основе односеместрового 108 часового курса лекций и материалов для практических занятий, используемых автором в учебной работе со
Скачать 0.89 Mb.
|
(dot per inch, точек на дюйм) или лазерный принтер с разрешением dpi, таки на типографскую аппаратуру с разрешением 2400 имея гарантии, что изображение будет наилучшего качества, возможного на выбранной аппаратуре. Возможности PostScript перекрывают возможности DVI, поэтому некоторые системы при компиляции документов производят сразу файлы в формате PostScript или Файлы PostScript можно вручную корректировать, но из-за сложности языка — это очень непросто, особенно если используются символы, не входящие в ASCII. Фактически эти файлы можно рассматривать как только для чтения и использовать для распространения информации, не подлежащей изменению. Комментарии в PostScript, как ив, начинаются знаком % и заканчиваются концом строки. Первая строчка программы обычно содержит точное название формата файла. Собственно программа начинается в файле с символов и заканчивается символами %%EOF. программы кроме собственной системы шрифтов могут использовать шрифты True Type фирм Apple и Различают уровни (levels) языка PostScript. Уровень 1 может поддерживать только черно-белую графику. Уровень 2 может работать с цветом. Уровень 3 — это современное состояние языка.2. 24 КГц. 8192. 4. x = 5. 5. HX = 0.9 + log 2 5 − 0.3 log 2 3 ≈ 2.75 бит/сим. 6. I(Y, X 1 ) = 0.5 бит/сим. 7. I(Z, X 1 ) = I(X 1 , X 1 ) = HX 1 = 1 бит/сим, те полностью определяет и, следовательно, X 1 — это функцией от Z. HZ = 2 бит/сим. 8. I(X 1 , X 2 ) = (5 − 3 log 2 3)/3 ≈ 0.08 бит/сим. 9. I(X 1 , Y ) = (10 − 3 log 2 3)/8 ≈ 0.66 бит/сим, HX 1 = 2 бит/сим, HY = (26 − 3 log 2 3)/8 ≈ 2.65 бит/сим. 10. I(Z, X 1 ) = (22 − 3 log 2 3)/16 ≈ 1.08 бит/сим, HZ = (54 − 3 log 2 3)/16 ≈ 3.08 бит/сим. 11. I(X 1 , Y ) = (3 log 2 3 − 2)/9 ≈ 0.31 бит/сим, I(X 2 , Y ) = (3 log 2 3 + 4)/9 ≈ 0.97 бит/сим, HX 1 = HX 2 = log 2 3 ≈ 1.58 бит/сим, HY = (12 log 2 3 − 2)/9 ≈ 1.89 бит/сим. 12. HX = 7/4 = 1.75 бит/сим, HY = (24 − 3 log 2 3 − 5 log 2 5)/8 ≈ 0.95 бит/сим, HZ = (328 − 12 log 2 3 − 35 log 2 5 − 17 log 2 17)/64 ≈ 2.47 бит/сим, I(Z, Y ) = (216 − 12 log 2 3 − 35 log 2 5 − 17 log 2 17)/64 ≈ 0.72 бит/сим. 13. M L1(X) = 3 бит/сим, M L2, 3, 4(X) = 2.2 бит/сим, HX = log 2 5 − 0.2 ≈ 2.12 бит/сим. 14. code(0) = 10, code(1) = 0, code(2) = 11 — это один из вариантов кодирующей функции. M L(X) = HX = 1.5 бит/сим. 15. code(2 n ) = 1 · · · 1 n−1 0 или code(2 n ) = 0 · · · 0 n−1 1. HX = ∞ n=1 n/2 n = M L(X) = 2 бит/сим. 16. M L(X) HX ≈ 3.25 бит/сим. 17. inf (s1) = 1, cont(s1) = 2, inf (s2) = 0.5, cont(s2) = 0.75. 18. 1.56 бит/сим. 19. HX ≈ 2.17 бит/сим, код Хаффмена M L(X) ≈ 2.22 бит/сим, код Шеннона-Фэно M L(X) ≈ 2.28 бит/сим. 20. Шеннона-Фэно, Хаффмена: M L 1 (X 1 ) = 2 бит/сим., M L 1 (X 2 ) = 2.25 бит/сим., M L 1 (X 3 ) = 2.7 бит/сим., M L 1 (X 4 ) = 2 13 / 60 бит/сим. Арифметический: M L 1 (X 1 ) = 1 5 / 6 бит/сим., M L 1 (X 2 ) = 2.05 бит/сим., M L 1 (X 3 ) = 2.3 бит/сим., M L 1 (X 4 ) = 2 1 / 60 бит/сим. 21. L Хаффмена = 3 бита, арифметический 4 бита. 010001011, 01011111. 23. 81, враз. Считая, что код генерирутся д.с.в. X с распределением P (X = A) = 2/3, P (X = B) = 1/3, можно получить наилучшие коды, для которых L Хаффмена-1 (ABAAAB) = 6 бит, L Хаффмена-2 (ABAAAB) = бит, L Хаффмена-3 (ABAAAB) = 5 бит, арифметический) = 1 бит. ’B’10’C’1101 26. code(AABCDAACCCCDBB) = ’A’10’B’00’C’000’D’00011001111 100110011001, L(AABCDAACCCCDBB) = 62 бит, длина исходного сообщения бит. КИБЕРНЕТИКИ) = КИБЕР 100’Н’1111000’Т’100110111, КИБЕРНЕТИКИ) = 85 бит, длина исходного сообщения — 88 бит. СИНЯЯ СИНЕВА СИНИ) = СИНЯ ’101001011100’Е’11000’В’10100’А’1010101101101111, L(СИНЯЯ СИНЕВА СИНИ) = 114 бит, длина исходного сообщения — 136 бит. Распакованное сообщение — AFXAFFXFXAXAFFA, его длина 120 бит, длина сжатого кода — 52 бит. 01000010111001. 29. AABCDAACCCCDBB, LZ77: 0,0,’A’ 11,1,’B’ 0,0,’C’ 0,0, ’D’ 7,2,’C’ 11,2,’C’ 5,2,’B’ 0,0,’B’ , длина 8 ∗ 15 = 120 бит LZSS: 0’A’1 11,1 0’B’0’C’0’D’1 7,2 1 8,1 1 11,1 1 10,2 1 5,1 1 3,1 1 11,1 , длина бит LZ78: 0,’A’ 1,’B’ 0,’C’ 0,’D’ 1,’A’ 3,’C’ 6,’D’ 0,’B’ 0,’B’ , длина 9 ∗ 12 = 108 бит LZW: 0’A’0’A’0’B’0’C’0’D’ 256 0’C’ 262 259 0’B’0’B’, длина 11 ∗ 9 = 99 бит. КИБЕРНЕТИКИ, LZ77: 0,0,’К’ 0,0,’И’ , 0,0,’Б’ 0,0,’Е’ 0,0,’Р’ 0,0,’Н’ 9,1,’Т’ 5,1,’К’ 0,0,’И’ , длина 9 ∗ 15 = 135 бит LZSS: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’ 1 9,1 Т 5,1 1 5,2 , длина 3 ∗ 7 + 7 ∗ 9 = 84 бит LZ78: 0,’К’ 0,’И’ 0,’Б’ 0,’Е’ 0,’Р’ 0,’Н’ 4,’Т’ 2,’К’ 0,’И’ , длина 9 ∗ 12 = бит LZW: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’0’Е’0’Т’0’И’ 256 , длина 10 ∗ 9 = 90 бит. СИНЯЯ СИНЕВА СИНИ, LZ77: СИНЯ ’ 6,3,’Е’ 0,0,’В’ 0,0,’А’ 5,4,’И’ , длина 9 ∗ 15 = бит LZSS: СИНЯ 11,1 0’ ’ 6,3 ЕВА 5,4 1 10,1 , длина бит LZ78: СИНЯ ’ 1,’И’ 3,’Е’ 0,’В’ 0,’А’ 0,’ НИ , длина 12 ∗ 12 = 144 бит СИНЯЯ ’ 256 НЕВА 261 257 И, длина ∗ 9 = 126 бит. Нет. Это следует из очевидного неравенства для длин кодов log 2 (L D + 256) < log 2 (L D ) + 8, где L D — это размер словаря. Во всех случаях сообщение — AFXAFFXFXAXAFFA, длина кода LZ77 — 105 бит, LZSS — 62 бит, LZ78 — 108 бит, LZW — 99 бит. 2000 бод. 1) 8000/3 ≈ 2666.67 сим/сек; 2) ≈ 2523 сим/сек; 3) 2000 сим/сек. 34. Пусть X — д. св, определяющая передатчика д. с. в., определяющая приемник. Тогда P (Y = 00/X = 00) = pp, P (Y = 00/X = 01) = pq, . . ., P (Y = 00/X = 11) = qq, . . . 86 Код Полное имя кода в Unicode 10-й 16-й Клавиатурный (краткое имя в Перевод имени кода — описание использования кода. Выше представлен шаблон для следующей далее таблицы управляющих символов. Под клавиатурным кодом подразумевается комбинация двух клавиш, Ctrl (Control, в таблице это знаки приводимой, одновременное нажатие которых должно производить соответствующий код 00 ^@ NULL (Пусто — этот код используется как завершающий в представлении строк многими системами программирования, например, Си, поэтому его использование в текстовых файлах крайне нежелательно 01 ^A START OF HEADING (Начало заголовка — практически не используется 02 ^B START OF TEXT (Начало текста — практически не используется 03 ^C END OF TEXT (Конец текста — в Unix и MS-DOS ввод этого символа с клавиатуры служит сигналом для прекращения выполнения программы 04 ^D END OF TRANSMISSION (Конец передачи — в Unix и PostScript означает конец вводимых данных 05 ^E ENQUIRY (Кто там — практически не используется 06 ^F ACKNOWLEDGE (Подтверждение, да — практически не используется 07 ^G BELL (Звонок — при его печати на консоли MS-DOS или Unix должен производиться звуковой сигнал 08 ^H BACKSPACE (Возврат на шаг — означает, что следующий символ следует печатать с предшествующей позиции 09 ^I HORISONTAL TABULATION (Горизонтальная табуляция — переход наследующую позицию табуляции (Подача новой строки — переход на новую строку. В текстовых файлах и Microsoft Windows с сохранением текущей горизонтальной позицию. В текстовых файлах Unix с переходом на первую горизонтальную позицию 11 0B ^K VERTICAL TABULATION (Вертикальная табуляция — используется очень редко, как правило, принтерами 0C ^L FORM FEED (Подача новой формы — для консоли, как правило, означает очистку экрана, для принтера — завершение печати на текущем листе и запрос нового 0D ^M CARRIAGE RETURN (Возврат каретки — переход на первую горизонтальную позицию строки. В текстовых файлах MS-DOS и Microsoft Windows с сохранением текущей строки, а в текстовых файлах Macintosh OS с переходом на новую строку. В текстовых файлах Unix не используется 0E ^N SHIFT OUT (Выход — используется очень редко, как правило, принтерами 0F ^O SHIFT IN (Вход — используется очень редко, как правило, принтерами 10 ^P DATA LINK ESCAPE (DLE) Авторегистр 1 — практически не используется 11 ^Q DEVICE CONTROL ONE (Используется некоторыми телекоммуникационными протоколами как байт X-ON. 18 12 ^R DEVICE CONTROL TWO (Практически не используется 13 ^S DEVICE CONTROL THREE (Используется некоторыми телекоммуникационными протоколами как байт X-OFF. 20 14 ^T DEVICE CONTROL FOUR (Практически не используется 15 ^U NEGATIVE ACKNOWLEDGE (Нет — практически не используется 16 ^V SYNCHRONOUS IDLE (Синхронизация — практически не используется 17 ^W END OF TRANSMISSION BLOCK (Конец блока — практически не используется 18 ^X CANCEL (Аннулирование — используется очень редко, как правило, принтерами (Конец носителя — практически не используется 1A ^Z SUBSTITUTE (Замена — в MS-DOS, Macintosh OS и CP/M — это маркер конца текстового файла 27 1B ^[ ESCAPE (ESC) Авторегистр 2 — указывает на то, что некоторое количество кодов после него ион сам образуют группу, рассматриваемую как один код С SEPARATOR (Разделитель файлов — практически не используется 1D ^] GROUP SEPARATOR (Разделитель групп — практически не используется 1E ^^ RECORD SEPARATOR (Разделитель записей — практически не используется 1F ^ UNIT SEPARATOR (Разделитель элементов — практически не используется 7F DELETE (Забой — удаление последнего видимого знака печатаемой строки. В чисто текстовых (plain text) файлах допустимы только управляющие символы, отмечающие концы строки, как правило, переходы на позиции табуляции (код 9). Маркер конца строки в Unix — это код, в Macintosh OS — 13, в CP/M, MS-DOS и Microsoft Windows последовательность 13, 10. 90 Приложение В. Кодировка видимых символов ASCII Код Символ Имя символа 10-й 16-й в Unicode 3.2 32 20 SPACE 33 21 ! EXCLAMATION MARK 34 22 " QUOTATION MARK 35 23 # NUMBER SIGN 36 24 $ DOLLAR SIGN 37 25 % PERCENT SIGN 38 26 & AMPERSAND 39 27 ´ APOSTROPHE 40 28 ( LEFT PARENTHESIS 41 29 ) RIGHT PARENTHESIS 42 2A * ASTERISK 43 2B + PLUS SIGN 44 2C , COMMA 45 2D - HYPHEN-MINUS 46 2E FULL STOP 47 2F / SOLIDUS 48 30 0 DIGIT ZERO 49 31 1 DIGIT ONE 50 32 2 DIGIT TWO 51 33 3 DIGIT THREE 52 34 4 DIGIT FOUR 53 35 5 DIGIT FIVE 54 36 6 DIGIT SIX 55 37 7 DIGIT SEVEN 56 38 8 DIGIT EIGHT 57 39 9 DIGIT NINE 58 3A : COLON 59 3B ; SEMICOLON 60 3C < LESS-THAN SIGN 61 3D = EQUALS SIGN 62 3E > GREATER-THAN SIGN 63 3F ? QUESTION MARK 91 Код Символ Имя символа 10-й 16-й в Unicode 3.2 64 40 @ COMMERCIAL AT 65 41 A LATIN CAPITAL LETTER A 66 42 B LATIN CAPITAL LETTER B 67 43 C LATIN CAPITAL LETTER C 68 44 D LATIN CAPITAL LETTER D 69 45 E LATIN CAPITAL LETTER E 70 46 F LATIN CAPITAL LETTER F 71 47 G LATIN CAPITAL LETTER G 72 48 H LATIN CAPITAL LETTER H 73 49 I LATIN CAPITAL LETTER I 74 4A J LATIN CAPITAL LETTER J 75 4B K LATIN CAPITAL LETTER K 76 4C L LATIN CAPITAL LETTER L 77 4D M LATIN CAPITAL LETTER M 78 4E N LATIN CAPITAL LETTER N 79 4F O LATIN CAPITAL LETTER O 80 50 P LATIN CAPITAL LETTER P 81 51 Q LATIN CAPITAL LETTER Q 82 52 R LATIN CAPITAL LETTER R 83 53 S LATIN CAPITAL LETTER S 84 54 T LATIN CAPITAL LETTER T 85 55 U LATIN CAPITAL LETTER U 86 56 V LATIN CAPITAL LETTER V 87 57 W LATIN CAPITAL LETTER W 88 58 X LATIN CAPITAL LETTER X 89 59 Y LATIN CAPITAL LETTER Y 90 5A Z LATIN CAPITAL LETTER Z 91 5B [ LEFT SQUARE BRACKET 92 5C \ REVERSE SOLIDUS 93 5D ] RIGHT SQUARE BRACKET 94 5E ^ CIRCUMFLEX ACCENT 95 5F LOW LINE 92 Код Символ Имя символа 10-й 16-й в Unicode 3.2 96 60 ‘ GRAVE ACCENT 97 61 a LATIN SMALL LETTER A 98 62 b LATIN SMALL LETTER B 99 63 c LATIN SMALL LETTER C 100 64 d LATIN SMALL LETTER D 101 65 e LATIN SMALL LETTER E 102 66 f LATIN SMALL LETTER F 103 67 g LATIN SMALL LETTER G 104 68 h LATIN SMALL LETTER H 105 69 i LATIN SMALL LETTER I 106 6A j LATIN SMALL LETTER J 107 6B k LATIN SMALL LETTER K 108 6C l LATIN SMALL LETTER L 109 6D m LATIN SMALL LETTER M 110 6E n LATIN SMALL LETTER N 111 6F o LATIN SMALL LETTER O 112 70 p LATIN SMALL LETTER P 113 71 q LATIN SMALL LETTER Q 114 72 r LATIN SMALL LETTER R 115 73 s LATIN SMALL LETTER S 116 74 t LATIN SMALL LETTER T 117 75 u LATIN SMALL LETTER U 118 76 v LATIN SMALL LETTER V 119 77 w LATIN SMALL LETTER W 120 78 x LATIN SMALL LETTER X 121 79 y LATIN SMALL LETTER Y 122 7A z LATIN SMALL LETTER Z 123 7B { LEFT CURLY BRACKET 124 7C | VERTICAL LINE 125 7D } RIGHT CURLY BRACKET 126 7E TILDE 93 Приложение Г. Кодировка букв русского алфавита В настоящее время наиболее широко используются пять (!) различных таблиц кодировки для формального представления русских букв. ISO 8859-5 — международный стандарт. Кодовая страница 866 (Microsoft CP866) — используется в MS- DOS; III. Кодовая страница 1251 (Microsoft CP1251) для Microsoft Windows; IV. На базе ГОСТ КОИ, koi8-r — применяется в мире Unix; V. Unicode — используется в Microsoft Windows, Unix и клонах Основная кодировка ГОСТ (государственный стандарт СССР) от года создана на основе рекомендаций ISO ив дальнейшем стала основой для представления знаков русских букв в Unicode. В ней ив кодировках II, III и V все буквы кроме е и Е расположены в алфавитном порядке. На практике эту кодировку можно встретить только на старых IBM PC совместимых компьютерах ЕС-1840 ив некоторых принтерах. Internet браузеры обычно поддерживают ее наряду с кодировками Кодировка CP866, разработанная на основе альтернативной кодировки ГОСТ, создана специально для ОС MS-DOS, в которой часто используются символы псевдографики. В этой кодировке эти символы имеют те же коды, что ив стандартном IBM PC совместимом компью- тере. Альтернативная кодировка ГОСТ, которая имеет два варианта, совпадает с CP866 по позициям для букв русского алфавита и знакам псевдографики. Основная кодировка ГОСТ совпадает столько по всем знакам русских букв, кроме загланой буквы ¨ Е. Использование CP1251 обусловлено почти исключительно влиянием на компьютерные технологии разработок фирмы Microsoft. В ней наиболее полно по сравнению с I, II, IV представлены такие символы как c , , №, различные виды кавычек и тире и т. п. Кодировка koi8-r основана на стандартах по обмену информацией, используемых на компьютерах под управлением ОС Unix, CP/M и некоторых других с середины х. Вона стандартизирована в документом Кодировка Unicode опирается на каталог символов UCS (Univer- sal Character Set) стандарта ISO 10646. UCS может содержать до 2 различных знаков. Коды UCS-2 — 2-байтные, UCS-4 — 4-байтные. Используются также коды переменной длины UTF-8 (Unicode Transfer |