10кл_Решение задач_Кодировнаие текстовой информации. Кодирование текстовой информации
Скачать 130.5 Kb.
|
Решение задач на тему «Кодирование текстовой информации» Типы задач: Объем памяти, занимаемый текстом. Кодирование (декодирование) текстовой информации. Внутреннее представление текста в компьютере. Объем памяти, занимаемый текстом. Методические рекомендации: В задачах такого типа используются понятия: алфавит, мощность алфавита символ, единицы измерения информации (бит, байт и др.) Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти. Уровень «3» 1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1) Решение: Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти. Ответ: 112 бит 2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31) Решение: Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов. Ответ: 256 символов 3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32) Решение: 30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти. Ответ: 10500 байт 4.Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия: Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)
Решение: В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит. Ответ: 400 бит 5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А) Решение: В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4. Ответ: 320 бит6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode: Каждый символ кодируется 8 битами. (ЕГЭ_2005, уровень А) Решение: 34 символа в предложении. Переведем в биты: 34*16=544 бита. Ответ: 544 бит7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке: В одном килограмме 100 грамм. (ЕГЭ_2005, уровень А) Решение: 19 символов в предложении. 19*2 =38 байт Ответ: 38 байтУровень «4» 8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34) Решение: 40*9 = 360 -секторов на дискете. 180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе. 5*1024= 5120 символов содержит текст. Ответ: 5120 символов 9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов. Решение: Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит. Переведем результат в байты. 14000 : 8 =1750 байт Ответ: 1750 байт. Уровень «5» 10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В) Решение: Найдем объем сообщения. 30*60*8*100 =1440000 бит. Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд Ответ: 50 секунд 11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В) Решение: Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит. Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд. Ответ: 128 секунд Кодирование (декодирование) текстовой информации. Методические рекомендации: В задачах такого типа используются понятия: Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов. Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование. Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами. Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович): КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование) 1) #154 неразрывный пробел. Рис.1 Кодировка КОИ8-Р ASCII –American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам). 1) #32 - пробел. Рис. 2 Международная кодировка ASCII Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница"). 1) #160 неразрывный пробел, 2) #173 мягкий перенос. Рис. 3 Кодировка CP1251 СР866 - кодировка под MS DOS 1) #255 неразрывный пробел. Рис. 4 Кодировка СР866 Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS. #202 неразрывный пробел. Рис. 5 Кодировка Mac ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку. 1) Коды 128-159 не используются; 2) #160 неразрывный пробел, 3) #173 мягкий перенос. Рис. 6 Кодировка ISO 8859-5 Уровень «3» Используем кодировочные таблицы 12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63) Решение: Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц
Используем ПО (текстовый редактор Hieroglyph, WiseCalculator) 13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты: а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110; б) 01001001 01000010 01001101; в) 01000101 01101110 01110100 01100101 01110010 ([2], стр. 68 №2.60) Решение: 1. Переведите коды из двоичной системы счисления в десятичную. а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 → 85 112 32 38 32 68 111 119 110 б) 01001001 01000010 01001101 → 73 66 77 в) 01000101 01101110 01110100 01100101 01110010 → 69 110 116 101 114 2. Запустите текстовый редактор Hieroglyph 3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква. а) 85 112 32 26 32 68 111 119 110 → Up & Down; б) 73 66 77 → IBM; в) 69 110 116 101 114 → Enter Ответ: Up & Down; IBM; Enter 14. Декодируйте следующие тексты, заданные десятичным кодом: а) 087 111 114 100; б) 068 079 083; в) 080 097 105 110 116 098 114 117 115 104. ([2], стр. 68 №2.61) Решение: Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква. а) 087 111 114 100 → Word; б) 068 079 083 → DOS; в) 080 097 105 110 116 098 114 117 115 104 → Paintbrush. Ответ: Word; DOS; Paintbrush. Уровень «4» Не используем кодировочные таблицы 15. Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107? ([1],пример 2, стр.132) Решение: Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.
Ответ: Закодировано слово «link» 16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову: 1) file; 2) help? ([1], №35, стр.133) Решение: Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:
Ответ: 1) 102105108101 2) 104101108112 17. Десятичный код (номер) буквы «о» в таблице кодировки символов равен 111. Что зашифровано с помощью последовательности десятичных кодов: 1) 115 112 111 114 116 2) 109 111 117 115 101 ([1], №36, стр.133) Решение: Речь идет о латинской букве «о», а не о русской, так как код меньше 127. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:
Ответ: 1) sport, 2)mouse 18. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице.
Определить, какой набор букв закодирован двоичной строкой 0110100011000 1) EBCEA 2) BDDEA 3)BDCEA 4) EBAEA ? Решение: Так как код записывается, начиная с младшего разряда, то рассмотрим двоичную строку справа налево: 0110 100011000. Легко увидеть, что последние три буквы будут С, Е, А. Кода 110 нет, значит рассмотрим код из двух бит. 10 – D, 01 – B. Значит, двоичной строкой закодирован набор букв 3) BDCEA. Других вариантов дешифровки заданной двоичной строки не существует. Ответ: 3) BDCEA Уровень «5»Не используем кодировочные таблицы 19. С помощью последовательности десятичных кодов: 99 111 109 112 117 116 101 114 зашифровано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами? ([1],пример 3, стр.132) Решение: Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32.
20. Десятичный код (номер) буквы «i» в таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION? ([1], №37, стр.134) Решение: Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, а также, что сначала в таблице записываются заглавные, а потом строчные буквы, определим код заглавной буквы «I». 105-32 =73. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:
Ответ: 73 78 70 79 82 77 65 84 73 79 78 21. С помощью последовательности десятичных кодов: 66 65 83 73 67 зашифровано слово BASIC. Какая последовательность десятичных кодов будет соответствовать этому слову, записанному строчными буквами. ([1], №38, стр.134) Решение: Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, и то, что заглавные буквы записываются раньше строчных, имеем, код слова basic: 98 97 115 105 99 Ответ: 98 97 115 105 99 Внутреннее представление текста в компьютере. Методические рекомендации: Для решения задач учащиеся должны пользоваться кодовыми таблицами (см.[1], приложение 2, стр.295, 296) и Wise Calculator (для перевода в систему счисления кодов символов, с целью экономии времени). Учащиеся должны понимать, что информация, хранящаяся в двоичном коде чаще всего перекодируется в шестнадцатеричную форму. Шестнадцатеричный код каждого символа – двузначное число от 00 до FF (если длина двоичного кода равна 8, разбиваем на тетрады) Уровень «3-4» Оценка 3 ставится за кодирование, оценка 4 –за перевод в 16-ричную систему Используем кодировочные таблицы 22. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты: а) Password; б) Windows; в) Norton Commander. ([2], стр. 68, №2.58) Решение: 1. Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления) а) Password → 80 97 115 115 119 111 114 100. б) Windows → 87 105 110 100 111 119 115. в) Norton Commander → 78 111 114 116 111 110 32 67 111 109 109 97 110 100 101 114 2. Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления. а) 80 97 115 115 119 111 114 100 → 50 61 73 73 77 6F 72 64 б) 87 105 110 100 111 119 115 → 57 69 6E 64 6F 77 73 в) 78 111 114 116 111 110 32 67 111 109 109 97 110 100 101 114 → 4E 6F 72 74 6F 6E 20 43 6F 6D 6D 61 6E 64 65 72 Ответ: а) 50 61 73 73 77 6F 72 64 б) 57 69 6E 64 6F 77 73 в) 4E 6F 72 74 6F 6E 20 43 6F 6D 6D 61 6E 64 65 72 23. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом: |
16СС | 57 | 69 | 6Е | 64 | 6F | 77 | 73 | 2D | 39 | 35 |
2СС | 01010111 | 01101001 | 01101110 | 01100100 | 01101111 | 01110111 | 01110011 | 00101101 | 0011001 | 00110101 |
буква | W | i | n | d | o | w | s | - | 9 | 5 |
25. Представьте в форме шестнадцатеричного кода слово "БИС" во всех пяти кодировках. ([2], стр. 68 №2.62)
Решение:
Последовательности десятичных кодов слова "БИС" в различных кодировках составляем на основе кодировочных таблиц:
КОI8-Р: = 226 233 243
СР1251: = 193 200 209;
СР866: = 129 136 145;
Мас: = 129 136 145;
ISO: = 177 184 193.
Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОI8-Р: = 226 233 243 = E2 E9 F3;
СР1251: = 193 200 209 = C1 C8 D1;
СР866: = 129 136 145 = 81 88 91;
Мас: = 129 136 145 = 81 88 91;
ISO: = 177 184 193 = B1 B8 C1.
Литература:
И. Семакин, Е Хеннер, Информатика. Задачник-практикум, т.1, Москва, ЛБЗ, 1999, с.131-134.
Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений / Н.Д. Угринович, Л.Л. Босова, Н.И. Михайлова. – М.: Бином. Лаборатория Знаний, 2002. 400 с.: ил.