Главная страница

10кл_Решение задач_Кодировнаие текстовой информации. Кодирование текстовой информации


Скачать 130.5 Kb.
НазваниеКодирование текстовой информации
Дата29.04.2022
Размер130.5 Kb.
Формат файлаdoc
Имя файла10кл_Решение задач_Кодировнаие текстовой информации.doc
ТипРешение
#505165

Решение задач на тему «Кодирование текстовой информации»
Типы задач:

  1. Объем памяти, занимаемый текстом.

  2. Кодирование (декодирование) текстовой информации.

  3. Внутреннее представление текста в компьютере.


  1. Объем памяти, занимаемый текстом.



Методические рекомендации:

В задачах такого типа используются понятия:

  • алфавит,

  • мощность алфавита

  • символ,

  • единицы измерения информации (бит, байт и др.)

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Уровень «3»

1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)

Решение:

Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.

Ответ: 112 бит

2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)

Решение:

Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.
Ответ: 256 символов

3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)

Решение:

30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.

Ответ: 10500 байт

4.Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)


1)

400 бит

2)

50 бит

3)

400 байт

4)

5 байт

Решение:

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Ответ: 400 бит

5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)

Решение:

В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.


Ответ: 320 бит



6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:

Каждый символ кодируется 8 битами.

(ЕГЭ_2005, уровень А)

Решение:

34 символа в предложении. Переведем в биты: 34*16=544 бита.

Ответ: 544 бит



7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:

В одном килограмме 100 грамм.

(ЕГЭ_2005, уровень А)

Решение:

19 символов в предложении. 19*2 =38 байт

Ответ: 38 байт



Уровень «4»

8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)

Решение:

  1. 40*9 = 360 -секторов на дискете.

  2. 180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.

  3. 5*1024= 5120 символов содержит текст.


Ответ: 5120 символов
9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.

Решение:

Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.

Переведем результат в байты. 14000 : 8 =1750 байт
Ответ: 1750 байт.
Уровень «5»

10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Решение:

  1. Найдем объем сообщения. 30*60*8*100 =1440000 бит.

  2. Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд


Ответ: 50 секунд
11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)

Решение:

  1. Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит.

  2. Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.


Ответ: 128 секунд



  1. Кодирование (декодирование) текстовой информации.


Методические рекомендации:

В задачах такого типа используются понятия:

Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

  • КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)


 

1) #154 неразрывный пробел.

Рис.1 Кодировка КОИ8-Р

  • ASCII –American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).


1) #32 - пробел.

Рис. 2 Международная кодировка ASCII

  • Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

  • СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").



1) #160 неразрывный пробел,

2)  #173 мягкий перенос.

Рис. 3 Кодировка CP1251

  • СР866 - кодировка под MS DOS


1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

  • Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.




    1. #202 неразрывный пробел.

Рис. 5 Кодировка Mac

  • ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.



 1) Коды 128-159 не используются;

2)  #160 неразрывный пробел,

3)  #173 мягкий перенос.

Рис. 6 Кодировка ISO 8859-5
Уровень «3»

Используем кодировочные таблицы

12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63)

Решение:

Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц

Кодовая таблица

Коды

Слово

СР1251

228 232 241 234

диск

КОI8-Р

228 232 241 234

ДХЯЙ

СР866

228 232 241 234

фшёъ

Мас

228 232 241 234

диск

ISO

228 232 241 234

фшёъ


Используем ПО (текстовый редактор Hieroglyph, WiseCalculator)

13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:


а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110;
б) 01001001 01000010 01001101;
в) 01000101 01101110 01110100 01100101 01110010

([2], стр. 68 №2.60)

Решение:

1. Переведите коды из двоичной системы счисления в десятичную.
а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 → 85 112 32 38 32 68 111 119 110
б) 01001001 01000010 01001101 → 73 66 77
в) 01000101 01101110 01110100 01100101 01110010 → 69 110 116 101 114
2. Запустите текстовый редактор Hieroglyph
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) 85 112 32 26 32 68 111 119 110 → Up & Down;
б) 73 66 77 → IBM;
в) 69 110 116 101 114 → Enter

Ответ: Up & Down; IBM; Enter

14. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100;
б) 068 079 083;
в) 080 097 105 110 116 098 114 117 115 104.


([2], стр. 68 №2.61)

Решение:

Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) 087 111 114 100 → Word;
б) 068 079 083 → DOS;
в) 080 097 105 110 116 098 114 117 115 104 → Paintbrush.

Ответ: Word; DOS; Paintbrush.
Уровень «4»

Не используем кодировочные таблицы

15. Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107? ([1],пример 2, стр.132)

Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.


Десятичный код

105

106

107

108

109

110

Латинская буква

i

j

k

l

m

n

Ответ: Закодировано слово «link»

16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:

1) file; 2) help? ([1], №35, стр.133)
Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:

Десятичный код

101

102

103

104

105

106

107

108

109

110

111

112

Латинская буква

e

f

g

h

i

j

k

l

m

n

o

p

Ответ:

1) 102105108101

2) 104101108112
17. Десятичный код (номер) буквы «о» в таблице кодировки символов равен 111. Что зашифровано с помощью последовательности десятичных кодов:

1) 115 112 111 114 116

2) 109 111 117 115 101

([1], №36, стр.133)
Решение:

Речь идет о латинской букве «о», а не о русской, так как код меньше 127. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:

код

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

буква

e

f

g

h

i

j

k

l

m

n

o

p

q

r

s

t

u

Ответ: 1) sport, 2)mouse

18. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице.

A

B

C

D

E

000

01

100

10

011

Определить, какой набор букв закодирован двоичной строкой 0110100011000

1) EBCEA 2) BDDEA 3)BDCEA 4) EBAEA ?
Решение:

Так как код записывается, начиная с младшего разряда, то рассмотрим двоичную строку справа налево: 0110 100011000. Легко увидеть, что последние три буквы будут С, Е, А. Кода 110 нет, значит рассмотрим код из двух бит. 10 – D, 01 – B. Значит, двоичной строкой закодирован набор букв 3) BDCEA. Других вариантов дешифровки заданной двоичной строки не существует.

Ответ: 3) BDCEA

Уровень «5»


Не используем кодировочные таблицы

19. С помощью последовательности десятичных кодов: 99 111 109 112 117 116 101 114 зашифровано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами? ([1],пример 3, стр.132)

Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32.

Десятичный код

Латинская буква строчная

Десятичный код

Латинская буква заглавная

99

c

67

C

111

o

79

O

109

m

77

M

112

p

80

P

117

u

85

U

116

t

84

T

101

e

69

E

114

r

82

R


20. Десятичный код (номер) буквы «i» в таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION? ([1], №37, стр.134)

Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, а также, что сначала в таблице записываются заглавные, а потом строчные буквы, определим код заглавной буквы «I». 105-32 =73. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:

код

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

буква

A

B


C

D

Е

f

g

h

i

j

k

l

m

n

o

p

q

r

s

t


Ответ: 73 78 70 79 82 77 65 84 73 79 78

21. С помощью последовательности десятичных кодов: 66 65 83 73 67 зашифровано слово BASIC. Какая последовательность десятичных кодов будет соответствовать этому слову, записанному строчными буквами. ([1], №38, стр.134)

Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, и то, что заглавные буквы записываются раньше строчных, имеем, код слова basic: 98 97 115 105 99

Ответ: 98 97 115 105 99


  1. Внутреннее представление текста в компьютере.


Методические рекомендации:

Для решения задач учащиеся должны пользоваться кодовыми таблицами (см.[1], приложение 2, стр.295, 296) и Wise Calculator (для перевода в систему счисления кодов символов, с целью экономии времени). Учащиеся должны понимать, что информация, хранящаяся в двоичном коде чаще всего перекодируется в шестнадцатеричную форму. Шестнадцатеричный код каждого символа – двузначное число от 00 до FF (если длина двоичного кода равна 8, разбиваем на тетрады)
Уровень «3-4»

Оценка 3 ставится за кодирование, оценка 4 –за перевод в 16-ричную систему

Используем кодировочные таблицы

22. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
а) Password;
б) Windows;
в) Norton Commander.


([2], стр. 68, №2.58)

Решение:

1. Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)
а) Password → 80 97 115 115 119 111 114 100.
б) Windows → 87 105 110 100 111 119 115.
в) Norton Commander → 78 111 114 116 111 110 32 67 111 109 109 97 110 100 101 114
2. Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.
а) 80 97 115 115 119 111 114 100 → 50 61 73 73 77 6F 72 64
б) 87 105 110 100 111 119 115 → 57 69 6E 64 6F 77 73
в) 78 111 114 116 111 110 32 67 111 109 109 97 110 100 101 114 → 4E 6F 72 74 6F 6E 20 43 6F 6D 6D 61 6E 64 65 72

Ответ:

а) 50 61 73 73 77 6F 72 64
б) 57 69 6E 64 6F 77 73
в) 4E 6F 72 74 6F 6E 20 43 6F 6D 6D 61 6E 64 65 72

23. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
а) 54 6F 72 6E 61 64 6F;
б) 49 20 6C 6F 76 65 20 79 6F 75;
в) 32 2A 78 B 79 3D 30

([2], стр. 68 №2.59)


Решение:

1. Переведите коды с помощью калькулятора из шестнадцатеричной системы счисления в десятичную.
а) 54 6F 72 6E 61 64 6F → 84 111 114 110 97 100 111
б) 49 20 6C 6F 76 65 20 79 6F 75 → 73 32 108 111 118 101 32 121 111 117
в) 32 2A 78 2B 79 3D 30 → 50 42 120 43 121 57 48
2. Найдите в кодовой таблице ASCII символы, соответствующие кодам:
а) 84 111 114 110 97 100 111 → Tornado;
б) 73 32 108 111 118 101 32 121 111 117 → I love you;
в) 50 42 120 43 121 57 48 → 2*X+Y=0.

Ответ: а) Tornado; б) I love you; в) 2*X+Y=0.

Уровень «5»
Используем кодировочные таблицы в приложении к учебнику [1], где представлен десятичный и двоичный код символа или кодировочные таблицы на CD к учебнику Н. Угриновича. Перевод чисел в шестнадцатеричную систему производится без калькулятора.
24. Пользуясь таблицей кодировки символов, расшифруйте текст, представленный в виде шестнадцатеричных кодов символов:

1) 57 69 6Е 64 6F 77 73 2D 39 35;

2) 63 6F 6D 65 2D 4F 4E 2D 6C 69 6E 65

([1], №40, стр.134)
Решение:


    1. Переведем числа в двоичную систему счисления и найдем символы в таблице:

16СС

57

69

6Е

64

6F

77

73

2D

39

35

2СС

01010111

01101001

01101110

01100100

01101111

01110111

01110011

00101101

0011001

00110101

буква

W

i

n

d

o

w

s

-

9

5


25. Представьте в форме шестнадцатеричного кода слово "БИС" во всех пяти кодировках. ([2], стр. 68 №2.62)

Решение:
Последовательности десятичных кодов слова "БИС" в различных кодировках составляем на основе кодировочных таблиц:
КОI8-Р: = 226 233 243
СР1251: = 193 200 209;
СР866: = 129 136 145;
Мас: = 129 136 145;
ISO: = 177 184 193.
Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОI8-Р: = 226 233 243 = E2 E9 F3;
СР1251: = 193 200 209 = C1 C8 D1;
СР866: = 129 136 145 = 81 88 91;
Мас: = 129 136 145 = 81 88 91;
ISO: = 177 184 193 = B1 B8 C1.
Литература:

  1. И. Семакин, Е Хеннер, Информатика. Задачник-практикум, т.1, Москва, ЛБЗ, 1999, с.131-134.

  2. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений / Н.Д. Угринович, Л.Л. Босова, Н.И. Михайлова. – М.: Бином. Лаборатория Знаний, 2002. 400 с.: ил.


написать администратору сайта