r Tr
| fr
| ln r
| ln fr
| ln r . ln fr
| (ln r)2
| fрасч
| ln fрасч
| Δ
| 92
| приводит
| 1
| 4,5218
| 0
| 0
| 20,4466
| 0,9789
| -0,0214
| 0,0005
| 93
| приемлемые
| 1
| 4,5326
| 0
| 0
| 20,5445
| 0,9738
| -0,0265
| 0,0007
| 94
| признаки
| 1
| 4,5433
| 0
| 0
| 20,6415
| 0,9689
| -0,0316
| 0,0010
| 95
| применено
| 1
| 4,5539
| 0
| 0
| 20,7378
| 0,9640
| -0,0367
| 0,0013
| 96
| продукта
| 1
| 4,5643
| 0
| 0
| 20,8333
| 0,9592
| -0,0416
| 0,0017
| 97
| рамках
| 1
| 4,5747
| 0
| 0
| 20,9280
| 0,9545
| -0,0466
| 0,0022
| 98
| распространение
| 1
| 4,5850
| 0
| 0
| 21,0219
| 0,9498
| -0,0515
| 0,0026
| 99
| рассматриваться
| 1
| 4,5951
| 0
| 0
| 21,1151
| 0,9453
| -0,0563
| 0,0032
| 100
| расширить
| 1
| 4,6052
| 0
| 0
| 21,2076
| 0,9408
| -0,0611
| 0,0037
| 101
| реализующего
| 1
| 4,6151
| 0
| 0
| 21,2993
| 0,9363
| -0,0658
| 0,0043
| 102
| связано
| 1
| 4,6250
| 0
| 0
| 21,3904
| 0,9319
| -0,0705
| 0,0050
| 103
| сигнальные
| 1
| 4,6347
| 0
| 0
| 21,4807
| 0,9276
| -0,0751
| 0,0056
| 104
| сказывается
| 1
| 4,6444
| 0
| 0
| 21,5704
| 0,9234
| -0,0797
| 0,0064
| 105
| следует
| 1
| 4,6540
| 0
| 0
| 21,6593
| 0,9192
| -0,0843
| 0,0071
| 106
| соответствующей
| 1
| 4,6634
| 0
| 0
| 21,7477
| 0,9150
| -0,0888
| 0,0079
| 107
| сохранено
| 1
| 4,6728
| 0
| 0
| 21,8353
| 0,9109
| -0,0933
| 0,0087
| 108
| специальной
| 1
| 4,6821
| 0
| 0
| 21,9224
| 0,9069
| -0,0977
| 0,0095
| 109
| средствами
| 1
| 4,6913
| 0
| 0
| 22,0087
| 0,9029
| -0,1021
| 0,0104
| 110
| среду
| 1
| 4,7005
| 0
| 0
| 22,0945
| 0,8990
| -0,1064
| 0,0113
| 111
| стало
| 1
| 4,7095
| 0
| 0
| 22,1797
| 0,8952
| -0,1108
| 0,0123
| 112
| стимулом
| 1
| 4,7185
| 0
| 0
| 22,2642
| 0,8913
| -0,1150
| 0,0132
| 113
| стороны
| 1
| 4,7274
| 0
| 0
| 22,3482
| 0,8876
| -0,1193
| 0,0142
| 114
| субъекта
| 1
| 4,7362
| 0
| 0
| 22,4316
| 0,8839
| -0,1235
| 0,0152
| 115
| сферу
| 1
| 4,7449
| 0
| 0
| 22,5144
| 0,8802
| -0,1276
| 0,0163
| 116
| сформированы
| 1
| 4,7536
| 0
| 0
| 22,5966
| 0,8766
| -0,1317
| 0,0174
| 117
| текст
| 1
| 4,7622
| 0
| 0
| 22,6783
| 0,8730
| -0,1358
| 0,0184
| 118
| терминологии
| 1
| 4,7707
| 0
| 0
| 22,7594
| 0,8695
| -0,1399
| 0,0196
| 119
| тиражирования
| 1
| 4,7791
| 0
| 0
| 22,8400
| 0,8660
| -0,1439
| 0,0207
| 120
| традиционном
| 1
| 4,7875
| 0
| 0
| 22,9201
| 0,8625
| -0,1479
| 0,0219
| 121
| узнавания
| 1
| 4,7958
| 0
| 0
| 22,9996
| 0,8591
| -0,1518
| 0,0231
| 122
| условия
| 1
| 4,8040
| 0
| 0
| 23,0786
| 0,8558
| -0,1557
| 0,0243
| 123
| фазы
| 1
| 4,8122
| 0
| 0
| 23,1571
| 0,8525
| -0,1596
| 0,0255
| 124
| цепочке
| 1
| 4,8203
| 0
| 0
| 23,2351
| 0,8492
| -0,1635
| 0,0267
| 125
| человеческой
| 1
| 4,8283
| 0
| 0
| 23,3126
| 0,8459
| -0,1673
| 0,0280
| суммы
| 193
| 481,8730
| 37,0099
| 90,7594
| 1966,6546
| 190,7015
| 37,0099
| 3,2687
| Рис. 3. Графическое представление отсортированного частотного словаря в
билогарифмических координатах.
Расчет и γ по формулам (1.3)-(1.4)
Расчет С
Расчет fрасч и Δ по формулам (1.1)-(1.2)
Расчет fрасч и Δ по формулам (1.1)-(1.2) выполнен средствами MS Excel и представлен в таблице 4 в соответствующих столбцах.
Выводы Работа была выполнена на небольшом фрагменте текста объемом 281 слово. Текст был отформатирован, «почищен» от стоп-слов, преобразован в список и упорядочен по алфавиту. Слова списка были приведены к одной словоформе и подсчитаны, повторы словоформ удалены. Всего оказалось 125 уникальных словоформ. Список был преобразован в частотный словарь и проранжирован по частоте употребления слов. Уникальных терминов, включая повторы, в частотном словаре - 193 слова, что составляет 68,68 % от общего количества слов фрагмента текста. Исследование частотного словаря выявило закономерность распределения частоты использования лексических единиц в тексте, подчиняющуюся закону Ципфа. |