ПРИЗНАКИ РАЗЛИЧЕНИЯ СПОНТАННОСТИ ИЛИ ПОДГОТОВКИ.... соотношение количества глаголов, существительных и количества всех словоупотреблений;
соотношение количества именных и глагольных сказуемых;
соотношение количества сложных и всех предложений;
отношение количества всех употреблений существительных, прилагательных, наречий, числительных, местоимений к суммарному числу появлений в тексте глаголов и предикативных наречий;
соотношение суммы появлений причастий и деепричастий и количества сказуемых;
соотношение количества местоимений в именительном падеже и количества местоимений в косвенных падежах;
соотношение количества личных местоимений и общей суммы употреблений всех местоимений;
соотношение количества союзов и количества предлогов;
соотношение количества сочинительных и подчинительных союзов;
соотношение количества местоименных прилагательных и суммы появления всех местоимений;
соотношение количества местоименных наречий и всех местоимений;
соотношение количества местоимений с частицами и количества всех местоимений;
соотношение количества местоименных наречий и местоименных наречий с частицами и общего числа наречий;
соотношение суммы употреблений местоименных прилагательных с частицами, притяжательных местоимений и количества всех прилагательных;
соотношение количества употреблений качественных прилагательных и количества появлений в тексте относительных и притяжательных прилагательных;
соотношение количества употреблений имен существительных с конкретным и абстрактным значением;
соотношение количества употреблений конкретных имен существительных и количества всех имен существительных;
соотношение количества абстрактных имен существительных и всех существительных;
соотношение количества собственных имен и всех имен существительных;
104 101 ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ПРИЗНАКИ РАЗЛИЧЕНИЯ СПОНТАННОСТИ ИЛИ ПОДГОТОВКИ.... соотношение количества вводных слов (конструкций) и предложений;
соотношение суммарного количества появлений группы местоимений (который, целый в значении «весь, всякий», каждый, любой, один — в значении «какой-то, другой, иной, прочий, этот, тот» в формах всех родов) и количества всех предложений;
соотношение количества предикативных наречий и безличных глаголов и количества сказуемых;
соотношение количества глаголов в форме настоящего и будущего времени и количества употреблений формы прошедшего времени;
соотношение количества употреблений всех существительных и общей суммы появлений в тексте прилагательных, притяжательных местоимений, местоименных прилагательных и частиц;
соотношение количества существительных и местоимений;
соотношение количества существительных и личных глагольных форм;
соотношение количества существительных и суммарного количества прилагательных, наречий, причастий и деепричастий;
соотношение количества имен существительных и местоименных существительных и общей суммы употреблений в тексте имен прилагательных, притяжательных местоимений, местоименных прилагательных и частиц, а также глагольных сказуемых и причастий;
соотношение количества употреблений именительного падежа имен существительных и количества глагольных сказуемых;
соотношение количества имен существительных и всех предложений;
соотношение количества всех определений и количества глаголов;
соотношение количества местоименных прилагательных и всех прилагательных;
соотношение количества всех определений и обстоятельственных элементов (сумма появлений в тексте наречий, местоименных наречий, последних с частицами);
соотношение количества определительных и обстоятельственных элементов и количества всех существительных и глаголов;
соотношение количества всех определений и количества всех предложений в тексте;
соотношение количества всех местоимений и количества всех глагольных сказуемых;
соотношение количества местоимений и наречий;
соотношение количества предлогов и глагольных сказуемых;
соотношение количества всех глагольных сказуемых и количества всех обстоятельственных элементов плюс деепричастий;
соотношение количества глагольных сказуемых и количества всех имен существительных;
соотношение количества сказуемых и предложений;
соотношение количества безличных сказуемых и глагольных и именных сказуемых;
соотношение общего количества употреблений в тексте личных глагольных форм, относящихся к выделенным семантическим классам, и количества употреблений глагольных сказуемых, не принадлежащих к таким классам;
соотношение количества обстоятельственных деепричастных элементов и количества всех предложений;
соотношение суммы употреблений именительных падежных форм существительных и местоимений и количества сказуемых;
соотношение количества составных глагольных сказуемых и количества всех глагольных сказуемых;
соотношение количества употреблений в качестве сказуемого глаголов I семантического класса (глаголы отражения мира) и количества всех сказуемых;
соотношение употреблений в качестве сказуемого глаголов III семантического класса (духовное и физическое состояние, изменение состояния и проявление признака) и количества всех сказуемых.
В данном перечне не встречаются признаки, связанные с неопределенными или неточными для обеих форм речи (устной и письменной) реалиями. Например, абзац (фоноабзац) или завершенное предложение в устной речи зачастую невозможно достаточно точно определить.
Круг явлений, которые могут быть подвергнуты количественному анализу при исследовании устных и письменных текстов, 106 101
ОСНОВЫ СУДЕБНОГО РЕЧЕВЕДЕНИЯ ПРИЗНАКИ РАЗЛИЧЕНИЯ СПОНТАННОСТИ ИЛИ ПОДГОТОВКИ.... достаточно велик. Однако не все из вышеперечисленных показателей априори отражают значимые особенности для дифференциации формы письменного или устного текста, а тем более спонтанного или подготовленного способа порождения каждой формы. Кроме того, сомнительно, что все они поддаются статистически надежному анализу на выборках сравнительно небольшого объема. В то же время на экспертизу, как правило, поступают тексты именно небольшого объема.
По нашему же мнению, в судебно-экспертном исследовании целесообразно использовать только статистические показатели, которые уже были опробованы в статистической стилистике для квантитативной типологии языков, жанров и видов устного и письменного дискурса. Подсчеты разных классов слов (частей речи), длины, глубины предложения, текстообразующей роли частотных слов активно используются в отечественной квантитативной лингвистике, однако для целей нашего исследования предпочтение было отдано тем, результаты использования которых, по литературным данным, показали хорошую надежность1. Анализ литературных источников и изучение эмпирического материала по экспериментальному массиву текстов позволил выявить следующий ряд статистических показателей, релевантных, по нашему мнению, для дифференциации устной и письменной формы речи, подготовленной и спонтанной речи, монологической и диалогической речи.
Индекс степени общей сложности слов. Вычисляется отношением количества морфем к количеству слов в тексте. Средняя величина степени синтеза для русского языка составляет около 2,33—2,39 (колеблется от 1 до 3,00)2. Значения индекса синтеза и последующие, вычисленные для исследованного экспериментального массива текстов, даны в таблице 43. По данному индексу хорошо дифференцируются письменная и устная формы речи и, соответственно, подготовленная и неподготовленная речь. Письменная подготовленная речь в среднем почти в два 1 Надежность статистических вычислений на языковом материале, по Б. Н. Головину, считается хорошей, если она не ниже 90%.
2 Мейлах М.Индексы морфологической типологии // Проблемы грамматического моделирования / Под ред. А. А. Зализняка. — М.: Наука, 1973. — С. 169.
3 Статистические показатели по отдельным группам устных и письменных текстов были получены разными соисполнителями по результатам обработки экспериментального массива текстов разной функционально-стилистической принадлежности и усреднены нами с учетом количества словоформ в каждом тексте и количества текстов одной и той же разновидности.
ПОКАЗАТЕЛИ ТЕКСТОВОЙ ИНДЕКСАЦИИ Таблица 4 № п/п
| Индекс
| Форма речи
| Способ порождения речи
| Характер интеракции
| Устная
| Письменная
| Спонтанная
| Подготовленная
| Диалог
| Монолог
| 1
| Синтез
| 2,1
| 2,9
| 2,1
| 2,8
| 2,1
| 2,3
| 2
| Словосложение
| 1,03
| 1,05
| 1,01
| 1,06
| 1,02
| 1,02
| 3
| Деривация
| 0,6
| 1,2
| 0,5
| 1,1
| 0,5
| 0,6
| 4
| Словоизменение
| 0,5
| 0,8
| 0,4
| 0,7
| 0,4
| 0,5
| 5
| Префиксация
| 0,15
| 0,3
| 0,15
| 0,31
| 0,13
| 0,17
| 6
| Суффиксация
| 0,4
| 0,8
| 0,4
| 0,7
| 0,4
| 0,47
| 7
| Флективность
| 0,4
| 0,6
| 0,4
| 0,6
| 0,4
| 0,5
| 8
| Глагольность
| 0,18
| 0,12
| 0,17
| 0,12
| 0,15
| 0,17
| 9
| Субстантивность
| 0,15
| 0,38
| 0,17
| 0,33
| 0,15
| 0,18
| 10
| Адъективность
| 0,06
| 0,12
| 0,05
| 0,13
| 0,03
| 0,05
| 11
| Местоименность
| 0,22
| 0,07
| 0,22
| 0,08
| 0,2
| 0,21
| 12
| Автосемантичность
| 0,43
| 0,69
| 0,44
| 0,66
| 0,43
| 0,45
| 13
| Именительный падеж
| 0,48
| 0,24
| 0,52
| 0,26
| 0,54
| 0,43
| 14
| Родительный падеж
| 0,14
| 0,34
| 0,12
| 0,3
| 0,12
| 0,17
| 15
| Личные местоимения
| 0,45
| 0,27
| 0,46
| 0,28
| 0,42
| 0,41
| 16
| Негация
| 0.036
| 0,022
| 0,04
| 0,022
| 0,046
| 0,026
| 17
| Предикативность
| 0,22
| 0,11
| 0,24
| 0,13
| 0,26
| 0,18
| 18
| Интонационная расчлененность
| 0,3
|
| 0,4
| 0,18
| 0,32
| 0,2
| 19
| Длина фразы
| 7
|
| 5
| 10,1
| 6
| 12
| 20
| Лексическое разнообразие
| 0,5
| 0,7
| 0,52
| 0,68
| 0,4
| 0,5
| 21
| Лексическая тривиальность
| 1,2
| 0,54
| 1,26
| 0,62
| 1,27
| 1,11
| |