Биометрия. Материалы для практического занятия. Предметом биометрии
Скачать 1.29 Mb.
|
Таблицы. Наиболее распространенной формой группировки являются статистические таблицы; они бывают простыми и сложными. К простым относятся, например, четырехпольные таблицы, применяемые при альтернативной группировке, когда одна группа вариант противопоставляется другой; например, здоровые — больным, высокие — низким и т. д. В качестве примера такой группировки могут служить результаты обследования 265 учащихся младших классов на состояние нёбных миндалин (табл. 1). Таблица 1
Из табл. 1 видно, что заболевание нёбных миндалин, по-видимому, чаще встречается среди учащихся третьих и четвертых классов. К сложным относятся многопольные таблицы, применяемые при изучении корреляционной зависимости и при выяснении причинно-следственных отношений между варьирующими признаками. Примером корреляционной таблицы служат классические данные Гальтона, показывающие наличие положительной зависимости между ростом родителей и ростом их детей (табл. 2). В качестве примера группировки, применяемой при выяснении причинно-следственных отношений между признаками, приведены данные, полученные в Научно-исследовательском институте имени В. В. Докучаева при испытании гречихи сорта «Богатырь» на урожайность в зависимости от предшественников табл. 3. Богатырь» на урожайность в зависимости от предшественников (табл. 3). Таблица 2.
Из табл. 3 ясно, что в данных условиях лучшим предшественником для гречихи является, по-видимому, ячмень. Таблица 3
Приведенными таблицами не исчерпывается их многообразие. Здесь рассмотрены лишь типичные для курса биометрии примеры. Из этих примеров видно, что статистические таблицы имеют не только иллюстративное, но и аналитическое значение, позволяя обнаруживать связи между варьирующими признаками.
Среди группировок видное место занимают вариационные ряды. На их описании следует остановиться более подробно. Ряды регрессии, динамики и другие будут рассмотрены в последующих главах. Вариационным, рядом или рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности. Например, из урожая картофеля, собранного на одной из опытных делянок, случайным способом, т. е. наугад, отобрано 25 клубней, в которых подсчитывали число глазков. Результаты подсчета оказались следующие: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 11, 9, 10. Чтобы разобраться в этих данных, расположим их в ряд (в порядке регистрации результатов наблюдений) с учетом повторяемости вариант в этой совокупности: Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f. Общая сумма частот вариационного ряда равна объему данной совокупности, т. е. (греческая буква сигма прописная) обозначает действие суммирования, в данном случае суммирование частот вариационного ряда от первогокласса, а п — общее число наблюдений, или объем совокупности. Частоты (веса) выражают не только абсолютными, но и относительными числами — в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частостей равна единице, т. е. , если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам. Распределение исходных данных в вариационный ряд преследует определенные цели. Одна из них — ускорение работы при вычислении по вариационному ряду обобщающих числовых характеристик— средней величины и показателей вариации. Другая сводится к выявлению закономерности варьирования учитываемого признака. Приведенный ряд удовлетворяет первой, но не удовлетворяет достижению второй цели. Чтобы ряд распределения полностью удовлетворял предъявляемым к нему требованиям, его нужно строить по ранжированным значениям признака. Под ранжированием (от франц.—выстраивать в ряд по ранжиру, т. е. по росту) понимают расположение членов ряда в возрастающем (или убывающем) порядке. Так, в данном случае результаты наблюдений следует распределить так: Этот упорядоченный ряд распределения в равной мере удовлетворяет достижению и первой, и второй целей. Он хорошо обозрим и наилучшим образом иллюстрирует закономерность варьирования признака. В зависимости от того, как варьирует признак — дискретно или непрерывно, в широком или узком диапазоне, — статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором — подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от — до), на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. Примером неравноинтервального ряда распределения могут служить данные А. Ф. Ковшарь (1966), показывающие зависимость между числом стай сизых голубей и количеством особей в стае в гнездовой (с 15 марта по 15 августа) и послегнездовой (с 15 августа по 15 марта) периоды их жизни (табл. 4). В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Поэтому в качестве числовых характеристик таких рядов используют особые показатели. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом. Таблица 5
Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые Таблица 4 интервалы) искажает типичные черты варьирования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования. Для получения хорошо обозримого вариационного ряда и обеспечениядостаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда: (1) где— величина классового интервала;— максимальная и минимальная варианты совокупности; К — число классов, на которые следует разбить вариацию признака. Число классов (К) можно приблизительно наметить, пользуясь табл. 5. Более точно величинуК можно определить по формуле Стерджеса:При наличии в совокупности большого числа членовможно использовать формулуК. Вопрос о том, распределять ли собранные данные в интервальный или безынтервальный ряд, решают в зависимости от характера и размаха варьирования признака. Если признак варьирует дискретно и слабо, т. е. в узких границах (величинаК оказывается равной единице или может быть приравнена к единице), данные распределяются в безынтервальный вариационный ряд. Если же признак варьирует в широких границах, то независимо от того, как он варьирует — дискретно или непрерывно, по данным строят интервальный вариационный ряд. |