Теория вероятностей и математическая статистика. Закон распределения случайной величины. Математическое ожидание 28 Дисперсия случайной величины 32
Скачать 361.49 Kb.
|
МАТЕМАТИЧЕСКАЯ СТАТИСТИКАВариационные рядыПусть собраны данные об успеваемости ста студентов в потоке. Для каждого из них средний балл за сессию составил 2,97; 2,79; 4,05; … 3,29; 3,12 (всего сто значений). Каждое из различных значений признака, которые были при этом получены, называют вариантой или вариантом. Отметим, что вариант, скорее всего, окажется меньше ста, так как они могут повторяться несколько раз (т.е. один и тот же средний балл получили несколько студентов). В таком виде данные плохо обозримы для исследователя, поэтому их необходимо подвергнуть предварительной обработке. Для этого вначале наблюдения ранжируют (т.е. упорядочивают) по возрастанию или убыванию, а также определяют наибольшую и наименьшую варианту. Пусть в нашем случае самый низкий средний бал составил 2,5, а самый высокий – 5 баллов. Проведем группировку данных, т.е. разобьем их на несколько интервалов. Число интервалов не должно быть ни слишком большим (иначе такую группировку сложно изучать), ни слишком маленьким (иначе изучение такой группировки будет бесполезным, не отразит вариацию признака). Разобьем наши наблюдения на пять интервалов и подсчитаем, сколько наблюдений попало в каждый интервал (результаты расчетов представлены в первых трех столбцах таблицы 4). Соответствующее число наблюдений (число студентов, получивших средний бал из каждого интервала), называют частотой этого интервала (группы) (обозначим ее ni, где i – номер интервала). В нашем примере 22 студента получили средний балл от 2,5 до 3 (включая 2,5), поэтому n1 = 22; 24 студента – от 3 до 3,5, поэтому n2 = 24 и т.д. Упорядоченный ряд вариант с соответствующими им частотами называют вариационным рядом. В таблице 4 представлен сгруппированный вариационный ряд. Обозначим общее число наблюдений n (в нашем случае n = 100). Если отнести частоту к общему числу студентов, можно получить относительную частоту wi = ni / n, которая показывает долю наблюдений из этого интервала во всей совокупности наблюдений. Например, относительная частота для первого интервала составляет w1 = n1 / n = 22/100 = 0,22. Таблица 4 – Интервальный вариационный ряд
При анализе вариационных рядов принято также рассчитывать накопленные частоты и накопленные относительные частоты. Каждая из них показывает, сколько имеется наблюдений с вариантами, меньшими i-й варианты. Например, для второго интервала накопленная частота равна 22 + + 24 = 46, т.е. имеется 46 студентов со средним баллом до 3,5. Для третьего интервала накопленная частота равна 46 + 17 = 63 (к предыдущей накопленной частоте прибавили частоту третьего интервала), и т.д. Накопленная относительная частота для второго интервала равна 0,22 + 0,24 = = 0,46, т.е. 46% студентов имеют средний балл до 3,5. И т.д. Вышеперечисленные показатели также приведены в табл. 4. В рассмотренном примере средний балл был округлен до сотых долей, но можно было бы округлить и с большей точностью. Поэтому можно сказать, что варианты могут отличаться друг от друга на сколь угодно малую величину, т.е. принимать любые значения на промежутке [2,5; 5]. Такой вариационный ряд принято называть непрерывным, или интервальным. Существуют также дискретные вариационные ряды, в которых варианты принимают отдельные значения. Например, если рассматривается не средний балл по всем дисциплинам, а оценка по одной дисциплине у ста студентов, то варианты будут 2, 3, 4 или 5 (пример приведен в таблице 5). Таблица 5– Дискретный вариационный ряд
|