Методы математической обработки данных педагогического исследования. мат пдф (1). Монография Чебоксары 2019 удк 796799 ббк 75. 1 К72 Рецензенты др экон наук, профессор
Скачать 0.59 Mb.
|
6,1; 5,8; 5,9; 6,0; 5,9; 5,7; 5,9; 6,0; 6,1; 5,9; 6,7 (ny= 11).Пример 2.2.7. Проведено измерение результатов в беге на 30 м у двух групп исследуемых. Определить с помощью метода Фишера, являются ли полученные показатели выборками из одной генеральной совокупно, если данные таковы: xi, с |
xi | (xi — x̄) | (xi — x̄)2 | yi | (yi — ȳ) | (yi — ȳ)2 |
6,4 | 0 | 0 | 6,1 | 0,1 | 0,01 |
6,6 | 0,2 | 0,04 | 5,8 | -0,2 | 0,04 |
6,2 | -0,2 | 0,04 | 5,9 | -0,1 | 0,01 |
6,1 | -0,3 | 0,09 | 6,0 | 0 | 0 |
6,5 | 0,1 | 0,01 | 5,9 | -0,1 | 0,01 |
6,3 | -0,1 | 0,01 | 5,7 | -0,3 | 0,09 |
6,0 | -0,4 | 0,16 | 5,9 | -0,1 | 0,01 |
6,2 | -0,2 | 0,04 | 6,0 | 0 | 0 |
6,4 | 0 | 0 | 6,1 | 0,1 | 0,01 |
6,5 | 0,1 | 0,01 | 5,9 | -0,1 | 0,01 |
6,3 | -0,1 | 0,01 | 6,7 | 0,7 | 0,49 |
7,4 | 1,0 | 1,00 | | | |
5,9 | -0,5 | 0,25 | | | |
6,8 | 0,4 | 0,16 | | | |
x̄ = 6,4 | | ∑(xi — x̄)2= 1,82 | ȳ = 6,0 | | ∑(yi — ȳ)2 = 0,68 |
На основании расчета средних величин выборок выдвигаем рабочую гипотезу.
Рабочая гипотеза: т.к. x̄ = 6,4 с ȳ = 6,0 с, то предположим, что результаты в беге на 30 м в группе Y выше, чем в группе X, и выборки взяты из разных гене- ральных совокупностей.
Подтвердим выдвинутое предположение расчетом F-критерия Фишера по формуле (2.2.7), рассчитав величины дисперсий выборок хи у:
2 ∑(xi — x̄)2
1,82
2 ∑(yi — ȳ)2
0,68
σx =
nx — 1 =
13 ≈ 0,14; σy =
ny —1 =
10 ≈ 0,07.
х =
σ
Тогда, т.к. σ2 > σ2, то Fф =
2 0,14
= 2,00.
σ
x y 2
у
0,07
Рассчитаем число степеней свободы для выборок хи укак
k1= nx– 1 = 14 – 1 = 13 и k2= ny– 1 = 11 – 1 = 10.
Сравним расчетное значение F-критерия (Fф = 2,0) с табличным значением для k1 = 13 и k2 = 10 при = 5% (прилож. 2) и сделаем вывод.
Вывод: т.к. Fф = 2 Fst = 2,89 для k1 = 13 и k2 = 10 при = 5%, то различия результатов в беге на 30 м в исследуемых группах недостоверны, а, следовательно, выборки взяты из одной генеральной совокупности.
Пример 2.2.8. Проведено измерение показателей ЖЕЛ у двух групп школьни- ков 13-14 лет. Определить с помощью метода Фишера, являются ли полученные показатели выборками из одной генеральной совокупно, если данные таковы:
хi, мл 2200; 2700; 2700; 2700; 2400; 2600; 2700; 2300; 2400; 2500; 3000; 2200;
2300; 2500; 2600; 2400; 2300; 2700 (nх= 18).
уi, мл 3400; 2400; 2700; 2500; 2600; 2900; 2800; 3200; 2300; 3300; 3300; 2900;
3400; 2100; 2100; 2500; 3200 (nу= 17);
Решение.
Данные тестирования заносим в рабочую таблицу и сделаем необходимые расчеты.
xi | (xi — x̄) | (xi — x̄)2 | yi | (yi — ȳ) | (yi — ȳ)2 |
2200 | -300 | 90000 | 3400 | 600 | 360000 |
2700 | 200 | 40000 | 2400 | -400 | 160000 |
2700 | 200 | 40000 | 2700 | -100 | 10000 |
2700 | 200 | 40000 | 2500 | -300 | 90000 |
2400 | -100 | 10000 | 2600 | -200 | 40000 |
2600 | 100 | 10000 | 2900 | 100 | 10000 |
2700 | 200 | 40000 | 2800 | 0 | 0 |
2300 | -200 | 40000 | 3200 | 400 | 160000 |
2400 | -100 | 10000 | 2300 | -500 | 250000 |
2500 | 0 | 0 | 3300 | 500 | 250000 |
3000 | 500 | 250000 | 3300 | 500 | 250000 |
2200 | -300 | 90000 | 2900 | 100 | 10000 |
2300 | -200 | 40000 | 3400 | 600 | 360000 |
2500 | 0 | 0 | 2100 | -700 | 490000 |
2600 | 100 | 10000 | 2100 | -700 | 490000 |
2400 | -100 | 10000 | 2500 | -300 | 90000 |
2300 | -200 | 40000 | 3200 | 400 | 160000 |
2700 | 200 | 40000 | | | |
x̄ = 2500 | | ∑(xi — x̄)2= = 800000 | ȳ = 2800 | | ∑(yi — ȳ)2 = = 3180000 |
На основании расчета средних величин выборок выдвинем рабочую гипотезу.
Рабочая гипотеза: т.к. x̄ = 2500 мл ȳ = 2800 мл, то предположим, что пока- затели ЖЕЛ в группе Yвыше, чем группе X,и выборки взяты из разных генераль- ных совокупностей.
Подтвердим выдвинутое предположение расчетом F-критерия Фишера по формуле (2.2.7), рассчитав величины дисперсий выборок хи у:
2 ∑(xi — x̄)2
x
800000
2 ∑(yi — ȳ)2
y
3180000
σx =
n — 1 =
17 ≈ 47058,8; σy =
n — 1 =
16 = 198750.
Тогда, т.к. σ2 > σ2, то F
2
σ 198750
= y = ≈ 4,22.
x
σ
y x ф
2 47058,8
Рассчитаем число степеней свободы для выборок хи укак
k1= nу– 1 = 18 – 1 = 17 и k2= nх– 1 = 17 – 1 = 16.
Сравним расчетное значение F-критерия (Fф= 4,22) с табличным значением для k1 = 17 и k2 = 16 при = 1% (прилож. 2) и сделаем вывод.
Вывод: т.к. Fф = 4,22 Fst = 3,34 для k1 = 17 и k2 = 16 при = 1%, то различия в показателях ЖЕЛ у двух групп исследуемых достоверны с уверенностью = 99%, а, следовательно, выборки взяты из разных генеральных совокупностей.
Непараметрическиекритерии.
Применение параметрических критериев было связано с целым рядом до- пущений. Например, сравнивая выборочные средние значения с помощью t-критерия, принимались следующие предположения: обе выборки являются случайными, т.е. каждая из них получена в результате измерений; обе вы- борки получены из генеральных совокупностей, имеющих нормальное рас- пределение; дисперсии генеральных совокупностей равны между собой.
На практике эти предположения строго никогда не выполняются, по- этому применение параметрических критериев всегда связано с опасно- стью ошибочных выводов, возникающих из-за нарушения принятых до- пущений. В последнее время в математической статистике по этой при- чине интенсивно разрабатываются непараметрические методы, которые строятся так, чтобы их применение зависело от возможно меньшего числа допущений.
Отметим в связи с этим еще одно важное обстоятельство. Параметри- ческие критерии значимости применимы только для сравнения выбороч- ных данных, представляющих собой результаты измерений, выраженных в единицах метрических шкал (метры, килограммы, секунды и т.д.). Но в спортивных исследованиях часто приходится иметь дело с данными, вы- раженными в шкалах наименований или порядка, например произвольная нумерация игроков футбольной команды, места, занятые спортсменами на соревнованиях и т.д. Такие данные нельзя сравнивать с помощью па- раметрических критериев, а непараметрические критерии могут быть успешно применены и к данным этого типа.
Если рассматривать только те случаи, когда выборки можно считать полученными из нормально распределенных совокупностей, непарамет- рические критерии всегда проигрывают соответствующим параметриче- ским критериям, оптимальным в этих случаях, потому что применение непараметрических критериев обычно связано с потерей части информа- ции об измеренных значениях признаков. Поэтому вводится показатель эффективностикритерия(Е). Он представляет собой отношение объема выборки параметрического критерия к объему выборки непараметриче- ского критерия при одинаковой мощности критериев в условиях нормаль- ного распределения генеральной совокупности. Этим показателем и при- нято оценивать эффективность непараметрических критериев.
Важную группу непараметрических критериев составляют ранговыекритерии. Они хорошо разработаны, и эффективность их оказывается очень высокой (для большинства из них при больших объемах выборки эффективность близка к единице). В то же время они просты в пользова- нии и не требуют сложных математических вычислений.
Рассмотрим некоторые из ранговых критериев.
РанговыйТ-критерийУайта.
Одним из критериев, применяемых для установления достоверностиразличий,присравнениидвухнезависимыхраспределений,являетсянепа-раметрический критерий Т Уайта, который в равной мере применим квыборкамравновеликогоинеодинакового объема.
Сущность методики, лежащей в основе применения этого критерия, следующая. Все члены сравниваемых выборок располагаются в возраста- ющем порядке в один ранжированный ряд. Затем каждой варианте при- сваивается порядковый номер или ранг, причем одинаковым по величине членам ряда присваивается один и тот же средний ранг. Общая сумма ран- гов должна быть при этом равна
T = n⋅(n+1), (2.2.8)
2
где n=n1+n2– общее число наблюдений.
Если сравниваемые выборки не отличаются друг от друга, то суммы их рангов должны быть равны между собой. В противном случае такого равен- ства не будет. И чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. А так как эта разница может быть случайной, то ее следует оценить с помощью Т-критерия Уайта, кри- тические значения которого (Тst) даются в таблицах для 5% и 1% уровней значимости с учетом объемов n1и n2сравниваемых выборок (прилож. 3).
Для оценки Т-критерия всегда берется меньшая из двух сумма рангов, которая сравнивается с табличным (стандартным) значением этого крите- рия для n1 и n2, т. е. объемов сравниваемых совокупностей и принятого порога доверительной вероятности. Если Тф<Тst, это указывает на досто- верность наблюдаемой разности и нулевая гипотеза о принадлежности выборок к одной генеральной совокупности несостоятельна и должна быть отвергнута. Если же Тф Тst, то нулевую гипотезу отвергнуть нельзя; разница между сравниваемыми выборками признается статистически не- достоверной.