Занятие 7. Практическое занятие 7 (1). Проверка статистических гипотез. Критерий Фишера. Непараметрические критерии Статистическая проверка гипотез
![]()
|
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 7 Тема: Проверка статистических гипотез. Критерий Фишера. Непараметрические критерии Статистическая проверка гипотез. Проверка гипотез для дисперсий. Критерий Фишера. Непараметрические критерии. Критерий знаков. Статистическая проверка гипотез Терминология Статистические методы используют для описания данных и для оценки статистической значимости результатов опыта. Ни одно исследование не обходится без сравнений. Сравнивают данные опыта с контролем и т.п. Методы оценки статистической значимости различий называют критериями. Критерий – это и сам метод и та величина, которая получается в результате его применения. Методов существует множество, но все они построены по одному принципу. Итак, обратимся ко второму направлению математической статистики—проверке статистических гипотез. Статистическая гипотеза – это любое предположение о виде неизвестного распределения или о параметрах известных распределений. Статистическая гипотеза - это всякое высказывание о генеральной совокупности, проверяемое по выборке. Гипотезы будем обозначать буквой H с индексами. Будем предполагать, что у нас имеется 2 непересекающиеся гипотезы ![]() ![]() ![]() ![]() Сначала формулируют нулевую гипотезу, то есть предполагают, что исследуемые факторы не оказывают никакого влияния на исследуемую величину и полученные различия случайны. Нулевая гипотеза (H0) всегда отвергает эффект. Например, разность средних равна нулю. Нулевая гипотеза формулируется всегда относительно генеральной совокупности (популяции) – она более интересна, чем выборка. Затем формулируют альтернативную гипотезу (H1), которая принимается, если нулевая гипотеза неверна. Она относится к той теории, которую собираются исследовать. Проверка гипотез – это определение аргументов против гипотезы. Задача проверки статистических гипотез состоит в том, чтоб на основе выборки ![]() ![]() ![]() Для проверки принятой гипотезы используют статистический критерий – это правило, позволяющее, основываясь только на выборке ![]() ![]() Значение критерия, полученное из выборки, связывают с уже известным распределением (теоретическим или табличным), которому оно подчиняется, чтобы определить достигнутый уровень значимости (). Значение - это максимально приемлемая вероятность, отвергающая нулевую гипотезу, если она верна, и тогда можно сказать, что результаты значимы на 5% уровне. Чем меньше значение , тем сильнее аргументы против нулевой гипотезы. Обычно полагают, что ![]() ![]() Рис.7.1. Достигнутый уровень значимости ![]() Когда отвергают нулевую гипотезу, то говорят, что результаты эксперимента статистически значимы на уровне ![]() Если ![]() ![]() Различают два вида критериев: параметрические и непараметрические. Параметрические критерии представляют собой функции параметров данной совокупности и используются, если совокупности, из которых взяты выборки, подчиняются нормальному закону распределения. Часто данные не подчиняются предположениям, которые лежат в основе этих методов. В этом случае можно использовать непараметрические критерии. Непараметрические критерии применяются, если нет подчинения распределения нормальному закону. Эти критерии обычно заменяют данные выборок знаками (плюс или минус) рангами (т.е. числами 1; 2; 3; …, описывающими их положение в упорядоченном наборе данных), категориями и т.п. Непараметрический критерий можно использовать, если объем выборки небольшой настолько, что невозможно оценить закон распределения данных. Но непараметрические критерии обладают меньшей мощностью в обнаружении реального эффекта, чем аналогичный параметрический критерий. Общая постановка задачи проверки гипотез 1. Формулируют (выдвигают) нулевую гипотезу ![]() Сущность нулевой гипотезы ![]() 2. Формулируют альтернативную гипотезу ![]() Задают уровень значимости ![]() ![]() ![]() Для проверки нулевой гипотезы используют критерии. Критерий – это случайная величина ![]() Фактическую величину критерия получают по данным наблюдения ![]() 5. По таблице определяют критическое значение, превышение которого при справедливости гипотезы маловероятно ![]() 6. Сравнивают ![]() ![]() Если ![]() ![]() ![]() Если ![]() ![]() Это для параметрических критериев. Если использованы непараметрические критерии, то наоборот: если ![]() ![]() Вывод: различие статистически значимо ![]() Проверка гипотез для дисперсий Пусть генеральные совокупности ![]() ![]() ![]() ![]() ![]() ![]() ![]() 1. ![]() ![]() 2. Н1 : ![]() В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий используем случайную величину F, равную отношению большей исправленной выборочной дисперсии к меньшей ![]() 4. Величина F, при условии справедливости нулевой гипотезы, имеет распределения Фишера-Снедекора со степенями свободы ![]() ![]() ![]() ![]() Из таблиц находим ![]() 5. Сравниваем ![]() ![]() Если ![]() Пример 7.2. По двум независимым выборкам объемов ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Решение. Конкурирующая гипотеза: ![]() ![]() ![]() ![]() ![]() ![]() ![]() Пример 7.3. По двум независимым малым выборкам объемов ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Решение. Так как выборочные дисперсии различны, проверим предварительно нулевую гипотезу о равенстве генеральных дисперсий, пользуясь критерием Фишера-Снедекора. Найдем отношение большей исправленной дисперсии к меньшей: ![]() По таблице при ![]() ![]() ![]() ![]() ![]() ![]() Вычислим наблюдаемое значение критерия Стъюдента: ![]() По таблице находим критическую точку: ![]() Так как ![]() ![]() Непараметрические критерии Это функции, зависящие непосредственно от вариант данной совокупности с их частотами. Служат для проверки рабочих гипотез независимо от формы распределения совокупностей, из которых взяты сравниваемые выборки. Непараметрические критерии рассматривают не только количественные, но и качественные признаки, многие из которых выражаются порядковыми номерами, рангами, индексами и пр. Например, критерий знаков, критерий Уилкоксона-Манна-Уитни. Критерий знаков Рассмотрим критерий знаков. Требования: 1) законы распределения X и Y предполагаются неизвестными, но одинаковыми; 2) объем выборок ![]() Критерий знаков применяют для проверки нулевой гипотезы ![]() Вводится величина ![]() ![]() ![]() ![]() ![]() ![]() ![]() Значение ![]() ![]() N – объем выборки. К = 0,98 при ![]() Сравниваем. Если ![]() ![]() ![]() Пример 7.5. Проведено 100 опытов по изучению влияния фактора на артериальное давление. При ![]() ![]() Решение. Из чисел 48 и 44 выбираем наименьшее – это 44: ![]() Найдем ![]() ![]() Целая часть числа – 39: ![]() 44 > 39, ![]() ![]() Принимаем ![]() |