5_Проверка статистических гипотез. Тема Проверка статистических гипотез 1 Основные понятия, используемые при проверке гипотез
Скачать 1.03 Mb.
|
5.3 Параметрические методы проверки однородности выборок 5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента) Наиболее распространенный метод проверки однородности выборок путем выдвижения и проверки параметрических гипотез основан на применении критерия Стьюдента. Рассмотрим случай сравнения двух независимых выборок. Выдвигаются: нулевая гипотеза о равенстве средних и альтернативная, о том, что средние не равны. Вычисляют выборочные средние арифметические и дисперсии в каждой выборке и статистику Стьюдента t, на основе которой принимают решение. По заданному уровню значимости и числу степеней свободы (m+n-2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t|>tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t|<tкр, то принимают. В приложении 1 приведены основные формулы и условия применения традиционного метода проверки равенства математических ожиданий, дисперсий, а также долей успешных исходов экспериментов в двух совокупностях 5.3.2 Классические условия применимости критерия Стьюдента Согласно математико-статистической теории должны быть выполнены два условия применимости критерия Стьюдента, основанного на использовании статистики t, заданной формулой (1):
с математическими ожиданиями m1 и m2 и дисперсиями 12 и 22 в первой и во второй выборках соответственно;
D(X)=12=D(Y)=22. Если условия а) и б) выполнены, то нормальные распределения F(x) и G(x) отличаются только математическими ожиданиями, а поэтому обе гипотезы H0 и H'0 сводятся к гипотезе H"0 : m1=m2, , а обе альтернативные гипотезы H1 и H'1 сводятся к гипотезе H"1 : m1m2, . Если условия а) и б) выполнены, то статистика t при справедливости H"0 имеет распределение Стьюдента с (n+m-2) степенями свободы. Только в этом случае описанный выше традиционный метод обоснован безупречно. Если хотя бы одно из условий не выполнено, то нет никаких оснований считать, что статистика t имеет распределение Стьюдента, поэтому применение традиционного метода, строго говоря, не обосновано. В большинстве случаев априори нет оснований предполагать нормальность распределения результатов экономических, технико-экономических, технических, медицинских и иных наблюдений. Однако проверка нормальности - более сложная и трудоемкая статистическая процедура, чем проверка однородности, требующая большого числа наблюдений. Тем не менее, несмотря на нарушение условия нормальности традиционный метод (критерий Стьюдента) можно использовать для проверки гипотезы о равенстве мат. ожиданий при больших объемах выборок. При этом вместо таблиц распределения Стьюдента достаточно пользоваться таблицами стандартного нормального распределения Ф(х). Иногда условие равенства дисперсий вытекает из методики получения результатов наблюдений, например, когда с помощью одного и того же прибора или методики m раз измеряют характеристику первого объекта и п раз - второго, а параметры распределения погрешностей измерения при этом не меняются. Однако, в большинстве технических, экономических, медицинских и иных задач условие равенства дисперсий нельзя считать выполненным, а проверять его нецелесообразно. Однако при больших и равных или мало различающихся объемах выборок нет необходимости требовать выполнения условия равенства дисперсий. В таких случаях применение t-критерия позволяет проверять гипотезу H'0 о равенстве математических ожиданий, но не гипотезу H0о том, что обе выборки взяты из одной и той же генеральной совокупности. Классические условия применимости критерия Стьюдента в подавляющем большинстве технических, экономических, медицинских и иных задач не выполнимы. Тем не менее, при больших и примерно равных объемах выборок его можно применять. При конечных объемах выборок традиционный метод носит неустранимо приближенный характер. Кроме того, следует обратить внимание на то, что t-критерий можно использовать лишь при выполнении следующих условий: 1. Наблюдения в каждой из рассматриваемых групп взяты случайным образом из одной и той же генеральной совокупности (например, две группы студентов одного курса или дети одного возраста и т.д.) 2. Наблюдения имеют нормальные распределения или объем каждой выборки превышает 30 значений. 5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок Вместо критерия Стьюдента для проверки равенства мат. ожиданий целесообразно использовать критерий Крамера-Уэлча, который в отличие от критерия Стьюдента не требует для своего использования равенства дисперсий D(X)=D(Y). Применение критерия Крамера-Уэлча основано на статистике . Правило принятия решения для критерия Крамера-Уэлча выглядит так:
Эмпирическое значение критерия Крамера-Уэлча есть приближенное значение эмпирического значения t-критерия Стьюдента. В прикладной статистике наиболее часто применяется уровень значимости Тогда значение модуля статистики Т Крамера-Уэлча надо сравнивать с граничным значением 5.3.4 Сравнение среднего с нормативом (t-тест одной выборки) Этот тест позволяет выяснить, отличается ли среднее значение, полученное на основе данной выборки, от предварительно заданного контрольного значения. Выдвигаются гипотезы Вычисляется значение статистики t по формуле , где Значимость отличия среднего от заданного значения определяется на основании сравнения полученной статистики t с критической или в зависимости от полученной величины наблюдаемого уровня значимости. Если наблюдаемый уровень значимости меньше необходимого (например, 0,05), то считается, что среднее значение существенно отличается от нормативной величины. 5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента Цель: определить, есть ли достоверные статистические различия между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки. Нулевая гипотеза: между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки отсутствуют достоверные статистические различия (M1=M2) Альтернативная гипотеза: между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки есть достоверные статистические различия. Среднее значение первой выборки достоверно выше среднего значения второй выборки или среднее значение второй выборки достоверно выше среднего значения первой выборки. Ограничения метода:
, где – средняя разность значений; – стандартное отклонение разностей, - размер выборки, число степеней свободы . Для определения уровня значимости используется таблица критических значений -критерия Стьюдента. В случае если эмпирическое≥критическое, то нулевая гипотеза о равенстве средних отклоняется на выбранном уровне статистической значимости. 5.4 Непараметрические методы проверки однородности выборок Критерии сравнения, которые могут быть применены как количественным, так и к порядковым совокупностям, называются непараметрическими. Использование этих критериев не нуждается в каких-либо предположениях о характере распределения переменных. Так как их применение не требует оценки параметров распределений, то критерии называют непараметрическими (термин ввел Вольфовиц в 1942 г.), или - свободными от параметров, или свободно распределенными Непараметрические критерии обладают рядом преимуществ:
Недостатки непараметрических критериев:
5.5 Сравнение двух независимых выборок 5.5.1 Сравнение двух независимых выборок Критерий Манна–Уитни Наиболее часто для сравнения двух независимых выборок используется U-критерий Манна–Уитни –– статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. В отличие от t-критерия Стьюдента U-критерий не требует проверки на нормальность распределения, с его помощью можно сравнивать маленькие выборки объёмом от 3-х наблюдений, т.е. тест позволяет выявлять различия в значении параметра между малыми выборками. Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann) и Д. Р. Уитни (D. R. Whitney), по именам которых сегодня обычно и называется. Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны. Иногда эти различия называют различиями в расположении двух выборок. Для корректной работы теста требуется выполнение следующих условий:
Первым рядом (выборкой, группой) выбирается тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже. Гипотезы U - критерия Манна-Уитни: H0: Уровень признака в группе 2 не ниже уровня признака в группе 1. H1: Уровень признака в группе 2 ниже уровня признака в группе 1. Для применения U-критерия Манна — Уитни нужно произвести следующие операции:
Пример проверки гипотезы при помощи U-критерия Манна-Уитни Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Для расчета U-критерия расположим значения сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до . Первая строка представляет собой значения первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:
Если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно (в нашем случае 20). Это правило используют для проверки правильности ранжирования. Отдельно для каждой выборки рассчитываем суммы рангов их рангов и . В нашем случае: Для проверки правильности вычислений можно воспользоваться правилом: В рассматриваемом случае . Статистика Для проверки одностороннего критерия определим критическое значение для и уровня значимости 5%, которое равно (таблица критических значений критерия приведены в приложении 2). Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий подтверждается с помощью данного непараметрического теста. |