Лекция_2. Лекция 2 нулевая и конкурирующая гипотезы
Скачать 0.68 Mb.
|
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ Лекция №2 НУЛЕВАЯ И КОНКУРИРУЮЩАЯ ГИПОТЕЗЫ Статистической называется гипотезу о виде неизвестного распределения или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу Н 0 Конкурирующей (альтернативной) – называют гипотезу Н, которая противоречит нулевой. Простой называется гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез ОШИБКИ ПЕРВОГО И ВТОРОГО РОДА Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность допустить ошибку первого рода называется уровнем значимости и обозначается через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. В медицине – как правило Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность не допустить ошибку второго рода называется мощностью критерия СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ПРОВЕРКИ НУЛЕВОЙ ГИПОТЕЗЫ Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы. Наблюдаемым (эмпирическим) значением К набл называют то значение критерия, которое вычислено по выборкам КРИТИЧЕСКАЯ ОБЛАСТЬ. О БЛАСТЬ ПРИНЯТИЯ ГИПОТЕЗЫ Основной принцип проверки статистических гипотез если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают. Критическими точками (границами) k кр называются точки, отделяющие критическую область от области принятия гипотезы Правосторонней называется критической область, определяемую неравенством кр, где кр положительное число. Левосторнней называется критической область, определяемую неравенством K< k кр , где кр отрицательное число. Двусторонней называется критическая область, определяемую неравенствами K< k 1 , K>k 2 , где В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенством кр ВЫБОР КРИТЕРИЕВ 7 Число групп Число групп Связанные выборки П арн ый критерий С ть ю д ен та Дисперсионны й анализ Критерий множественных сравнений Непараметрически й дисперсионный анализ группы больше х групп Крит ери и С ть ю д ен та, Ф ишера да нет Различие значимо Связанные выборки группы Нормальное распределение? да нет больше х групп П арн ый критерий У илк о к со н а К рит ерии «зн ак ов », М ан н а -У ит н и да нет Критерий множественных сравнений Различие значимо КРИТЕРИИ НОРМАЛЬНОСТИ Критерии нормальности — это группа статистических критериев, предназначенных для проверки нормальности распределения. Тестирование данных на нормальность часто является первым этапом их анализа, так как большое количество статистических методов исходит из предположения нормальности распределения изучаемых данных СТАТИСТИЧЕСКАЯ ПРОВЕРКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ Для проверки гипотезы о нормальности распределения какого-либо признака чаще всего используют следующие статистические критерии: o Критерий Колмогорова-Смирнова базируется на максимальном различии между эмпирической функцией и теоретической функцией распределения. Критерий Шапиро-Уилка Этот критерий является одним из наиболее мощных в большинстве случаев. o Критерии Д'Агостино критерии нормальности основанные на коэффициентах эксцесса и асимметрии, которые при нормальном распределении равны 3 и 0 соответственно. o Критерий Пирсона 9 Асимметрия - или коэффициент асимметрии является мерой несимметричности распределения. Например, если асимметрия (показывающая отклонение распределения от симметричного) существенно отличается от 0, то распределение несимметрично, в то время как нормальное распределение абсолютно симметрично. Итак, у симметричного распределения асимметрия равна Асимметрия распределения с длинным правым хвостом положительна. Если распределение имеет длинный левый хвост, то его асимметрия отрицательна Эксцесс - или точнее, коэффициент эксцесса измеряет "пикообразность" распределения. Если эксцесс показывающий "остроту пика" распределения) существенно отличен от 0, то распределение имеет или более закругленный пик, чем нормальное, или, напротив, имеет более острый пик (возможно, имеется несколько пиков. Обычно, если эксцесс положителен, топик заострен, если отрицательный, топик закруглен. Эксцесс нормального распределения равен 0. 11 Коэффициент асимметрии Коэффициент эксцесса Для нормального закона Е. Смысл термина эксцесс состоит в том, что он показывает, как быстро уменьшается плотность распределения вблизи её максимального значения Для всех без исключения симметричных распределений нечётные центральные моменты равны 0, поэтому и коэффициент асимметрии А для симметричных распределений также равен нулю ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Если вид распределения или функция распределения выборки нам заданы, тов этом случае задача оценки различий двух групп независимых наблюдений может решаться с использованием параметрических критериев статистики. Использование параметрических критериев статистики без предварительной проверки вида распределения может привести к определенным ошибкам входе проверки рабочей гипотезы ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ О РАВЕНСТВЕ ДИСПЕРСИИ ( НЕЗНАЧИМОСТЬ РАЗЛИЧИЯ ОЦЕНОК ДИСПЕРСИЙ ) При заданном уровне значимости проверить нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе при уровне значимости Критерий Фишера-Снедекора: в качестве критерия принимают отношение оценок большей из оценок дисперсий к меньшей, полученных на основании двух выборок объемами Аи В 2 B A набл s s F 2 2 1 B A : H 2 2 0 B A : H При уровне значимости р находят по таблице значение и сравнивают с Если , тонет основания отвергнуть нулевую гипотезу. Если конкурирующая гипотеза , то 17 2 1 , , f f F кр набл F 1 1 A n f 1 2 B n f кр набл F F 2 2 2 1 2 кр КРИТИЧЕСКИЕ ТОЧКИ КРИТЕРИЯ Ф ИШЕРА -С НЕДЕКОРА 18 Таблица №1 К РИТЕРИЙ К ОЧРЕНА Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема удобно проводить по критерию Кочрена. Требуется при заданном уровне значимости проверить нулевую гипотезу о равенстве генеральных дисперсий (значимо ли различие несмещенных оценок дисперсий). Наблюдаемое значение критерия Кочрена: Критическую точку находят по таблице кр КРИТИЧЕСКИЕ ТОЧКИ КРИТЕРИЯ К ОЧРЕНА 20 Таблица №2 ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ О НЕЗНАЧИМОСТИ РАЗЛИЧИЙ СРЕДНИХ АРИФМЕТИЧЕСКИХ В случае, если известно, что неизвестные генеральные дисперсии равны между собой или, что различие оценок дисперсий незначимо, для сравнения средних арифметических применяют критерий Стьюдента (выборки несвязаны между собой. Необходимо проверить нулевую гипотезу о , при конкурирующей гипотезе По двум независимым выборкам объемами и находят выборочные средние и несмещенные оценки дисперсий B А Х М Х М B А Х М Х М A n B n B A x , x 2 2 B A S , S Вычисляют отношение: оценка средней квадратической оценки разности средних арифметических Число степеней свободы Критическое значение критерия 22 B A x x B A набл S x x t B A B A B A 2 B B 2 A A x x n n n n 2 n n S 1 n S 1 n S B A 2 B A n n f f , p t кр ТАБЛИЦА Если оценки дисперсий различаются значимо или не проверяются, тогда среднюю квадратическую оценку разности средних арифметических вычисляют по формуле: Наблюдаемое значение критерия Число степеней свободы 2 2 B 2 2 A 2 B 2 A B A s s s s 2 1 2 n n f ПАРНЫЙ КРИТЕРИЙ С ТЬЮДЕНТА Применяется в исследованиях в тех случаях, когда изучаются параметры одной и той же группы объектов дои после воздействия. Наблюдаемые значения критерия: 25 S t набл 1 2 n n S i 1 n f |