статистика. про тьюкиMU_4_5(DA). Дисперсионный анализ
![]()
|
Дисперсионный анализДисперсионный анализ — метод, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. Дисперсионный анализ позволяет сравнивать средние значения двух и более групп. Основную задачу дисперсионного анализа можно сформулировать следующим образом: оказывает ли значимое влияние на значение некоторой количественной переменной интересующий нас признак, измеренный на номинальном или порядковом уровне? В терминах метода дисперсионного анализа та переменная, которая, как мы считаем, должна оказывать влияние на конечный результат, называется фактором. Например, если мы хотим объяснить различия в средних доходов респондентов тем, что респонденты проживают в различных населенных пунктах, то переменная «место проживания респондента» - будет выступать фактором. Конкретное значение фактора (например, определенный населенный пункт) называют уровнем фактора. Значение измеряемого признака (в нашем примере — величину среднего дохода) называют откликом. Если исследуется зависимость отклика только от одного фактора, то такой дисперсионный анализ называется однофакторным, если исследуется зависимость от двух и более факторов, то такой дисперсионный анализ называется многофакторным. Само название - дисперсионный анализ (analysis of variance – сокращенно ANOVA) происходит из того, что метод проверки статистической гипотезы о равенстве средних значений в нескольких непересекающихся группах, основан на сопоставлении двух оценок дисперсии анализируемой количественной переменной. 1. Однофакторный дисперсионный анализВ однофакторной модели дисперсионного анализа исходят из следующей модели порождения данных: ![]() где: ![]() ![]() ![]() ![]() ![]() ![]() Выражение ![]() ![]() или: ![]() Данное соотношение говорит о том, что отклонение наблюдаемого значения отклика для j-ой группы складывается из суммы двух слагаемых: отклонения отклика от среднего значения j-ой группы: ![]() ![]() Разложение общей дисперсии на составляющие для выборочных данных обычно записывается в виде равенства сумм квадратов соответствующих отклонений: ![]() где: ![]() ![]() ![]() ![]() ![]() ![]() В разложении дисперсии на составляющие заключена основная идея дисперсионного анализа: общая вариация переменной, порожденная влиянием фактора и измеренная суммой ![]() ![]() ![]() ![]() ![]() В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы. Число степеней свободы для суммы квадратов случайных величин определяется как общее число линейно независимых слагаемых. Для полной суммы квадратов ![]() ![]() ![]() Для суммы квадратов эффекта фактора ![]() ![]() ![]() Для суммы квадратов ошибок ![]() ![]() ![]() ![]() ![]() Соответственно выражения для средних квадратов отклонений, которые являются несмещенными оценками соответствующих дисперсий, имеют вид: ![]() ![]() ![]() В случае нормального распределения остатков ![]() ![]() ![]() ![]() имеет распределение Фишера с ![]() ![]() Если наблюдаемое значение статистики ![]() ![]() ![]() ![]() ![]() ![]() Условия применимости данной модели дисперсионного анализа: 1) нормальность распределения данных для каждого уровня фактора; 2) однородность (равенство) дисперсий для различных уровней фактора. Рассмотренная модель дисперсионного анализа предполагает, что данные измерены в количественной шкале. Для порядковых данных непараметрической альтернативой однофакторного дисперсионного анализа являются ранговый дисперсионный анализ Краскела–Уоллиса и медианный тест. В основе метода дисперсионного анализа Краскела — Уоллиса лежит однофакторный дисперсионный анализ, в котором вместо значений переменных используется ранг переменных. Если обозначить через ![]() ![]() ![]() ![]() ![]() При условии истинности гипотезы ![]() ![]() будет иметь приближенно распределение Хи-квадрат с ![]() Если наблюдаемое значение статистики ![]() ![]() ![]() ![]() ![]() |