Главная страница

статистика. про тьюкиMU_4_5(DA). Дисперсионный анализ


Скачать 1.5 Mb.
НазваниеДисперсионный анализ
Анкорстатистика
Дата20.01.2023
Размер1.5 Mb.
Формат файлаdocx
Имя файлапро тьюкиMU_4_5(DA).docx
ТипДокументы
#896353
страница2 из 5
1   2   3   4   5

2. Многофакторный дисперсионный анализ



Если анализируется одновременное влияние двух и более различных факторов на результаты наблюдений, то используется многофакторный дисперсионный анализ. Например, двухфакторная модель нам потребуется, если мы будем строить модель объяснения различий в средних доходов респондентов не только с учетом места проживания респондента, но и с учетом пола респондента.
Пусть мы исследуем влияние на величину двух факторов A и B, имеющих, соответственно и уровней. В двухфакторной модели дисперсионного анализа обычно исходят из следующей модели порождения данных:

,

где: - l-ое наблюдаемое значение отклика для i-го уровня фактора A и j-го уровня фактора B;

- среднее значение отклика по всей совокупности (генеральное среднее);

- среднее значение отклика для i-го уровня фактора A и j-го уровня фактора B;

- главный эффект i-го уровня фактора A ( - среднее значение отклика для i-го уровня фактора A);

- главный эффект j-го уровня фактора B ( - среднее значение отклика для j-го уровня фактора B);

- эффект взаимодействия i-го уровня фактора A и j-го уровня фактора B;

- независимые случайные величины с математическим ожиданием равным нулю и одинаковой дисперсией .
Заметим, что эффекты , , удовлетворяют условиям: , , , .
Выражение можно представить в виде:

.
Данное соотношение говорит о том, что отклонение наблюдаемого значения отклика складывается из суммы четырех слагаемых: отклонения отклика от среднего значения для i, j-го набора уровней факторов A и B , главных эффектов i-го уровня фактора A и j-го уровня фактора B и эффекта взаимодействия. Что, означает, с учетом указанных выше условий на эффекты, что дисперсия отклика может быть представлена в виде суммы четырех дисперсий, одна из которых характеризует внутригрупповую изменчивость для i, j-го набора уровней факторов A и B, а остальные соответствующие эффекты.
Разложение общей дисперсии на составляющие для выборочных данных обычно записывается в виде равенства сумм квадратов соответствующих отклонений (которое, вообще говоря, справедливо только в случае выполнения условия пропорциональности ):

,

где:

– общая, или полная, сумма квадратов отклонений;

– сумма квадратов отклонений средних по уровням фактора A от общей средней, или сумма квадратов главных эффектов A;

– сумма квадратов отклонений средних по уровням фактора B от общей средней, или сумма квадратов главных эффектов B;

– сумма квадратов взаимодействия эффектов A и B;

– остаточная сумма квадратов отклонений.
Число степеней свободы сумм квадратов и равно соответственно и .

Число степеней свободы сумм квадратов взаимодействия эффектов равно .

Число степеней свободы сумм квадратов остатков равно .

Соответственно средние суммы квадратов будут равны:

, , , .

Поскольку двухфакторная модель учитывает различные эффекты влияния факторов, то и статистический анализ для двухфакторной модели предполагает проверку гипотез о значимости различных эффектов. В качестве статистик критериев проверки гипотез о значимости соответствующих эффектов используются отношения средней суммы квадратов эффектов к средней сумме квадратов остатков. При условии истинности «эффект незначим» и нормальном распределении остатков данные статистики имеют распределение Фишера с параметрами степеней свободы, определяемыми числами степеней свободы соответствующих сумм, участвующих в отношении. В табл. 1 приведены основные рассматриваемые гипотезы, статистики критериев для проверки данных гипотез и соответствующие числа степеней свободы данных статистик.

Табл. 1. Статистики для проверки гипотез двухфакторного дисперсионного анализа

Основная гипотеза:

Все

Все

Все

Статистика критерия







Числа степеней

свободы













Если наблюдаемое значение статистики , где - критическая точка распределения Фишера уровня (или квантиль уровня ) с числом степеней свободы и , то нулевая гипотеза отклоняется и считается, что средние для различных уровней фактора значимо различаются.

1   2   3   4   5


написать администратору сайта