Программам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем
Скачать 0.95 Mb.
|
4.3 Алгоритм расчета однофакторного дисперсионного анализа Проведение ДА связано с большими вычислениями, поэтому желатель- но применение вычислительной техники и упрощающих приемов. Так, перед началом «ручного» счета все исходные данные можно уменьшить (увеличить) на одну и ту же величину – на дисперсиях это не отразится. Оформив все данные в виде таблицы 4.1 и, используя зависимости (4.6) – (4.18), алгоритм однофакторного ДА можно представить в виде следующей последовательности вычислений 1 Подсчитывают итоги по столбцам – суммы наблюдений по каждому уровню фактора Х: ∑ = = n j ji i y Y 1 . (4.26) 2 Вычисляют сумму квадратов всех наблюдений: ∑ ∑ = = = m i ji n j y Q 1 2 1 1 . (4.27) 3 Вычисляют сумму квадратов итогов по столбцам, деленную на чис- ло наблюдений в столбце: 1 1 2 2 ∑ = = m i i Y n Q (4.28) 96 4 Рассчитывают квадрат общего итога, деленный на число всех на- блюдений (корректирующий член): 2 1 3 1 ⋅ = ∑ = m i i Y n m Q . (4.29) 5 Определяют сумму квадратов для столбца: 3 2 Q Q SS x − = . (2.30) 6 Определяют общую сумму квадратов: 3 1 Q Q SS общ − = . (4.31) 7 Определяют остаточную сумму квадратов для оценки ошибки экс- перимента: 2 1 Q Q SS − = ε . (4.32) 8 Рассчитывают оценку дисперсии : 2 x S 1 2 − = m SS S x x . (4.33) 9 Рассчитывают оценку дисперсии : 2 ε S ( ) 1 2 − = n m SS S ε ε . (4.34) 10 Оценивается влияние фактора Х по зависимости (4.18) - (4.25). Результаты расчета, как правило, представляются в виде следующей таблицы дисперсионного анализа. 97 Таблица 4.2 – Однофакторный дисперсионный анализ с равным числом повто- рений опытов Компоненты дисперсии Число степеней свободы Сумма квадратов Средний квадрат (оценка дисперсии) Математиче- ское ожида- ние среднего квадрата Междууров- невая m-1 3 2 Q Q SS x − = 1 2 − = m SS S x x 2 2 ε σ σ + x n Внутриуров- невая m(n-1) 2 1 Q Q SS − = ε ( ) 1 2 − = n m SS S ε ε 2 ε σ Общая (полная) mn-1 3 1 Q Q SS общ − = 1 2 − = mn SS S общ y – В случае, когда на различных уровнях фактора проводится разное чис- ло параллельных опытов, можно, ориентируясь на уровень с меньшим числом, отбросить лишние наблюдения в остальных уровнях. Однако такое отбрасы- вание нежелательно, так как существенно снизит точность проводимого ана- лиза. Тем более что новая схема вычислений лишь не многим будет отличать- ся от случая равных столбцов. Пусть на уровне х i проведено n i параллельных наблюдений. Общее число всех наблюдений будет равно ∑ = = m i i n N 1 . (4.35) Определим: 1 Итоги по столбцам – суммы наблюдений по каждому уровню фак- тора х i : ∑ = = n j ji i y Y 1 . (4.36) 2 Суммы квадратов всех наблюдений: ∑ ∑ = = = m i ji n j y Q 1 2 1 1 . (4.37) 3 Сумму квадратов итогов по столбцам, деленных на число наблюде- ний в соответствующем столбце: 1 2 2 ∑ = = m i i i n Y Q (4.38) 98 4 Квадрат общего итога, деленный на число всех наблюдений: 2 1 1 3 ∑ = = m i i Y N Q . (4.39) Дальнейшие расчеты проводятся по формулам (4.30) - (4.34). Если оценки дисперсий : 2 x S и : 2 ε S значимо отличаются друг от друга, то диспер- сию фактора Х можно вычислить по формуле: ( ) ( ) 2 2 2 2 1 1 ε σ S S n N N m x i x m i − ∑ − − ≈ = . (4.40) При этом соотношение для чисел степеней свободы следующее: ( ) ( ) 2 2 2 1 1 x общ S S f f m m N N f S + = − + − = − = ε . (4.41) Задача 4.1. Пороховой завод изготовил заряды к артиллерийским боеприпасам на четырех однотипных поточных линиях. С каждой поточной линии случайным образом было выбрано и отстрелено в одинаковых условиях по пять боеприпа- сов. Результаты замеров начальных скоростей полета снарядов V 0 , м/с, для ка- ждой группы приведены в таблице 4.3. Таблица 4.3 – Результаты испытаний Уровни фактора Х (поточные линии), i=1,m Номер опыта j=1,n x 1 x 2 x 3 x 4 1 2 3 4 5 600 420 510 435 495 570 450 630 450 450 690 570 600 570 600 450 510 450 510 540 Стоит задача: выяснить, существенно ли влияние данных поточных ли- ний на величину начальной скорости полета снарядов V 0. Решение. 1 Проверяем предпосылки ДА. Пусть из априорных данных известно, что результаты наблюдений яв- ляются независимыми случайными величинами, имеющие нормальный закон распределения; опыты, проведенные нами, равноточны, а случайные ошибки наблюдений подчиняются нормальному закону. Однородность выборочных дисперсий проверим по критерию Кохрена. 99 – определяем средние по столбцам: ; 492 5 495 435 510 420 600 1 1 1 1 = + + + + = = ∑ = n j j y n y ; 492 ; 606 ; 510 4 3 2 = = = y y y – определяем оценки дисперсий для каждого столбца: ( ) = − − = ∑ = 1 2 1 2 1 n y y S n j j y ( ) ( ) ( ) ( ) ( ) ; 5107 492 495 492 435 492 510 492 420 492 600 1 5 1 2 2 2 2 2 = − + − + + − + − + − − = ; 1620 ; 2430 ; 7200 2 4 2 2 3 2 = = = y y y S S S – определяем расчетное значение критерия Кохрена: ; 4402 0 1620 2430 7200 5107 7200 max 1 2 2 = + + + = = ∑ = m i y y расч i i S S G – определяем табличное значение G-критерия по таблице приложения 4: ( ) 6287 , 0 4 1 5 ; 4 ; 05 , 0 = = − = = = f n G табл α Так как G расч табл. , то оценки дисперсий однородны и можно присту- пить к проведению ДА. 2 Подсчитываем итоги по столбцам: ∑ = = n j ji i y Y 1 , 2460 495 435 510 420 600 1 = + + + + = Y ; 2550 2 = Y ; 3030 3 = Y ; 100 2460 4 = Y 3 Вычисляем сумму квадратов всех наблюдений: ∑ ∑ = = = m i ji n j y Q 1 2 1 1 ; 5622750 540 420 600 2 2 2 1 = + + + = Q 4 Вычисляем сумму квадратов итогов по столбцам, деленную на чис- ло наблюдений в столбце: 2 1 2 1 ∑ = = m i i Y n Q ; ( ) 5557320 2460 3030 2550 2460 5 1 2 2 2 2 2 = + + + = Q 5 Рассчитаем квадрат общего итога, деленный на число всех наблю- дений: 2 1 3 1 = ∑ = m i i Y mn Q ; ( ) 5512500 2460 3030 2550 2460 5 4 1 2 3 = + + + ⋅ = Q 6 Определяем сумму квадратов для столбца: 3 2 Q Q SS x − = ; 44820 5512500 5557320 = − = x SS 7 Определяем общую сумму квадратов: 3 1 Q Q SS общ − = ; 110250 5512500 5622750 = − = общ SS 8 Определяем остаточную сумму квадратов для оценки ошибки экс- перимента: 2 1 Q Q SS − = ε ; 101 65430 5557320 5622750 = − = ε SS 9 Рассчитывают оценку дисперсии : 2 x S 1 2 − = m SS S x x ; 14940 1 4 44820 2 = − = x S 10 Рассчитывают оценку дисперсии : 2 ε S ( ) 1 2 − = n m SS S ε ε ; ( ) 4089 1 5 4 65430 2 = − = ε S 11 Вычисляем расчетное значение F - критерия: ε 2 2 S S F x расч = ; 6537 , 3 4089 14940 = = расч F 12 Определяем критическое табличное значение F - критерия (прило- жение Б): ( ) ( ) 2389 3 16 1 ; 3 1 ; 05 , 0 2 1 = = − = = − = = n m f m f F табл α 13 Сравним F расч и F табл : 2389 , 3 6537 , 3 = > = табл расч F F Таким образом, влияние поточных линий на величину начальной ско- рости полета снаряда V 0 следует признать значимым. 14 Определяем величину влияния номера поточной линии: 2170 5 4089 14940 2 2 2 = − = − = n S S x x ε σ 102 15 Производим сравнение влияния номеров поточных линий по кри- терию Дункана. С этой целью: - вычисляем нормированную ошибку среднего: 60 28 5 4089 2 = = = n S S y ε ; - располагаем значения средних по столбцам (смотреть таблицу 2.3) в порядке возрастания их величин: 492 1 y 492 4 y 510 2 y 606 3 y ; - выписываем из таблицы Дункана (приложение В) ( ) ( ) рангов значимых значения m все m p n m f n S D 1 ..., 3 2 ; 05 0 ; 16 1 2 − = = = − = = α ε ранги р 00 , 3 2 15 , 3 3 23 , 3 4 ; - вычисляем (m-1) наименьшие значимые ранги (НЗР), умножая ранги на нормированную ошибку среднего: y S НЗР р ⋅ 80 85 2 09 90 3 38 92 4 ; - проверяем значимость различия между средними по столбцам для всех m(m-1)/2 парами: 80 85 0 492 492 ; 80 85 18 492 510 ; 80 85 18 492 510 ; 80 85 96 510 606 ; 09 , 92 114 492 606 ; 38 , 92 114 492 606 1 4 4 2 1 2 2 3 4 3 1 3 незначимо различия y y незначимо различия y y незначимо различия y y значимо различия y y значимо различия y y значимо различия y y < = − = − < = − = − < = − = − > = − = − > = − = − > = − = − Таким образом, для выпуска однородной продукции усовершенствова- ние целесообразно начать с третьей поточной линии. 103 4.4 Двухфакторный дисперсионный анализ Дисперсионный анализ особенно эффективен при одновременном изу- чении нескольких факторов. В этом случае при постановке активного экспе- римента одновременно варьируют все факторы, и каждое наблюдение выход- ного параметра Y используют для их одновременной оценки. При этом нема- ловажен и тот факт, что в ряде случаев можно не делать параллельных наблю- дений, ограничиваясь лишь одним наблюдением для каждого сочетания уров- ней изучаемых факторов. Пусть требуется изучить одновременное влияние на процесс двух каче- ственных факторов Х А и Х В . Фактор Х А исследуется на уровнях Х А1 , Х А2 , …, Х Аi , …, Х АК , фактор Х В – на уровнях Х В1 , Х В2 , …, Х Вj , …, Х Вm . Допустим, что при каж- дом сочетании уровней исследуемых факторов было проведено по n парал- лельных наблюдений (равное количество взято для упрощения вкладок). Мат- рицу наблюдений в рассматриваемом случае можно представить в виде табли- це 4.4. Общее число наблюдений равно m k n N ⋅ ⋅ = Таблица 4.4 – Исходные данные для двухфакторного ДА с равным числом по- вторений опытов X A Х В x A1 x A2 … x Ai … x AK ∗ ∗ j y y 111, y 112 , …, y 11n y 211, y 212 , …, y 21n … y i11, y i12 , …, y i1n … y K11, y K12 , …, y K1n x B1 ∗ 11 y ∗ 21 y … ∗ 1 i y … ∗ 1 K y ∗ ∗1 y y 121, y 122 , …, y 12n y 221, y 222 , …, y 22n … y i21, y i22 , …, y i2n … y K21, y K22 , …, y K2n x B2 ∗ 12 y ∗ 22 y … ∗ 2 i y … ∗ 2 K y ∗ ∗ 2 y … … … … … … … … y 1j1, y 1j2 , …, y 1jn y 2j1, y 2j2 , …, y 2jn … y ij1, y ij2 , …, y ijn … y Kj1, y Kj2 , …, y Kjn x Bj ∗ j y 1 ∗ j y 2 … ∗ j i y … ∗ Kj y ∗ ∗ j y … … … … … … … … y 1m1, y 1m2 , …, y 1mn y 2m1, y 2m2 , …, y 2mn … y im1, y im2 , …, y imn … y Km1, y Km2 , …, y Kmn x Bm ∗ m y 1 ∗ m y 2 … ∗ im y … ∗ Km y ∗ ∗ m y ∗ ∗ i y ∗ ∗ 1 y ∗ ∗ 2 y … ∗ ∗ i y … ∗ ∗ K y y 104 В таблице 4.4. обозначено: i=1,k – число уровней фактора Х А (число столбцов); J=1,m – число уровней фактора Х В (число строк); l=1,n – число наблюдений ячейке (число параллельных опытов); y 111, y 112 ,…, y 11n ,…, у kmn – наблюдавшиеся значения выходного парамет- ра; ∗ j i y – среднее значение в ячейке; ∑ = ∗ = n l ijl ij y n y 1 ; 1 (4.42) ∗ ∗ j y – среднее значение по уровням фактора Х В (средние по строкам); ∑ = ∗ ∗ = k i ij j y k y 1 * ; 1 (4.43) ∗ ∗ i y – среднее значение по уровням фактора Х А (средние по столбцам); ∑ = ∗ = m j ij i y m y 1 * * ; 1 (4.44) y – общее среднее; ∑ ∑ = = = m j ij k i y km y 1 * 1 1 . (4.45) Будем полагать, что предпосылки проведения ДА выполнены. В рас- сматриваемых условиях любое наблюдение из таблицы 4.4 может быть пред- ставлено виде следующей модели: , ijl i i j i ijl d d y ε γ γ µ + + + + = (4.46) где µ – общая средняя (математическое ожидание для среднего по всей таблице 4.4); i d – эффект фактора Х А на i-ом уровне (отклонение математи- ческого ожидания выходного параметра при i-ом уровне фактора Х А от общего математического ожидания); 105 j γ – эффект фактора Х В на j-ом уровне (отклонение математи- ческого ожидания выходного параметра при j-ом уровне фактора Х B от общего математического ожидания); i i d γ – эффект взаимодействия факторов Х А и Х В ; ijl ε – случайный остаток или вариация результатов внутри от- дельной ячейки (ошибка воспроизводимости). Эффект взаимодействия факторов i i d γ представляет собой отклонение среднего по наблюдениям в ij-ой серии от суммы первых трех членов модели (4.46). Если предположить, что между факторами нет взаимодействия, то можно построить линейную модель вида: ijl j i ij d y ε γ µ + + + = . (4.47) Эта модель, как правило, применяется лишь в случае отсутствия парал- лельных опытов, например, как показано в таблице 4.5. (при анализе трех и более факторов отдельные эффекты взаимодействия удается оценить и без па- раллельных наблюдений). Таблица 4.5 – Исходные данные для двухфакторногоДАсодним наблюде- нием в ячейке X A Х В x A1 x A2 … x Ai … x AK ∗ ∗ j y x B1 ∗ 11 y ∗ 21 y … ∗ 1 i y … ∗ 1 K y ∗ ∗ 1 y x B2 ∗ 12 y ∗ 22 y … ∗ 2 i y … ∗ 2 K y ∗ ∗ 2 y … … … … … … … … x Bj ∗ j y 1 ∗ j y 2 … ∗ ij y … ∗ Kj y ∗ ∗ j y … … … … … … … … x Bm ∗ m y 1 ∗ m y 2 … ∗ im y … ∗ Km y m y ∗ ∗ ∗ i y ∗ ∗ 1 y ∗ ∗ 2 y … ∗ ∗ i y … ∗ ∗ K y y В таблице 4.5 обозначено: i=1,k – число уровней фактора Х А (число столбцов); J=1,m – число уровней фактора Х В (число строк); ∗ 11 y ,…, у kmn – наблюдавшиеся значения выходного параметра; j y ∗ – среднее значение по уровням фактора Х B (средние по столбцам); 106 ∑ = = k i ij j y k y 1 * ; 1 (4.48) ∗ i y – среднее значение по уровням фактора Х А (средние по столбцам); ∑ = = m j ij i y m y 1 * ; 1 (4.49) y – общее среднее; ∑ ∑ = = = m j ij k i y km y 1 1 1 . (4.50) В рассматриваемом случае (модель (4.47)) оценки общей дисперсии, как и ранее, можно получить из основного тождества ДА. Однако следует под- черкнуть, что в двухфакторном ДА, в отличие от однофакторного, общая сум- ма квадратов отклонений наблюдений ij y от общего среднего y (числитель (4.9)) раскладывается согласно (4.47) уже не на две, а на три части: часть, обу- словленную влиянием фактора Х А , часть, обусловленную влиянием фактора Х В, и часть, обусловленную влиянием всех неучтенных факторов. ( ) ( ) ( ) ( ) ( ) 2 1 * * 1 2 1 * 2 1 * 2 1 * * * * 1 2 1 1 ε S SS SS y y y y y y m y y k y y y y y y y y y y SS A B X X m j j i ij k i k i i m j j m j j i j i ij k i m j ji k i общ + + = = + − − + − + − = = − + − + + − − = = − = ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = = = (4.51) Слагаемое B X SS представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение выходного параметра по фактору Х B : ( ) 2 1 * ∑ = − = m j j X y y k SS B . (4.52) 107 Слагаемое A X SS представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение выходного параметра по фактору Х A : ( ) 2 1 * ∑ = − = k i i X y y m SS A . (4.53) Слагаемое SS Е называется остаточной суммой квадратов и характеризу- ет влияние неучтенных моделью (4.47) факторов: ( ) 2 1 * * 1 ∑ ∑ = = + − − = m j j i ij k i y y y y S ε . (4.54) Зная суммы квадратов отклонений, определим оценки соответствую- щих дисперсий: ; 1 1 2 − = − = N SS mk SS S общ общ общ (4.55) ; 1 2 − = m SS S B B X X (4.56) ; 1 2 − = K SS S A A X X (4.57) ( )( ) 1 1 2 − − = K m SS S ε ε (4.58) Нулевые гипотезы о незначимости факторов Х А и Х В проверяют по кри- терию Фишера. Если дисперсионное отношение ), , , ( 2 1 2 2 f f F S S F табл X расч B α ε ≤ = (4.59) где ( )( ) , 1 1 ; 1 2 1 − − = − = k m f m f принимается гипотеза 0 : 0 = j H γ 108 Если дисперсионное отношение ), , , ( 2 1 2 2 f f F S S F табл X расч B α ε > = (4.60) нулевая гипотеза отвергается, и влияние фактора Х В считается значимым. Аналогично, если дисперсионное отношение ), , , ( 2 1 2 2 f f F S S F табл X расч A α ε ≤ = (4.61) где ( )( ) , 1 1 ; 1 2 1 − − = − = m k f k f принимается гипотеза 0 : 0 = i d H При несправедливости неравенства ), , , ( 2 1 2 2 f f F S S F табл X расч A α ε > = (4.62) влияние фактора Х А считается значимым. При проверке нулевых гипотез, так- же принимается односторонний F-критерий (приложение Б). При проведении ДА в условиях линейной модели (4.47) удобно исполь- зовать следующий алгоритм расчета. Находят: - итоги по столбцам: ∑ = = m j ij A y X i 1 ; - итоги по строкам: ∑ = = k i ij B y X j 1 ; - сумму квадратов всех наблюдений: ∑ ∑ = = = m j ij k i y Q 1 2 1 1 ; 109 - сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце: ∑ = = k i A i X m Q 1 2 2 1 ; - сумму квадратов итогов по строкам, деленную на число наблюдений в строке: ∑ = = m j B j X k Q 1 2 3 1 ; - квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член): ; 1 1 2 1 2 1 4 ⋅ = ⋅ = ∑ ∑ = = m j B k i A j i X k m X k m Q - сумму квадратов для столбца: 4 2 Q Q SS A X − = ; - сумму квадратов для строки: 4 3 Q Q SS B X − = ; - общую сумму квадратов: ; 4 1 Q Q SS общ − = - остаточную сумму квадратов: ; 4 3 2 1 4 2 4 3 4 1 Q Q Q Q Q Q Q Q Q Q SS SS SS SS XA XB общ + − − = = − − + − − = = − − = ε 110 - оценку дисперсии : 2 A X S 1 2 − = k SS S A A X X ; - оценку дисперсии : 2 B X S 1 2 − = m SS S B B X X ; - оценку дисперсии : 2 ε S ( )( ) 1 1 2 − − = k m SS S ε ε Результаты расчета удобно представлять в виде таблицы 4.6. Таким образом, установив при помощи ДА значимость влияния факто- ров, выясняют затем, какие именно средние значения Y различны. Как было отмечено ранее, линейная модель вида (4.47) справедлива лишь при отсутствии взаимодействия факторов. В противном случае этому взаимодействию как самостоятельному фактору присуща своя дисперсия 2 B A X X σ В приведенном выше алгоритме при наличии взаимодействия между факторами Х А и Х В дисперсия 2 B A X X σ , как составная часть, входит в дисперсию ошибки 2 ε σ . Выделить и оценить эту дисперсию можно только при наличии параллельных наблюдений (таблица 4.4). При указанном расположении на- блюдений их рассеяние в каждой ячейке относительно среднего той же ячейки обусловлено действием только случайных причин с дисперсией 2 B A X X σ . Рассея- ние же самих средних в ячейках по всем возможным сочетаниям уровней фак- торов Х А и Х В вокруг общего среднего, помимо фактора случайности, вызыва- ется влиянием фактора взаимодействия Х А Х В с дисперсией 2 B A X X σ . Кроме этих факторов на рассеяние средних по строкам оказывает влияние только один фактор Х В с дисперсией 2 B X σ , а на рассеяние средних по столбцам – только один фактор Х А с дисперсией 2 A X σ , так как все уровни другого фактора в каж- дом из этих случаев осреднены. В этом случае для получения модели вида (4.46) общую сумму квадра- тов отклонений, наблюдений от общего среднего общ SS необходимо разложить уже на четыре компонента, отвечающие перечисленным выше факторам. 111 Таблица 4.6 – Двухфакторный ДА с одним наблюдением в ячейке Компо- ненты диспер- сии Число степеней свободы Сумма квадратов Средний квадрат (оценка диспер- сии) Матема- тическое ожидание среднего квадрата Х А k-1 4 2 Q Q SS A X − = 1 2 − = k SS S A A X X 2 2 ε σ σ + A X m Х В m-1 4 3 Q Q SS B X − = 1 2 − = m SS S B B X X 2 2 ε σ σ + B X k Остаточ- ная (ошибки) (k-1)(m-1) 4 3 2 1 Q Q Q Q SS + − − = ε ( )( ) 1 1 2 − − = k m SS S ε ε 2 ε σ Общая (полная) km-1 ; 4 1 Q Q SS общ − = 1 2 − = mk SS S общ y – ( ) ( ) ( ) ( ) ( ) ( ) 2 1 * * * * * 1 1 2 1 * * 1 1 2 1 * * 1 1 2 1 * 1 1 2 1 * * * * * * * * * * 1 1 2 1 1 1 B A A B X X X X n l i j ij m j k i n l i m j k i n l j m j k i n l ij ijl m j k i n l i i j j ij ij ijl m j k i n l ijl m j k i общ SS SS SS SS y y y y y y y y y y y y y y y y y y y y y y SS + + + = + − − + + − + − + − = = − + − + − + − + − = = − = ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = = = = = = = = = = = = = ε (4.63) Полученные суммы имеют следующий смысл: ε SS - сумма квадратов отклонений внутри ячейки (серии опытов), характеризующая рассеяние от- дельных наблюдений ijl y в сериях опытов только за счет влияния фактора слу- чайности, так как на протяжении серии опытов внутри одной ячейки факторы Х А и Х В остаются неизменными: ( ) 2 1 * 1 1 ∑ ∑ ∑ = = = − = n l ij ijl m j k i y y SS ε , (4.64) B X SS – сумма квадратов отклонений между строками: 112 ( ) ( ) ∑ ∑ ∑ ∑ = = = = − = − = m j j n l j m j k i X y y kn y y SS B 1 2 * * 2 1 * * 1 1 . (4.65) Сумма kn SS B X / характеризует рассеяние средних * * j y по строке в ре- зультате действия фактора случайности (с дисперсией среднего для строки kn / 2 ε σ ) и фактора Х В (с дисперсией 2 B X σ ); A X SS – сумма квадратов отклонений между строками: ( ) ( ) 2 1 * * 2 1 * * 1 1 ∑ ∑ ∑ ∑ = = = = − = − = k i i n l i m j k i X y y mn y y SS А . (4.66) Сумма mn SS A X / характеризует рассеяние средних по столбцам в ре- зультате действия фактора случайности (с дисперсией среднего для строки mn / 2 ε σ ) и фактора Х А (с дисперсией 2 A X σ ); B A X X SS – сумма квадратов отклонений между сериями: ( ) ( ) 1 2 * * * * * 1 2 1 * * * * * 1 1 ∑ ∑ ∑ ∑ ∑ = = = = = + − − = = + − − = m j i j ij k i n l i j ij m j k i X X y y y y n y y y y S B A (4.67) Сумма n SS B A X X / характеризует рассеяние средних * ij y по ячейкам (се- риям) в результате действия фактора случайности (с дисперсией среднего ячейки n / 2 ε σ ) и фактора взаимодействия (с дисперсией 2 B A X X σ ). Поделив полученные суммы на соответствующее число степеней сво- боды, получим оценки дисперсий: – оценку общей дисперсии по всем N = mkn наблюдением выходного параметра с числом степеней свободы f общ = mkn-1 = N - 1: ; 1 2 2 2 2 2 2 B A B A X X X X y общ N SS S S общ σ σ σ σ ε + + + ≈ − = = (4.68) – оценку дисперсии рассеяния внутри ячеек, то есть оценку остаточной дисперсии, которая является средневзвешенной оценкой дисперсии по всем km сериям наблюдений с числом степеней свободы: ) 1 ( − = n km f ε ; 113 ( ) ; 1 2 2 ε ε ε σ ≈ − = n km SS S (4.69) – оценку дисперсии рассеяния между строками с числом степеней сво- боды : ) 1 ( − = m f B X ; 1 2 2 2 B B B X X X kn m SS S σ σ ε + ≈ − = (4.70) – оценку дисперсии рассеяния между столбцами с числом степеней сво- боды : 1 − = k f A X ; 1 2 2 2 A A A X X X mn k SS S σ σ ε + ≈ − = (4.71) – оценку дисперсии рассеяния между сериями (ячейками) с числом сте- пеней свободы ( )( ) : 1 1 − − = k m f B A X X ( )( ) 2 2 2 1 1 B A B A B A X X X X X X n k m SS S σ σ ε + ≈ − − = (4.72) Правильность подсчета чисел степеней свободы можно проверить с помощью соотношения B A B A X X X X общ f f f f f + + + = ε . (4.73) При практических расчетах удобно использовать следующий алгоритм. По таблице 4.4. находят: – суммы наблюдений в каждой ячейке: ∑ = = n l ijl ij y y 1 ; – квадрат суммы в каждой ячейке: ; 2 1 2 = ∑ = n l ijl ij y y – итоги по столбцам: 114 ; 1 1 ∑∑ = = = m j n l ijl A y X i – итоги по строкам: ∑∑ = = = k i ijl n l B y X j 1 1 ; – сумму всех наблюдений (общий итог): ; 1 1 1 1 1 ∑ ∑ ∑ ∑ ∑ = = = − = = = m j Bj m j k i Ai ijl n l k i X X y – сумму квадратов всех наблюдений: ; 1 2 1 1 1 ∑∑ ∑ = − = = m j ijl n l k i y Q – сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце: ; 1 1 2 2 ∑ = = k i Ai X mn Q – сумму квадратов итогов по строкам, деленную на число наблюдений в строке: ; 1 1 2 3 ∑ = = m j Bj X kn Q – квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член): ; 1 1 2 1 2 1 2 1 1 1 4 ⋅ ⋅ = ⋅ ⋅ = = ∑ ∑ ∑∑∑ = = = = = m j Bj k i Ai k i m j n l ijl X n k m X n k m N y Q – сумму квадратов для столбца: 4 2 Q Q SS A X − = ; – сумму квадратов для строки: 115 4 3 Q Q SS B X − = ; – сумму квадратов для дисперсии воспроизводимости: ; 1 1 2 1 n y Q SS k i m j ij ∑∑ = = − = ε – общую сумму квадратов: ; 4 1 Q Q SS общ − = – остаточную сумму квадратов отклонений для эффекта взаимодейст- вия X A X B : ; ε SS SS SS SS SS A B B A X X общ X X − − − = – оценку дисперсии : 2 A X S 1 2 − = k SS S A A X X ; – оценку дисперсии : 2 B X S 1 2 − = m SS S B B X X ; – оценку дисперсии : 2 B A X X S ( )( ) ; 1 1 2 − − = m k SS S B A B A X X X X – оценку дисперсии воспроизводимости : 2 ε S ( ) 1 2 − = n mk SS S ε ε Полученные результаты целесообразно представить в виде таблицы 4.7. 116 Проверка гипотезы о значимости влияния факторов X A , X B и взаимодей- ствия X A X B производится по критерию Фишера. С этой целью рассчитывают дисперсионное отношение вида: ; ; 2 2 2 2 2 2 ε ε ε S S F S S F S S F B A B A X X расч X расч X расч = = = (4.74) Таблица 4.7 – Двухфакторный ДА с n наблюдениями в каждой ячейке Компо- ненты диспер- сии Число степеней свободы Сумма квадратов Средний квадрат (оценка диспер- сии) Математиче- ское ожида- ние среднего квадрата Х А k-1 4 2 Q Q SS A X − = 1 2 − = k SS S A A X X 2 2 ε σ σ + A X mn Х В m-1 4 3 Q Q SS B X − = 1 2 − = m SS S B B X X 2 2 ε σ σ + B X kn X A X B ( )( ) 1 1 − − m k ε SS SS SS SS SS A B B A X X общ X X − − − − = ( )( ) 1 1 2 − − = m k SS S B A B A X X X X 2 2 ε σ σ + B A X X n Остаточ- ная (ошибки) km(n-1) n y Q SS k i m j ij ∑∑ = = − = 1 1 2 1 ε ( ) 1 2 − = n mk SS S ε ε 2 ε σ Общая (полная) kmn-1 4 1 Q Q SS общ − = – – и сравнивают их с табличными критическими ( ) [ ] ; 1 ; 1 , 2 1 − = − = n mk f k f F A X табл α ( ) [ ] ; 1 ; 1 , 2 1 − = − = n mk f m f F B X табл α ( )( ) ( ) [ ] 1 ; 1 1 , 2 1 − = − − = n mk f m k f F B X A X табл α Если дисперсионные отношения (4.74) больше соответствующих таб- личных, то влияние факторов X A , X B и взаимодействия X A X B следует признать значимыми. В противном случае – незначимыми. Дальнейший анализ и выво- ды о существенности влияния факторов производят так же, как и в однофак- торном ДА. Таким образом, мы рассмотрели процедуру двухфакторного дисперси- онного анализа. При многофакторном анализе последовательность операций |