Главная страница
Навигация по странице:

  • 4.4 Двухфакторный дисперсионный анализ

  • Программам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем


    Скачать 0.95 Mb.
    НазваниеПрограммам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем
    Дата11.05.2022
    Размер0.95 Mb.
    Формат файлаpdf
    Имя файлаmetod475.pdf
    ТипПрограмма
    #523652
    страница9 из 11
    1   2   3   4   5   6   7   8   9   10   11
    4.3 Алгоритм расчета однофакторного дисперсионного анализа
    Проведение ДА связано с большими вычислениями, поэтому желатель- но применение вычислительной техники и упрощающих приемов. Так, перед началом «ручного» счета все исходные данные можно уменьшить (увеличить) на одну и ту же величину – на дисперсиях это не отразится.
    Оформив все данные в виде таблицы 4.1 и, используя зависимости (4.6)
    – (4.18), алгоритм однофакторного ДА можно представить в виде следующей последовательности вычислений
    1 Подсчитывают итоги по столбцам – суммы наблюдений по каждому уровню фактора Х:

    =
    =
    n
    j
    ji
    i
    y
    Y
    1
    . (4.26)
    2 Вычисляют сумму квадратов всех наблюдений:


    =
    =
    =
    m
    i
    ji
    n
    j
    y
    Q
    1 2
    1 1
    . (4.27)
    3 Вычисляют сумму квадратов итогов по столбцам, деленную на чис- ло наблюдений в столбце:
    1 1
    2 2

    =
    =
    m
    i
    i
    Y
    n
    Q
    (4.28)

    96 4 Рассчитывают квадрат общего итога, деленный на число всех на- блюдений (корректирующий член):
    2 1
    3 1







    =

    =
    m
    i
    i
    Y
    n
    m
    Q
    . (4.29)
    5 Определяют сумму квадратов для столбца:
    3 2
    Q
    Q
    SS
    x

    =
    . (2.30)
    6 Определяют общую сумму квадратов:
    3 1
    Q
    Q
    SS
    общ

    =
    . (4.31)
    7 Определяют остаточную сумму квадратов для оценки ошибки экс- перимента:
    2 1
    Q
    Q
    SS

    =
    ε
    . (4.32)
    8 Рассчитывают оценку дисперсии
    :
    2
    x
    S
    1 2

    =
    m
    SS
    S
    x
    x
    . (4.33)
    9 Рассчитывают оценку дисперсии
    :
    2
    ε
    S
    (
    )
    1 2

    =
    n
    m
    SS
    S
    ε
    ε
    . (4.34)
    10 Оценивается влияние фактора Х по зависимости (4.18) - (4.25).
    Результаты расчета, как правило, представляются в виде следующей таблицы дисперсионного анализа.

    97
    Таблица 4.2 – Однофакторный дисперсионный анализ с равным числом повто- рений опытов
    Компоненты дисперсии
    Число степеней свободы
    Сумма квадратов
    Средний квадрат
    (оценка дисперсии)
    Математиче- ское ожида- ние среднего квадрата
    Междууров- невая
    m-1 3
    2
    Q
    Q
    SS
    x

    =
    1 2

    =
    m
    SS
    S
    x
    x
    2 2
    ε
    σ
    σ
    +
    x
    n
    Внутриуров- невая
    m(n-1)
    2 1
    Q
    Q
    SS

    =
    ε
    (
    )
    1 2

    =
    n
    m
    SS
    S
    ε
    ε
    2
    ε
    σ
    Общая
    (полная)
    mn-1 3
    1
    Q
    Q
    SS
    общ

    =
    1 2

    =
    mn
    SS
    S
    общ
    y

    В случае, когда на различных уровнях фактора проводится разное чис- ло параллельных опытов, можно, ориентируясь на уровень с меньшим числом, отбросить лишние наблюдения в остальных уровнях. Однако такое отбрасы- вание нежелательно, так как существенно снизит точность проводимого ана- лиза. Тем более что новая схема вычислений лишь не многим будет отличать- ся от случая равных столбцов. Пусть на уровне х
    i проведено n i
    параллельных наблюдений. Общее число всех наблюдений будет равно

    =
    =
    m
    i
    i
    n
    N
    1
    . (4.35)
    Определим:
    1 Итоги по столбцам – суммы наблюдений по каждому уровню фак- тора х
    i
    :

    =
    =
    n
    j
    ji
    i
    y
    Y
    1
    . (4.36)
    2 Суммы квадратов всех наблюдений:


    =
    =
    =
    m
    i
    ji
    n
    j
    y
    Q
    1 2
    1 1
    . (4.37)
    3 Сумму квадратов итогов по столбцам, деленных на число наблюде- ний в соответствующем столбце:
    1 2
    2

    =
    =
    m
    i
    i
    i
    n
    Y
    Q
    (4.38)

    98 4 Квадрат общего итога, деленный на число всех наблюдений:
    2 1
    1 3





    ∑
    =
    =
    m
    i
    i
    Y
    N
    Q
    . (4.39)
    Дальнейшие расчеты проводятся по формулам (4.30) - (4.34). Если оценки дисперсий
    :
    2
    x
    S
    и
    :
    2
    ε
    S
    значимо отличаются друг от друга, то диспер- сию фактора Х можно вычислить по формуле:
    (
    )
    (
    )
    2 2
    2 2
    1 1
    ε
    σ
    S
    S
    n
    N
    N
    m
    x
    i
    x
    m
    i





    =
    . (4.40)
    При этом соотношение для чисел степеней свободы следующее:
    (
    ) (
    )
    2 2
    2 1
    1
    x
    общ
    S
    S
    f
    f
    m
    m
    N
    N
    f
    S
    +
    =

    +

    =

    =
    ε
    . (4.41)
    Задача 4.1.
    Пороховой завод изготовил заряды к артиллерийским боеприпасам на четырех однотипных поточных линиях. С каждой поточной линии случайным образом было выбрано и отстрелено в одинаковых условиях по пять боеприпа- сов. Результаты замеров начальных скоростей полета снарядов V
    0
    , м/с, для ка- ждой группы приведены в таблице 4.3.
    Таблица 4.3 – Результаты испытаний
    Уровни фактора Х (поточные линии), i=1,m
    Номер опыта
    j=1,n
    x
    1
    x
    2
    x
    3
    x
    4 1
    2 3
    4 5
    600 420 510 435 495 570 450 630 450 450 690 570 600 570 600 450 510 450 510 540
    Стоит задача: выяснить, существенно ли влияние данных поточных ли- ний на величину начальной скорости полета снарядов V
    0.
    Решение.
    1 Проверяем предпосылки ДА.
    Пусть из априорных данных известно, что результаты наблюдений яв- ляются независимыми случайными величинами, имеющие нормальный закон распределения; опыты, проведенные нами, равноточны, а случайные ошибки наблюдений подчиняются нормальному закону. Однородность выборочных дисперсий проверим по критерию Кохрена.

    99
    – определяем средние по столбцам:
    ;
    492 5
    495 435 510 420 600 1
    1 1
    1
    =
    +
    +
    +
    +
    =
    =

    =
    n
    j
    j
    y
    n
    y
    ;
    492
    ;
    606
    ;
    510 4
    3 2
    =
    =
    =
    y
    y
    y
    – определяем оценки дисперсий для каждого столбца:
    (
    )
    =


    =

    =
    1 2
    1 2
    1
    n
    y
    y
    S
    n
    j
    j
    y
    (
    ) (
    ) (
    )
    (
    ) (
    )
    ;
    5107 492 495 492 435 492 510 492 420 492 600 1
    5 1
    2 2
    2 2
    2
    =









    +

    +
    +

    +

    +


    =
    ;
    1620
    ;
    2430
    ;
    7200 2
    4 2
    2 3
    2
    =
    =
    =
    y
    y
    y
    S
    S
    S
    – определяем расчетное значение критерия Кохрена:
    ;
    4402 0
    1620 2430 7200 5107 7200
    max
    1 2
    2
    =
    +
    +
    +
    =
    =

    =
    m
    i
    y
    y
    расч
    i
    i
    S
    S
    G
    – определяем табличное значение G-критерия по таблице приложения
    4:
    (
    )
    6287
    ,
    0 4
    1 5
    ;
    4
    ;
    05
    ,
    0
    =
    =

    =
    =
    =
    f
    n
    G
    табл
    α
    Так как G
    расч

    табл.
    , то оценки дисперсий однородны и можно присту- пить к проведению ДА.
    2
    Подсчитываем итоги по столбцам:

    =
    =
    n
    j
    ji
    i
    y
    Y
    1
    ,
    2460 495 435 510 420 600 1
    =
    +
    +
    +
    +
    =
    Y
    ;
    2550 2
    =
    Y
    ;
    3030 3
    =
    Y
    ;

    100 2460 4
    =
    Y
    3
    Вычисляем сумму квадратов всех наблюдений:


    =
    =
    =
    m
    i
    ji
    n
    j
    y
    Q
    1 2
    1 1
    ;
    5622750 540 420 600 2
    2 2
    1
    =
    +
    +
    +
    =
    Q
    4
    Вычисляем сумму квадратов итогов по столбцам, деленную на чис- ло наблюдений в столбце:
    2 1
    2 1

    =
    =
    m
    i
    i
    Y
    n
    Q
    ;
    (
    )
    5557320 2460 3030 2550 2460 5
    1 2
    2 2
    2 2
    =
    +
    +
    +
    =
    Q
    5
    Рассчитаем квадрат общего итога, деленный на число всех наблю- дений:
    2 1
    3 1






    =

    =
    m
    i
    i
    Y
    mn
    Q
    ;
    (
    )
    5512500 2460 3030 2550 2460 5
    4 1
    2 3
    =
    +
    +
    +

    =
    Q
    6
    Определяем сумму квадратов для столбца:
    3 2
    Q
    Q
    SS
    x

    =
    ;
    44820 5512500 5557320
    =

    =
    x
    SS
    7
    Определяем общую сумму квадратов:
    3 1
    Q
    Q
    SS
    общ

    =
    ;
    110250 5512500 5622750
    =

    =
    общ
    SS
    8
    Определяем остаточную сумму квадратов для оценки ошибки экс- перимента:
    2 1
    Q
    Q
    SS

    =
    ε
    ;

    101 65430 5557320 5622750
    =

    =
    ε
    SS
    9
    Рассчитывают оценку дисперсии
    :
    2
    x
    S
    1 2

    =
    m
    SS
    S
    x
    x
    ;
    14940 1
    4 44820 2
    =

    =
    x
    S
    10
    Рассчитывают оценку дисперсии
    :
    2
    ε
    S
    (
    )
    1 2

    =
    n
    m
    SS
    S
    ε
    ε
    ;
    (
    )
    4089 1
    5 4
    65430 2
    =

    =
    ε
    S
    11
    Вычисляем расчетное значение F - критерия:
    ε
    2 2
    S
    S
    F
    x
    расч
    =
    ;
    6537
    ,
    3 4089 14940 =
    =
    расч
    F
    12
    Определяем критическое табличное значение F - критерия (прило- жение Б):
    (
    )
    (
    )
    2389 3
    16 1
    ;
    3 1
    ;
    05
    ,
    0 2
    1
    =
    =

    =
    =

    =
    =
    n
    m
    f
    m
    f
    F
    табл
    α
    13 Сравним F
    расч
    и F
    табл
    :
    2389
    ,
    3 6537
    ,
    3
    =
    >
    =
    табл
    расч
    F
    F
    Таким образом, влияние поточных линий на величину начальной ско- рости полета снаряда V
    0
    следует признать значимым.
    14 Определяем величину влияния номера поточной линии:
    2170 5
    4089 14940 2
    2 2
    =

    =

    =
    n
    S
    S
    x
    x
    ε
    σ

    102 15 Производим сравнение влияния номеров поточных линий по кри- терию Дункана. С этой целью:
    - вычисляем нормированную ошибку среднего:
    60 28 5
    4089 2
    =
    =
    =
    n
    S
    S
    y
    ε
    ;
    - располагаем значения средних по столбцам (смотреть таблицу 2.3) в порядке возрастания их величин:
    492 1
    y
    492 4
    y
    510 2
    y
    606 3
    y ;
    - выписываем из таблицы Дункана (приложение В)
    (
    )
    (
    )
    рангов
    значимых
    значения
    m
    все
    m
    p
    n
    m
    f
    n
    S
    D
    1
    ...,
    3 2
    ;
    05 0
    ;
    16 1
    2

    =
    =
    =

    =
    =
    α
    ε
    ранги
    р
    00
    ,
    3 2
    15
    ,
    3 3
    23
    ,
    3 4
    ;
    - вычисляем (m-1) наименьшие значимые ранги (НЗР), умножая ранги на нормированную ошибку среднего:
    y
    S
    НЗР
    р

    80 85 2
    09 90 3
    38 92 4
    ;
    - проверяем значимость различия между средними по столбцам для всех m(m-1)/2 парами:
    80 85 0
    492 492
    ;
    80 85 18 492 510
    ;
    80 85 18 492 510
    ;
    80 85 96 510 606
    ;
    09
    ,
    92 114 492 606
    ;
    38
    ,
    92 114 492 606 1
    4 4
    2 1
    2 2
    3 4
    3 1
    3
    незначимо
    различия
    y
    y
    незначимо
    различия
    y
    y
    незначимо
    различия
    y
    y
    значимо
    различия
    y
    y
    значимо
    различия
    y
    y
    значимо
    различия
    y
    y
    <
    =

    =

    <
    =

    =

    <
    =

    =

    >
    =

    =

    >
    =

    =

    >
    =

    =

    Таким образом, для выпуска однородной продукции усовершенствова- ние целесообразно начать с третьей поточной линии.

    103
    4.4 Двухфакторный дисперсионный анализ
    Дисперсионный анализ особенно эффективен при одновременном изу- чении нескольких факторов. В этом случае при постановке активного экспе- римента одновременно варьируют все факторы, и каждое наблюдение выход- ного параметра Y используют для их одновременной оценки. При этом нема- ловажен и тот факт, что в ряде случаев можно не делать параллельных наблю- дений, ограничиваясь лишь одним наблюдением для каждого сочетания уров- ней изучаемых факторов.
    Пусть требуется изучить одновременное влияние на процесс двух каче- ственных факторов Х
    А и Х
    В
    . Фактор Х
    А исследуется на уровнях Х
    А1
    , Х
    А2
    , …, Х
    Аi
    ,
    …, Х
    АК
    , фактор Х
    В
    – на уровнях Х
    В1
    , Х
    В2
    , …, Х
    Вj
    , …, Х
    Вm
    . Допустим, что при каж- дом сочетании уровней исследуемых факторов было проведено по n парал- лельных наблюдений (равное количество взято для упрощения вкладок). Мат- рицу наблюдений в рассматриваемом случае можно представить в виде табли- це 4.4.
    Общее число наблюдений равно
    m
    k
    n
    N


    =
    Таблица 4.4 – Исходные данные для двухфакторного ДА с равным числом по- вторений опытов
    X
    A
    Х
    В
    x
    A1
    x
    A2
    … x
    Ai
    … x
    AK

    j
    y
    y
    111,
    y
    112
    ,
    …, y
    11n
    y
    211,
    y
    212
    ,
    …, y
    21n

    y
    i11,
    y
    i12
    ,
    …, y
    i1n

    y
    K11,
    y
    K12
    ,
    …, y
    K1n
    x
    B1

    11
    y

    21
    y


    1
    i
    y


    1
    K
    y

    ∗1
    y
    y
    121,
    y
    122
    ,
    …, y
    12n
    y
    221,
    y
    222
    ,
    …, y
    22n

    y
    i21,
    y
    i22
    ,
    …, y
    i2n

    y
    K21,
    y
    K22
    ,
    …, y
    K2n
    x
    B2

    12
    y

    22
    y


    2
    i
    y


    2
    K
    y


    2
    y
    … …
    … … … … … …
    y
    1j1,
    y
    1j2
    ,
    …, y
    1jn
    y
    2j1,
    y
    2j2
    ,
    …, y
    2jn

    y
    ij1,
    y
    ij2
    ,
    …, y
    ijn

    y
    Kj1,
    y
    Kj2
    ,
    …, y
    Kjn
    x
    Bj

    j
    y
    1

    j
    y
    2


    j
    i
    y


    Kj
    y


    j
    y
    … …
    … … … … … …
    y
    1m1,
    y
    1m2
    ,
    …, y
    1mn
    y
    2m1,
    y
    2m2
    ,
    …, y
    2mn

    y
    im1,
    y
    im2
    ,
    …, y
    imn

    y
    Km1,
    y
    Km2
    ,
    …, y
    Kmn
    x
    Bm

    m
    y
    1

    m
    y
    2


    im
    y


    Km
    y


    m
    y


    i
    y


    1
    y


    2
    y



    i
    y



    K
    y
    y

    104
    В таблице 4.4. обозначено:
    i=1,k – число уровней фактора Х
    А
    (число столбцов);
    J=1,m – число уровней фактора Х
    В
    (число строк);
    l=1,n – число наблюдений ячейке (число параллельных опытов);
    y
    111,
    y
    112
    ,…, y
    11n
    ,…, у
    kmn
    наблюдавшиеся значения выходного парамет- ра;

    j
    i
    y
    – среднее значение в ячейке;

    =

    =
    n
    l
    ijl
    ij
    y
    n
    y
    1
    ;
    1
    (4.42)


    j
    y
    – среднее значение по уровням фактора Х
    В
    (средние по строкам);

    =


    =
    k
    i
    ij
    j
    y
    k
    y
    1
    *
    ;
    1
    (4.43)


    i
    y
    – среднее значение по уровням фактора Х
    А
    (средние по столбцам);

    =

    =
    m
    j
    ij
    i
    y
    m
    y
    1
    *
    *
    ;
    1
    (4.44)
    y – общее среднее;


    =
    =
    =
    m
    j
    ij
    k
    i
    y
    km
    y
    1
    *
    1 1
    . (4.45)
    Будем полагать, что предпосылки проведения ДА выполнены. В рас- сматриваемых условиях любое наблюдение из таблицы 4.4 может быть пред- ставлено виде следующей модели:
    ,
    ijl
    i
    i
    j
    i
    ijl
    d
    d
    y
    ε
    γ
    γ
    µ
    +
    +
    +
    +
    =
    (4.46) где
    µ
    – общая средняя (математическое ожидание для среднего по всей таблице 4.4);
    i
    d – эффект фактора Х
    А
    на i-ом уровне (отклонение математи- ческого ожидания выходного параметра при i-ом уровне фактора Х
    А от общего математического ожидания);

    105
    j
    γ
    – эффект фактора Х
    В
    на j-ом уровне (отклонение математи- ческого ожидания выходного параметра при j-ом уровне фактора Х
    B от общего математического ожидания);
    i
    i
    d
    γ
    – эффект взаимодействия факторов Х
    А
    и Х
    В
    ;
    ijl
    ε
    – случайный остаток или вариация результатов внутри от- дельной ячейки (ошибка воспроизводимости).
    Эффект взаимодействия факторов
    i
    i
    d
    γ
    представляет собой отклонение среднего по наблюдениям в ij-ой серии от суммы первых трех членов модели
    (4.46). Если предположить, что между факторами нет взаимодействия, то можно построить линейную модель вида:
    ijl
    j
    i
    ij
    d
    y
    ε
    γ
    µ
    +
    +
    +
    =
    . (4.47)
    Эта модель, как правило, применяется лишь в случае отсутствия парал- лельных опытов, например, как показано в таблице 4.5. (при анализе трех и более факторов отдельные эффекты взаимодействия удается оценить и без па- раллельных наблюдений).
    Таблица 4.5 – Исходные данные для двухфакторногоДАсодним наблюде- нием в ячейке
    X
    A
    Х
    В
    x
    A1 x
    A2
    … x
    Ai
    … x
    AK

    j
    y x
    B1

    11
    y

    21
    y


    1
    i
    y


    1
    K
    y


    1
    y x
    B2

    12
    y

    22
    y


    2
    i
    y


    2
    K
    y


    2
    y
    … …
    … … … … … … x
    Bj

    j
    y
    1

    j
    y
    2


    ij
    y


    Kj
    y

    j
    y
    … …
    … … … … … … x
    Bm

    m
    y
    1

    m
    y
    2


    im
    y


    Km
    y
    m
    y



    i
    y


    1
    y


    2
    y



    i
    y



    K
    y
    y
    В таблице 4.5 обозначено:
    i=1,k
    – число уровней фактора Х
    А
    (число столбцов);
    J=1,m – число уровней фактора Х
    В
    (число строк);

    11
    y ,…, у
    kmn
    наблюдавшиеся значения выходного параметра;
    j
    y

    – среднее значение по уровням фактора Х
    B
    (средние по столбцам);

    106

    =
    =
    k
    i
    ij
    j
    y
    k
    y
    1
    *
    ;
    1
    (4.48)

    i
    y – среднее значение по уровням фактора Х
    А
    (средние по столбцам);

    =
    =
    m
    j
    ij
    i
    y
    m
    y
    1
    *
    ;
    1
    (4.49)
    y – общее среднее;


    =
    =
    =
    m
    j
    ij
    k
    i
    y
    km
    y
    1 1
    1
    . (4.50)
    В рассматриваемом случае (модель (4.47)) оценки общей дисперсии, как и ранее, можно получить из основного тождества ДА. Однако следует под- черкнуть, что в двухфакторном ДА, в отличие от однофакторного, общая сум- ма квадратов отклонений наблюдений
    ij
    y
    от общего среднего
    y
    (числитель
    (4.9)) раскладывается согласно (4.47) уже не на две, а на три части: часть, обу- словленную влиянием фактора Х
    А
    , часть, обусловленную влиянием фактора Х
    В, и часть, обусловленную влиянием всех неучтенных факторов.
    (
    )
    (
    )
    (
    )
    (
    )
    (
    )
    2 1
    *
    *
    1 2
    1
    *
    2 1
    *
    2 1
    *
    *
    *
    *
    1 2
    1 1
    ε
    S
    SS
    SS
    y
    y
    y
    y
    y
    y
    m
    y
    y
    k
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    SS
    A
    B
    X
    X
    m
    j
    j
    i
    ij
    k
    i
    k
    i
    i
    m
    j
    j
    m
    j
    j
    i
    j
    i
    ij
    k
    i
    m
    j
    ji
    k
    i
    общ
    +
    +
    =
    =
    +


    +

    +

    =
    =

    +

    +
    +


    =
    =

    =








    =
    =
    =
    =
    =
    =
    =
    =
    (4.51)
    Слагаемое
    B
    X
    SS
    представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение выходного параметра по фактору Х
    B
    :
    (
    )
    2 1
    *

    =

    =
    m
    j
    j
    X
    y
    y
    k
    SS
    B
    . (4.52)

    107
    Слагаемое
    A
    X
    SS
    представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение выходного параметра по фактору Х
    A
    :
    (
    )
    2 1
    *

    =

    =
    k
    i
    i
    X
    y
    y
    m
    SS
    A
    . (4.53)
    Слагаемое SS
    Е называется остаточной суммой квадратов и характеризу- ет влияние неучтенных моделью (4.47) факторов:
    (
    )
    2 1
    *
    *
    1


    =
    =
    +


    =
    m
    j
    j
    i
    ij
    k
    i
    y
    y
    y
    y
    S
    ε
    . (4.54)
    Зная суммы квадратов отклонений, определим оценки соответствую- щих дисперсий:
    ;
    1 1
    2

    =

    =
    N
    SS
    mk
    SS
    S
    общ
    общ
    общ
    (4.55)
    ;
    1 2

    =
    m
    SS
    S
    B
    B
    X
    X
    (4.56)
    ;
    1 2

    =
    K
    SS
    S
    A
    A
    X
    X
    (4.57)
    (
    )(
    )
    1 1
    2


    =
    K
    m
    SS
    S
    ε
    ε
    (4.58)
    Нулевые гипотезы о незначимости факторов Х
    А и Х
    В проверяют по кри- терию Фишера. Если дисперсионное отношение
    ),
    ,
    ,
    (
    2 1
    2 2
    f
    f
    F
    S
    S
    F
    табл
    X
    расч
    B
    α
    ε

    =
    (4.59) где
    (
    )(
    )
    ,
    1 1
    ;
    1 2
    1


    =

    =
    k
    m
    f
    m
    f
    принимается гипотеза
    0
    :
    0
    =
    j
    H
    γ

    108
    Если дисперсионное отношение
    ),
    ,
    ,
    (
    2 1
    2 2
    f
    f
    F
    S
    S
    F
    табл
    X
    расч
    B
    α
    ε
    >
    =
    (4.60) нулевая гипотеза отвергается, и влияние фактора Х
    В
    считается значимым.
    Аналогично, если дисперсионное отношение
    ),
    ,
    ,
    (
    2 1
    2 2
    f
    f
    F
    S
    S
    F
    табл
    X
    расч
    A
    α
    ε

    =
    (4.61) где
    (
    )(
    )
    ,
    1 1
    ;
    1 2
    1


    =

    =
    m
    k
    f
    k
    f
    принимается гипотеза
    0
    :
    0
    =
    i
    d
    H
    При несправедливости неравенства
    ),
    ,
    ,
    (
    2 1
    2 2
    f
    f
    F
    S
    S
    F
    табл
    X
    расч
    A
    α
    ε
    >
    =
    (4.62) влияние фактора Х
    А
    считается значимым. При проверке нулевых гипотез, так- же принимается односторонний F-критерий (приложение Б).
    При проведении ДА в условиях линейной модели (4.47) удобно исполь- зовать следующий алгоритм расчета. Находят:
    - итоги по столбцам:

    =
    =
    m
    j
    ij
    A
    y
    X
    i
    1
    ;
    - итоги по строкам:

    =
    =
    k
    i
    ij
    B
    y
    X
    j
    1
    ;
    - сумму квадратов всех наблюдений:


    =
    =
    =
    m
    j
    ij
    k
    i
    y
    Q
    1 2
    1 1
    ;

    109
    - сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

    =
    =
    k
    i
    A
    i
    X
    m
    Q
    1 2
    2 1
    ;
    - сумму квадратов итогов по строкам, деленную на число наблюдений в строке:

    =
    =
    m
    j
    B
    j
    X
    k
    Q
    1 2
    3 1
    ;
    - квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член):
    ;
    1 1
    2 1
    2 1
    4
    


    



    =







    =


    =
    =
    m
    j
    B
    k
    i
    A
    j
    i
    X
    k
    m
    X
    k
    m
    Q
    - сумму квадратов для столбца:
    4 2
    Q
    Q
    SS
    A
    X

    =
    ;
    - сумму квадратов для строки:
    4 3
    Q
    Q
    SS
    B
    X

    =
    ;
    - общую сумму квадратов:
    ;
    4 1
    Q
    Q
    SS
    общ

    =
    - остаточную сумму квадратов:
    ;
    4 3
    2 1
    4 2
    4 3
    4 1
    Q
    Q
    Q
    Q
    Q
    Q
    Q
    Q
    Q
    Q
    SS
    SS
    SS
    SS
    XA
    XB
    общ
    +


    =
    =


    +


    =
    =


    =
    ε

    110
    - оценку дисперсии
    :
    2
    A
    X
    S
    1 2

    =
    k
    SS
    S
    A
    A
    X
    X
    ;
    - оценку дисперсии
    :
    2
    B
    X
    S
    1 2

    =
    m
    SS
    S
    B
    B
    X
    X
    ;
    - оценку дисперсии
    :
    2
    ε
    S
    (
    )(
    )
    1 1
    2


    =
    k
    m
    SS
    S
    ε
    ε
    Результаты расчета удобно представлять в виде таблицы 4.6.
    Таким образом, установив при помощи ДА значимость влияния факто- ров, выясняют затем, какие именно средние значения Y различны.
    Как было отмечено ранее, линейная модель вида (4.47) справедлива лишь при отсутствии взаимодействия факторов. В противном случае этому взаимодействию как самостоятельному фактору присуща своя дисперсия
    2
    B
    A
    X
    X
    σ
    В приведенном выше алгоритме при наличии взаимодействия между факторами Х
    А и Х
    В дисперсия
    2
    B
    A
    X
    X
    σ
    , как составная часть, входит в дисперсию ошибки
    2
    ε
    σ
    . Выделить и оценить эту дисперсию можно только при наличии параллельных наблюдений (таблица 4.4). При указанном расположении на- блюдений их рассеяние в каждой ячейке относительно среднего той же ячейки обусловлено действием только случайных причин с дисперсией
    2
    B
    A
    X
    X
    σ
    . Рассея- ние же самих средних в ячейках по всем возможным сочетаниям уровней фак- торов Х
    А и Х
    В вокруг общего среднего, помимо фактора случайности, вызыва- ется влиянием фактора взаимодействия Х
    А
    Х
    В
    с дисперсией
    2
    B
    A
    X
    X
    σ
    . Кроме этих факторов на рассеяние средних по строкам оказывает влияние только один фактор Х
    В с дисперсией
    2
    B
    X
    σ
    , а на рассеяние средних по столбцам – только один фактор Х
    А
    с дисперсией
    2
    A
    X
    σ
    , так как все уровни другого фактора в каж- дом из этих случаев осреднены.
    В этом случае для получения модели вида (4.46) общую сумму квадра- тов отклонений, наблюдений от общего среднего
    общ
    SS
    необходимо разложить уже на четыре компонента, отвечающие перечисленным выше факторам.

    111
    Таблица 4.6 – Двухфакторный ДА с одним наблюдением в ячейке
    Компо- ненты диспер- сии
    Число степеней свободы
    Сумма квадратов
    Средний квадрат
    (оценка диспер- сии)
    Матема- тическое ожидание среднего квадрата
    Х
    А
    k-1 4
    2
    Q
    Q
    SS
    A
    X

    =
    1 2

    =
    k
    SS
    S
    A
    A
    X
    X
    2 2
    ε
    σ
    σ
    +
    A
    X
    m
    Х
    В
    m-1 4
    3
    Q
    Q
    SS
    B
    X

    =
    1 2

    =
    m
    SS
    S
    B
    B
    X
    X
    2 2
    ε
    σ
    σ
    +
    B
    X
    k
    Остаточ- ная
    (ошибки)
    (k-1)(m-1)
    4 3
    2 1
    Q
    Q
    Q
    Q
    SS
    +


    =
    ε
    (
    )(
    )
    1 1
    2


    =
    k
    m
    SS
    S
    ε
    ε
    2
    ε
    σ
    Общая
    (полная)
    km-1
    ;
    4 1
    Q
    Q
    SS
    общ

    =
    1 2

    =
    mk
    SS
    S
    общ
    y

    (
    )
    (
    )
    (
    )
    (
    )
    (
    )
    (
    )
    2 1
    *
    *
    *
    *
    *
    1 1
    2 1
    *
    *
    1 1
    2 1
    *
    *
    1 1
    2 1
    *
    1 1
    2 1
    *
    *
    *
    *
    *
    *
    *
    *
    *
    *
    1 1
    2 1
    1 1
    B
    A
    A
    B
    X
    X
    X
    X
    n
    l
    i
    j
    ij
    m
    j
    k
    i
    n
    l
    i
    m
    j
    k
    i
    n
    l
    j
    m
    j
    k
    i
    n
    l
    ij
    ijl
    m
    j
    k
    i
    n
    l
    i
    i
    j
    j
    ij
    ij
    ijl
    m
    j
    k
    i
    n
    l
    ijl
    m
    j
    k
    i
    общ
    SS
    SS
    SS
    SS
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    y
    SS
    +
    +
    +
    =
    +


    +
    +

    +

    +

    =
    =

    +

    +

    +

    +

    =
    =

    =


















    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    =
    ε
    (4.63)
    Полученные суммы имеют следующий смысл:
    ε
    SS - сумма квадратов отклонений внутри ячейки (серии опытов), характеризующая рассеяние от- дельных наблюдений
    ijl
    y в сериях опытов только за счет влияния фактора слу- чайности, так как на протяжении серии опытов внутри одной ячейки факторы
    Х
    А
    и Х
    В остаются неизменными:
    (
    )
    2 1
    *
    1 1



    =
    =
    =

    =
    n
    l
    ij
    ijl
    m
    j
    k
    i
    y
    y
    SS
    ε
    , (4.64)
    B
    X
    SS – сумма квадратов отклонений между строками:

    112
    (
    )
    (
    )




    =
    =
    =
    =

    =

    =
    m
    j
    j
    n
    l
    j
    m
    j
    k
    i
    X
    y
    y
    kn
    y
    y
    SS
    B
    1 2
    *
    *
    2 1
    *
    *
    1 1
    . (4.65)
    Сумма
    kn
    SS
    B
    X
    /
    характеризует рассеяние средних
    *
    * j
    y
    по строке в ре- зультате действия фактора случайности (с дисперсией среднего для строки
    kn
    /
    2
    ε
    σ
    ) и фактора Х
    В
    (с дисперсией
    2
    B
    X
    σ
    );
    A
    X
    SS – сумма квадратов отклонений между строками:
    (
    )
    (
    )
    2 1
    *
    *
    2 1
    *
    *
    1 1




    =
    =
    =
    =

    =

    =
    k
    i
    i
    n
    l
    i
    m
    j
    k
    i
    X
    y
    y
    mn
    y
    y
    SS
    А
    . (4.66)
    Сумма
    mn
    SS
    A
    X
    /
    характеризует рассеяние средних по столбцам в ре- зультате действия фактора случайности (с дисперсией среднего для строки
    mn
    /
    2
    ε
    σ
    ) и фактора Х
    А
    (с дисперсией
    2
    A
    X
    σ
    );
    B
    A
    X
    X
    SS
    – сумма квадратов отклонений между сериями:
    (
    )
    (
    )
    1 2
    *
    *
    *
    *
    *
    1 2
    1
    *
    *
    *
    *
    *
    1 1





    =
    =
    =
    =
    =
    +


    =
    =
    +


    =
    m
    j
    i
    j
    ij
    k
    i
    n
    l
    i
    j
    ij
    m
    j
    k
    i
    X
    X
    y
    y
    y
    y
    n
    y
    y
    y
    y
    S
    B
    A
    (4.67)
    Сумма
    n
    SS
    B
    A
    X
    X
    / характеризует рассеяние средних
    *
    ij
    y
    по ячейкам (се- риям) в результате действия фактора случайности (с дисперсией среднего ячейки
    n
    /
    2
    ε
    σ
    ) и фактора взаимодействия
    (с дисперсией
    2
    B
    A
    X
    X
    σ
    ).
    Поделив полученные суммы на соответствующее число степеней сво- боды, получим оценки дисперсий:
    – оценку общей дисперсии по всем N = mkn наблюдением выходного параметра с числом степеней свободы f
    общ
    = mkn-1 = N - 1:
    ;
    1 2
    2 2
    2 2
    2
    B
    A
    B
    A
    X
    X
    X
    X
    y
    общ
    N
    SS
    S
    S
    общ
    σ
    σ
    σ
    σ
    ε
    +
    +
    +


    =
    =
    (4.68)
    оценку дисперсии рассеяния внутри ячеек, то есть оценку остаточной дисперсии, которая является средневзвешенной оценкой дисперсии по всем km сериям наблюдений с числом степеней свободы:
    )
    1
    (

    =
    n
    km
    f
    ε
    ;

    113
    (
    )
    ;
    1 2
    2
    ε
    ε
    ε
    σ


    =
    n
    km
    SS
    S
    (4.69)
    – оценку дисперсии рассеяния между строками с числом степеней сво- боды
    :
    )
    1
    (

    = m
    f
    B
    X
    ;
    1 2
    2 2
    B
    B
    B
    X
    X
    X
    kn
    m
    SS
    S
    σ
    σ
    ε
    +


    =
    (4.70)
    – оценку дисперсии рассеяния между столбцами с числом степеней сво- боды
    :
    1

    = k
    f
    A
    X
    ;
    1 2
    2 2
    A
    A
    A
    X
    X
    X
    mn
    k
    SS
    S
    σ
    σ
    ε
    +


    =
    (4.71)
    – оценку дисперсии рассеяния между сериями (ячейками) с числом сте- пеней свободы
    (
    )(
    )
    :
    1 1


    =
    k
    m
    f
    B
    A
    X
    X
    (
    )(
    )
    2 2
    2 1
    1
    B
    A
    B
    A
    B
    A
    X
    X
    X
    X
    X
    X
    n
    k
    m
    SS
    S
    σ
    σ
    ε
    +



    =
    (4.72)
    Правильность подсчета чисел степеней свободы можно проверить с помощью соотношения
    B
    A
    B
    A
    X
    X
    X
    X
    общ
    f
    f
    f
    f
    f
    +
    +
    +
    =
    ε
    . (4.73)
    При практических расчетах удобно использовать следующий алгоритм.
    По таблице 4.4. находят:
    – суммы наблюдений в каждой ячейке:

    =
    =
    n
    l
    ijl
    ij
    y
    y
    1
    ;
    – квадрат суммы в каждой ячейке:
    ;
    2 1
    2






    =

    =
    n
    l
    ijl
    ij
    y
    y
    – итоги по столбцам:

    114
    ;
    1 1
    ∑∑
    = =
    =
    m
    j
    n
    l
    ijl
    A
    y
    X
    i
    – итоги по строкам:
    ∑∑
    =
    =
    =
    k
    i
    ijl
    n
    l
    B
    y
    X
    j
    1 1
    ;
    – сумму всех наблюдений (общий итог):
    ;
    1 1
    1 1
    1





    =
    =
    =

    =
    =
    =
    m
    j
    Bj
    m
    j
    k
    i
    Ai
    ijl
    n
    l
    k
    i
    X
    X
    y
    – сумму квадратов всех наблюдений:
    ;
    1 2
    1 1
    1
    ∑∑

    = −
    =
    =
    m
    j
    ijl
    n
    l
    k
    i
    y
    Q
    – сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:
    ;
    1 1
    2 2

    =
    =
    k
    i
    Ai
    X
    mn
    Q
    – сумму квадратов итогов по строкам, деленную на число наблюдений в строке:
    ;
    1 1
    2 3

    =
    =
    m
    j
    Bj
    X
    kn
    Q
    – квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член):
    ;
    1 1
    2 1
    2 1
    2 1
    1 1
    4








    =








    =






    =


    ∑∑∑
    =
    =
    =
    = =
    m
    j
    Bj
    k
    i
    Ai
    k
    i
    m
    j
    n
    l
    ijl
    X
    n
    k
    m
    X
    n
    k
    m
    N
    y
    Q
    – сумму квадратов для столбца:
    4 2
    Q
    Q
    SS
    A
    X

    =
    ;
    – сумму квадратов для строки:

    115 4
    3
    Q
    Q
    SS
    B
    X

    =
    ;
    – сумму квадратов для дисперсии воспроизводимости:
    ;
    1 1
    2 1
    n
    y
    Q
    SS
    k
    i
    m
    j
    ij
    ∑∑
    =
    =

    =
    ε
    – общую сумму квадратов:
    ;
    4 1
    Q
    Q
    SS
    общ

    =
    – остаточную сумму квадратов отклонений для эффекта взаимодейст- вия X
    A
    X
    B
    :
    ;
    ε
    SS
    SS
    SS
    SS
    SS
    A
    B
    B
    A
    X
    X
    общ
    X
    X



    =
    – оценку дисперсии
    :
    2
    A
    X
    S
    1 2

    =
    k
    SS
    S
    A
    A
    X
    X
    ;
    – оценку дисперсии
    :
    2
    B
    X
    S
    1 2

    =
    m
    SS
    S
    B
    B
    X
    X
    ;
    – оценку дисперсии
    :
    2
    B
    A
    X
    X
    S
    (
    )(
    )
    ;
    1 1
    2


    =
    m
    k
    SS
    S
    B
    A
    B
    A
    X
    X
    X
    X
    – оценку дисперсии воспроизводимости
    :
    2
    ε
    S
    (
    )
    1 2

    =
    n
    mk
    SS
    S
    ε
    ε
    Полученные результаты целесообразно представить в виде таблицы 4.7.

    116
    Проверка гипотезы о значимости влияния факторов X
    A
    , X
    B
    и взаимодей- ствия X
    A
    X
    B
    производится по критерию Фишера. С этой целью рассчитывают дисперсионное отношение вида:
    ;
    ;
    2 2
    2 2
    2 2
    ε
    ε
    ε
    S
    S
    F
    S
    S
    F
    S
    S
    F
    B
    A
    B
    A
    X
    X
    расч
    X
    расч
    X
    расч
    =
    =
    =
    (4.74)
    Таблица 4.7 – Двухфакторный ДА с n наблюдениями в каждой ячейке
    Компо- ненты диспер- сии
    Число степеней свободы
    Сумма квадратов
    Средний квадрат
    (оценка диспер- сии)
    Математиче- ское ожида- ние среднего квадрата
    Х
    А
    k-1 4
    2
    Q
    Q
    SS
    A
    X

    =
    1 2

    =
    k
    SS
    S
    A
    A
    X
    X
    2 2
    ε
    σ
    σ
    +
    A
    X
    mn
    Х
    В
    m-1 4
    3
    Q
    Q
    SS
    B
    X

    =
    1 2

    =
    m
    SS
    S
    B
    B
    X
    X
    2 2
    ε
    σ
    σ
    +
    B
    X
    kn
    X
    A
    X
    B
    (
    )(
    )
    1 1


    m
    k
    ε
    SS
    SS
    SS
    SS
    SS
    A
    B
    B
    A
    X
    X
    общ
    X
    X




    =
    ( )(
    )
    1 1
    2


    =
    m
    k
    SS
    S
    B
    A
    B
    A
    X
    X
    X
    X
    2 2
    ε
    σ
    σ
    +
    B
    A
    X
    X
    n
    Остаточ- ная
    (ошибки)
    km(n-1)
    n
    y
    Q
    SS
    k
    i
    m
    j
    ij
    ∑∑
    =
    =

    =
    1 1
    2 1
    ε
    (
    )
    1 2

    =
    n
    mk
    SS
    S
    ε
    ε
    2
    ε
    σ
    Общая
    (полная)
    kmn-1 4
    1
    Q
    Q
    SS
    общ

    =
    – – и сравнивают их с табличными критическими
    (
    )
    [
    ]
    ;
    1
    ;
    1
    ,
    2 1

    =

    =
    n
    mk
    f
    k
    f
    F
    A
    X
    табл
    α
    (
    )
    [
    ]
    ;
    1
    ;
    1
    ,
    2 1

    =

    =
    n
    mk
    f
    m
    f
    F
    B
    X
    табл
    α
    (
    )(
    )
    (
    )
    [
    ]
    1
    ;
    1 1
    ,
    2 1

    =


    =
    n
    mk
    f
    m
    k
    f
    F
    B
    X
    A
    X
    табл
    α
    Если дисперсионные отношения (4.74) больше соответствующих таб- личных, то влияние факторов
    X
    A
    ,
    X
    B
    и взаимодействия
    X
    A
    X
    B
    следует признать значимыми. В противном случае – незначимыми. Дальнейший анализ и выво- ды о существенности влияния факторов производят так же, как и в однофак- торном ДА.
    Таким образом, мы рассмотрели процедуру двухфакторного дисперси- онного анализа. При многофакторном анализе последовательность операций

    117
    аналогична, но значительно усложняются таблицы наблюдений и расчетные формулы.
    С целью упрощения расчетов можно воспользоваться одним из воз- можных алгоритмов машинной обработки результатов проведения ДА.
    1   2   3   4   5   6   7   8   9   10   11


    написать администратору сайта