Главная страница
Навигация по странице:

  • Двухфакторный дисперсионный анализ без повторений

  • Двухфакторный дисперсионный анализ с повторениями: расчет параметров для проверки гипотезы

  • Вопросы для самоконтроля

  • 4.4. Задания №1.

  • Данные для однофакторного анализа

  • Данные для двухфакторного анализа

  • Данные для двухфакторного анализа с повторениями

  • Порядок выполнения работы

  • Результаты проверки гипотезы H 0 : 2 1  = 2 2  =  = 2 5

  • Диалоговое окно Однофакторный дисперсионный анализ

  • Результат Однофакторного дисперсионного анализа

  • Диалоговое окно Двухфакторный дисперсионный анализ без повторений

  • Результат Двухфакторного дисперсионного анализа без повторений

  • Лаб. работа №4. Лабораторная работа дисперсионный анализ


    Скачать 0.58 Mb.
    НазваниеЛабораторная работа дисперсионный анализ
    АнкорЛаб. работа №4
    Дата12.12.2022
    Размер0.58 Mb.
    Формат файлаpdf
    Имя файлаЛаб. работа №4.pdf
    ТипЛабораторная работа
    #840833
    страница2 из 3
    1   2   3
    Двухфакторныйдисперсионный анализ без повторений:
    дисперсии групп
    ИТОГИ
    Группы
    Счет
    Сумма
    Среднее
    Дисперсия
    Строка 1
    J
    СЧЕТ


    J
    j
    j
    y
    1 1
    СУММ
    J
    y
    y
    J
    j
    j
    A



    1 1
    1
    СРЗНАЧ
    1
    )
    (
    1 2
    1 1
    2 1





    J
    y
    y
    S
    J
    j
    A
    j
    A
    ДИСП
    Группы
    Счет
    Сумма
    Среднее
    Дисперсия




    Строка I
    J
    СЧЕТ


    J
    j
    Ij
    y
    1
    СУММ
    J
    y
    y
    J
    j
    Ij
    I
    A



    1
    СРЗНАЧ
    1
    )
    (
    1 2
    2





    J
    y
    y
    S
    J
    j
    I
    A
    Ij
    I
    A
    ДИСП
    Столбец 1
    I
    СЧЕТ


    I
    i
    i
    y
    1 1
    СУММ
    I
    y
    y
    I
    i
    i
    B



    1 1
    1
    СРЗНАЧ
    1
    )
    (
    1 2
    1 1
    2 1





    I
    y
    y
    S
    I
    i
    B
    i
    B
    ДИСП





    Столбец J
    I
    СЧЕТ


    I
    i
    iJ
    y
    1
    СУММ
    I
    y
    y
    I
    i
    iJ
    J
    B



    1
    СРЗНАЧ
    1
    )
    (
    1 2
    2





    I
    y
    y
    S
    I
    i
    J
    B
    iJ
    J
    B
    ДИСП
    Таблица 18. Двухфакторный дисперсионный анализ без повторений:
    расчет параметров для проверки гипотезы
    Дисперсионный анализ

    Источни
    к
    вариаци
    и
    Строки
    Столбцы
    Погрешность
    Итого
    SS
    Q
    A
    =



    I
    i
    i
    A
    y
    y
    J
    1 2
    )
    (
    Q
    B
    =



    J
    j
    j
    B
    y
    y
    I
    1 2
    )
    (
    Q
    AB
    =
     


     
    I
    i
    J
    j
    ij
    y
    y
    1 1
    (
    2
    )
    j
    B
    i
    A
    y
    y


    Q =
    =
    2 1
    1
    )
    (
     



    I
    i
    J
    j
    ij
    y
    y
    df
    I – 1
    J – 1
    (I – 1) (J – 1)
    IJ – 1
    Окончание табл. 18
    Дисперсионный анализ
    Источни
    к
    вариаци
    и
    Строки
    Столбцы
    Погрешность
    Итого
    MS
    1

    I
    Q
    A
    1

    J
    Q
    B
    )
    1
    )(
    1
    (


    J
    I
    Q
    AB
    F
    A
    набл
    F
    =
    =
    AB
    A
    Q
    k
    n
    Q
    I


    1 1
    1
    B
    набл
    F
    =
    =
    AB
    B
    Q
    k
    n
    Q
    I


    1 1
    1
    P-Зна-
    чение
    )
    (
    A
    кр
    A
    набл
    F
    F
    P

    FРАСП
    )
    (
    B
    кр
    B
    набл
    F
    F
    P

    FРАСП
    Значим
    ость F
    A
    кр
    F = F(

    ; I – 1;
    (I – 1) (J – 1))
    FРАСПОБР
    B
    кр
    F = F(

    ; J – 1;
    (I – 1) (J – 1))
    FРАСПОБР
    Замечание. В Excel на экран выводится таблица, строки которой записаны в столбцах табл. 18.
    После заполнения диалогового окна Двухфакторный дисперсионный анализ с повторениями результат анализа появляется в виде двух таблиц. Формулы, по которым выполняются расчеты в
    Excel, представлены в таблицах 19 и 20 соответственно.
    Таблица 19. Двухфакторныйдисперсионный анализ с повторениями:
    расчет параметров для проверки гипотезы
    ИТОГИ
    Уровень B
    1

    Уровень B
    J
    Итого
    Уровень A
    1
    Счет
    n

    n
    Jn
    Сумма


    n
    t
    t
    y
    1 1 1



    n
    t
    Jt
    y
    1 1
     
     
    J
    j
    n
    t
    Jt
    y
    1 1
    1
    Среднее
    1 1
    y =


    n
    t
    t
    y
    n
    1 1 1 1

    J
    y
    1
    =
    n
    1


    n
    t
    Jt
    y
    1 1
    1
    A
    y
    =
    Jn
    1
     
     
    J
    j
    n
    t
    Jt
    y
    1 1
    1
    Окончание табл. 19
    ИТОГИ
    Уровень B
    1

    Уровень B
    J
    Итого
    Дисперсия
    n
    y
    y
    n
    t
    t



    1 2
    1 1 1 1
    )
    (

    n
    y
    y
    n
    t
    J
    Jt



    1 2
    1 1
    )
    (
    2 1
    A
    S
    =
    1
    )
    (
    1 1
    2 1
    1

     

     
    Jn
    y
    y
    J
    j
    n
    t
    A
    Jt





    Уровень A
    I
    Счет
    n

    n
    Jn
    Сумма


    n
    t
    t
    I
    y
    1 1



    n
    t
    IJt
    y
    1
     
     
    J
    j
    n
    t
    IJt
    y
    1 1

    Среднее
    1
    I
    y =
    n
    1


    n
    t
    t
    I
    y
    1 1

    IJ
    y =
    n
    1


    n
    t
    IJt
    y
    1
    I
    A
    y
    =
    Jn
    1
     
     
    J
    j
    n
    t
    IJt
    y
    1 1
    Дисперсия
    n
    y
    y
    n
    t
    t
    I



    1 2
    1 1 1
    )
    (

    n
    y
    y
    n
    t
    J
    IJt



    1 2
    1
    )
    (
    2
    I
    A
    S
    =
    1
    )
    (
    1 1
    2 1
    1

     

     
    Jn
    y
    y
    J
    j
    n
    t
    A
    Jt
    Итого
    Счет
    In

    In
    Сумма
     
     
    I
    i
    n
    t
    t
    i
    y
    1 1
    1

     
     
    I
    i
    n
    t
    iJt
    y
    1 1
    Среднее
    1
    B
    y
    =
    n
    I
    y
    I
    i
    n
    t
    t
    i
     
     
    1 1
    1

    J
    B
    y
    =
    n
    I
    y
    I
    i
    n
    t
    iJt
     
     
    1 1
    Дисперсия
    2 1
    B
    S
    =
    =
    1
    )
    (
    1 1
    2 1
    1

     

     
    n
    I
    y
    y
    I
    i
    n
    t
    B
    t
    i

    2
    J
    B
    S
    =
    =
    1
    )
    (
    1 1
    2

     

     
    n
    I
    y
    y
    I
    i
    n
    t
    J
    B
    iJt
    Вопросы для самоконтроля
    1. В чем суть дисперсионного анализа?
    2. В каком случае используется однофакторный дисперсионный анализ?
    3. Каким условиям должны удовлетворять группы наблюдений фактора, для того чтобы применить однофакторный дисперсионный анализ?
    4. С помощью какого критерия проверяется гипотеза о равенстве дисперсий нескольких выборок?
    5. Каким образом можно представить сумму квадратов отклонений отдельных наблюдений от общей суммы?
    6. Что характеризует межгрупповая вариация?
    7. Что характеризует внутригрупповая вариация?
    8. Какая статистика используется для проверки гипотезы о равенстве математических ожиданий групп фактора?
    9. В чем разница между однофакторным и двухфакторным анализами?
    10. Каким условиям должны удовлетворять группы наблюдений факторов, для того чтобы применить двухфакторный дисперсионный анализ?
    11. Какая гипотеза проверяется в двухфакторном дисперсионном анализе?
    12. Какие разновидности имеет двухфакторный дисперсионный анализ?
    4.4. Задания
    №1.
    Результаты наблюдений за расходом сырья при производстве одинаковой продукции по одной и той же технологии на пяти различных заводах равных мощностей представлены в таблице MS
    Excel на рис. 25 (считается, что расход сырья является нормально распределенной случайной величиной).

    Рис. 25. Данные для однофакторного анализа
    При уровне значимости

    = 0,05 требуется выяснить, зависит ли расход сырья от того, на каком заводе произведена продукция. Необходимо оценить степень этой зависимости.
    №2.
    Данные о разрывной нагрузке пряжи, изготовленной на разных станках и из отличающегося некоторым образом друг от друга сырья, представлены в таблице MS Excel на рис. 26.
    Рис. 26. Данные для двухфакторного анализа
    Качество пряжи измеряется величиной разрывной нагрузки. Требуется при уровне значимости

    = 0,05 выяснить, влияют ли на качество пряжи тип станка и вид сырья, из которого пряжа производится.
    №3.
    Выборочные данные об урожайности пшеницы, выращенной на участках, на которые вносились различные виды удобрений и которые подвергались различной химической обработке, приведены в таблице MS Excel на рис. 27.
    Рис. 27. Данные для двухфакторного анализа с повторениями
    Требуется при уровне значимости

    = 0,05 выяснить, влияют ли на урожайность пшеницы способы химической обработки почвы.
    Порядок выполнения работы
    Задание №1

    По условию задачи результирующим признаком F является расход сырья, который зависит от влияющего фактора A (завода), представленного пятью группами. Решение задачи выполняется в следующие два этапа:
    1. Проверка гипотезы о равенстве групповых дисперсий с помощью критерия Бартлетта.
    Пусть нулевая гипотеза имеет вид
    Н
    0
    :
    2 5
    2 2
    2 1






    , где
    2
    i

    – дисперсия
    i-й группы фактора
    A,
    i = 1, 2,

    , 5. Показатели, рассчитанные в ходе проверки данной гипотезы, представлены в таблице на рис. 32.
    Содержимое ячеек таблицы заполняется следующим образом:

    в ячейках B2:F2 находятся объемы выборок n
    j
    , вычисленные с помощью функции СЧЕТ для каждого завода (СЧЕТ(B3:B14) и т. д.);

    в ячейках B3:F3 находятся несмещенные оценки
    2
    j
    S , вычисленные с помощью функции
    ДИСП для каждого завода (ДИСП(B3:B14) и т. д.);

    в ячейки B4:F4 вводится формула массива
    {=СУММПРОИЗВ(B2:F2-1;B3:F3)/СУММ(B2:F2-1)};

    в ячейки B5:F5 вводится формула массива
    {=1+1/(3*(5-1))*(СУММ(1/(B2:F2-1))-1/(СУММ(B2:F2)-5))};

    в ячейки B6:F6 вводится формула массива
    {=1/B5*СУММПРОИЗВ(B2:F2-1;LN(B4/B3:F3))};

    ячейка B7 содержит формулу =ХИ2ОБР(0,05;5-1).
    Рис. 28. Результаты проверки гипотезы H
    0
    :
    2
    1

    =
    2
    2

    =

    =
    2
    5

    Так как V
    набл
    = 0,829796 не попадает в критическую область (9,487728; +

    ), то гипотеза о равенстве дисперсий групп принимается, поэтому можно приступить к проверке гипотезы о равенстве математических ожиданий.
    2. Однофакторный анализ – проверка нулевой гипотезы
    Н
    0
    : а
    1
    = а
    2
    =

    = а
    5
    (о равенстве средних значений объемов расходов пяти заводов).
    Для этого используется режим анализа Однофакторный дисперсионный анализ. Значения параметров в одноименном диалоговом окне устанавливаются следующим образом (рис. 33):

    Входной интервал (вводятся ссылки на ячейки B2:F14, в которых находятся наблюдаемые значения признака F и названия уровней фактора);

    Группирование (проставляется автоматически);

    Метки (устанавливается флажок);

    Альфа (вводится уровень значимости 0,05);

    Параметры вывода (вводится ссылка на Новый рабочий лист Однофакт-анализ).

    Рис. 29. Диалоговое окно Однофакторный дисперсионный анализ
    Показатели, рассчитанные в ходе анализа, представлены в виде двух таблиц «ИТОГИ» и
    «Дисперсионный анализ» на рис. 30.
    Рис. 30. Результат Однофакторного дисперсионного анализа
    Вывод. Вычисленное значение F
    набл
    = 2,4155 не попадает в критическую область (2,5787;

    ), поэтому нулевая гипотеза о равенстве математических ожиданий групп принимается.
    Следовательно, расход сырья статистически не зависит от завода, производящего продукцию. Для
    P-значения имеет место неравенство 0,05 < 0,06, что также говорит о хорошем согласии гипотезы
    Н
    0
    :
    5 2
    1
    a
    a
    a



    с выборочными данными. С другой стороны, P-значение находится близко к
    0,05, что вызывает сомнения в истинности гипотезы.
    Выборочный коэффициент детерминации
    2 2
    2
    F
    A
    R



    =
    n
    SS
    n
    SS
    итого
    группами
    между
    /
    /
    =
    50
    /
    32
    ,
    1722 50
    /
    437
    ,
    304
    = 0,1768 показывает, что только 17% общей выборочной вариации расхода сырья связано с выбором завода.
    Задание №2
    Результирующим признаком F является величина разрывной нагрузки пряжи, факторами – тип станка (A) и вид сырья (B) (см. рис. 30). Необходимо проверить следующие гипотезы:

    о равенстве математических ожиданий групп фактора A
    A
    H
    0
    :
    3 2
    1
    a
    a
    a


    ;

    о равенстве математических ожиданий групп фактора B
    B
    H
    0
    :
    2 1
    b
    b

    ;

    о равенстве математических ожиданий взаимодействия факторов
    AB
    H
    0
    :
    32 31 22 21 12 11
    c
    c
    c
    c
    c
    c





    Для решения данной задачи используется режим анализа Двухфакторный дисперсионный
    анализ без повторений. Значения параметров в одноименном диалоговом окне устанавливаются
    следующим образом (рис. 31):

    Входной интервал (вводятся ссылки на ячейки А2:C5, в которых находятся значения наблюдаемого признака F и названия уровней факторов);

    Метки (устанавливается флажок);

    Альфа (вводится уровень значимости 0,05);

    Параметры вывода (вводится ссылка на Новый рабочий лист Двухфакт-без-повторений).
    Рис. 31. Диалоговое окно Двухфакторный дисперсионный анализ
    без повторений
    Показатели, рассчитанные в ходе анализа, представлены в виде двух таблиц «ИТОГИ» и
    «Дисперсионный анализ» на рис. 32.
    Рис. 32. Результат Двухфакторного дисперсионного анализа без повторений
    Вывод. Вычисленное значение F-критерия фактора A (тип станка)
    A
    набл
    F
    = 4,3333 не попадает в критическую область (19,00; +

    ), образованную правосторонним интервалом, поэтому гипотеза
    A
    H
    0
    :
    3 2
    1
    a
    a
    a


    принимается, т. е. считается, что влияние типа изготавливающего станка на качество пряжи не подтвердилось. Для P-значения имеет место неравенство 0,1875 > 0,05, что говорит о хорошем согласии гипотезы
    A
    H
    0
    с выборочными данными.
    Вычисленное значение F-критерия фактора B (вид сырья)
    B
    набл
    F
    = 25 попадает в критическую область
    )
    ;
    5128
    ,
    18
    (


    , образованную правосторонним интервалом, поэтому гипотеза
    B
    H
    0
    :
    2 1
    b
    b

    отвергается, т. е. считается, что вид сырья влияет на качество пряжи. Так как для P-значения имеет место неравенство 0,038 < 0,05, то гипотеза
    B
    H
    0
    также не принимается.
    Выборочный коэффициент детерминации

    2 2
    2
    F
    B
    R



    =
    n
    SS
    n
    SS
    итого
    столбцы
    /
    /
    =
    6
    /
    5350 6
    /
    3750
    = 0,7009 показывает, что на 70% всей выборочной вариации качества пряжи влияет вид сырья. Влиянию типа станка подвержено только 24% выборочной вариации
    2 2
    2
    F
    A
    R



    =
    n
    SS
    n
    SS
    итого
    строки
    /
    /
    =
    6
    /
    5350 6
    /
    1300
    = 0,243.
    1   2   3


    написать администратору сайта