Главная страница
Навигация по странице:

  • 2.4 Оценка равенства дисперсий двух выборок

  • 2.5 Оценка однородности дисперсии

  • 2.6 Оценка сомнительных результатов

  • 3 Обработка результатов эксперимента методом регресси- онного анализа 3.1 Зависимость между случайными величинами

  • Программам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем


    Скачать 0.95 Mb.
    НазваниеПрограммам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем
    Дата11.05.2022
    Размер0.95 Mb.
    Формат файлаpdf
    Имя файлаmetod475.pdf
    ТипПрограмма
    #523652
    страница4 из 11
    1   2   3   4   5   6   7   8   9   10   11

    2.3 Проверка гипотезы о равенстве среднеквадратичной оценки
    выборочной оценки самой среднеквадратичной генеральной совокупно-
    сти
    Имеем выборку объёма n из генеральной совокупности
    n
    x
    x
    x
    ...,
    ,
    ,
    2 1
    , тогда оценка:
    (
    )



    =
    2


    1 1

    x
    i
    m
    x
    n
    σ
    Известно
    Г
    σ
    генеральной совокупности. Необходимо проверить ги- потезу
    Г
    H
    σ
    σ
    =

    :
    0
    . Для оценки гипотезы вводим статистику V . Считаем, что переменная V принадлежит
    2
    χ
    (хи-квадрат) распределению с n – 1 степенью свободы
    (
    )
    2 1
    2 2
    1





    =
    n
    Г
    n
    V
    χ
    σ
    σ
    Проверка гипотезы осуществляется в следующем порядке.
    Берется односторонний критерий и по заданной доверительной ве- роятности
    α
    и n по таблице
    χ
    2
    определяется
    ρ
    к
    V .

    39
    Затем сравнивается опытное значение
    кр
    оп
    V
    с
    V
    . Если
    оп
    V
    попало в критическую область, то гипотезу Н
    0
    отвергаем. Если
    кр
    оп
    V
    V
    <
    (попали в левую часть характеристики), то делают вывод: опытные данные не проти- воречат гипотезе Н
    0
    Если нет конкурирующей гипотезы, то гипотеза просто принимается.
    2.4 Оценка равенства дисперсий двух выборок
    Имеем две выборки объёмом n и m.
    ;
    2 21 1
    11
    m
    n
    x
    x
    m
    II
    x
    x
    n
    I
    K
    K
    K
    K


    Оценки дисперсий будут иметь вид
    (
    )



    =



    =
    =
    =






    m
    j
    n
    i
    x
    j
    x
    i
    m
    x
    m
    m
    x
    n
    1 1

    1 1

    ;

    1 1

    2 2
    2 2
    2 2
    1 1
    2 1
    σ
    σ
    Выдвигается гипотеза о равенстве дисперсий
    2 2
    2 1
    0


    :
    σ
    σ
    =
    H
    Вводим статистику
    (
    )
    (
    )
    2 1
    2 2
    2 2
    ;
    2 1
    2 2
    1 1
    1

    1






    =



    =
    m
    Г
    n
    Г
    m
    V
    и
    n
    V
    χ
    σ
    σ
    χ
    σ
    σ
    x
    2
    α
    = p (V>V
    кр
    )
    V
    β
    Рисунок 2.6 – Распределение
    2
    χ

    40
    Рассмотрим отношение
    (
    )
    1
    ,
    1


    1 1
    2 2
    2 1
    2 1



    =


    =
    m
    n
    F
    m
    V
    n
    V
    F
    σ
    σ
    Данное отношение дисперсии принадлежит распределению Фишера со степенями свободы n – 1 и m – 1. Рассмотрим на примере односторонний критерий.
    Пример № 5. Имеем две выборки n
    1
    = 11 и n
    2
    = 14. Найденные оцен- ки дисперсии равны 76
    ,
    0

    2 1
    =
    σ
    и 38
    ,
    0

    2 2
    =
    σ
    . Необходимо при уровне значимости α = 0,05 проверить гипотезу


    :
    ;


    :
    2 2
    2 1
    1 2
    2 2
    1 0
    σ
    σ
    σ
    σ
    >
    =
    H
    H
    По заданному
    α
    найдем F критическое для n – 1 и m – 1. Из таблицы
    Фишера F
    кр
    (10,13) = 2,67 определяем:
    2 38
    ,
    0 76
    ,
    0


    2 2
    2 1
    =
    =
    =
    σ
    σ
    F
    , следовательно
    кр
    оп
    F
    F
    <
    , поэтому опытные данные не противоречат гипо- тезе Н
    0
    . Возьмем уровень доверительной вероятности
    α
    = 0,1. По таблице
    Фишера (приложение В) F (10, 13) = 2,14. Следовательно, гипотеза Н
    0
    при- нимается (рисунок 2.7).
    Рисунок 2.7 – Распределение Фишера для одностороннего критерия
    H
    0
    2, 67
    F
    2 2,14

    41
    Рассмотрим двусторонний критерий. Для этого α = 0,1 делим пополам. Для двустороннего критерия выдвигаем две гипотезы


    :
    ;


    :
    2 2
    2 1
    2 2
    2 1
    1 0
    σ
    σ
    σ
    σ

    =
    H
    H
    Если оценка попадает внутрь интервала, то исходные данные не про- тиворечат гипотезе Н
    0
    Для двустороннего критерия мы имеем следующую статистику Фи- шера.
    Рисунок 2.8 – Распределение Фишера для двустороннего критерия
    2
    α
    =
    <






    кр
    F
    F
    P
    По таблице Фишера определим:
    05
    ,
    0 2
    1
    =
    =
    <






    α
    кр
    F
    F
    P
    ,
    Поэтому
    2 1
    1 1
    α
    =
    >
    



    



    кр
    F
    F
    P
    ,
    37
    ,
    0 67
    ,
    2 1
    ;
    67
    ,
    2 1
    1 1
    =
    =
    =
    кр
    кр
    F
    F
    – левый интервал.
    Получили двусторонний интервал меньше 0,37 и больше 2,67. Наша оценка находится в интервале принятия решения.
    H
    0
    α
    /2
    F
    2
    F
    1кр
    0,37
    F
    2кр
    2,67
    α
    /2

    42
    2.5 Оценка однородности дисперсии
    Оценка однородности дисперсии это оценка принадлежности дис- персии одной генеральной совокупности. Данная оценка производится по критерию Кохрена. Имеется К выборок
    2 2
    2 2
    1

    ...,
    ,

    ,

    k
    σ
    σ
    σ
    . Несмотря на то, что все дисперсии различны, они все из одной выборки. Необходимо оценить однородность дисперсий. Кохрен ввел статистику G.
    { }

    =
    =
    k
    i
    i
    i
    G
    0 2
    2


    max
    σ
    σ
    Величина G - имеет распределение Кохрена (приложение A). Для применения распределения Кохрена необходимо, чтобы выборки по всем дисперсиям были одинаковы.
    По заданному уровню значимости находим G
    кр.
    Рассчитываем
    оп
    G опытное значение. Если
    кр
    оп
    G
    G
    >
    - то гипотеза отвергается.
    Пример № 6. Имеем четыре независимых выборки (объемом n = 17) из нормальной совокупности
    40
    ,
    0
    ;
    34
    ,
    0
    ;
    25
    ,
    0
    ;
    21
    ,
    0
    :

    2
    σ
    При доверительной вероятности
    05
    ,
    0
    =
    α
    проверить гипотезу однородности дисперсии
    { }
    3 1
    20
    ,
    1 40
    ,
    0


    max
    1 2
    2
    =
    =

    =
    =
    k
    i
    i
    i
    оп
    G
    σ
    σ
    По таблице Кохрена для числа степеней свободы n = 17 – 1 = 16 и количества в выборке N = 4 дисперсий находим G
    кр
    = 0,4366. Так как,
    кр
    оп
    G
    G
    <
    , то гипотеза об однородности принимается.
    2.6 Оценка сомнительных результатов
    Допустим, получили результаты из одной генеральной совокупно- сти, для которой некоторые результаты выборки вызывают сомнение. Воз- никает вопрос: какие наблюдения оставить в выборке, а какие выбросить?
    Для решения данной задачи существует ряд критериев. Рассмотрим их на примерах.
    1 Провели пять выстрелов из гаубицы, имеем следующий ряд точек попадания снарядов по дальности [M]
    L: 3200; 3225; 3230; 3245; 3600.
    Подозрительным является результат 3600 м. Если данный результат находится в пределах
    σ
    3 для нормального распределения, то мы имеем
    3300
    =
    x
    m
    м, а
    5
    ,
    168
    =
    x
    σ
    м. Если результат 3600 исключить из выборки как

    43
    аномальный, то получим следующие оценки: 2580
    =
    x
    m
    м, а
    6
    ,
    12
    =
    x
    σ
    м. Как видим, среднее квадратичное (сигма) отличается на порядок.
    1 Критерий об оценке сомнительных результатов предполагает, что
    Г
    σ
    - генеральной совокупности известная величина. Вводится статистика
    Г
    x
    m
    x
    t
    σ

    max

    =
    Данная статистика распределена не по нормальному закону, но по- хожа на нормальный закон (рисунок 2.9).
    1
    ;
    0
    ;
    1
    ,
    0

    max
    n
    n
    m
    n
    n
    N
    m
    x
    t
    t
    t
    Г
    x

    =
    =
    


    





    =
    σ
    σ
    Нормируем случайную величину
    ( )
    1
    ,
    0 1
    N
    n
    n
    t
    Z


    =
    Запишем через нормальный закон распределения вероятность попа- дания в критическую область
    dz
    l
    z
    кр
    z



    =

    2 2
    0 2
    1 2
    1 2
    π
    α
    Рисунок 2.9 – Нормальный закон распределения
    α
    /2
    α
    /2
    z
    Z
    кр

    По заданному уровню значимости находим
    кр
    z
    (смотреть приложение
    Д). Рассчитываем
    оп
    t опытное значение. Если
    кр
    оп
    t
    t
    >
    , то сомнительный ре- зультат отбрасывается
    2 Если
    x
    σ
    генеральной совокупности неизвестно, то в этом случае вводим статистику, которая принадлежит критерию Смирнова – Гребса
    x
    x
    m
    x
    t
    σ


    max

    =
    Распределение Смирнова – Гребса имеет оценку
    (
    )


    =
    =
    n
    i
    x
    i
    x
    m
    x
    n
    1 2

    1

    σ
    В таблице имеем такую оценку
    (
    )

    =


    =
    n
    i
    x
    i
    x
    m
    x
    n
    1 2

    1 1

    σ
    Для перехода к распределению Смирнова – Гребса все результаты на- до увеличить на
    1

    n
    n . Для нашего примера:
    78
    ,
    1 5
    ,
    168 3300 3600
    =

    =
    оп
    t
    , табличное критическое значение равно
    2
    ,
    2
    =
    кр
    t
    Получили опытное значение меньше критического, значит, подозри- тельный результат следует оставить в выборке.
    3 Распределение Смирнова – Гребса по одному выбросу.
    Вводится статистика Гребса
    (
    )
    (
    )


    =

    =


    =
    n
    i
    n
    i
    x
    i
    i
    оп
    m
    x
    x
    x
    G
    1 1
    1 2
    2 1


    , где

    =
    =
    n
    i
    i
    x
    x
    n
    m
    1 1

    – среднее по всей выборке;


    =

    =
    1 1
    1 1

    1
    n
    i
    i
    x
    n
    x
    – среднее по выборки без сомнительного результата.
    46

    45
    Если
    оп
    G попадает в критическую область, то аномальный результат отбрасываем.
    4 Статистика Титьена – Мура позволяет проводить оценку сразу не- скольких выбросов. Определяется опытное значение:
    (
    )
    (
    )
    ,
    1 1
    2 2




    =

    =


    =
    n
    i
    k
    n
    i
    x
    i
    xk
    i
    оп
    m
    x
    m
    x
    Z
    где

    =
    =
    n
    i
    i
    x
    x
    n
    m
    1 1

    – среднее по всей выборке;


    =

    =
    k
    n
    i
    i
    xk
    x
    k
    n
    m
    1 1

    – среднее по выборке без к выборочных сомни- тельных результатов.
    Оценка Титьена-Мура имеет большое распределение, входом в табли- цу является
    α
    , количество выбросов k и объем выборки n.
    Пример № 6. Имеются данные – временные затраты на выполнение однотипных работ для десяти человек (таблица 2.4).
    Таблица 2.4
    Количество человек
    1 3 2 2 1 1
    Время вы- полнения
    11 12 13 14 15 18
    Нет информации о значениях математического ожидания
    x
    m
    и дис- персии
    2
    x
    σ
    . Есть ли основание для исключения последнего результата из вы- борки. Проведем оценки по следующим критериям:
    1
    По критерию Смирнова определяем опытные значения
    29
    ,
    2 01
    ,
    2 4
    ,
    13 18
    ;

    max
    =

    =

    =
    оп
    x
    x
    оп
    t
    m
    x
    t
    σ
    Если выбрать
    %
    5
    ,
    2
    =
    α
    , то по таблице Смирнова (приложение З)
    3
    ,
    2
    =
    кр
    t
    Вывод: Результат 18
    =
    t
    – проходит с малой надежностью.
    2
    По критерию Гребса имеем
    ( )
    (
    )
    ( ) ( )
    ( )
    ( )
    ( )
    ( ) ( )
    ( )
    ( )
    ( ) ( )
    =
    +
    +

    +

    +

    +
    +

    +

    +

    +
    =


    =


    =

    =
    2 2
    2 2
    2 2
    2 2
    2 2
    2 2
    2 1
    6
    ,
    4 6
    ,
    1 2
    6
    ,
    0 2
    4
    ,
    0 3
    4
    ,
    1 4
    ,
    2 2
    ,
    2 2
    2
    ,
    1 2
    2
    ,
    0 3
    8
    ,
    0 8
    ,
    1


    1 1
    1
    n
    i
    n
    i
    x
    i
    i
    оп
    m
    x
    x
    x
    G

    46 356
    ,
    0 4
    ,
    36 96
    ,
    12
    =
    =
    , где
    4
    ,
    13

    ;
    8
    ,
    12

    1
    =
    =
    x
    m
    x
    При уровне значимости 025
    ,
    0
    =
    α
    по таблице Гребса (приложение Е) определяем критическую область 3526
    ,
    0
    =
    кр
    G
    . Функция Гребса представлена на рисунке 2.10.
    Рисунок 2.10 – Функция Гребса
    По критерию Гребса результат также проходит с малой надежностью.
    3
    По критерию Титьена-Мура проверим следующие результаты: а)
    если выбросить последний результат 18
    =
    t
    , то получим 356
    ,
    0
    =
    оп
    Z
    По таблице Титьена-Мура (приложение Ж) при
    05
    ,
    0
    =
    α
    находим кри- тическое значение 418
    ,
    0
    =
    кр
    Z
    следовательно, результат необходимо выбро- сить, а при 01
    ,
    0
    =
    α
    получаем 28
    ,
    0
    =
    кр
    Z
    , поэтому результат нужно оставить. б)
    Определим опытное значение статистики Титьена-Мура
    (
    )
    (
    )
    216
    ,
    0 4
    ,
    36 875
    ,
    7 4
    ,
    36 78
    ,
    3 28
    ,
    0 17
    ,
    1 64
    ,
    2


    1 2
    1 2
    2 2
    =
    =
    +
    +
    +
    =


    =


    =

    =

    n
    i
    n
    i
    x
    i
    n
    i
    оп
    m
    x
    x
    x
    Z
    , где
    6
    ,
    12 8
    2
    =
    =

    x
    x
    n
    Из таблицы для количества выбросов
    2
    =
    k
    определяем критические значения статистики для различных уровней значимости
    α
    При 287
    ,
    0
    ,
    1
    ,
    0
    =
    =
    кр
    Z
    α
    ; при
    233
    ,
    0
    ,
    05
    ,
    0
    =
    =
    кр
    Z
    α
    ; при
    142
    ,
    0
    ,
    01
    ,
    0
    =
    =
    кр
    Z
    α
    Вывод: при
    %
    10
    =
    α
    и
    %
    5
    =
    α
    – результат 15 и 18 необходимо выбро- сить из выборки. Если
    %
    1
    =
    α
    , то результаты 15 и 18 необходимо оставить.
    0,356 1
    G
    G
    кр

    47
    3 Обработка результатов эксперимента методом регресси-
    онного анализа
    3.1 Зависимость между случайными величинами
    При изучении процессов функционирования сложных систем прихо- дится иметь дело с целым рядом одновременно действующих случайных вели- чин. Для уяснения механизма явлений, причинно-следственных связей между элементами системы и т.д., по полученным наблюдениям мы пытаемся устано- вить взаимоотношения этих величин.
    В математическом анализе зависимость, например, между двумя вели- чинами выражается понятием функции
    y=f(x),
    где каждому значению одной переменной соответствует только одно значение другой. Такая зависимость носит название функциональной.
    Гораздо сложнее обстоит дело с понятием зависимости случайных ве- личин. Как правило, между случайными величинами (случайными факторами), определяющими процесс функционирования сложных систем, обычно сущест- вует такая связь, при которой с изменением одной величины меняется распре- деление другой. Такая связь называется стохастической, или вероятностной.
    При этом величину изменения случайного фактора Y, соответствующую изме- нению величины Х, можно разбить на два компонента. Первый связан с зави- симостью Y от X, а второй с влиянием "собственных" случайных составляю- щих величин Y и X. Если первый компонент отсутствует, то случайные вели- чины Y и X являются независимыми. Если отсутствует второй компонент, то Y и X зависят функционально. При наличии обоих компонент соотношение меж- ду ними определяет силу или тесноту связи между случайными величинами Y и X.
    Существуют различные показатели, которые характеризуют те или иные стороны стохастической связи. Так, линейную зависимость между слу- чайными величинами X и Y определяет коэффициент корреляции.
    y
    x
    y
    x
    a
    Y
    a
    X
    M
    r
    σ
    σ



    =
    )]
    )(
    [(
    ,
    (3.1) где
    y
    x
    a
    a ,
    – математические ожидания случайных величин X и Y.
    y
    x
    σ
    σ
    ,
    – средние квадратические отклонения случайных вели- чин X и Y.

    48
    Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенден- цию возрастать (или убывать) по линейному закону. Если случайные величины
    X и Y связаны строгой линейной функциональной зависимостью, например,
    y=b
    0
    +b
    1
    x
    1
    ,
    то коэффициент корреляции будет равен
    1
    ±
    =
    r
    ; причем знак соответствует знаку коэффициента b
    1
    .Если величины X и Y связаны произвольной стохасти- ческой зависимостью, то коэффициент корреляции будет изменяться в преде- лах
    1 1
    +
    <
    <

    r
    Следует подчеркнуть, что для независимых случайных величин коэф- фициент корреляции равен нулю. Однако коэффициент корреляции как пока- затель зависимости между случайными величинами обладает серьезными не- достатками. Во-первых, из равенства r = 0 не следует независимость случай- ных величин X и Y (за исключением случайных величин, подчиненных нор- мальному закону распределения, для которых r = 0 означает одновременно и отсутствие всякой зависимости). Во- вторых, крайние значения
    1
    ±
    =
    r
    также не очень полезны, так как соответствуют не всякой функциональной зависимости, а только строго линейной.
    Полное описание зависимости Y от X , и притом выраженное в точных функциональных соотношениях, можно получить, зная условную функцию распределения
    [
    ]
    x
    X
    Y
    F
    = .
    Следует отметить, что при этом одна из наблюдаемых переменных ве- личин считается неслучайной. Фиксируя одновременно значения двух случай- ных величин X и Y, мы при сопоставлении их значений можем отнести все ошибки лишь к величине Y. Таким образом, ошибка наблюдения
    y

    будет складываться из собственной случайной ошибки величины Y и из ошибки со- поставления, возникающей из-за того, что с величиной Y сопоставляется не со- всем то значение X, которое имело место на самом деле.
    Однако отыскание условной функции распределения, как правило, ока- зывается весьма сложной задачей. Наиболее просто исследовать зависимость между Х и Y при нормальном распределении Y, так как оно полностью опреде- ляется математическим ожиданием и дисперсией. В этом случае для описания зависимости Y от X не нужно строить условную функцию распределения, а достаточно лишь указать, как при изменении параметра X изменяются матема- тическое ожидание и дисперсия величины Y.
    Таким образом, мы приходим к необходимости отыскания только двух функций:
    ).
    (
    ]
    /
    [
    D
    );
    (
    ]
    /
    [
    *
    2
    /
    /
    x
    x
    X
    Y
    x
    a
    x
    X
    Y
    M
    x
    y
    x
    y
    ϕ
    σ
    ϕ
    =
    =
    =
    =
    =
    =
    (3.2)

    49
    Зависимость условной дисперсии D [Y/X=x] от параметра Х носит на- звание сходастической зависимости. Она характеризует изменение точности методики наблюдений при изменении параметра и используется достаточно редко.
    Зависимость условного математического ожидания M[Y/x=x] от X носит название регрессии, она дает истинную зависимость величин Х и У, лишенную всех случайных наслоений. Поэтому идеальной целью всяких исследований зависимых величин является отыскание уравнения регрессии, а дисперсия ис- пользуется лишь для оценки точности полученного результата.
    1   2   3   4   5   6   7   8   9   10   11


    написать администратору сайта