Главная страница
Навигация по странице:

  • 6.2.3. Задачи о генеральной доле

  • теория вероятностей. Управления и радиоэлектроники (тусур) Кафедра автоматизации обработки информации (аои) З. А. Смыслова М


    Скачать 3.11 Mb.
    НазваниеУправления и радиоэлектроники (тусур) Кафедра автоматизации обработки информации (аои) З. А. Смыслова М
    Анкортеория вероятностей.pdf
    Дата13.12.2017
    Размер3.11 Mb.
    Формат файлаpdf
    Имя файлатеория вероятностей.pdf
    ТипУчебное пособие
    #11331
    страница9 из 13
    1   ...   5   6   7   8   9   10   11   12   13

    6.2.2. Сравнение параметров нормальной генеральной совокупности
    На практике часто бывает необходимо сравнить два способа действия по их результатам. Например: обеспечивают ля два станка одинаковую точность обработки деталей? Или одинакова ли в среднем производительность труда при двух технологиях работы? Нередко на этот вопрос можно ответить, срав- нивая выборочные средние или выборочные дисперсии.
    Пусть по двум независимым выборкам
    1
    ...,
    ,
    ,
    2 1
    n
    x
    x
    x
    и
    ,
    ...,
    ,
    ,
    2 2
    1
    n
    y
    y
    y
    извлеченным из нормальных генеральных совокупностей
    )
    ,
    (


    1 1
    σ
    a
    N
    X
    и
    )
    ,
    (

    2 2
    σ
    a
    N
    Y
    найдены несмещенные оценки дисперсий
    2 1
    σ
    и
    :
    2 2
    σ

    =


    =
    n
    i
    i
    )
    x
    x
    (
    n
    s
    1 2
    1 2
    1 1
    1

    =


    =
    2 1
    2 2
    2 2
    1 1
    n
    j
    j
    .
    )
    y
    y
    (
    n
    s
    Для того, чтобы на данном уровне значимости
    α
    проверить гипотезу о равенстве генеральных дисперсий
    ,
    :
    2 2
    2 1
    0
    σ
    =
    σ
    H
    используют статистику
    (табл. 6.4), имеющую распределение Фишера с числами степеней свободы
    1 1
    1

    = n
    k
    и
    1 2
    2

    = n
    k
    Наблюдаемое значение этой статистики обычно вычисляют, рассматривая отношение большей оценки
    ( )
    2 2
    2 1
    ,
    max
    s
    s
    к мень- шей
    ( )
    ,
    ,
    min
    2 2
    2 1
    s
    s
    поэтому альтернативная гипотеза и критическая область являются правосторонними.
    Таблица 6.4
    Сравнение генеральных дисперсий
    Гипотеза
    2 2
    2 1
    0
    :
    σ
    =
    σ
    H
    Предположения
    Нормальная генеральная совокупность
    Оценки по выборкам
    ;
    2 1
    2 1
    s
    =
    σ

    2 2
    2 2
    s
    =
    σ

    Статистика
    K
    2 2
    2 1
    S
    S
    Распределение статистики K
    Распределение Фишера
    )
    1
    ,
    1
    (
    2 1

    n
    n
    F
    и

    74
    Пример 3. Двумя методами проведены измерения одной и той же физи- ческой величины. В первом случае по выборке объема
    5 1
    =
    n
    получена не- смещенная оценка дисперсии
    8 14 2
    1
    =
    s
    Для второго метода соответственно
    6 2
    =
    n
    и
    2 10 2
    2
    =
    s
    Можно ли считать, что оба метода обеспечивают одина- ковую точность измерений, если принять уровень значимости
    ?
    05 0
    =
    α
    Предполагается, что результаты измерений распределены нормально и выбор- ки независимы.
    Решение. Будем судить о точности методов по величинам генеральных дисперсий. Нулевая гипотеза имеет вид
    2 2
    2 1
    0
    :
    σ
    =
    σ
    H
    . Наблюдаемое значе- ние статистики
    K
    (табл. 6.4) равно
    45 1
    2 10 8
    14 2
    2 2
    1
    набл
    =
    =
    =
    s
    s
    K
    Границу правосторонней критической области кр
    K
    определим по таб- лицам распределения Фишера (приложение 4) на уровне значимости
    05 0
    =
    α
    и вычисленным по выборке числам степеней свободы
    ,
    4 1
    5 1
    1 1
    =

    =

    = n
    k
    :
    5 1
    6 1
    2 2
    =

    =

    = n
    k
    5.19.
    0.05)
    5;
    (4,
    )
    ;
    ,
    (
    2 1
    кр
    =
    =
    α
    =
    F
    k
    k
    F
    K
    Наблюдаемое значение статистики K не попадает в критическую область
    ),
    (
    кр набл
    K
    K
    <
    поэтому нет оснований отвергать нулевую гипотезу. Выбо- рочные оценки дисперсий различаются незначимо, и оба метода обеспечивают одинаковую точность измерений.
    Пусть теперь по двум независимым выборкам объема
    1
    n
    и
    ,
    2
    n
    извле- ченным из нормальных генеральных совокупностей
    )
    ,
    (

    1 1
    σ
    a
    N
    X
    и
    )
    ,
    (

    2 2
    σ
    a
    N
    Y
    требуется сравнить генеральные средние, т.е. основная гипо- теза имеет вид
    ).
    :
    (
    :
    0 2
    1 0
    Y
    X
    H
    a
    a
    H
    =
    =
    Если обе генеральные дисперсии известны, то используется статистика, имеющая стандартное нормальное распределение. Если же дисперсии неиз- вестны, но предполагается, что они равны, то применяется статистика, имею- щая распределение Стьюдента (табл. 6.5).
    Пример 4. Экономический анализ производительности труда предпри- ятий отрасли позволил выдвинуть гипотезу о наличии двух типов предприятий с различной средней величиной показателя производительности труда. Выбо- рочное обследование 42 предприятий первой группы дало следующие резуль- таты: средняя производительность труда
    119
    =
    x
    деталей. На 35 обследован- ных предприятиях второй группы средняя производительность труда
    107
    =
    y
    деталей. Генеральные дисперсии известны:
    ),
    дет.
    (
    9 126
    )
    (
    2 2
    1
    =
    σ X

    75
    ).
    дет.
    (
    1 136
    )
    (
    2 2
    2
    =
    σ Y
    Считая, что выборки извлечены из нормально распре- деленных генеральных совокупностей
    X
    и
    Y
    , на уровне значимости 0.05 про- верить, случайно ли полученное различие средних показателей производи- тельности труда в группах или же имеются два типа предприятий с различной средней величиной производительности труда.
    Решение. Сформулируем основную и альтернативную гипотезы.
    2 1
    0
    :
    a
    a
    H
    =
    или
    Y
    X
    H
    =
    :
    0
    — генеральные средние двух нормально распределенных совокупностей равны (предприятия двух обследованных групп относятся к одному типу предприятий; выборочные средние различа- ются незначимо; средняя производительность труда в двух группах оди- накова).
    Таблица 6.5
    Сравнение генеральных средних
    Гипотеза
    2 1
    0
    :
    a
    a
    H
    =
    Предположения
    Нормальные генеральные совокупности;
    2 1
    ,
    σ
    σ
    известны
    Нормальные генеральные совокупности;
    2 1
    ,
    σ
    σ
    неизвестны;
    2 1
    σ
    =
    σ
    Оценки по выборке
    y
    a
    x
    a
    =
    =


    2 1
    ;
    y
    a
    x
    a
    =
    =


    2 1
    ;
    ;
    2 1
    2 1
    s
    =
    σ

    2 2
    2 2
    s
    =
    σ

    2
    )
    1
    (
    )
    1
    (
    2 1
    2 2
    2 2
    1 1
    2

    +

    +

    n
    n
    s
    n
    s
    n
    s
    Статистика
    K
    2 2
    2 1
    2 1
    n
    n
    Y
    X
    σ
    +
    σ

    2 1
    2 1
    n
    n
    n
    n
    S
    Y
    X
    +



    Распределение статистики K
    Стандартное нормальное
    )
    1
    ,
    0
    (
    N
    Распределение Стьюдента
    )
    2
    (
    2 1

    +n
    n
    T
    2 1
    1
    :
    a
    a
    H

    — генеральные средние различны (предприятия двух групп относятся к разному типу предприятий; средняя производительность труда в двух группах неодинакова).
    Так как генеральные дисперсии известны, то для проверки гипотезы применим статистику, имеющую стандартное нормальное распределение
    (табл. 6.5). Её наблюдаемое значение равно

    76 56 4
    35 1
    136 42 9
    126 107 119 2
    2 2
    1 2
    1
    набл
    =
    +

    =
    σ
    +
    σ

    =
    n
    n
    y
    x
    K
    Альтернативная гипотеза
    1
    H
    двусторонняя, поэтому критическое зна- чение кр
    K
    находим по таблице значений функции Лапласа (приложение 1) из соотношения:
    2 1
    )
    (
    кр
    α

    =
    Φ K
    По условию
    05 0
    =
    α
    Отсюда
    ,
    )
    (
    475 0
    кр
    =
    Φ K
    следовательно
    96 1
    кр
    =
    K
    Так как критическая область двусторонняя, то ее границами служат две точки:
    96 1
    кр
    =
    K
    и
    ,
    96 1
    кр

    =
    K
    т.е. область допустимых значений гипо- тезы
    0
    H
    представляет собой интервал
    ).
    96 1
    ;
    96 1
    (

    Наблюдаемое значе- ние
    56 4
    набл
    =
    K
    лежит за пределами этого интервала и не является допус- тимым на заданном уровне значимости. На данном уровне значимости основ- ная гипотеза
    0
    H
    отвергается в пользу альтернативной: полученное различие средних показателей труда в группах неслучайно, имеется два типа предпри- ятий с различной средней производительностью труда.
    Пример 5. Предполагается, что применение нового типа резца сократит время обработки некоторой детали. Хронометраж времени обработки 9 дета- лей, обработанных старым типом резцов, дал следующие результаты: среднее выборочное время обработки детали
    57
    =
    x
    мин, несмещенная оценка дис- персии
    ).
    (
    2 186 2
    2
    мин
    =
    X
    s
    Среднее время обработки 15 деталей, изготовлен- ных с помощью нового резца,
    52
    =
    y
    мин, несмещенная оценка дисперсии
    ).
    (
    4 166 2
    2
    мин
    =
    Y
    s
    На уровне значимости
    01 0
    =
    α
    выяснить, позволяет ли использование нового типа резцов сократить время обработки деталей.
    Решение. Сформулируем основную и альтернативную гипотезы.
    Y
    X
    H
    =
    :
    0
    )
    :
    (
    2 1
    0
    a
    a
    H
    =
    — генеральные средние двух нормально рас- пределенных совокупностей с неизвестными дисперсиями равны. Примени- тельно к условию это означает, что среднее время, затрачиваемое на обработку детали резцами нового и старого типа одинаково, т.е. использование нового резца не позволяет снизить время на обработку детали.
    Y
    X
    H
    >
    :
    1
    — среднее время, затрачиваемое на обработку детали резцами старого типа, больше, чем — нового, т.е. использование ново- го типа резца позволяет снизить время на обработку детали. Альтерна- тивная гипотеза правосторонняя, значит критическая область право- сторонняя.

    77
    Так как генеральные дисперсии неизвестны, то применим статистику, имеющую распределение Стьюдента (табл. 6.5). Но предварительно проверим, выполняется ли предположение о том, что неизвестные генеральные диспер- сии равны. Это предположение проверяется с помощью вспомогательной ну- левой гипотезы
    2 2
    0
    :
    Y
    X
    H
    σ
    =
    σ

    с альтернативой
    2 2
    1
    :
    Y
    X
    H
    σ
    >
    σ

    (выбрана альтернатива — неравенство, т.к. выборочная дисперсия для Х значительно больше выборочной дисперсии для Y).
    В качестве критерия для сравнения двух дисперсий применим статисти- ку, имеющую распределение Фишера (табл. 6.4) Её наблюдаемое значение равно
    12 1
    4 166 2
    186 2
    2
    набл
    =
    =
    =
    Y
    X
    s
    s
    K
    Критическое значение кр
    K
    определим по таблице распределения Фи- шера (приложение 4) по уровню значимости
    01 0
    =
    α
    и числам степеней свободы
    ,
    8 1
    9 1
    1 1
    =

    =

    = n
    k
    :
    14 1
    15 1
    2 2
    =

    =

    = n
    k
    4.14.
    0.01)
    14;
    (8,
    )
    ;
    ,
    (
    2 1
    кр
    =
    =
    α
    =
    F
    k
    k
    F
    K
    Наблюдаемое значение не попадает в правостороннюю критическую об- ласть
    ),
    (
    кр набл
    K
    K
    <
    поэтому нет оснований отвергать нулевую гипотезу
    0
    H
    о равенстве генеральных дисперсий.
    Вернемся теперь к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей с неизвестными (но одинако- выми) генеральными дисперсиями. Оценим эту неизвестную генеральную дисперсию по совокупности двух выборок:
    53 190 2
    15 9
    4 166
    )
    1 15
    (
    2 186
    )
    1 9
    (
    2
    )
    1
    (
    )
    1
    (
    2 1
    2 2
    2 1
    2
    =

    +


    +


    =

    +

    +

    n
    n
    s
    n
    s
    n
    s
    Y
    X
    Наблюдаемое значение статистики K (табл. 6.5) равно
    86 0
    15 9
    15 9
    53 190 52 57 2
    1 2
    1
    набл
    =
    +



    =
    +


    =
    n
    n
    n
    n
    s
    y
    x
    K
    Критическое значение кр
    K
    этой статистики находим по таблице рас- пределения Стьюдента (приложение 3) при уровне значимости
    01 0
    =
    α
    и числе степеней свободы
    22 2
    2 1
    1
    =

    +
    =
    n
    n
    k
    (односторонняя критическая область):
    51 2
    )
    01 0
    ;
    22
    (
    )
    ;
    (
    кр
    =
    =
    α
    =
    t
    k
    t
    K
    Наблюдаемое значение не попадает в правостороннюю критическую об- ласть
    ),
    (
    кр набл
    K
    K
    <
    поэтому нет оснований отклонять основную гипотезу
    0
    H
    На уровне значимости 0.01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

    78
    Заметим, что при левосторонней альтернативной гипотезе
    Y
    X
    H
    <
    :
    1
    значение кр
    K
    следует находить по таблице распределения Стьюдента (прил.
    3) для уровня значимости
    α
    и числа степеней свободы
    2 2
    1 1

    +
    =
    n
    n
    k
    (од- носторонняя критическая область) и присваивать ему знак «минус».
    При двусторонней конкурирующей гипотезе
    Y
    X
    H

    :
    1
    значение кр
    K
    находим по таблицам распределения Стьюдента (приложение 3) с уровнем значимости
    α
    и числом степеней свободы
    2 2
    1 1

    +
    =
    n
    n
    k
    для двусторон- ней критической области. Область допустимых значений представляет собой интервал
    ).
    ;
    (
    кр кр
    K
    K

    6.2.3. Задачи о генеральной доле
    В разделе 5.2. мы рассматривали задачу построения доверительного ин- тервала для генеральной доли
    p
    события
    А
    . На вопрос «Накрывает ли довери- тельный интервал заданное значение
    0
    p
    ?» — можно ответить, проверив ста- тистическую гипотезу
    :
    0 0
    p
    p
    H
    =
    При этом предполагается, что опыты проводятся по схеме испытаний Бернулли (независимы, вероятность
    p
    появле- ния события
    А
    постоянна). По выборке объема
    n
    определяют относительную частоту

    p
    появления события
    ,
    :
    n
    m
    p
    A
    =

    где
    m
    — количество появлений события
    А
    в серии из
    n
    испытаний. Для проверки гипотезы
    0
    H
    используется статистика, имеющая при достаточно большом объеме выборки стандартное нормальное распределение (табл. 6.6).
    Таблица 6.6
    Гипотезы о генеральной доле
    Гипотеза
    0 0
    :
    p
    p
    H
    =
    2 1
    0
    :
    p
    p
    H
    =
    Предположения
    Схема испытаний
    Бернулли
    Схема испытаний
    Бернулли
    Оценки по выборке
    n
    m
    p
    =

    2 1
    2 1
    2 2
    2 1
    1 1

    ;
    ;
    n
    n
    m
    m
    p
    n
    m
    p
    n
    m
    p
    +
    +
    =
    =
    =


    Статистика
    K
    n
    p
    p
    p
    p




    )
    1
    (
    0 0
    0 2
    1 2
    1 2
    1
    )

    1
    (

    n
    n
    n
    n
    p
    p
    p
    p
    +





    Распределение статистики K
    Стандартное нормальное
    )
    1
    ,
    0
    (
    N
    Стандартное нормальное
    )
    1
    ,
    0
    (
    N

    79
    Пример 6. Партия изделий принимается, если вероятность того, что изде- лие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответ- ствующих стандарту. Можно ли на уровне значимости
    02 0
    =
    α
    принять партию?
    Решение. Сформулируем основную и альтернативную гипотезы.
    97 0
    :
    0 0
    =
    = p
    p
    H
    — неизвестная генеральная доля
    p
    равна заданному значению
    97 0
    0
    =
    p
    Применительно к условию — вероятность того, что де- таль из проверяемой партии окажется соответствующей стандарту, равна 0.97; т.е. партию изделий можно принять.
    97 0
    :
    1
    <
    p
    H
    — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нель- зя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
    Наблюдаемое значение статистики
    K
    (табл. 6.6) вычислим при заданных значениях
    :
    193
    ,
    200
    ,
    97 0
    0
    =
    =
    =
    m
    n
    p
    415 0
    )
    97 0
    1
    (
    97 0
    97 0
    200 193
    )
    1
    (
    0 0
    0
    набл

    =


    =



    =

    n
    p
    p
    p
    p
    K
    Критическое значение находим по таблице функции Лапласа (приложе- ние 1) из равенства
    2 1
    )
    (
    кр
    α

    =
    Φ K
    По условию
    ,
    02 0
    =
    α
    отсюда
    48 0
    )
    (
    кр
    =
    Φ K
    и
    05 2
    кр
    =
    K
    Критиче- ская область левосторонняя, т.е. является интервалом
    ).
    05 2
    ;
    (
    )
    ;
    (
    кр

    −∞
    =

    −∞
    K
    Наблюдаемое значение
    475 0
    набл

    =
    K
    не при- надлежит критической области, следовательно, на данном уровне значимости нет оснований отклонять основную гипотезу. Партию изделий принять можно.
    Пример 7. Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бра- кованных, среди 300 изделий второго завода — 15 бракованных.
    На уровне значимости 0.025 выяснить, имеется ли существенное разли- чие в качестве изготавливаемых этими заводами деталей.
    Решение. Это задача о сравнении генеральных долей двух совокупно- стей. Сформулируем основную и альтернативную гипотезы.
    2 1
    0
    :
    p
    p
    H
    =
    — генеральные доли равны. Применительно к условию — вероятность появления бракованного изделия в продукции первого завода

    80
    равна вероятности появления бракованного изделия в продукции второго за- вода (качество продукции одинаково).
    2 1
    1
    :
    p
    p
    H

    — заводы изготавливают детали разного качества.
    Для вычисления наблюдаемого значения статистики
    K
    (табл. 6.6) рассчи- таем оценки по выборке.
    ;
    05 0
    300 15
    ;
    1 0
    200 20 2
    2 2
    1 1
    1
    =
    =
    =
    =
    =
    =


    n
    m
    p
    n
    m
    p
    07 0
    500 35 300 200 15 20

    2 1
    2 1
    =
    =
    +
    +
    =
    +
    +
    =
    n
    n
    m
    m
    p
    Наблюдаемое значение равно
    15 2
    300 200 300 200
    )
    07 0
    1
    (
    07 0
    05 0
    1 0
    )

    1
    (

    2 1
    2 1
    2 1
    набл
    =
    +

    =


    =
    +



    =


    m
    m
    n
    n
    p
    p
    p
    p
    K
    Так как альтернативная гипотеза двусторонняя, то критическое значение статистики
    )
    1
    ,
    0
    (
    N
    K
    находим по таблице функции Лапласа (приложе- ние 1) из равенства
    2 1
    )
    (
    кр
    α

    =
    Φ K
    По условию
    ,
    025 0
    =
    α
    отсюда
    4875 0
    )
    (
    кр
    =
    Φ K
    и
    24 2
    кр
    =
    K
    При двусторонней альтернативе область допустимых значений имеет вид
    ).
    24 2
    ;
    24 2
    (
    )
    ;
    (
    кр

    =

    −∞
    K
    Наблюдаемое значение
    15 2
    набл
    =
    K
    попадает в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества.
    1   ...   5   6   7   8   9   10   11   12   13


    написать администратору сайта