Главная страница
Навигация по странице:

  • 11. Проверка статистических гипотез о законе распределения

  • 12. Оценка коэффициента корреляции и линейной регрессии.

  • сборник. Сборник. сборник задач по теории вероятностей и математической статистике


    Скачать 1.15 Mb.
    Названиесборник задач по теории вероятностей и математической статистике
    Анкорсборник
    Дата24.03.2022
    Размер1.15 Mb.
    Формат файлаpdf
    Имя файлаСборник.pdf
    ТипСборник
    #412871
    страница6 из 7
    1   2   3   4   5   6   7
    Задачи
    10.1. Одним и тем же прибором со средним квадратическим отклонением
    σ = 40 м произведено пять равноточных измерений расстояния от орудия до цели. Определить доверительный интервал для оценки истинного расстояния до цели с надежностью γ = 0,95, зная среднее арифметическое результатов из- мерения
    2000 м.
    х
    Ответ:
    1964,938 2035,06
    х
    m


    10.2. По данным семи измерений некоторой величины найдены средняя результатов измерений, равная 30, и выборочная дисперсия, равная 36. Найти границы, в которых с надежностью 0,99 заключено истинное значение измеря- емой величины.
    Ответ:
    24,172 35,828
    х
    m


    10.3. С целью определения среднего трудового стажа на предприятии ме- тодом случайной повторной выборки проведено обследование трудового стажа рабочих. Из всего коллектива рабочих завода случайным образом выбрано
    400 рабочих, данные о трудовом стаже которых и составили выборку. Средний стаж по выборке оказался равным 9,4 г. Считая, что трудовой стаж рабочих имеет нормальный закон распределения, определить с вероятностью 97 % гра- ницы, в которых окажется средний трудовой стаж для всего коллектива, если известно, что σ = 1,7 г.
    Ответ:
    9, 21555 9,58445
    x
     

    50
    11. Проверка статистических гипотез о законе распределения
    Критерием согласия называется случайная величина


    1
    ,
    ,
    ,
    n
    U
    x
    x


    где
    x
    i
    – значение выборки, которая позволяет принять или отклонить гипотезу о предполагаемом законе распределения.
    Алгоритм проверки гипотезы при помощи критерия согласия
    2
     :
    1. Построить интервальный статистический ряд вероятностей и гисто- грамму.
    2. По виду гистограммы выдвинуть гипотезу
    H
    0
    : f(x) = f
    0
    (x), F(x) = F
    0
    (x);
    H
    1
    : f(x)  f
    0
    (x), F(x) F
    0
    (x), где f
    0
    (x), F
    0
    (x) – плотность и функция гипотетического закона распределения.
    График эмпирической функции распределения F*(x)должен быть похож на график гипотетического закона, а гистограммы – на график плотности гипо- тетического закона f
    0
    (x). На рис. 11.1 – 11.3 приведены графики функций рас- пределения и плотностей распределения равномерного, экспоненциального и нормального законов распределения.
    Рис 11.1. Графики плотности распределения и функции распределения для равномерного закона распределения.
    Рис. 11.2. Графики плотности распределения и функции распределения для экспоненциального закона распределения.

    51
    Рис. 11.3. Графики плотности распределения и функции распределения для нормального закона распределения.
    3. Используя метод моментов или максимального правдоподобия, опре- делить оценки неизвестных параметров
    1
    ˆ
    ˆ
    , ...,
    m
    Q
    Q гипотетического закона распределения.
    4. Вычислить значение критерия по формуле




    2 2
    *
    2 1
    1
    M
    M
    j
    j
    j
    j
    j
    j
    j
    j
    p
    p
    np
    n
    p
    np










    ,
    (11.1) где pj – теоретическая вероятность попадания случайной величины в j-й интер- вал при условии, что гипотеза H
    0
    верна:
    0 0
    0
    (
    )
    ( )
    (
    )
    (
    )
    j
    j
    B
    j
    j
    j
    j
    j
    A
    p
    p A
    X
    B
    f x dx
    F B
    F A







    (11.2)
    Замечания. При расчете p
    1
    и p
    M
    в качестве крайних границ первого и по- следнего интервалов A
    1
    , B
    M
    следует использовать теоретические границы гипо- тетического закона распределения. Например, для нормального закона A
    1
    = –,
    B
    M
    = +. После вычисления всех вероятностей p
    i
    проверить, выполняется ли контрольное соотношение
    1 1
    0,01
    M
    i
    j
    p




    5. Из таблицы
    2
     (см. прил. 4) выбирается значение
    2
    ,k


    , где


    заданный уровень значимости (

    = 0,05 или 0,01), а k – число степеней свобо- ды, определяемое по формуле
    1
    k
    M
    s

     
    , где s – число параметров гипотетического закона распределения, значения ко- торых были определены в п. 3.
    6. Если
    2 2
    ,k




    , то гипотеза H
    0
    отклоняется, в противном случае нет оснований ее отклонить.
    Последовательность действий при проверке гипотезы о законе распреде- ления при помощи критерия согласия Колмогорова следующая:

    52 1. Построить вариационный ряд и график эмпирической функции распре- деления F*(x) (см. формулу(12.1)).
    2. По виду графика F*(x) выдвинуть гипотезу:
    H
    0
    : F(x) = F
    0
    (x) ,
    H
    1
    : F(x)  F
    0
    (x) , где F
    0
    (x) – функция гипотетического закона распределения.
    3. Используя метод моментов или максимального правдоподобия, опре- делить оценки неизвестных параметров
    1
    ˆ
    ˆ
    , ...,
    m
    Q
    Q гипотетического закона распределения.
    4. Рассчитать 1020 значений функции F
    0
    (x) и построить ее график в од- ной системе координат с функцией F*(x).
    5. По графику определить максимальное по модулю отклонение между функциями F*(x) и F
    0
    (x).
    *
    0 1
    max
    ( )
    ( ) .
    n
    i
    i
    i
    Z
    F x
    F x



    (11.3)
    6. Вычислить значение критерия Колмогорова
    n Z



    (11.4)
    7. Из таблицы распределения Колмогорова (см. прил. 5) выбрать критиче- ское значение
    
    ,
    1


     
    . Здесь

    – заданный уровень значимости (

    = 0,05 или 0,01).
    8. Если

    >
    
    , то нулевая гипотеза H
    0
    отклоняется, в противном случае нет оснований ее отклонить.
    Пример 11.1: В некоторой местности в течение 300 сут регистрировалась среднесуточная температура воздуха. В итоге было получено эмпирическое распределение, приведенное в табл. 11.1.
    Таблица 11.1
    Эмпирическое распределение среднесуточной температуры
    x
    i–1
    x
    i
    v
    i
    x
    i–1
    x
    i
    v
    i
    –40 … –30 25 0 … 10 40
    –30 … –20 40 10 … 20 46
    –20 … –10 30 20 … 30 48
    –10 … 0 45 30 … 40 26
    Необходимо определить несмещенную оценку математического ожида- ния и дисперсию среднесуточной температуры, а также на уровне значимости
    0,05 проверить гипотезу о том, что среднесуточная температура распределена по равномерному закону.
    Решение. На основании полученной информации построим интервальный статистический ряд вероятностей (таб. 11.2):

    53
    Таблица 11.2.
    Равноинтервальный ряд вероятностей для примера 11.1
    j
    A
    j
    B
    j
    X
    Среднее
    h
    i

    i
    1
    –40
    –30 10
    –35 25 0,083333 0,010417 2
    –30
    –20 10
    –25 40 0,133333 0,016667 3
    –20
    –10 10
    –15 30 0,1 0,0125 4
    –10 0
    10
    –5 45 0,15 0,01875 5
    0 10 10 5
    40 0,133333 0,016667 6
    10 20 10 15 46 0,153333 0,019167 7
    20 30 10 25 48 0,16 0,02 8
    30 40 10 35 26 0,086667 0,010833
    На основании построенного интервального ряда построим статистиче- ский аналог графика плотности распределения случайной величины Х, отобра- зим значения
    *
    *
    j
    j
    j
    j
    j
    p
    f
    h
    nh



    на рис. 11.4.
    Рис. 11.4. Равноинтервальная гистограмма
    Определим несмещенную оценку математического ожидания:
    7
    *
    *
    ср
    1 1
    1,5 300
    X
    i
    j
    i
    m
    x
    x
    p

     


    Далее рассчитаем несмещенную оценку дисперсии:
    *
    2
    * 2 2
    0
    ср
    1 1
    300 453, 4167 300 1 300 1
    n
    X
    i
    i
    i
    D
    S
    p x
    x








    На основании вида рис. 11.4(равноинтервальной гистограммы) выдвинем следующие гипотезы:

    54
    H
    0
    : случайная величина распределена по равномерному закону распре- деления
    0,
    ,
    ( )
    ,
    ,
    1,
    ;
    x
    a
    x
    a
    F x
    a
    x
    b
    b
    a
    x
    b


     


     
     


    
    H
    1
    : случайная величина распределена не по равномерному закону рас- пределения.
    Используя метод моментов, определим оценку неизвестных параметров
    a
    *
    и b
    *
    гипотетического (равномерного) закона распределения, решив систему уравнения:
    *
    *
    *
    *
    *
    * 2 2
    0
    ,
    2 35,3816,
    38,3816
    (
    )
    12
    b
    a
    x
    a
    b
    b
    a
    S
     

    

     





    
    Значение критерия Пирсона вычисляем по формуле (11.1):
    * 2 10 2
    1
    (
    )
    300
    j
    j
    j
    j
    p
    p
    p





    Теоретические вероятности pi рассчитываем по формуле (11.2)
    0 0
    35,3816 35,3816
    (
    )
    (
    )
    (38,31816 35,3816)
    (38,31816 35,3816)
    j
    j
    j
    j
    j
    B
    A
    p
    F B
    F A








    ,
    1 0
    0 30 35,3816
    (10)
    (
    )
    0 0,072958
    (38,31816 35,3816)
    p
    F
    F
     


     
     

    ,
    p
    2
    = 0,135569, p
    3
    = 0, 135569,p
    4
    = 0, 135569, p
    5
    = 0, 135569, p
    6
    = 0, 135569,
    p
    7
    = 0,135569, p
    8
    = 0, 135569; p
    9
    = 0, 135569,
    10 0
    0 30 35,3816
    ( )
    (30)
    1 0,113628.
    (38,31816 35,3816)
    p
    F
    F


     
     


    Проверим выполнение контрольного соотношения
    10 1
    1 0
    0,01.
    j
    j
    p


     

    Тогда получаем, что
    2 7,6636.


    Далее определяем табличное значение критерия Пирсона (см. прил. 4) при
    10 1 2 7
    k
      
    :
    2 0,05;7 14,07.


    Так как
    2 2
    ,k




    , то нет оснований не принять гипотезу Н
    0

    55
    Задачи
    11.1. Случайная величина Х задана таблицей значений:
    № п/п
    x
    i
    № п/п
    x
    i
    № п/п
    x
    i
    № п/п
    x
    i
    1 2,13 10 3,84 19 4,77 28 5,42 2
    2,15 11 3,88 20 5,15 29 5,53 3
    2,28 12 4,11 21 5,17 30 5,59 4
    2,45 13 4,31 22 5,23 31 5,73 5
    2,95 14 4,34 23 5,26 32 5,85 6
    3,25 15 4,41 24 5,28 33 6,02 7
    3,28 16 4,42 25 5,38 34 6,22 8
    3,41 17 4,65 26 5,4 35 6,53 9
    3,73 18 4,69 27 5,42 36 7,2
    Определить математические ожидание, дисперсию случайной величины
    Х. Определить несмещенные оценки и доверительные интервалы надежностью
    96 % для математического ожидания и дисперсии случайной величины. Прове- рить гипотезу о нормальном распределении случайной величины на уровне значимости

    = 0,05.
    Ответ:
    2 2
    0 4,5,
    4,595,
    1,614,
    4,159 5,031,0,819 2, 409.
    x
    x
    x
    S
    m
    D








    11.2. Проверить гипотезу о равномерном законе распределения случайной величины, представленной в задаче 11.1, на уровне значимости

    = 0,05.
    Ответ:
    2 12,88.


    11.3. Вариационный ряд случайной величины Х имеет следующий вид:
    –5,58 -3,88 –1,9 0,14 1,24
    –4,32 –3,65 –1,21 0,19 1,35
    –4,23 –3,32 –1,09 0,38 1,47
    –4,19 –3,3
    –0,82 0,66 2,27
    –4,1
    –2,21 –0,15 0,95 4,31
    Определить математические ожидание, дисперсию случайной величины
    Х. Определить несмещенные оценки и доверительные интервалы надежностью
    95 % для математического ожидания и дисперсии случайной величины. Прове- рить гипотезу о нормальном распределении случайной величины на уровне значимости

    = 0,05.
    Ответ:




    2 1, 24,
    2, 24; 0, 24 ,
    6,52,
    2,91;10,14 ,
    11,5.
    x
    x
    x
    m
    x
    D
    m
    I
    D
    I

     
     


     


    56 11.4. Вариационный ряд случайной величины Х имеет вид:
    0,02 0,24 0,68 1,43 2,16 0,06 0,37 0,94 1,47 2,22 0,17 0,51 0,97 1,65 3,26 0,17 0,57 1,03 1,72 6,25 0,22 0,58 1,18 1,74 6,7
    Определить математические ожидание, дисперсию случайной величины
    Х. Определить несмещенные оценки и доверительные интервалы надежностью
    95 % для математического ожидания и дисперсии случайной величины. Выдви- нуть гипотезу о распределении случайной величины и проверить ее на уровне значимости

    = 0,05.
    Ответ:




    2 1, 45,
    0,78;2,12 ,
    2,93,
    1,31;4,55 ,
    10,1.
    x
    x
    x
    m
    x
    D
    m
    I
    D
    I







    57
    12. Оценка коэффициента корреляции и линейной регрессии.
    Пусть проводится n независимых опытов, в каждом из которых двухмер- ная СВ (Х,Y) принимает определенные значения и результаты опытов представ- ляют собой двухмерную выборку вида {(х
    1
    , у
    1
    ), (х
    2
    , у
    2
    ), (х
    n
    , у
    n
    )}. Состоятельная несмещенная оценка корреляционного момента равна:
    *
    1 1
    (
    )(
    ),
    1
    n
    XY
    i
    i
    i
    K
    x
    x y
    y
    n







    (12.1) где xi, yi – значения, которые приняли случайные величины X, Y в i–м опыте;
    ,
    x y
    – средние значения случайных величин X и Y соответственно.
    Состоятельная оценка коэффициента корреляции:
    *
    *
    0 0
    ( )
    ( )
    XY
    XY
    K
    R
    S
    x S
    y

    (12.2)
    Доверительный интервал с надежностью γ для коэффициента корреляции
    *
    XY
    R
    и случая двухмерного нормального распределения:
    2 2
    2 2
    1 1
    1 1
    a
    b
    XY
    a
    b
    e
    e
    R
    e
    e






    ,
    (12.3) где
    *
    *
    1 0,5 ln
    3 1
    XY
    XY
    z
    R
    a
    n
    R















    ;
    *
    *
    1 0,5 ln
    3 1
    XY
    XY
    z
    R
    b
    n
    R















    ; arg
    ( )
    2
    z




    – значение аргумента функции Лапласа Ф(z) =
    2

    ;
    Алгоритм проверки гипотезы об отсутствии корреляционной зависимо-
    сти следующий (предполагается, что двухмерная случайная величина (X, Y) распределена по нормальному закону):
    1. Формулируется гипотеза:
    H
    0
    :
    0
    XY
    R
     ;
    H
    1
    :
    0
    XY
    R
     .
    Здесь
    XY
    R
    – теоретический коэффициент корреляции.
    2. Вычисляется оценка коэффициента корреляции
    *
    XY
    R
    по формуле (12.2).
    3. Определяется значение критерия
     
    *
    2
    *
    2 1
    XY
    XY
    R
    n
    t
    R



    ,
    (12.4) который распределен по закону Стьюдента с (n – 2) степенями свободы, если гипотеза H
    0
    верна.

    58 4. По заданному уровню значимости

    вычисляется доверительная веро- ятность

    = 1 –

    и из таблицы Стьюдента выбирается критическое значение
    ,
    2
    n
    t


    5. Если
    ,
    2
    n
    t
    t
     

    , то гипотеза H
    0
    отклоняется, а следовательно, величины
    X, Y коррелированы. В противном случае гипотеза H
    0
    принимается.
    Регрессией случайной величины Y на X называется условное математиче- ское ожидание случайной величины Y при условии, что X = x:
    /
    M[ /
    ]
    Y x
    m
    Y X
    x


    Регрессия Y на X устанавливает зависимость среднего значения величины
    Y от величины X. Если X и Y независимы, то
    /
    const.
    Y x
    Y
    m
    m


    Если величины X, Y распределены по нормальному закону, то регрессия является линейной:
    /
    0 1
    Y x
    m
    a
    a x


    Оценки параметров
    0
    ˆa
    и
    1
    ˆa
    по методу наименьших квадратов вычисля- ются по следующим формулам:
    *
    1 2
    0
    ˆ
    ,
    ( )
    XY
    K
    a
    S
    x

    (12.5)
    0 1
    ˆ
    ˆ
    a
    y
    a x
      
    (12.6) где
    ,
    x y
    – оценки математического ожидания величин X и Y;
    2 0
    ( )
    S
    x – оценка дисперсии величины X;
    *
    XY
    K
    – оценки корреляционного момента величин X и Y.
    Для визуальной проверки правильности вычисления величин
    0 1
    ˆ
    ˆ
    ,
    a
    a необходимо построить диаграмму рассеивания и график
    0 1
    ˆ
    ˆ
    ( )
    y x
    a
    a x


    x
    x
    i
    y
    i
    y(x)
    _
    Если оценки параметров a
    0
    , a
    1
    рассчитаны без грубых ошибок, то сумма квадратов отклонений всех точек (xi, yi) от прямой
    0 1
    ˆ
    ˆ
    ( )
    y x
    a
    a x


    должна быть минимально возможной.
    Пример 12.1: Выборочный коэффициент корреляции, вычисленный по выборке объема 10,
    *
    0,64
    XY
    R
     
    . Найти 90 %-ный доверительный интервал для коэффициента корреляции
    XY
    R
    Решение. Из таблицы Лапласа выбирается значение
    0,9 1,645
    z

    . Тогда

    59 1
    1 0,64 1,645
    ln
    1,380 2
    1 0,64 7
    a





     





    , b = –0,136.
    Доверительный интервал вычисляем по формуле (12.3).
    2 ( 1,38)
    2 ( 0,136)
    2 ( 1,38)
    2 ( 0,136)
    1 1
    1 1
    XY
    e
    e
    R
    e
    e
     
     
     
     






    , т. е.
    –0,881 <
    XY
    R
    < –0,135.
    Пример12.2: Проверить гипотезу об отсутствии корреляционной зависи- мости при следующих данных:
    *
    0,2,
    XY
    R

    n = 20;

    = 0,05. Предполагается так- же, что двухмерный закон распределения – нормальный.
    Решение. Вначале вычислим значение критерия t по формуле (12.4)
    2 0, 2 18 0,866.
    1 0, 2
    t




    Из таблицы
    Стьюдента выбираем критическое значение
    ;
    2 1
    ;
    2 0,95;18 2,10.
    n
    n
    t
    t
    t








    Так как
    2,10,
    t
    то гипотеза H
    0
    принимается, по- тому что нет оснований ее отклонить.
    1   2   3   4   5   6   7


    написать администратору сайта