Главная страница
Навигация по странице:

  • Критерий согласия Пирсона

  • 1. Проверка согласованности эмпирической функции с теоретическим нормальным распределением

  • Критерий Романовского

  • Приближенный критерий

  • Практ.раб 4.к надеж.Эмпир.. Построение кривой нормального распределения по опытным данным. Проверка гипотезы о нормальном распределении выборки


    Скачать 378.01 Kb.
    НазваниеПостроение кривой нормального распределения по опытным данным. Проверка гипотезы о нормальном распределении выборки
    Дата06.12.2021
    Размер378.01 Kb.
    Формат файлаdocx
    Имя файлаПракт.раб 4.к надеж.Эмпир..docx
    ТипЛекция
    #293612
    страница1 из 9
      1   2   3   4   5   6   7   8   9





    Практическая работа 4


    Построение кривой нормального распределения по опытным данным. Проверка гипотезы о нормальном распределении выборки (лекция 4)

    Содержание работы: Проверка статистических гипотез включает в себя большой пласт задач математической статистики. Зная некоторые характеристики выборки (или имея просто выборочные данные), мы можем проверять гипотезы о виде распределении случайной величины или ее параметрах (примеры этих задач на странице Проверка гипотез о параметрах распределения).Ниже в примерах разбираются основные учебные задачи на проверку гипотез о виде распределения. Чаще всего для этого используется критерий согласия χ2χ2 Пирсона, а также критерий Колмогорова-Смирнова.

    Критерий согласия Пирсона (или критерий χ2χ2 - "хи квадрат") - наиболее часто употребляемый для проверки гипотезы о принадлежности некоторой выборки теоретическому закону распределения (в учебных задачах чаще всего проверяют "нормальность" - распределение по нормальному закону).

    В учебных задачах обычно используется следующий алгоритм: Выбор теоретического закона распределения (обычно задан заранее, если не задан - анализируем выборку, например с помощью гистограммы относительных частот, которая имитирует плотность распределения).

    1. Оцениваем параметры распределения по выборке (для этого вычисляется математическое ожидание и дисперсия): a,σa,σ для нормального, a,ba,b - для равномерного, λλ - для распределения Пуассона и т.д.

    2. Вычисляются теоретические значения частот (через теоретические вероятности попадания в интервал) и сравниваются с исходными (выборочными).

    3. Анализируется значение статистики χ2χ2 и делается вывод о соответствии (или нет) теоретическому закону распределения.

    Основная задача работы проверить согласованность эмпирического распределения с теоретическим нормальным, применяя критерии и гипотезы:

    1.О нормальном распределении

    2.О распределении по закону Пуассона

    3. О распределении по показательному закону

    4.О распределении по равномерному закону

    5. По критерию Колмогорова

    6. По критерию Колмогорова-Смирнова

    7. по критерию Вилкоксона

    8.Проверка гипотезы по критерию 2

    1. Проверка согласованности эмпирической функции с теоретическим нормальным распределением

    1) Критерий Пирсона

    Покажем, как применять данный критерий в двух случаях: а) без объединения интервалов и б) с объединением интервалов, в которые попало менее 5 значений

    а) Вычисляем статистику критерия хи-квадрат:



    Для уровня значимости α=0.95 и числе степеней свободы l=k-r=8-3=5по Приложению 4, входом к которую является p=1-α=0.05 и K=l=5, находим критическое значение

    Условием принятия гипотезы о нормальном распределении является условие , которое выполняется. Гипотезу о соответствии данного распределения нормальному закону распределения принимаем.
    б) Подробнее покажем, как вычисляется статистика критерия в случае объединения интервалов, содержащих малое количество эмпирических частот. Исходные данные:

    левая граница интеравала

    правая граница интеравала

    середина xi

    ni

    -5

    0.795

    0.78

    4

    0.795

    0.825

    0.81

    7

    0.825

    0.855

    0.84

    7

    0.855

    0.885

    0.87

    11

    0.885

    0.915

    0.9

    14

    0.915

    0.945

    0.93

    1

    0.945

    0.975

    0.96

    3

    0.975

    5

    0.99

    3


    *Примечание. Числа -5 и 5 как левый конец первого и правый конец последнего интервалов взяты вместо -∞ и ∞ соответственно для подсчета вероятности попадания в эти интервалы.

    После объединения интервалов, содержащих малочисленные эмпирические частоты получаем

    После

    объединения

    эмпирических

    частот

    Левая

    граница

    интервала

    Правая

    граница

    интервала

    p

    npk



    11

    -5

    0.825

    0.191

    9.563

    0.216

    7

    0.825

    0.855

    0.183

    9.150

    0.505

    11

    0.855

    0.885

    0.218

    10.876

    0.001

    14

    0.885

    0.915

    0.192

    9.597

    2.020

    7

    0.915

    5

    0.216

    10.814

    1.345















    4.088

    *Примечание. Для подсчета вероятности попадания в соответствующий интервал использовалась статистическая функция Excel НОРМРАСП.

    Например, для подсчета вероятности попадания в первый из интервалов, в соответствующую ячейку вводилась формула

    =НОРМРАСП(G4;$D$12;$C$23;ИСТИНА)-НОРМРАСП(F4;$D$12;$C$23;ИСТИНА),

    где G4 и F4 – адреса ячеек, в которых находятся соответственно правая и левая границы интервала, $D$12 – адрес ячейки, в которой находится ,$C$23 – адрес ячейки, вкоторой находится смещенная оценка σ (S=0.054279, см. с.34).

    По заданному уровню значимости α=0.05 и f=5-2-1=2 степеням свободы с помощью статистической функции ХИ2ОБР(J12;H13), первый аргумент которой – адрес ячейки, содержащей значение уровня значимости, второй – адрес ячейки, содержащей число степеней свободы, находим . Так как , гипотезу о нормальном распределении генеральной совокупности принимаем.

    2) Критерий Романовского

    Воспользуемся результатами предыдущих расчетов.

    а) для случая без объединения интервалов:



    б) для случая с объединением интервалов, в которые попало менее 5 значений:



    Условием принятия гипотезы о нормальном распределении является условие , которое выполняетсяв обоих случаях.

    Гипотезу о соответствии данного распределения нормальному закону распределения принимаем.
    3) Критерий Колмогорова-Смирнова

    По несгруппированной выборке находим и

    xi

    Эмпирические

    частоты ni

    Накопленные

    частоты ωi

    F(xcp,s)

    Fn(xi)

    Fn(xi+1)








    0.78

    2

    2

    0.038911

    0

    0.04

    0.038911

    0.001089

    0.79

    2

    4

    0.057483

    0.04

    0.08

    0.017483

    0.022517

    0.80

    2

    6

    0.082408

    0.08

    0.12

    0.002408

    0.037592

    0.81

    2

    8

    0.114710

    0.12

    0.16

    0.005290

    0.045290

    0.82

    3

    11

    0.155137

    0.16

    0.22

    0.004863

    0.064863

    0.84

    2

    13

    0.261008

    0.22

    0.26

    0.041008

    0.001008

    0.85

    5

    18

    0.325262

    0.26

    0.36

    0.065262

    0.034738

    0.86

    4

    22

    0.395185

    0.36

    0.44

    0.035185

    0.044815

    0.87

    3

    25

    0.468665

    0.44

    0.50

    0.028665

    0.031335

    0.88

    4

    29

    0.543232

    0.50

    0.58

    0.043232

    0.036768

    0.89

    3

    32

    0.616302

    0.58

    0.64

    0.036302

    0.023698

    0.90

    6

    38

    0.685448

    0.64

    0.76

    0.045448

    0.074552

    0.91

    5

    43

    0.748632

    0.76

    0.86

    0.011368

    0.111368

    0.94

    1

    44

    0.890989

    0.86

    0.88

    0.030989

    0.010989

    0.95

    1

    45

    0.922052

    0.88

    0.90

    0.042052

    0.022052

    0.96

    1

    46

    0.945887

    0.90

    0.92

    0.045887

    0.025887

    0.97

    1

    47

    0.963547

    0.92

    0.94

    0.043547

    0.023547

    0.98

    2

    49

    0.976183

    0.94

    0.98

    0.036183

    0.003817

    0.99

    1

    50

    0.984914

    0.98

    1

    0.004914

    0.015086

    n

    50










    макс

    0.065262

    0.111368


    Теоретическая функция распределения F(xcp,S) вычислялась с помощью статистической функции НОРМ. РАСП. Так, первое значение этой функции равно

    F(x1)=P(X<x1)=НОРМ.РАСП(A6;$C$3;$C$2;ИСТИНА)

    где A6 – адрес ячейки, содержащей первое значение х1;$C$3 – адрес ячейки, содержащей значение ;$C$2 – адрес ячейки, содержащей значение S.

    По двум последним столбцам таблицы определяем Dn. Dn=max(0.065262; 0.111368)= 0.111368.

    В качестве статистики критерия используется величина



    Критические точки взяты из таблицы (см. с. 58). Так, для α=0.05 . Так как гипотеза о нормальном распределении не отклоняется.

    Критерий Колмогорова для сгруппированной выборки:

    Критическое значение статистики Колмогорова подсчитывается по формуле:

    .

    Для нахождения максимума абсолютного значения разности между накопленными эмпирическими и теоретическими частотами |wi- wi'| построим таблицу

    xi

    ni

    ni'

    wi

    wi'

    |wi-wi'|

    0,78

    4

    3

    4

    3

    1

    0,81

    7

    6

    11

    9

    2

    0,84

    7

    9

    18

    18

    0

    0,87

    11

    11

    29

    29

    0

    0,9

    14

    10

    43

    39

    4

    0,93

    1

    6

    44

    45

    1

    0,96

    3

    3

    47

    48

    1

    0,99

    3

    1

    50

    49

    1



    K(λ)= 0,9228

    Гипотеза о нормальном распределении принимается,
    еслиK(λ)>0.05.Это условие выполняется. Гипотезу о соответствии данного распределения нормальному закону распределения принимаем.

    1. Критерий Ямстремского

    где ,

    ni– эмпирические частоты, - теоретические частоты,k– число интервалов дискретного вариационного ряда, n- объем выборки.

    Так как k<20, то Θ=0,6.

    а) без объединения интервалов:

    Обозначим Для вычисления величины c составляем таблицу. Теоретические частоты взяты со с. 68.

    xi

    ni

    ni'

    pi'

    qi'

    (ni-ni')2

    ni'qi'

    (ni-ni')2/(ni'qi')

    0,78

    4

    3

    0,06

    0,94

    1

    2,82

    0,354609929

    0,81

    7

    6

    0,12

    0,88

    1

    5,28

    0,189393939

    0,84

    7

    9

    0,18

    0,82

    4

    7,38

    0,54200542

    0,87

    11

    11

    0,22

    0,78

    0

    8,58

    0

    0,9

    14

    10

    0,2

    0,8

    16

    8

    2

    0,93

    1

    6

    0,12

    0,88

    25

    5,28

    4,734848485

    0,96

    3

    3

    0,06

    0,94

    0

    2,82

    0

    0,99

    3

    1

    0,02

    0,98

    4

    0,98

    4,081632653

    .

    .

    Условие принятия гипотезы о нормальном распределении (т.е. 3.902≤12.8686) выполняется.

    б) для случая с объединением интервалов, в которые попало менее 5 значений, имеем:

    Эмпирические

    частоты n1

    pi

    Теоретические

    частоты npi



    11

    0.19126030

    9.563014902

    0.26699365

    7

    0.18300999

    9.150499527

    0.61861031

    11

    0.21751227

    10.87561356

    0.001818087

    14

    0.19194079

    9.597039292

    2.499822427

    7

    0.21627665

    10.81383272

    1.716251184

    Объем n=50






    5.103495659

    Число

    интерваловk

    5



    0.029390792

    Поскольку гипотеза о нормальном распределении экспериментальных данных принимается.

    5) Приближенный критерий

    Средние квадратические отклонения асимметрии и эксцесса вычисляют по формулам:

    .

    .

    Условием принятия гипотезы о нормальном распределении являются условия (0.279<0.32979) и (0.293<0.62193).Оба условия выполняются.

    Вывод: гипотезу о соответствии данного распределения нормальному закону распределения принимаем.

    Задачи:

      1   2   3   4   5   6   7   8   9


    написать администратору сайта