Главная страница
Навигация по странице:

  • Подбор закона распределения по опытным данным и проверка его согласия по критериям χ

  • Отчёт по 1 л.р. (1). Лабораторная работа 1 Подбор закона распределения по опытным данным и проверка его согласия по критериям 2 и Колмогорова


    Скачать 73.11 Kb.
    НазваниеЛабораторная работа 1 Подбор закона распределения по опытным данным и проверка его согласия по критериям 2 и Колмогорова
    Дата03.10.2021
    Размер73.11 Kb.
    Формат файлаdocx
    Имя файлаОтчёт по 1 л.р. (1).docx
    ТипЛабораторная работа
    #240773

    МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

    Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

    Пермский национальный исследовательский политехнический университет

    Кафедра прикладной математике

    Лабораторная работа № 1

    Подбор закона распределения по опытным данным и проверка его согласия по критериям χ2 и Колмогорова

    Работу выполнил

    Гр. РНГМв-12

    Работу принял

    Карандашов В.П.

    Пермь 2012
    1. Исходные данные


    В таблице 1 приведена выборка результатов измерения веса 100 студентов обучающихся на 1ом курсе в педагогическом институте. Измерения проводились с точностью до 1 кг:

    Таблица 1 Выборка случайной величины объёмом n=100

    70

    70

    78

    83

    68

    75

    86

    75

    77

    83

    85

    83

    83

    78

    70

    71

    74

    81

    63

    70

    80

    75

    80

    80

    78

    69

    71

    88

    66

    78

    88

    73

    78

    78

    83

    86

    84

    68

    78

    82

    73

    70

    81

    63

    70

    78

    74

    79

    75

    73

    78

    83

    87

    66

    78

    89

    93

    78

    83

    68

    78

    75

    68

    78

    81

    74

    78

    83

    90

    86

    70

    80

    74

    75

    73

    79

    84

    84

    67

    76

    85

    75

    79

    82

    68

    79

    80

    78

    70

    71

    73

    93

    84

    90

    85

    69

    94

    81

    78

    88


    1.1 Исключение ложных результатов в выборке


    Для исключения из экспериментальных данных грубых ошибок (ложных результатов) воспользуемся критерием Стьюдента



    где – математическое ожидание случайной величины x, – среднее квадратичное отклонение т.е. корень квадратный дисперсии, – критерий Стьюдента берётся из таблице.

    Поскольку, выборка объёмом 100, то для исключения ложных результатов удобней воспользоваться методом вычисления максимального относительного отклонения:



    где – крайний (наибольший или наименьший) элемент выборки. Таким образом, для выделения аномального значения вычисляют τ, которое сравнивают с табличным значением . Если неравенство соблюдается, то наблюдение не отсеивают, если не соблюдается, то наблюдение исключают.

    Максимальное значение в данной выборке равняется Xmax=94, а минимальное значение Xmin=63. Рассчитаем математическое ожидание:



    И среднее квадратичное отклонение:



    Для рассчитываются по формуле (1) τ





    Далее из выбирают наибольшее. Для отсева грубых погрешностей удобно максимальные относительные отклонения разделить на три неравенства:







    Из таблицы распределения Стьюдента: ,

    Подставляя найденные значения τ при , получаем, что выполняется неравенство (5), следовательно, рассматриваемые значения не исключаем, так как весомых аргументов в их ошибочности нет.
    1. Оценка числовых характеристик распределения:


    1. Среднее арифметическое рассчитывается по формуле (2) и принимает значение равное 77.78

    2. Эмпирическая дисперсия:



    1. Среднеквадратическое отклонение рассчитывается по формуле (3) и принимает значение = 6.941

    2. Выборочное значение коэффициент вариации, является мерой относительной изменчивости наблюдаемой случайной величины в %, вычисляют по формуле:



    1. Выборочный коэффициент асимметрии (скошенности) это количественная характеристика показывающая сходство с нормальным распределением и рассчитываемая по формуле:



    Коэффициент асимметрии положителен, т.е. плотность распределения обладает положительной асимметрией

    1. Выборочный коэффициент эксцесса (островершинности) это количественная характеристика островершинности распределения, которая вычисляется по формуле:



    Эксцесс отрицателен, следовательно, вершина более пологая.
    1. Статистическая проверка случайности и независимости результатов наблюдений


    Рассмотрим критерий серий, основанный на медиане выборки.

    Так как значение n – чётное, то выборочное значение медианы принимает вид



    В исходной выборке вместо каждого хi будем ставить "+", если хi>xmed(n), "-", если хi < xmed(n). Если хi = xmed(n), то не ставится никакой знак. Полученная последовательность "+" и "-" может характеризоваться количеством серий (n) и длиной самой длинной серии (n). При этом под серией понимается последовательность подряд идущих "+" или "-". Серия может состоять только из одного "+" или "-". Длина серии – количество подряд идущих "+" или "-". Если выборка стохастически независима (выборка случайна), то чередование плюсов и минусов в последовательности должно быть случайно. Таким образом, в данном критерии рассматриваются две критические статистики .



    где в квадратных скобках неравенства обозначена […] – целая часть, - число серий, τ(n) – длина самой длинной серии.



    Рассмотрим второй критерий - Критерий «восходящих» и «нисходящих» серий.

    По аналогии с критерием серий, основанном на медиане выборки, в ранговом критерии «восходящих» и «нисходящих» серий также формируется последовательность серий "+" и "-". Для этого в исходной выборке из генеральной совокупности xi, i = на месте i-го элемента ставят "+" если хi+1 > xi, и "-" если хi+1 < xi. Если хi+1 = xi, то в серии ничего не проставляется.

    При уровне значимости q=0.05 количественное выражение этого правила примет вид:



    где - число серий, τ(n) – длина самой длинной серии, – принимает значение 6 так как объём выборке удовлетворяет неравенству 26<n<153.


    1. Проверка нормальности распределения

    Критерий, основанный на вычислении среднего абсолютного отклонения (САО).


    Для выборки n > 120 среднее абсолютное отклонение вычисляется по формуле:



    Для выборки, имеющий приближенно нормальный закон распределения, должно быть справедливо выражение:



    Подставляя значения в данное неравенство получаем , следовательно неравенство выполнено выборка имеет приближённо нормальный закон распределения.

    Критерий, основанный на анализе показателей асимметрии и эксцесса.


    В случаи нормального распределения характеристики асимметрии и эксцесса должны быть нулевыми. Вычислим выборочные характеристики асимметрии по формуле 7 и эксцесса по формуле 8.



    Далее определим среднеквадратическое отклонение выборочных асимметрий и эксцесс соответственно:





    Если выполняются два неравенства,



    то гипотеза о нормальном законе распределения рассматриваемой случайной величины принимается.

    Подставляя полученные значения в неравенство (9) получаем:



    Гипотеза о нормальном законе может быть принята.
    1. Построение гистограммы, полигона и кумулянты.


    Разделим данные выборки на классы и построим полигон, гистограмму и кумулянту частот. Гистограмма и полигон дают графическое представление об эмпирической функции плотности этой переменной, а кумулятивная кривая – о её эмпирической функции распределения. Для этого выполним следующие преобразования:

    1) находим xmin=63 и xmax=94, Размах выборки R= xmax- xmin = 31;

    2) n=100 наблюдений;

    3) Определяем длину интервала разбиений:



    Длину интервала принимаем равной 4.0, число интервалов возьмём 8.

    4) Разбиваем массив данных на интервалы и вычисляем частоту. Результаты этой операции представлены в таблице 2.

    Таблица 2.

    Интервал веса

    Середина интервала

    Частоты




    абсолютные

    относительные

    относительные накопленные

    от 62 до 66

    64

    4

    0.04

    0.04

    от 66 до 70

    68

    17

    0.17

    0.21

    от 70 до 74

    72

    10

    0.1

    0.31

    от 74 до 78

    76

    25

    0.25

    0.56

    от 78 до 82

    80

    16

    0.16

    0.72

    от 82 до 86

    84

    18

    0.18

    0.9

    от 86 до 90

    88

    7

    0.07

    0.97

    от 90 до 94

    92

    3

    0.03

    1

    5) После составления таблицы строим полигон, гистограмму и кумулянту распределения результатов наблюдения:



    Рис.1. Полигон распределения



    Рис.2. Гистограмма распределения



    Рис. 3. Кумулянта распределения

    По виду гистограммы подбираем закон распределения случайной величины. В данной работе имеем гистограмму близкую к гистограмме нормального закона распределения.

    Нормальный закон:



    ,

    Проверим по критериям согласия, будут ли опытные данные согласоваться с нормальным законом распределения.
    1. Проверка согласия опытных данных с нормальным законом распределения по критерию


    Условие:



    где r – число интервалов, на которые разбиты исходные опытные данные; ni – число опытных данных, попавших в i-ый интервал (абсолютная частота); - теоретическое число, попавшее в i-ый интервал.



    где n- объём выборки.

    В случае нормального закона распределения



    где (значения данной функции берутся из таблицы её значений).

    Для первого интервала левый конец изменим на - , а для последнего интервала правый конец на + . Таким образом, первый интервал будет (- ; 66), а последний (90; + ). Расчёт приведён в табл. 3; 4; 5.

    Таблица 3

    i

    Границы интервала

    xi -

    xi +1 -

    Границы интервалов

    zi=

    zi+1=

    xi

    xi+1

    1

    - ∞

    66

    -

    -11.78

    - ∞

    -1.6972

    2

    66

    70

    -11.78

    -7.78

    -1.6972

    -1.1209

    3

    70

    74

    -7.78

    -3.78

    -1.1209

    -0.5446

    4

    74

    78

    -3.78

    0.22

    -0.5446

    0.0317

    5

    78

    82

    0.22

    4.22

    0.0317

    0.608

    6

    82

    86

    4.22

    8.22

    0.608

    1.1843

    7

    86

    90

    8.22

    12.22

    1.1843

    1.7606

    8

    90

    + ∞

    12.22

    -

    1.7606

    + ∞

    Таблица 4

    i

    Границы интервала

    (zi)

    (zi+1)

    Pi = (zi+1) - (zi)

    =100Pi

    zi

    zi+1

    1

    - ∞

    -1.6972

    -0.5

    -0.4552

    0.0448

    4.48

    2

    -1.6972

    -1.1209

    -0.4552

    -0.3688

    0.0864

    8.64

    3

    -1.1209

    -0.5446

    -0.3688

    -0.207

    0.1618

    16.18

    4

    -0.5446

    0.0317

    -0.207

    0.0126

    0.2196

    21.96

    5

    0.0317

    0.608

    0.0126

    0.2284

    0.2158

    21.58

    6

    0.608

    1.1843

    0.2284

    0.3819

    0.1535

    15.35

    7

    1.1843

    1.7606

    0.3819

    0.4608

    0.0789

    7.89

    8

    1.7606

    + ∞

    0.4608

    0.5

    0.0392

    3.92

    Таблица 5

    i

    ni



    ni -

    (ni - )2

    (ni - )2 /



    /

    1

    4

    4.48

    -0.48

    0.2304

    0.05143

    16

    3.57

    2

    17

    8.64

    8.36

    69.8896

    8.0891

    289

    33.45

    3

    10

    16.18

    -6.18

    38.1924

    2.3605

    100

    6.18

    4

    25

    21.96

    3.04

    9.2416

    0.4208

    625

    28.46

    5

    16

    21.58

    -5.58

    31.1364

    1.4428

    256

    11.86

    6

    18

    15.35

    2.65

    7.0225

    0.4575

    324

    21.11

    7

    7

    7.89

    -0.89

    0.7921

    0.1004

    49

    6.21

    8

    3

    3.92

    -0.92

    0.8464

    0.2159

    9

    2.30

    Σ

    100

    100







    13.1384




    113.14

    Столбцы и служат для контроля вычисления по формуле:



    . Вычисления произведены правильно.

    По таблице критических точек распределения χ2, по уровню значимости α=0.01 и числу степеней свободы k=S-3=8-3=5 (S-число интервалов, 3-количество неизвестных параметров нормального закона распределения), находим критическую точку

    Имеем , следовательно, выдвинутая гипотеза о нормальном законе распределения принимается, т.е. опытные данные согласуются с нормальным законом распределения.
    1. Проверка согласия опытных данных с нормальным законом распределения по критерию Колмогорова.


    λ=D , где n-объём выборки; Необходимо вычислить



    где и теоретическая и эмпирическая функции распределения.

    Расчёты согласия по критерию Колмогорова приведены в таблице 6, где nx и -суммы опытных и теоретических данных меньших x.

    Таблица 6

    ni

    nx





    F(x) =

    F*(x) =



    4

    4

    4.48

    4.48

    0.04

    0.0448

    0.0048

    17

    21

    8.64

    13.12

    0.21

    0.1312

    0.0788

    10

    31

    16.18

    29.3

    0.31

    0.293

    0.017

    25

    56

    21.96

    51.26

    0.56

    0.5126

    0.0474

    16

    72

    21.58

    72.84

    0.72

    0.7284

    0.0084

    18

    90

    15.35

    88.19

    0.9

    0.8819

    0.0181

    7

    97

    7.89

    96.08

    0.97

    0.9608

    0.0092

    3

    100

    3.92

    100

    1

    1

    0

    D = 0.0788; при n=100;

    λ=D = 0.0788· = 0.788; При α = 0.2, λкр = 1.073;

    Имеем λ < λкр , следовательно, по критерию Колмогорова имеем, что опытные данные согласуются с нормальным законом распределения.
    1. Графики функций плотности и распределения.












    написать администратору сайта