Главная страница
Навигация по странице:

  • І. Применение критерия Пирсона

  • ІІ. Применение критерия Колмогорова.

  • § 6. Замечания.

  • § 7. Применение вычислительной техники.

  • статистическая обработка данных. основы статистической обработки опытных даных. Учебнометодическое пособие Нижний Новгород 2011 Трегубова Е. В. Основы статистической обработки опытных данных. Учебнометодическое пособие


    Скачать 1.63 Mb.
    НазваниеУчебнометодическое пособие Нижний Новгород 2011 Трегубова Е. В. Основы статистической обработки опытных данных. Учебнометодическое пособие
    Анкорстатистическая обработка данных
    Дата23.12.2021
    Размер1.63 Mb.
    Формат файлаdocx
    Имя файлаосновы статистической обработки опытных даных.docx
    ТипУчебно-методическое пособие
    #315809
    страница5 из 17
    1   2   3   4   5   6   7   8   9   ...   17
    § 5. Проверка гипотезы о нормальном

    распределении случайной величины.

    По данным рассмотренного выше примера выдвинем гипотезу о виде распределения и проверим ее на уровне значимости по критерию согласия и по критерию Колмогорова.

    Гистограмма опытных значений похожа на плотность нормального распределения, поэтому выдвигаем гипотезу о том, что распределение является нормальным. В данном параграфе приведем методику подсчета в случае гипотезы о том, что данное распределение является нормальным. Подсчеты произведем для рассмотренного выше распределения. Высказываем нулевую гипотезу : имеет нормальное распределение, плотность вероятности которого описывается формулой

    ,

    где - математическое ожидание, т.е , σ - среднее квадратическое отклонение случайной величины. Параметры нормального закона и σ неизвестны, поэтому заменяем их «наилучшими» оценками по выборке – несмещенными и состоятельными оценками соответственно выборочной средней и «исправленным» средним квадратическим отклонением. Таким образом, , . Отметим, что в случае, когда число наблюдений достаточно велико (как в примере ), то вместо «исправленного» среднего квадратического отклонения можно взять выборочное среднее квадратическое отклонение .
    І. Применение критерия Пирсона.

    Подсчитаем - опытное значение критерия . Вычисления представим в виде таблицы.

    Интервалы

















    – 300

    -0,99

    17

    0,16

    0,16

    16

    1

    0,06

    300 – 600

    -0,51

    19

    0,31

    0,15

    15

    4

    1,07

    600 – 900

    -0,03

    19

    0,49

    0,18

    18

    1

    0,06

    900 – 1200

    0,45

    15

    0,67

    0,18

    18

    -3

    0,50

    1200 – 1500

    0,94

    14

    0,83

    0,16

    16

    -2

    0,25

    1500 – 1800

    1,42

    6

    0,92

    0,09

    9

    -3

    1,00

    1800 –




    10

    1,00

    0,08

    8

    2

    0,50

    Сумма Σ




    100




    1







    3,44

    Таблица 12

    =0,06+1,07+0,06+0,50+0,25+1,00+0,50=3,44.

    Пояснения по составлению таблицы. Интервалы начинаются с , т.к. функция плотности нормального распределения определена на всей оси . Последние три интервала объединим в один, т.к. в каждом из них было . Полученный интервал также имеет число значений , поэтому объединим его с четвертым с конца интервалом. Во втором столбце приведенной ниже таблицы с точностью до 0,01 подсчитаны отношения для правых концов интервалов. Из таблицы, приведенной в Приложении 1, по значениям интеграла вероятностей выписываем в четвертый столбец. В пятом столбце с точностью до 0,01 подсчитаны при нулевой гипотезе вероятности попадания в интервалы , для . Например, , и т.д., причем .

    Из таблицы распределения , приведенной в

    Приложении 3, по уровню значимости и числу степеней свободы находим .

    Сравниваем и . Получаем, что 3,44<7,78, т.е < .

    Следовательно, нет оснований отвергать нулевую гипотезу о нормальном распределении на уровне значимости .
    ІІ. Применение критерия Колмогорова.

    Подсчитаем . Вычисления представим в таблице:


    Интервалы













    -300

    17

    0,17

    -0,99

    0,16

    0,01

    300-600

    19

    0,36

    -0,51

    0,31

    0,05

    600-900

    19

    0,55

    -0,03

    0,49

    0,06

    900-1200

    15

    0,70

    0,45

    0,67

    0,03

    1200-1500

    14

    0,84

    0,94

    0,82

    0,02

    1500-1800

    6

    0,90

    1,42

    0,92

    0,02

    1800-

    10

    1,00




    1,00

    0,00

    Сумма Σ

    100










    D=0,06

    Таблица 13

    Определив меру расхождения между теоретическим и эмпирическим распределением вычисляем величину

    =0,06 =0,6.

    По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, не противоречит опытным данным.
    § 6. Замечания.

    Рассмотренный пример показывает, что один и тот же набор данных описывается, согласно критерию Колмогорова, любым из трех рассмотренных распределений, а согласно критерию Пирсона - распределением Вейбулла и нормальным. Данный факт объясняется в § 4. Главы 2.

    Нам из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода правок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, то получим завышенное значение вероятности , а значит, большее критическое значение . В результате принимаем нулевую гипотезу о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.

    Т.к. при проверке гипотезы о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода (возможность отвергнуть правильную гипотезу), но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т.е. с возможностью совершения ошибки второго рода.

    Таким образом, в данной ситуации критерий Пирсона указывает на нормальное распределение и распределение Вейбулла. Отметим, что в случае распределения Вейбулла =1,86, в случае нормального распределения =3,86, а =7,8, т.к. опытное значение для распределения Вейбулла меньше, то остановимся на распределение Вейбулла.

    Вывод: будем считать, что данный набор значений случайной величины описывается с помощью распределения Вейбулла.
    § 7. Применение вычислительной техники.

    Современное развитие вычислительной техники существенно упрощает и ускоряет процесс анализа опытных данных. Так, например, с помощью электронных таблиц можно облегчить решение вопроса о виде распределения на стадии проверки гипотезы по критерию Пирсона и по критерию Колмогорова.

    Проиллюстрируем работу с электронными таблицами на конкретном примере.

    Задание. Необходимо изучить изменение выработки на одного рабочего механического цеха в отчетном году по сравнению с предыдущим. Получены следующие данные о распределении 100 рабочих цеха по выработке в отчетном году (в процентах к предыдущему году): 119,0; 120,9; 121,5; 112,1; 134,7; 97,0; 125,6; 130,2; 97,8; 128,3; 99,1; 100,0; 100,9; 114,1; 105,6; 120,3; 102,4; 105,8; 132,9; 113,6; 100,1; 125,5; 122,2; 118,8; 119,9; 121,2; 123,3; 103,8; 135,6; 126,3; 112,1; 115,0; 120,0; 123,3; 120,8; 116,2; 106,5; 124,3; 123,5; 119,6; 120,0; 122,9; 121,0; 107,9; 129,9; 115,1; 116,3; 117,2; 108,2; 115,0; 124,9; 126,3; 128,3; 129,6; 131,6; 110,3; 125,5; 118,9; 120,0; 121,1; 107,6; 106,9; 129,6; 110,2; 119,0; 119,6; 111,8; 125,0; 131,8; 108,6; 117,2; 13,5; 119,6; 123,3; 107,3; 129,6; 133,3; 116,1; 113,6; 123,2; 128,7; 122,3; 115,4; 116,3; 113,0; 121,1; 122,0; 135,2; 108,4; 138,0; 126,0; 141,0; 126,4; 132,2; 136,9; 127,2; 126,1; 117,5; 116,2; 113,5.
    Решение. Для решения воспользуемся электронными таблицами. Имеющиеся числовые данные внесем в первый столбец таблицы, затем выберем функцию «Сортировка и фильтр» и с помощью операции «Сортировка от минимума к максимуму» расположим элементы в порядке возрастания. В результате получим столбец, элементы которого выписаны в таблице 14.

    Первый элемент в таблице является минимальным, а последний – максимальным. Т.о. , , тогда и .

    Берем . И заполняем таблицу 15. Первый и третий столбики таблицы заполняются вручную, а остальные с помощью задания формулы в первой строке и функции заполнить вниз. Три нижние строки заполняются в виде формул:


    97

    97,8

    99,1

    100

    100,1

    100,9

    102,4

    103,8

    105,6

    105,8

    106,5

    106,9

    107,3

    107,6

    107,9

    108,2

    108,4

    108,6

    110,2

    110,3

    111,8

    112,1

    112,1

    113

    113,54

    113,6

    113,6

    114,1

    115

    115

    115,1

    115,4

    116,1

    116,2

    116,2

    116,3

    116,3

    117,2

    117,2

    117,5

    118,8

    118,9

    119

    119

    119,6

    119,6

    119,6

    119,9

    120

    120

    120

    120,3

    120,8

    120,9

    121

    121,1

    121,1

    121,2

    121,5

    122

    122,2

    122,3

    122,9

    123,2

    123,3

    123,3

    123,3

    123,5

    124,3

    124,9

    125

    125,5

    125,5

    125,6

    126

    126,1

    126,3

    126,3

    126,4

    127,2

    128,3

    128,3

    128,7

    129,6

    129,6
    129,6129,9
    130,2131,6

    131,8

    132,2

    132,9

    133,3

    134,7

    135,2

    135,6

    136,9

    138

    141

    141




    Таблица 14


    Интервалы

    Середины интервалов

    Часто-ты





    95 – 99,5

    97,25

    3

    291,75

    1446,725

    99,5 – 104

    101,75

    5

    508,75

    1524,258

    104 – 108,5

    106,25

    9

    956,25

    1511,654

    108,5 – 113

    110,75

    7

    775,25

    501,0012

    113 – 117,5

    115,25

    16

    1844

    250,9056

    117,5 – 122

    119,75

    20

    2395

    5,832

    122 – 126,5

    124,25

    19

    2360,75

    482,6304

    126,5 – 131

    128,75

    9

    1158,75

    819,1044

    131 – 135,5

    133,25

    7

    932,75

    1379,851

    135,5 – 140

    137,75

    3

    413,25

    1031,195

    140 – 144,5

    142,25

    2

    284,5

    1061,683









































    Таблица 15

    Создадим еще один столбец, куда внесем . Выделив полученный столбец, обратимся к функции «Вставка», затем выберем пункт «Диаграмма» и далее - «гистограмма». В результате получим гистограмму, которая дает представление о графике плотности распределения случайной величины (см. рис.17).


    95 99,5 104 108,5 113 117,5 122 126,5 131 135,5 140 144,5

















































































































































































































































































































































































































































































    Рис. 17

    Чтобы построить график функции распределения создадим столбец , выделим его и затем выберем в пункте «Диаграмма» подпункт «График». Получим рис.18.



























































































































































































































































    Рис.18

    Доверительный интервал для математического ожидания случайной величины получаем следующий: .

    Гистограмма опытных значений Х похожа на график плотности нормального распределения. По опытному значению коэффициента вариации (см. Приложение 2) распределение является нормальным. Высказываем нулевую гипотезу : Х имеет нормальное распределение с и . Проверим эту гипотезу на уровне значимости

    В электронных таблицах заполним первый столбик значениями левых концов интервалов, а второй значениями правых концов, при этом в первую ячейку первого столбика поместим , а в последнюю . Два первых интервала объединим в один, т.к. число элементов в первом интервале меньше 5. Два последних интервала объединим в один, так как число элементов в каждом из них меньше 5. В третий столбец внесем . Четвертый столбец заполняем обращаясь к заданию формулы с помощью следующей последовательности действий: выбираем «функция», «статистические», «норм.распр.». В качестве аргумента выбираем правый конец интервала, математическое ожидание и среднее квадратическое отклонение указываем в соответствии с задачей, логическое значение «истина». В пятом столбце подсчитаем , присвоив первому элементу значение , а далее

    В шестом столбике зададим формулу . Подсчитав с помощью операции суммирования сумму элементов седьмого столбца, получим . Полученная таблица аналогична таблице 16.

    Из таблицы распределения (см. Приложение 3) по уровню значимости и числу степеней свободы находим .

    Левый конец

    Правый конец








    104

    8

    0,06413

    0,06413

    0,392733

    104

    108,5

    9

    0,142085

    0,077955

    0,186117

    108,5

    113

    7

    0,2673

    0,125215

    2,434776

    113

    117,5

    16

    0,432112

    0,164812

    0,01405

    117,5

    122

    20

    0,609878

    0,177766

    0,278099

    122

    126,5

    19

    0,766999

    0,157122

    0,687996

    126,5

    131

    9

    0,880801

    0,113802

    0,497816

    131

    135,5

    7

    0,948343

    0,067543

    0,008941

    135,5



    5

    1

    0,051657

    0,005312













    1

    4,50584



















    Таблица 16
    Сравнивая и , получаем, что < Следовательно гипотеза о нормальном распределении на выбранном уровне значимости подтверждается опытным путем. Т.о., с помощью критерия Пирсона, проверена гипотеза о нормальном распределении.

    Проведем проверку, выдвинутой гипотезы с помощью критерия Колмогорова. Заполняем таблицу. Первый, второй, третий и четвертый столбцы заполняются также как и в случае критерия Пирсона. В пятом столбце подсчитываем , а в шестой столбец внесем . Получаем таблицу вида, аналогичного таблице 17.

    Левый конец

    Правый конец








    104

    8

    0,06413

    0,08

    0,01587

    104

    108,5

    9

    0,142085

    0,17

    0,027915

    108,5

    113

    7

    0,2673

    0,24

    0,0273

    113

    117,5

    16

    0,432112

    0,4

    0,032112

    117,5

    122

    20

    0,609878

    0,6

    0,009878

    122

    126,5

    19

    0,766999

    0,79

    0,023001

    126,5

    131

    9

    0,880801

    0,88

    0,000801

    131

    135,5

    7

    0,948343

    0,95

    0,001657

    135,5



    5

    1

    1

    0
















    0,032112



















    Таблица 17

    Найдя максимальный из элементов шестого столбца, получаем =

    По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, не противоречит опытным данным. Т.о. с помощью критерия Колмогорова проверена гипотеза о нормальном распределении.
    Попробуем выдвинуть гипотезу, что рассматриваемая закономерность описывается показательным распределением. Воспользуемся критерием Пирсона. Заполним таблицу 18.

    Левый конец

    Правый конец






    0

    104

    8

    0,582057

    0,582057

    43,30524

    104

    108,5

    9

    0,59754

    0,015483

    35,86484

    108,5

    113

    7

    0,612449

    0,014909

    20,35672

    113

    117,5

    16

    0,626806

    0,014357

    147,7483

    117,5

    122

    20

    0,64063

    0,013825

    250,7143

    122

    126,5

    19

    0,653943

    0,013313

    234,4986

    126,5

    131

    9

    0,666763

    0,01282

    46,46625

    131

    135,5

    7

    0,679108

    0,012345

    26,92749

    135,5



    5

    1

    0,320892

    22,86831













    1

    828,75005



















    Таблица 18

    Получаем, что . Из таблицы (см. Приложение 3) распределения по уровню значимости и числу степеней свободы находим . Сравнивая и , получаем, что > , следовательно гипотеза о показательном распределении на выбранном уровне значимости отвергается опытным путем. Т.о. с помощью критерия Пирсона отвергнута гипотеза о показательном распределении.

    Проведем проверку, выдвинутой гипотезы с помощью критерия Колмогорова. Заполняем таблицу.

    Левый конец

    Правый конец






    0

    104

    8

    0,582057

    0,08

    0,502057

    104

    108,5

    9

    0,59754

    0,17

    0,42754

    108,5

    113

    7

    0,612449

    0,24

    0,372449

    113

    117,5

    16

    0,626806

    0,4

    0,226806

    117,5

    122

    20

    0,64063

    0,6

    0,04063

    122

    126,5

    19

    0,653943

    0,79

    0,136057

    126,5

    131

    9

    0,666763

    0,88

    0,213237

    131

    135,5

    7

    0,679108

    0,95

    0,270892

    135,5



    5

    1

    1

    0
















    0,502057



















    Таблица 19

    Найдя максимальный из элементов шестого столбца, получаем =0,502 =5,02.

    По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, противоречит опытным данным. Т.о. с помощью критерия Колмогорова гипотеза о показательном распределении также отвергнута.

    Ответ: данный набор значений случайной величины описывается с помощью нормального распределения.

    Рассмотренный выше пример не только проиллюстрировал способ решения задачи с использованием электронных таблиц, но также показал, как отвергается неверно выдвинутая гипотеза.
    1   2   3   4   5   6   7   8   9   ...   17


    написать администратору сайта