статистическая обработка данных. основы статистической обработки опытных даных. Учебнометодическое пособие Нижний Новгород 2011 Трегубова Е. В. Основы статистической обработки опытных данных. Учебнометодическое пособие
Скачать 1.63 Mb.
|
§ 5. Проверка гипотезы о нормальном распределении случайной величины. По данным рассмотренного выше примера выдвинем гипотезу о виде распределения и проверим ее на уровне значимости по критерию согласия и по критерию Колмогорова. Гистограмма опытных значений похожа на плотность нормального распределения, поэтому выдвигаем гипотезу о том, что распределение является нормальным. В данном параграфе приведем методику подсчета в случае гипотезы о том, что данное распределение является нормальным. Подсчеты произведем для рассмотренного выше распределения. Высказываем нулевую гипотезу : имеет нормальное распределение, плотность вероятности которого описывается формулой , где - математическое ожидание, т.е , σ - среднее квадратическое отклонение случайной величины. Параметры нормального закона и σ неизвестны, поэтому заменяем их «наилучшими» оценками по выборке – несмещенными и состоятельными оценками соответственно выборочной средней и «исправленным» средним квадратическим отклонением. Таким образом, , . Отметим, что в случае, когда число наблюдений достаточно велико (как в примере ), то вместо «исправленного» среднего квадратического отклонения можно взять выборочное среднее квадратическое отклонение . І. Применение критерия Пирсона. Подсчитаем - опытное значение критерия . Вычисления представим в виде таблицы.
Таблица 12 =0,06+1,07+0,06+0,50+0,25+1,00+0,50=3,44. Пояснения по составлению таблицы. Интервалы начинаются с , т.к. функция плотности нормального распределения определена на всей оси . Последние три интервала объединим в один, т.к. в каждом из них было . Полученный интервал также имеет число значений , поэтому объединим его с четвертым с конца интервалом. Во втором столбце приведенной ниже таблицы с точностью до 0,01 подсчитаны отношения для правых концов интервалов. Из таблицы, приведенной в Приложении 1, по значениям интеграла вероятностей выписываем в четвертый столбец. В пятом столбце с точностью до 0,01 подсчитаны при нулевой гипотезе вероятности попадания в интервалы , для . Например, , и т.д., причем . Из таблицы распределения , приведенной в Приложении 3, по уровню значимости и числу степеней свободы находим . Сравниваем и . Получаем, что 3,44<7,78, т.е < . Следовательно, нет оснований отвергать нулевую гипотезу о нормальном распределении на уровне значимости . ІІ. Применение критерия Колмогорова. Подсчитаем . Вычисления представим в таблице:
Таблица 13 Определив меру расхождения между теоретическим и эмпирическим распределением вычисляем величину =0,06 =0,6. По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, не противоречит опытным данным. § 6. Замечания. Рассмотренный пример показывает, что один и тот же набор данных описывается, согласно критерию Колмогорова, любым из трех рассмотренных распределений, а согласно критерию Пирсона - распределением Вейбулла и нормальным. Данный факт объясняется в § 4. Главы 2. Нам из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода правок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, то получим завышенное значение вероятности , а значит, большее критическое значение . В результате принимаем нулевую гипотезу о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным. Т.к. при проверке гипотезы о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода (возможность отвергнуть правильную гипотезу), но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т.е. с возможностью совершения ошибки второго рода. Таким образом, в данной ситуации критерий Пирсона указывает на нормальное распределение и распределение Вейбулла. Отметим, что в случае распределения Вейбулла =1,86, в случае нормального распределения =3,86, а =7,8, т.к. опытное значение для распределения Вейбулла меньше, то остановимся на распределение Вейбулла. Вывод: будем считать, что данный набор значений случайной величины описывается с помощью распределения Вейбулла. § 7. Применение вычислительной техники. Современное развитие вычислительной техники существенно упрощает и ускоряет процесс анализа опытных данных. Так, например, с помощью электронных таблиц можно облегчить решение вопроса о виде распределения на стадии проверки гипотезы по критерию Пирсона и по критерию Колмогорова. Проиллюстрируем работу с электронными таблицами на конкретном примере. Задание. Необходимо изучить изменение выработки на одного рабочего механического цеха в отчетном году по сравнению с предыдущим. Получены следующие данные о распределении 100 рабочих цеха по выработке в отчетном году (в процентах к предыдущему году): 119,0; 120,9; 121,5; 112,1; 134,7; 97,0; 125,6; 130,2; 97,8; 128,3; 99,1; 100,0; 100,9; 114,1; 105,6; 120,3; 102,4; 105,8; 132,9; 113,6; 100,1; 125,5; 122,2; 118,8; 119,9; 121,2; 123,3; 103,8; 135,6; 126,3; 112,1; 115,0; 120,0; 123,3; 120,8; 116,2; 106,5; 124,3; 123,5; 119,6; 120,0; 122,9; 121,0; 107,9; 129,9; 115,1; 116,3; 117,2; 108,2; 115,0; 124,9; 126,3; 128,3; 129,6; 131,6; 110,3; 125,5; 118,9; 120,0; 121,1; 107,6; 106,9; 129,6; 110,2; 119,0; 119,6; 111,8; 125,0; 131,8; 108,6; 117,2; 13,5; 119,6; 123,3; 107,3; 129,6; 133,3; 116,1; 113,6; 123,2; 128,7; 122,3; 115,4; 116,3; 113,0; 121,1; 122,0; 135,2; 108,4; 138,0; 126,0; 141,0; 126,4; 132,2; 136,9; 127,2; 126,1; 117,5; 116,2; 113,5. Решение. Для решения воспользуемся электронными таблицами. Имеющиеся числовые данные внесем в первый столбец таблицы, затем выберем функцию «Сортировка и фильтр» и с помощью операции «Сортировка от минимума к максимуму» расположим элементы в порядке возрастания. В результате получим столбец, элементы которого выписаны в таблице 14. Первый элемент в таблице является минимальным, а последний – максимальным. Т.о. , , тогда и . Берем . И заполняем таблицу 15. Первый и третий столбики таблицы заполняются вручную, а остальные с помощью задания формулы в первой строке и функции заполнить вниз. Три нижние строки заполняются в виде формул:
Таблица 14
Таблица 15 Создадим еще один столбец, куда внесем . Выделив полученный столбец, обратимся к функции «Вставка», затем выберем пункт «Диаграмма» и далее - «гистограмма». В результате получим гистограмму, которая дает представление о графике плотности распределения случайной величины (см. рис.17).
Рис. 17 Чтобы построить график функции распределения создадим столбец , выделим его и затем выберем в пункте «Диаграмма» подпункт «График». Получим рис.18.
Рис.18 Доверительный интервал для математического ожидания случайной величины получаем следующий: . Гистограмма опытных значений Х похожа на график плотности нормального распределения. По опытному значению коэффициента вариации (см. Приложение 2) распределение является нормальным. Высказываем нулевую гипотезу : Х имеет нормальное распределение с и . Проверим эту гипотезу на уровне значимости В электронных таблицах заполним первый столбик значениями левых концов интервалов, а второй значениями правых концов, при этом в первую ячейку первого столбика поместим , а в последнюю . Два первых интервала объединим в один, т.к. число элементов в первом интервале меньше 5. Два последних интервала объединим в один, так как число элементов в каждом из них меньше 5. В третий столбец внесем . Четвертый столбец заполняем обращаясь к заданию формулы с помощью следующей последовательности действий: выбираем «функция», «статистические», «норм.распр.». В качестве аргумента выбираем правый конец интервала, математическое ожидание и среднее квадратическое отклонение указываем в соответствии с задачей, логическое значение «истина». В пятом столбце подсчитаем , присвоив первому элементу значение , а далее В шестом столбике зададим формулу . Подсчитав с помощью операции суммирования сумму элементов седьмого столбца, получим . Полученная таблица аналогична таблице 16. Из таблицы распределения (см. Приложение 3) по уровню значимости и числу степеней свободы находим .
Таблица 16 Сравнивая и , получаем, что < Следовательно гипотеза о нормальном распределении на выбранном уровне значимости подтверждается опытным путем. Т.о., с помощью критерия Пирсона, проверена гипотеза о нормальном распределении. Проведем проверку, выдвинутой гипотезы с помощью критерия Колмогорова. Заполняем таблицу. Первый, второй, третий и четвертый столбцы заполняются также как и в случае критерия Пирсона. В пятом столбце подсчитываем , а в шестой столбец внесем . Получаем таблицу вида, аналогичного таблице 17.
Таблица 17 Найдя максимальный из элементов шестого столбца, получаем = По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, не противоречит опытным данным. Т.о. с помощью критерия Колмогорова проверена гипотеза о нормальном распределении. Попробуем выдвинуть гипотезу, что рассматриваемая закономерность описывается показательным распределением. Воспользуемся критерием Пирсона. Заполним таблицу 18.
Таблица 18 Получаем, что . Из таблицы (см. Приложение 3) распределения по уровню значимости и числу степеней свободы находим . Сравнивая и , получаем, что > , следовательно гипотеза о показательном распределении на выбранном уровне значимости отвергается опытным путем. Т.о. с помощью критерия Пирсона отвергнута гипотеза о показательном распределении. Проведем проверку, выдвинутой гипотезы с помощью критерия Колмогорова. Заполняем таблицу.
Таблица 19 Найдя максимальный из элементов шестого столбца, получаем =0,502 =5,02. По таблице из Приложения 5 находим критическое значение определенное на уровне значимости α=0,1: =1,22. Т.к. , то считают, что нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, противоречит опытным данным. Т.о. с помощью критерия Колмогорова гипотеза о показательном распределении также отвергнута. Ответ: данный набор значений случайной величины описывается с помощью нормального распределения. Рассмотренный выше пример не только проиллюстрировал способ решения задачи с использованием электронных таблиц, но также показал, как отвергается неверно выдвинутая гипотеза. |