твмс. ТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20). Контрольная работа выполняется и оформляется при соблюдении следующих правил
Скачать 2.47 Mb.
|
Лемма Неймана−Пирсона. При заданном уровне значимости мощность M = 1 – статистического критерия К = f должна быть максимальной: (1) (2) где k = — выборочное значение статистического критерия K = — вероятность ошибки 2-го рода, — вероятность ошибки 1-го рода, — вероятность попадания выборочного значения статистического критерия в критическую область при условии истинности основной гипотезы Ho; — вероятность попадания выборочного значения статистического критерия в критическую область при условии истинности альтернативной гипотезы H1. Из изложенного следует правило согласия на уровне доверия γ = 1 – : eсли то гипотезу Ho следует отклонить, как не согласующуюся с результатами наблюдений; если то гипотезу Ho принять, как не противоречащую результатам наблюдений. 2. Общее правило проверки статистической гипотезы Н0 Для того, чтобы на основании результатов независимых наблюдений генеральной совокупности Х сделать заключение о принятии или отклонении гипотезы Ho, необходимо выполнить следующую последовательность действий: 1. Сформулировать проверяемую основную гипотезу Ho и альтернативную гипотезу H1. 2. Задать уровень значимости . 3. Выбрать статистический критерий K = для проверки гипотезы Ho. 4. Установить функцию распределения F(k|Ho) статистического критерия K = при условии, что гипотеза Ho истинна. 5. Построить, в зависимости от формулировки гипотезы H1, критическую область значений k = статистического критерия K = . 6. Получить выборку результатов наблюдений генеральной совокупности Х. 7. Вычислить выборочное значение k = статистического критерия . 8. Сделать заключение о принятии или отклонении гипотезы Ho о генеральной совокупности Х в соответствии с правилом согласия на уровне доверия = 1 – . 3. Критерий согласия 2. Теорема Пирсона. Теорема Фишера. Исследование генеральной совокупности Х на основе выборки предполагает решение двух задач: 1) оценка неизвестных значений параметров известного распределения генеральной совокупности Х, 2) получение наиболее полной, исчерпывающей характеристики генеральной совокупности Х — закона F(x) ее распределения. Рассмотрим вторую задачу, называемую задачей о проверке непараметрической гипотезы Ho о виде закона распределения генеральной совокупности Х. Вопрос: можно ли принять гипотезу Ho о том, что генеральная совокупность Х имеет некоторое предполагаемое, гипотетическое распределение, например, равномерное, экспоненциальное, нормальное, биномиальное, распределение Пуассона или какое-либо иное? Возможна эквивалентная по смыслу другая формулировка вопроса: не противоречат ли (или согласуются ли) результаты наблюдений (опытные данные) в случайной выборке из генеральной совокупности Х гипотезе Ho о некотором гипотетическом виде закона распределения генеральной совокупности Х? Альтернативная гипотеза H1 хотя явно и не высказана, но подразумевается, как предположение о возможном другом виде закона распределения, отличном от предлагаемого и проверяемого на основе выборки. Для получения ответа необходимо прежде всего сформулировать основную гипотезу Ho о виде закона F(x) распределения исследуемой генеральной совокупности Х (случайной величины Х). Гипотеза Ho, а также альтернативная ей H1, формулируется на основе всей имеющейся информации о случайной величине Х: представлений о физическом характере величины Х, геометрической формы гистограммы, обоснованных в соответствующих теоремах утверждений. Следует учитывать, например, что гипотезе Ho о нормальном законе противостоит гипотеза H1 об усеченном нормальном законе, логистическом законе, законах Коши или Стьюдента; с экспоненциальным законом конкурируют законы 2 (хи – квадрат), Вейбулла, гамма, Эрланга, смещенный показательный закон. Решение поставленной задачи основано на применении статистических критериев: при малых объемах выборки (n < 50) применяются, например, критерий Колмогорова и критерий 2 (омега – квадрат); при n 50 в практике исследователей часто используется критерий согласия Пирсона (другой термин «критерий согласия 2 (хи-квадрат)»). Критерий согласия 2 разработан Пирсоном (1900 г.) для случая гипотетической функции распределения F(x), когда параметры ее известны. Критерийсогласия 2 образуется следующим образом. Пусть случайная величина Х распределена на всей действительной оси. Разобьем исследуемую генеральную совокупность Х (множество значений случайной величины Х) на k не пересекающихся подмножеств: (3) где 1 и k — полубесконечные промежутки, а — полуоткрытые промежутки. При промежутки i, за исключением крайних, могут быть различной длины, а их число k может быть любым. Но поскольку n конечно, то данное утверждение нуждается в коррекции, а именно, длины промежутков удобно сделать равными, а число k согласовать с n по полуэмпирической формуле (4) или по формуле Старджесса (5) Обозначим через вероятность попадания случайной величины Х на i промежуток (6) Тогда (7) Пусть — частоты попадания элементов выборки на промежутки соответственно. Очевидно, что в случае истинности основной гипотезы Ho относительные частоты будут близки к вероятностям pi, причем, чем больше n, тем ближе: (8) Отсюда следует, что за меру отклонения выборочного распределения от гипотетического с функцией распределения F(x) можно выбрать величину (9) где ci — некоторые положительные «весовые» числа, отвечающие за долю каждой из величин в общей сумме. Пирсон в качестве «весовых» чисел принял числа (10) предложил статистику критерия 2, обозначая ее тем же символом (11) и доказал теорему. Теорема Пирсона. Статистика (11) критерия 2 асимптотически при распределена по закону 2 с числом степеней свободы k – 1. Другими словами, независимо от вида проверяемого гипотетического закона распределения генеральной совокупности Х, т.е. функции F(x), эмпирическая (выборочная) функция распределения статистики 2 при стремится к функции распределения случайной величины 2 с плотностью вероятности (12) где — гамма функция. Применение закона распределения для проверки гипотезы Н0 осуществляется с помощью квантилей этого закона. Квантилью порядка распределения случайной величины называется число удовлетворяющее уравнению Таблица квантилей распределения приведена в прил. 5. Понятие числа k – 1 степеней свободы статистики 2 (11) происходит от понятия числа степеней свободы функции, под которым понимают число независимых аргументов функции. Аргументами статистики 2 являются частоты n1, n2,…,nk, связанные одной связью n1 + n2 + … + nk = n, которая также входит в формулу статистики 2 и позволяет выразить каждую из частот через все остальные и тем самым уменьшает число независимых аргументов статистики 2 на единицу. Правило проверки гипотезы Нo о виде закона распределения генеральной совокупности на основе статистики критерия 2 составляется в соответствии с общим правилом проверки статистической гипотезы Нo: 1. Формулируем основную Нo и альтернативную Н1 гипотезы и задаем уровень значимости . 2. Строим промежутки , . 3. Находим частоты попадания элементов выборки в промежутки i, i = 1,…,k. 4. При помощи гипотетической функции распределения F(x) вычисляем вероятности (13) 5. Проверяем условие (14) для каждого промежутка i, i = 1,…,k. Если (14) для какого-либо промежутка i не выполняется, то объединяем соседние промежутки и тем самым обеспечиваем достаточную численность элементов выборки в промежутке i. Тогда величины будут близки к нормальным , а их квадраты образуют статистику 2, распределенную по закону, близкому к 2. 6. Вычисляем наблюдаемое выборочное значение статистики критерия 2: (15) 7. По таблице (прил. 5) находим квантиль распределения 2 с k – 1 степенями свободы и порядка квантили и таким образом строим критическую область (16) и область доверия : (16) статистики 2. 8. В соответствии с правилом согласия на уровне доверия составляем заключение: а) если то гипотеза Нo принимается; б) если то гипотеза Нo отвергается, выбирается одно из альтернативных распределений и процедура проверки повторяется. При составлении заключения необходимо учесть возможность получения более четкого решения о принятии или отклонении гипотезы Нo при увеличении n. Такая возможность следует из выражения (11), поскольку с увеличением n в случае ложной гипотезы Нo будет увеличиваться при фиксированном значении границы разделяющей все множество значений статистики 2 на доверительную и критическую области. Критерий согласия 2 и теорему Пирсона уточнил Фишер (1924 г.) для широко распространенного на практике случая, когда параметры гипотетической функции распределения F(x) неизвестны и оцениваются на основе имеющейся выборки по методу максимального правдоподобия. Фишер установил, что оценивание неизвестных параметров накладывает дополнительные связи на частоты и уменьшает число степеней свободы статистики критерия 2. |