Лекция+2. 1. 1 Статистическая гипотеза и общая схема ее проверки
Скачать 21.18 Kb.
|
1 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 1.1 Статистическая гипотеза и общая схема ее проверки Прежде чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверенности, лежащий в основе применения выводов и рекомендаций с помощью теории вероятностей и математической статистики. Если вероятность события А в данном испытании очень мала, то при однократном выполнении испытания можно быть уверенным в том, что событие А не произойдет, и в практической деятельности вести себя так, как будто событие А вообще невозможно. Этот принцип не может быть доказан математически; он подтверждается всем практическим опытом человеческой деятельности, и мы постоянно (хотя и бессознательно) им руководствуемся. Например, отправляясь самолетом в другой город, мы не рассчитываем на возможность погибнуть в авиационной катастрофе, хотя некоторая (весьма малая) вероятность такого события все же имеется. Принцип практической уверенности о невозможности маловероятных событий сформулирован «при однократном выполнении испытания». Если же произведено много испытаний, в каждом из которых вероятность события А даже очень мала, то существенно повышается вероятность того, что событие А произойдет хотя бы один раз в массе испытаний, действительно, пусть вероятность Р(А) = α, где α<1. Тогда вероятность события В, состоящего в том, что событие А произойдет хотя бы один раз в n независимых испытаниях, равна: Р(В)=1-(1- α)n ≈1-(1-nα)= nα, т.е. вероятность Р(В) увеличилась по сравнению с Р(А) в n раз. Таким образом, при многократном повторении испытаний мы уже не можем считать маловероятное событие А практически невозможным. Вопрос о том, насколько мала должна быть вероятность α события А, чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события А. В одних случаях считается возможным пренебрегать событиями, имеющими вероятность меньше 0,05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т.п., нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0,001. С теорией статистического оценивания параметров тесно связана проверка статистических гипотез. Она используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе вносимого удобрения, лекарства, об уровне доходности ценных бумаг, о значимости математической модели и т.д. Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения. Различают простую и сложную статистические гипотезы. Простая гипотеза, в отличие от сложной, полностью определяет теоретическую функцию распределения случайной величины. Например, гипотезы «вероятность появления события в схеме Бернулли равна 1/2», «закон распределения случайной величины нормальный с параметрами а=0, σ2=1» являются простыми, а гипотезы «вероятность появления события в схеме Бернулли заключена между 0,3 и 0,6», «закон распределения не является нормальным» — сложными. Проверяемую гипотезу обычно называют нулевой (или основной) и обозначают Н0. Наряду с нулевой гипотезой Но рассматривают альтернативную, или конкурирующую, гипотезу Н1, являющуюся логическим отрицанием Н0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Суть проверки статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) θ̃n(х1 ..., хn,), полученная по выборке Х1, ..., Хn, точное или приближенное распределение которой известно. Затем по этому выборочному распределению определяется критическое значение θkp —такое, что если гипотеза Н0 верна, то вероятность Р(θ̃n >θkр ,) = α мала; так что в соответствии с принцпом практической уверенности в условиях данного исследования событие θ̃n >θkр можно (с некоторым риском) считать практически невозможным. Поэтому если в данном конкретном случае обнаруживается значение статистики θ̃n >θkр ,то гипотеза Н0 отвергается,в то время как появление значения θ̃n ≤θkр считается совместимым с гипотезой Н0, которая тогда принимается (точнее ,не отвергается ). Правило, по которому гипотеза Н0 отвергается или принимается, называется статистическим критерием или статистическим тестом. Таким образом, множество возможных значений статистики критерия (критической статистики) θ̃n разбивается на два непересекающихся подмножества : критическую область (область отклонения гипотезы)W и область допустимых значений (область принятия гипотезы ) . Если фактически наблюдаемое значение статистики критерия попадает в критическую область W, то гипотезу Н0 отвергают. При этом возможны четыре случая (таблица 1.1). Таблица 1.1
Вероятность α допустить ошибку 1-го рода, т.е. отвергнуть гипотезу Н0, когда она верна, называется уровнем значимости, или размером, критерия. Вероятность допустить ошибку 2-го рода, т.е. принять гипотезу Н0, когда она неверна, обычно обозначают β. Вероятность (1- β ) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу Н0, когда она неверна, называется мощностью критерия. Пользуясь терминологией статистического контроля качества продукции, можно сказать, что вероятность α представляет «риск поставщика», связанный с забраковкой по результатам выборочного контроля изделий всей партии,удовлетворяющей стандарту,а вероятность β-«риск потребителя»,связанный с принятием по анализу выборки партии, не удовлетворяющей стандарту. Применяя юридическую терминологию, α-вероятность вынесения судом обвинительного приговора, когда на самом деле обвиняемый невиновен, β-вероятность вынесения судом оправдательного поиговора,когда обвиняемый на самом деле виновен в совершении приступления.В ряде прикладных исследований ошибка первого рода α означает вероятность того, что предназначавшийся наблюдателю сигнал не будет им принят, а ошибка второго рода β –вероятность того,что наблюдатель примет ложный сигнал. Возможностью двойной ошибки (1-го и 2-го рода) проверка гипотез отличается от рассматриваемого выше интервального оценивания параметров, в котором имелась лишь одна возможность ошибки: получение доверительного интервала, который на самом деле не содержит оцениваемого параметра. |