МЕТОДЫ ПЛАНИРОВАНИЯ. Металлургия Екатеринбург 2015
Скачать 7.01 Mb.
|
Рис. 3.3. Плотность (аи функция (б) распределения Стьюдента Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 66 Следовательно, интервал (3.31) является доверительным интервалом для математического ожидания M x случайной величины с нормальным законом распределения, построенным с доверительной вероятностью P = 1 – α, при неизвестном значении генеральной дисперсии Значения t α,m табулированы (см, например, [11] или табл. П, их можно определить также, воспользовавшись статистической функцией СТЬЮДЕНТ.ОБР.2Х из электронных таблиц Microsoft Excel, причем при m > 30 t α,m ≈ z 1- α/2 . Так, при α = 0,05 и m = 31 СТЬЮДЕНТ.ОБР.2Х(0,05;31) = 2,039515, а НОРМ.СТ.ОБР (1-0,05/2) = 1,959961. Если в примере 3.1 потрем) выборочным значениями (первый рельс - 362 HB x ; 85 , 9 HB S ) было бы необходимо при α = 0,05 построить доверительный интервал для математического ожидания твердости на поверхности катания головки рельса, то, если предположить, что твердость не противоречит нормальному закону распределения, и поскольку t 0,05,2 ≈ 4,3 (СТЬЮ- ДЕНТ.ОБР.2Х (0,05;2) = 4,302656), он оказался бы равным 3 85 , 9 3 , 4 362 3 85 , 9 3 , 4 362 HB M , или 45 , 24 Следовательно, интервал [337,55; 386,45] с вероятностью 1 – 0,05 = 0,95 накрывает математическое ожидание твердости на поверхности катания головки рельса. Расчет теоретического значения критерия Стьюдента в вероятностном калькуляторе пакета Statistica приведен на рис. 3.4. На рис. 3.4 показан расчет значения критерия Стьюдента («t (Student)») для вероятности 0,95 и числа степеней свободы 2: t 0.95,2 = 4,3. Параметр «df» позволяет указать число степеней свободы. Флаг «Two-tailed» отвечает за число хвостов распределения. Если выставить данную опцию, то будет рассчитываться двухстороннее распределение. Флаг «(1-Cumulative p)» позволяет рассчитать квантиль для разности 1 – вероятность. В качестве примера предположим, что нам необходимо определить правую границу для M HB Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 67 Для этого выполним расчет критерия Стьюдента для одностороннего распределения, рис. 3.5. Рис. 3.4. Калькулятор вероятностных распределений, расчет значения критерия Стьюдента, двустороннее распределение Рис. 3.5. Калькулятор вероятностных распределений, расчет значения критерия Стьюдента, односторонее распределение Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 3 85 , 9 92 , 2 362 HB M , M HB < 378,55 Следовательно, M HB с вероятностью 0,95 не превысит значения 378,55. 3.2.2. Построение доверительного интервала для дисперсии При построении доверительного интервала для дисперсии используется случайная величина 2 (читается «хи-квадрат»), , 1 2 1 2 2 2 x n i x x i S n x x (которая имеет так называемое распределение Пирсона (по имени английского математика и биолога К. Пирсона), или распределение («хи-квадрат-распределение»). Плотность распределения случайной величины 2 описывается уравнением , 0 , e 2 m 2 1 f 2 2 1 2 2 m 2 2 / m 2 2 (3.33) где Г) — гамма – функция m — число степеней свободы (при построении доверительного интервала m = n-1). На рис. 3.6 приведены кривые f( 2 ) для различных значений m. Эти кривые асимметричны, причем асимметрия особенно резко выражена при малых значениях параметра m. Так, при m =1 и 2 =0 кривая уходит в бесконечность, а при m = 2 иона достигает максимального значения, равного 0,5. При m>2 кривые имеют максимум при 2 max = m – 2. При больших значениях m (m>30) распределение переходит в нормальное со средним значением 1 2 ) ( 2 m f и дисперсией Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 69 Для построения доверительного интервала для дисперсии рассмотрим соотношение 1 2 2 2 2 ) ( 2 1 P P P P P (3.34) и с учетом (3.32) решим стоящее в скобках неравенство относительно x 2 : 1 2 2 P 2 x 2 x 2 P 2 x P P ) 1 n S 1 n S ( P 2 1 , (3.35) 2 4 6 8 10 12 14 m=10 m=4 m=2 а f( 2 ) 16 18 2 2 4 6 8 10 12 14 m=10 m=4 m=1 б 18 2 1,0 0,2 0,4 0,6 Рис. 3.6. Плотность распределения (аи функция распределения (б) 2 0,5 0,1 0,2 0,3 0,4 Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 70 где 2 P 2 x 2 x 2 P 2 x 2 1 1 n S 1 n S (3.36) есть доверительный интервал для дисперсии x 2 с доверительной вероятностью- Как и при построении доверительного интервала для математического ожидания в технических приложениях обычно принимают P 1 = /2 и P 2 =1- /2, а выбирают равным 0,1 или 0,05, реже 0,01. Квантили распределения Пирсона находят по таблицам (см. [11] или табл. Пав для этого используется функция ХИ2.ОБР.ПХ. Границы доверительного интервала для среднего квадратичного отклонения x находятся путем извлечения квадратного корня из значений доверительных границ для дисперсии. В примере 3.1 потрем выборочным значениями при α = 0,05 (P 1 = 0,05/2 = 0,025 и P 2 = 1-0,05/2 = 0,975; ХИ2.ОБР.ПХ(0,025;2) = 7,377779 и ХИ2.ОБР.ПХ(0,975;2) = 0,050636) доверительный интервал для дисперсии твердости составит 05 , 0 1 3 97 38 , 7 1 3 97 2 , или после вычислений 3880 26 2 , а доверительный интервал для среднего квадратичного отклонения будет равен 62 Расчеты теоретического значения критерия Пирсона в вероятностном калькуляторе пакета Statistica. На рисунках 3.7 и 3.8 показан расчет значения критерия Пирсо- на («Chi I») для вероятностей 0,975 и 0,025 соответственно при числе степеней свободы 2: 2 0.975,2 =7,377759 2 0.025,2 =0,050636 Параметр «df» позволяет указать число степеней свободы. Флаг «Two-tailed» в данном случае недоступен, поскольку распределение- несимметрично. Флаг «(1-Cumulative p)» позволяет рассчитать квантиль для разности 1 – вероятность. Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 71 Рис. 3.7. Калькулятор вероятностных распределений, расчет значения критерия Пирсона, расчет для вероятности 0,975 Рис. 3.8. Калькулятор вероятностных распределений, расчет значения критерия Пирсона, расчет для вероятности 0,025 Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ. Определение необходимого количества опытов при построении интервальной оценки для математического ожидания Увеличение количества измерений (числа проб, образцов и т.п.), как видно из выражений (3.27) и (3.31) даже при неизменной их точности, может увеличить доверительную вероятность P или сузить доверительный интервал ± для определения действительного значения измеряемой величины (математического ожидания. Необходимое количество измерений (образцов, проб и т.п.) n для достижения требуемой точности при заданной доверительной вероятности Р можно определить заранее в том случае, когда известно действительное значение среднеквадратичного отклонения x , а экспериментальные данные (измерения) подчиняются нормальному закону распределения. Действительно, при этих допущениях число измерений можно определить из выражения (3.27): 2 2 2 1 2 2 2 1 2 2 1 / x / x / z z z n , (3.37) где ε = Таким образом, число измерений n определяется требуемой доверительной вероятностью Р = 1 – α и относительным (по отношению к среднеквадратичному отклонению) значением половины ширины доверительного интервала , те. требуемой точностью определения измеряемой величины. Так, при Р = 0,95, z 0,975 = 1,96 и при = x число измерений равно 4. При увеличении необходимой точности измерений в 2 раза, те. сужении доверительного интервала до величины =(1/2) x , необходимое число измерений составит 16. Нетрудно заметить, что необходимое число измерений с увеличением точности возрастает в квадратичной зависимости. Как правило, действительное значение среднеквадратичной ошибки ( x ) неизвестно, а имеется только ее оценка (S x ). В этом случае следует воспользоваться соотношением (3.31), те. критерием Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 73 Стьюдента, и необходимое число измерений определять из соотношения (где ε = При расчетах поэтому уравнению следует иметь ввиду, что значение критерия Стьюдента зависит не только от , но и от числа степеней свободы m, последние же определяются числом измерений. В связи с этим уравнение (3.38) следует решать методом последовательных приближений. В качестве начального приближения можно задать, в частности, число измерений, рассчитанных по формуле (3.37). Так, если решить последнее уравнение методом последовательных приближений, то можно показать, что при P = 0,95 ( =0,05) для определения доверительного интервала с точностью =S x требуется измерений, ас точностью =0,5S x – 19. С повышением необходимой точности различие в числе измерений, рассчитанных по соотношениями, уменьшается и, как показывают расчеты, при величине 0,2S x они практически совпадают. В примере 3.1 доверительный интервал для математического ожидания твердости на поверхности катания головки рельса составили если бы нам было необходимо определить твердость с точностью ±10НВ (ε ≈ 1), то для этого потребовалось бы еще, как минимум, четыре измерения (кроме уже трех имеющихся. Действительно, при ε = 1 и P = 0,95 ( = 0,05), как уже было отмечено, по (3.38) получается 4 ) 96 , 1 ( 1 2 2 2 2 / 05 , 0 1 z n , затем при m = 4-1 = 3 t 0,05,2 ≈ 3 (СТЬЮДЕНТ.ОБР.2Х (0,05;3) = 3,182449), по (3.27) получаем 9 1 2 2 3 , 05 , 0 t n ; наследующей итерации t 0,05,8 ≈ 2,3 (СТЬЮДЕНТ.ОБР.2Х (0,05;8) = 2,306006), n ≥ 2,3 2 ≈5 и затем t 0,05,4 ≈ 2,8 (СТЬЮДЕНТ.ОБР.2Х (0,05;4) = 2,776451), n ≥ 2,8 2 ≈7. Количество опытов, необходимых для построения доверительных интервалов для математического ожидания при некоторых других и P, приведены в табл. 3.1 (для P = 0,95 в скобках приведены значения, рассчитанные по формуле (3.37)). Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 74 Т а блица Необходимое количество измерений при построении доверительного интервала для математического ожидания /S x P=0,90 P=0,95 P=0,99 1 5 7 (4) 11 0,5 13 19 (16) 31 0,4 19 27 (24) 46 0,3 32 46 (48) 78 0,1 273 387 (384) 668 3.3. Статистические гипотезы Как уже видно из изложенного выше материала, при статистическом оценивании (те. при приближенном определении случайной величины) для обоснования (состоятельности, несмещенности и эффективности) выбора той или иной оценки неизвестного параметра распределения приходится высказывать предположение, что, например, случайная величина не противоречит нормальному закону распределения. Кроме того, использование всех имеющихся выборочных значений при расчете оценок, так или иначе, предполагает, что среди них нет грубых ошибок (резко выделяющихся значений. С еще большим количеством различных предположений (гипотез) приходится сталкиваться, когда необходимо не только определять случайные величины, но и сравнивать их между собой, и тем более, когда по результатам эксперимента строится функция отклика. Статистическая гипотеза — любое предположение, касающееся неизвестного распределения случайной величины. Например, специалиста интересует, удалось ли добиться повышения механической прочности окатышей при использовании новой технологии их обжига. Он может сформулировать следующую гипотезу Механическая прочность окатышей увеличилась. Эта гипотеза нулевая гипотеза) будет подлежать проверке входе проведения опытов. Кроме того, можно сформулировать и любую другую (альтернативную) гипотезу, например Изменения механической прочности не произошло или Механическая прочность окатышей, наоборот, даже уменьшилась. Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 75 Процесс принятия решения называется проверкой статистической гипотезы. Поскольку мы выдвигали гипотезу, опираясь только на случайные выборочные значения, наши выводы будут носить вероятностный характер, то есть мы не можем дать точного ответа да или нет. Можно будет лишь с некоторой долей уверенности (с некоторой вероятностью) утверждать, что данные не противоречат (или противоречат) предположению. Статистические гипотезы можно разделить наследующие группы 1. Гипотезы о параметрах распределения . Эти гипотезы представляют собой предположение о значении некоторых параметров распределения генеральной совокупности. Пусть, например, высказывается гипотеза о том, что параметры (математическое ожидание, дисперсии) в двух выборках равны между собой. Обычно гипотезы о параметрах распределения можно выдвигать, располагая достаточно большой информацией о генеральной совокупности или имея весомые основания считать известным ее закон распределения. 2. Гипотезы о виде распределения . Это более общие гипотезы, они выдвигаются в условиях недостаточной информации о генеральной совокупности. По выборке выдвигается гипотеза о том, соответствуют ли данные, например, нормальному закону распределения. Заметим, что проверка гипотезы о нормальности распределения может помочь при дальнейшей обработке выборки если случайную величину достаточно уверенно можно считать нормально распределенной, ток ней применимы все теоремы о нормальных величинах, в частности имеется возможность построить доверительные интервалы для параметров. Нулевая гипотеза Н — гипотеза, подлежащая проверке. Это гипотеза, имеющая наиболее важное значение в проводимом исследовании. Нулевую гипотезу выдвигают и затем проверяют с помощью статистических критериев с целью выявления оснований для ее отклонения и принятия альтернативной гипотезы. Альтернативная гипотеза Н — каждая допустимая гипотеза, отличная от нулевой. Обычно в качестве альтернативной гипотезы принимают гипотезу вторую по значимости после основной. Предположение, которое касается неизвестного параметра рас Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 76 пределения, когда вид распределения известен (например, закон Гаусса, называется параметрической гипотезой, а предположение, при котором вид распределения неизвестен, называется непараметрической гипотезой. Задача исследователя заключается в том, чтобы на основе анализа опытных данных, полученных по выборке, принять ту или иную гипотезу относительно свойств генеральной совокупности, используя при этом какой-либо способ (критерий) проверки высказанного предположения. Статистический критерий — однозначно определенный способ проверки статистических гипотез. Критерии для проверки параметрических гипотез называются параметрическими, а для проверки непараметрических гипотез — соответственно непараметрическими. Естественно, что прежде чем использовать тот или иной параметрический критерий, экспериментатор должен найти способ убедиться в том, согласуется или нет распределение исследуемой им случайной величины стем или иным теоретическим (например, нормальным) распределением. Критерий согласия — статистический критерий для проверки гипотезы о согласии (равенстве) распределения случайной величины исследуемой совокупности с теоретическим распределением или гипотезы о согласии распределений в двух и более совокупностях. Как и при статистическом оценивании, любой критерий может быть построен только на основе тех результатов наблюдений, которые имеются в распоряжении исследователя, те. путем вычисления той или иной статистики. А как уже раннее было отмечено, любая статистика как некоторая функция случайной величины (функция от результатов наблюдений) также является случайной величиной. Таким образом, статистические гипотезы всегда носят вероятностный характер. Это говорит о том, что, основываясь на той или иной статистике и принимая нулевую гипотезу в качестве рабочей либо отвергая эту гипотезу ив качестве рабочей принимая альтернативную, исследователь может совершить ошибки. Ситуации, возникающие при проверке статистических гипотез, представлены в табл. 3.2. Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 77 Т а блица Возможные исходы при проверке статистических гипотез Фактическая ситуация Н — принимается Н — отвергается Н — верна Правильное решение Ошибка первого рода (α) Н — неверна Ошибка второго рода (β) Правильное решение 1. Гипотеза Н верна, иона не отвергается, те. принятое решение отражает истинное положение и принимается верная гипотеза. 2. Гипотеза Н верна, но она отвергается, те. в этом случае допущена ошибка первого рода. Ошибка первого рода — ошибка, заключающаяся в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Вероятность этого события по определению равна уровню значимости α. Уровень значимости α — вероятность ошибки первого рода. Так как уровень значимости задается произвольно, можно снизить вероятность ошибки первого рода до сколь угодно низкого уровня. 3. Гипотеза Н неверна, иона отвергается Опять принятое решение отражает истинное положение и отвергается неверная гипотеза. Гипотеза Н неверна, но она не отвергается. В этом случае допущена ошибка второго рода. Ошибка второго рода — ошибка, заключающаяся в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна. Если вероятность ошибки второго рода обозначить как β, то величина 1 – β носит название мощность критерия. Мощность критерия — вероятность того, что если верна альтернативная гипотеза, то нулевая гипотеза будет отвергнута. Значения применяемой для данного критерия статистики, при которых для выбранного уровня значимости отвергается нулевая гипотеза, образуют так называемую критическую область. Критическая область ω — область со следующими свойствами если значения применяемой статистики принадлежат данной области, то отвергают нулевую гипотезу в противном случае ее принимают. Приведенные определения намечают самую простую форму Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 78 проверки статистических гипотез. Для того чтобы пояснить сущность этого метода, предположим, что выборочная величина , представляющая собой несмещенную оценку параметра 0 , имеет плотность распределения f( ). Если гипотеза, состоящая в том, что = 0 , верна, то функция f( ) должна попадать в среднюю область, как показано на рис. 3.8. Вероятность того, что параметр не будет превышать нижнего уровня 1- , составит . / d f P / / 2 2 1 Вероятность того, что параметр превысит верхний уровень , равна . / d f P / / 2 2 2 Следовательно, вероятность того, что параметр выйдет за пределы интервала [ 1- ; ], составляет . Теперь примем величину малой, чтобы попадание параметра за пределы интервала [ 1- ; ] было маловероятно. Если после извлечения выборки и определения величины окажется, что она выходит за пределы интервала и попадает в критическую область, тов этом случае есть серьезные основания подвергнуть сомнению справедливость проверяемой гипотезы = 0 . С другой стороны, если параметр попадает в интервал [ 1- ; ], тов этом случае нет серьезных оснований подвергать сомнению справедливость проверяемой гипотезы, и гипотезу равенства = 0 можно принять. Как видно из рис. 3.9 ошибка первого рода допускается, если гипотеза верна, а параметр попадает в область отклонения гипотезы. Отсюда следует, что вероятность допустить ошибку первого рода равна , те. уровню значимости критерия. Для того чтобы найти, какова вероятность допустить ошибку второго рода, необходимо задать определенную величину отклонения истинного значения от гипотетического значения параметра, которое требуется определить. Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 79 Предположим, например, что истинное значение параметра в действительности равно 0 +d или 0 -d, как показано на рис. 3.10. Если, согласно гипотезе, = 0 , а в действительности = 0 d, то вероятность того, что попадает в область принятия гипотезы, те. в интервал [ 1- ; ], составляет . Это означает, что вероятность допустить ошибку второго рода при выявлении отклонения d от гипотетического значения равна Очевидно, что при любом заданном объеме выборки вероятность допустить ошибку первого рода можно сократить, уменьшив уровень значимости . Однако при этом увеличивается вероятность допущения ошибки второго рода (снижается мощность критерия. Таким образом, в большинстве случаев нельзя добиться минимального значения вероятностей и β одновременно. Поступают обычно следующим образом фиксируют вероятность ошибки первого рода, а затем добиваются минимума вероятности β ошибки второго рода. За счет чего можно уменьшить β при фиксированном значении ? За счет правильного выбора критической области при заданной альтернативе Н критическую область выбирают таким образом, чтобы значение β (вероятность принять неверную гипотезу) было наименьшим из возможных. Таким образом, задача состоит в построении f( ) 1- /2 Площадь = Область отклонения Область принятия Область отклонения Площадь = Площадь = /2 /2 0 Рис. 3.9. Области принятия и отклонения гипотезы при проверке гипотез Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 80 наиболее мощного критерия (1- β) при заданном уровне значимости Различают односторонние и двусторонние критические области. Различные варианты областей представлены на рис. 3.11. Если хотят убедиться, что одна случайная величина строго больше или строго меньше другой, то используют одностороннюю критическую область (риса, б. Область принятия Область отклонения кр пр, |