МЕТОДЫ ПЛАНИРОВАНИЯ. Металлургия Екатеринбург 2015
Скачать 7.01 Mb.
|
Рис. 3.11. Критические области плотности распределения а – правосторонняя, б – левосторонняя, в – двусторонняя Область принятия Область отклонения кр лев,81 Таким образом, для данного случая Н = 0 ; Н : 0 ; Н 1 (2) 0 Если проверяют как положительные, таки отрицательные расхождения между изучаемыми величинами, то используют двусторонние критические области (рис. 3.11 в Н : = 0 ; Н Подводя итог всему вышесказанному, алгоритм проверки любой статистической гипотезы в самом общем случае заключается в следующем) формулирование нулевой гипотезы Н 2) выбор одной из альтернативных гипотез Н) Н) , Н 3) поиск критерия, по которому может быть проверена сформулированная нулевая гипотеза Н 4) расчет значения статистики, применяемой для данного критерия) выбор уровня значимости ; 6) построение критической области ω при выбранном уровне значимости ; 7) принятие решения если значение статистики попало в критическую область — нулевая гипотеза отвергается, при этом вероятность ошибки (первого рода) не превышает выбранный уровень значимости в противном случае — нулевая гипотеза принимается. При использовании механизма статистических гипотез следует помнить, что даже в случае принятия нулевой гипотезы в 100 % вывод будет ошибочным в связи со всегда имеющейся вероятностью совершить ошибку первого рода. Причем если значение статистики не попадает в критическую область, то прежде, чем принять нулевую гипотезу, необходимо оценить вероятность ошибки второго рода, те. рассчитать мощности критерия. Если же его величина оказывается 82 недостаточной для решения поставленной задачи, требуется увеличение объема опытных данных (однако поскольку при обработке эксперимента исследователи зачастую уже не имеют возможности увеличить объем выборки, то они обычно пропускают данный пункт. 3.4. Отсев грубых погрешностей Часто даже тщательно поставленные эксперименты могут давать неоднородные данные, поскольку в процессе эксперимента могут измениться условия проведения опытов. Если экспериментатор по каким-либо причинам не уловил этих изменений, наблюдения, соответствующие разным уровням факторов, будут принадлежать к разным генеральным совокупностям. Данные, соответствующие изменившимся условиям, называют грубыми погрешностями (ошибками) или резко выделяющимися (аномальными) значениями. Грубые погрешности появляются также при неправильной записи показаний приборов. В литературе приводятся сведения о том, что экспериментальные данные могут содержать 10% аномальных значений. Однако эти 10% могут дать сильное смещение при оценке параметров распределения, особенно для дисперсии, так как ошибки заметно отклоняются от основной группы значений, а на дисперсию особенно сильно влияют крайние члены вариационного ряда (вариационный ряд — результаты наблюдений, расположенные в возрастающей последовательности. В случае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом Н Среди результатов наблюдений (выборочных, опытных данных) нет резко выделяющихся (аномальных) значений. Альтернативной гипотезой может быть либо Н Среди результатов наблюдений есть только одна грубая ошибка, либо Н Среди результатов наблюдений есть две или более грубых ошибки. В литературе можно встретить большое количество различных критериев для отсева грубых погрешностей наблюдений. Обычно 83 экспериментаторы имеют дело с выборками небольшого объема (те. когда генеральная дисперсия x 2 неизвестна и оценивается по опытным данным через выборочную дисперсию S x 2 ), причем именно в этом случае аномальные данные имеют большой вес. Наиболее распространенными и теоретически обоснованными в этом случае являются критерий Н.В. Смирнова (используется при Ни критерий Диксона (применим как при Н) , таки при Н) ). 3.4.1. Критерий Н.В. Смирнова Если известно, что есть только одно аномальное значение (альтернативная гипотеза Н, то оно будет крайним членом вариационного ряда. Поэтому проверять выборку на наличие одной грубой ошибки естественно при помощи статистики x s x x u 1 _ 1 , (3.39) если сомнение вызывает первый член вариационного ряда i i x x min 1 , или x n n s x x u _ , (3.40) если сомнителен максимальный член вариационного ряда Этот критерий впервые был предложен Н.В. Смирновым. Он исследовал распределение статистики составил таблицы процентных точек u α,n квантили порядка р = 1 – α) для α = 0,1; 0,05; 0,01 при 3 ≤ n ≤ 20 [11]. При выбранном уровне значимости α критическая область для критерия Н.В. Смирнова строится следующим образом u 1 > u α,n или u n > u α,n , (3.41) где u α,n — это табличные значения (см. [6] или табл. П. 84 В случае если выполняется последнее условие (статистика попадает в критическую область, то нулевая гипотеза отклоняется, те. выбросили неслучаен и нехарактерен для рассматриваемой ности данных, а определяется изменившимися условиями или грубыми ошибками при проведении опытов. В этом случае значение x 1 или x n исключают из рассмотрения, а найденные ранее оценки подвергаются корректировке с учетом отброшенного результата. 3.4.2. Критерий Диксона В критерии Диксона применяется статистика если подозрительная чужеродная точка имеет наибольшее значение, 1 , j n i n n j i x x x x r , (3.42) если подозрительная чужеродная точка имеет наименьшее значение, 1 1 1 , x x x x r j n i j i , (3.43) где x n , x n-i , x j+1 — члены вариационного ряда x 1 ≤ x 2 ≤ x 3 ... ≤ x i Диксоном были получены распределения для r 10 , r 11 , r 12 , r 20 , r 21 и r 22 и построены таблицы для α = 0,1; 0,05; 0,01 и 0,005 при 3 ≤ n ≤ 30 [11]. Статистика 1 1 10 x x x x r n n n используется для проверки максимального или минимального члена вариационного ряда (одна грубая ошибка, альтернативная гипотеза Н) ) при 3 ≤ n ≤ 7. Если притом же объеме выборки предполагается наличие двух и более резко выделяющихся значений (альтернативная гипотеза Н, то используется статистика r 20 . Статистики критерия Диксона, 85 используемые при других объемах выборки, приведены в табл. 3.3. Таблица Статистики критерия Диксона, используемые при различных объемах выборки n Объем выборки n Число грубых погрешностей одна две и более 3…7 8…10 11…13 14…30 r 10 r 11 r 21 r 22 r 20 r 20 r 21 Критическая область в критерии Диксона выглядит аналогично критерию Н.В. Смирнова и включает значения r ij > (r ij ) α,n , (3.44) где (r ij ) α,n — табличные значения (см. [11] или табл. П. Рассмотрим небольшой пример. Пример. Пирометром измеряется температура поверхности нагретого тела (например, прокатываемой заготовки, причем будем предполагать, что температура ее видимой поверхности во всех точках одинакова. Было проведено шесть измерений температуры T Си получены следующие значения 925, 930, 950, 975, 990, 1080 (n = 6, причем, как видно, все значения приведены в возрастающей последовательности, те. в виде вариационного ряда T 1 = 925 ≤ T 2 = = 930 ≤ T 3 =950... ≤ T 6 = 1080). Можно ли значение T 6 =1080 считать грубой погрешностью, полученной, допустим, в результате неправильной регистрации показаний пирометра Для ответа на поставленный в этом примере вопрос предварительно вычислим оценки параметров распределения исследуемой случайной величины T (предполагая, что она не противоречит нормальному закону распределения выборочное среднее арифметическое и выборочное среднее квадратичное отклонение S T : ; 975 6 / ) 1080 990 975 950 930 925 ( 1 1 n i i T n T ( 6 1 ) 1080 990 975 950 930 925 [( 1 6 1 T n 1 T 1 n 1 S 2 2 2 2 2 2 2 2 n 1 i i n 1 i 2 i 2 T 27 , 57 3280 В электронных таблицах Microsoft Excel для этих расчетов можно было бы использовать две статистические функции СРЗНАЧ (925;930;950;975;990;1080) = 975 и СТАНДОТКЛОН.В(925;930;950;975;990;1080) = 57,27128. Теперь воспользуемся предложенным выше алгоритмом проверки статистических гипотез. 1. Формулируем нулевую гипотезу Н Среди значений 925; 930; 950; 975; 990; 1080 нет грубых погрешностей. 2. Исходя из условий примера 3.3, выбираем следующую альтернативную гипотезу Н Значение 1080 является (одной) грубой погрешностью. 3. Сформулированная нулевая гипотеза Н может быть проверена по любому из приведенных в этом разделе критериев, те. как по критерию Н.В. Смирнова, таки по критерию Диксона (хотя в литературе могут быть найдены и другие критерии. Для начала остановимся на критерии Н.В. Смирнова. 4. Значение статистики критерия Н.В. Смирнова в примере 3.3 равно (см. (3.40)) 83 , 1 27 , 57 975 1080 _ 6 6 T s T T u 5. Уровень значимости α примем равным 0,05. 6. По табл. П при α = 0,05 и n = 6 находим u 0,05;6 = 1,82, и с использованием) строим критическую область ω: u 6 > u 0,05;6 , те. u 6 > 1,82. 7. Принимаем решение поскольку значение статистики (1,83 > 1,82) попало в критическую область — нулевая гипотеза отвергается, ив качестве рабочей принимается альтернативная гипотеза, те. значение 1080 с вероятностью 0,95 (уровень значимости, не пре- 87 вышает 0,05) по критерию Н.В. Смирнова можно считать грубой погрешностью. Интересно отметить, что если бы на этапе 5 мы приняли α = 0,01, по таблицам критерия Н.В. Смирнова u 0,01;6 = 1,94 и подсчитанное значение статистики при этом уровне значимости, то оно не попало бы в критическую область (1,83<1,94). Следовательно, примы не можем отвергнуть нулевую гипотезу, те. по критерию Н.В. Смирнова с вероятностью 0,99 (надежностью, достоверностью) мы не можем сказать, что значение 1080 является грубой погрешностью. В завершение данного примера рассмотрим, как бы выглядели наши расчеты, если на этапе 3 мы бы остановились на критерии Диксона 4. При n = 6 и альтернативной гипотезе, что имеется только одна грубая погрешность, в критерии Диксона используется статистика (см. табл. 3.3), значение которой в примере 3.2 (см. (3.43)): 581 , 0 925 1080 990 1080 1 6 5 6 1 0 6 1 6 6 10 T T T T T T T T r 5. Уровень значимости α примем равным 0,05. 6. По табл. П при α = 0,05 и n = 6 находим (r 10 ) 0,05;6 = 0,560, и с использованием (3.44) строим критическую область ω: r 10 > (r 10 ) 0,05;6 , те. r 10 > 0,560. 7. Принимаем решение поскольку значение статистики > 0,560) попало в критическую область — нулевая гипотеза отвергается, ив качестве рабочей принимается альтернативная, те. значение 1080 с вероятностью и по критерию Диксона можно считать грубой погрешностью. Заметим, однако, как и по критерию Н.В. Смирнова, высказать подобное утверждение с вероятностью 0,99 по критерию Диксона мы не имеем права, поскольку по таблицам (r 10 ) 0,01;6 = 0,698. 3.5. Сравнение двух рядов наблюдений При проведении и анализе результатов экспериментальных ис- 88 следований часто приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Вот некоторые примеры подобных ситуаций 1. Необходимо сравнить показания двух приборов, измеряющих одну и туже величину, когда этими рабочими средствами измерений получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного итого же технологического параметра разными приборами 2. Требуется поверить рабочее средство измерения (те. определить, не выходят ли погрешности его измерений за пределы регламентированных значений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний данного прибора действительному значению измеряемого параметра 3. Два агрегата выпускают одну и туже продукцию. Необходимо сделать вывод о том, какой из них лучше или хуже в каком-либо смысле. Решение подобных задач осуществляется также с использованием аппарата проверки статистических гипотез. Ведь если нам необходимо было бы сравнить две случайные величины X и Y, имеющие нормальное распределение, при известных их математических ожиданиях и дисперсиях M x ; σ x 2 и M y ; σ y 2 , то вопрос, очевидно, решался бы достаточно просто. Две случайные величины с нормальным распределением равны между собой (имеют одинаковое распределение, те. имеют одну и туже функцию распределения F(X) = F(Y) или плотность распределения f(X) = f(Y)), когда равны между собой их математические ожидания (M x = M y ) и дисперсии (σ x 2 = σ y 2 ), поскольку только эти два параметра полностью определяют нормальное (двух- параметрическое) распределение (см. (2.12) или (2.21)). Однако, как это уже неоднократно ранее отмечалось, любой из параметров распределения случайной величины может быть найден лишь по всей генеральной совокупности, те. только теоретически при проведении бесконечно большого количества опытов. Практически, по выборке ограниченного объема, исследователь может определить только приближенное значение параметра — его оценку *. При этом вероятность того, что оценка * совпадет со значением оцениваемого параметра , очень мала. Следовательно, даже если равны 89 между собой параметры распределений двух случайных величин ( x = y ), то их оценки скорее всего не будут одинаковыми ( x * y *). Поэтому при сравнении двух случайных величин обычно приходится высказывать и проверять нулевую гипотезу Н x = y , при альтернативных гипотезах типа Н x < y или Н x > y . Н x y 3.5.1. Сравнение двух дисперсий При выполнении измерений в различных условиях часто возникает задача сравнения степени разброса (дисперсий) исследуемых параметров (случайных величин. Проверка гипотезы о равенстве дисперсий имеет большое значение, так как измеряемая дисперсией величина рассеяния характеризует такие исключительно важные показатели, как точность машин, приборов, стабильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продукции вывод можно часто сделать в результате сравнения дисперсий тех параметров, которые их характеризуют. Таким образом, требуется установить, являются ли выборочные дисперсии S 1 2 S 2 2 со степенями свободы m 1 и m 2 значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупности или из генеральных совокупностей с равными дисперсиями ( 1 2 = 2 2 = 2 ). В этом случае нулевая гипотеза формулируется в виде H 0 : 1 2 = 2 2 = 2 , те. между двумя генеральными дисперсиями различия нет при заданном уровне значимости Для проверки этой гипотезы используется критерий, основанный на распределении Фишера, зависящем только от числа степеней свободы m 1 и m 2 . Аналитическое выражение критерия Фишера имеет вида) Плотность распределения величины F m1, m2 , представленная на рис. 3.12, есть функция 90 0. F при 0 при m F m 1 2 m Г 2 m Г F m m 2 m Г m 2 1 2 1 1 2 m 2 m 2 1 2 1 2 1 1 б) Рис. 3.12. Плотность (аи функция (б) распределения частный случай при m 1 = 20) 1 2 F m 1 =20 m 2 =25 m 2 =10 0 1 2 3 4 F(F) 1,0 F f(F) 0 m 2 = 5 а б 0,8 0,6 0,4 0,2 1,0 0,8 0,6 0,4 0,2 91 Надо иметь ввиду, что скорость возрастания и убывания функции, а также величина и положение максимума зависят от параметров m 1 и Соответствующая функция распределения величины F m1, m2 определяется через плотность распределения в) Существуют статистические таблицы как с табулированными значениями функции распределения Фишера для принятого уровня значимости, таки с табулированными значениями квантилей этого распределения (см. табл. Пи П. Поскольку по условию нуль–гипотезы 1 2 = 2 2 , то выражение можно представить как отношение выборочных дисперсий F=S 1 2 /S 2 2 , где S 1 2 S 2 2 Если при проверке нулевой гипотезы H 0 : 1 2 = 2 2 = 2 альтернативной является гипотеза H 1 (1) : 1 2 2 2 , то применяют одностороннее неравенство F=S 1 2 /S 2 2 Для альтернативной гипотезы H 1 (2) : 1 2 2 2 , когда соотношение между генеральными дисперсиями неизвестно, различие между дисперсиями считают значимым, если выполняется условие F=S 1 2 /S 2 2 F ( /2),m1,m2 . Таким образом, алгоритм решения задачи сводится к следующему. Пусть по результатам испытаний двух независимых выборок объемом и n 2 из нормально распределенных совокупностей подсчитаны оценки дисперсий S 1 2 и S 2 2 , причем S 1 2 > S 2 2 . Требуется проверить предположение (нулевую гипотезу Но том, что указанные выборки принадлежат генеральным совокупностям с равными дисперсиями Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 92 В соответствии с общим алгоритмом проверки любой статистической гипотезы 1. Н σ 1 2 = σ 2 2 = σ 2 2. Возможно два варианта альтернативной гипотезы Н σ 1 2 σ 2 2 ; Н σ 1 2 > Предположить вариант альтернативной гипотезы Н σ 1 2 < σ 2 2 , конечно же, возможно, но вряд ли целесообразно при условии, что S 1 2 > S 2 2. 3. Используется критерий (критерий Фишера) — это отношение двух дисперсий (большей к меньшей, F — статистика поэтому имеет вид 2 2 2 1 S S F , (3.45) где S 1 2 > Очевидно, что значения F всегда больше единицы. 4. Выбирается уровень значимости 5. Границы критической области можно установить по таблицам квантилей распределения (см. [11] или табл. П, Пав для этого используется функция |