Реброва ТПЭ. Программа для чтения pdfфайлов Adobe Acrobat Reader Редактор Н. И. Косенкова Техническая подготовка Т. И. Кукина Издание первое. Дата подписания к использованию 18. 03. 2016
Скачать 1.31 Mb.
|
19 Следовательно, можно записать следующее вероятностное ут- верждение: 1 / 1 t n m x t P (2.5) Преобразуем выражение в скобках: 1 1 n t x m n t x P (2.6) Величина Д P 1 – доверительная вероятность. При этой до- верительной вероятности доверительный интервал для математиче- ского ожидания 1 m задается пределами n t x n t x ; Величина x x S t n t представляет случайную ошибку наблюдения. На практике, как правило, число измерений не превышает 10…30. При таком числе наблюдений фактическая дисперсия 2 не- известна, поэтому при построении доверительного интервала для ма- тематического ожидания используют выборочную дисперсию 2 x S При этом t-критерий имеет распределение Стьюдента и зависит от числа степеней свободы d.f. Число степеней свободы – это понятие, которое учитывает в статистических ситуациях связи, ограничивающие свободу изменения случайных величин. Поэтому число степеней свободы вычисляется Рис. 2.1. Кривые плотности вероятности: a – нормального распределения; б – t-распределения t Площадь 1 Площадь 2 / Площадь 2 / t t t p t p 0,4 0,1 -2 4 2 0 - 4 t d.f = d.f = 5 d.f = 1 а б Си бА ДИ 20 как разность между числом экспериментальных точек n и числом свя- зей, ограничивающих свободу изменения случайной величины. Так, при вычислении выборочно дисперсии по формуле (2.3) на- блюдается одна связь, определяемая уровнем выборочного среднего, поэтому число степеней свободы выборочной дисперсии 1 n f d , а для дисперсии, найденной из соотношения (2.2), число степеней сво- боды равно числу испытаний, так как m 1 определено независимым способом. 2.2. Статистические гипотезы Статистической гипотезой H называется предположение о свойстве генеральной совокупности, которое можно проверить, опи- раясь на данные выборки. Гипотезы о параметрах генеральной сово- купности называются параметрическими, о распределениях – непара- метрическими. Любая гипотеза формулируется до опыта и проверяется на ос- нове последующего эксперимента. Основная гипотеза 0 H обычно вы- сказывается в форме, отрицающей наличие каких-либо видимых от- личий, поэтому гипотеза 0 H называется нулевой. Одновременно формулируется альтернативная гипотеза 1 H Проверка гипотезы осуществляется на основе выявления согла- сованности эмпирических (экспериментальных) данных с гипотетиче- скими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу при- нимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Нулевая гипотеза отвергается тогда, когда по выборке полу- чается результат, который при истинности выдвинутой нулевой гипо- тезы маловероятен. Границей невозможного или маловероятного обычно считают 0,05, или 0,01, или 0,001 и называют уровнем значимости. Процедура проверки гипотезы производится при помощи стати- стического критерия – правила, определяющего условия, при кото- ром проверяемую нулевую гипотезу следует либо принять, либо от- клонить. Критерий представляет собой случайную функцию резуль- татов наблюдения с известным законом распределения (t-, F-, 2 - критерий). В соответствии с характером распределения одни значения Си бА ДИ 21 критерия являются более вероятными, другие – менее. Таким обра- зом, область возможных значений делится на две части. Одна называ- ется областью принятия гипотезы, другая (где гипотеза должна быть отвергнута) – критической областью. Чтобы проверить гипоте- зу, необходимо вычислить критерий и посмотреть, в какую область попадает вычисленное значение. Проверка статистических гипотез складывается из следующих этапов: формулируется в виде статистической гипотезы задача ис- следования; выбирается статистическая характеристика гипотезы; выбираются нулевая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий; выбирается приемлемый уровень значимости; выбирается критерий проверки гипотезы; вычисляется фактическое значение статистического крите- рия; определяется критическое значение статистического крите- рия по соответствующей таблице; проверяется нулевая гипотеза на основе сравнения фактиче- ского и критического значений критерия, в зависимости от результа- тов проверки гипотеза либо отклоняется, либо не отклоняется. При проверке гипотез по одному из критериев возможны два ошибочных решения: неправильное отклонение нулевой гипотезы – ошибка перво- го рода; неправильное принятие нулевой гипотезы – ошибка второго рода. Возможные решения приведены в табл. 2.1. Вероятность ошибки первого рода равна уровню значимости . Вероятность не совершить ошибку второго рода 1 называют мощностью критерия. Обычно задают и пытаются сделать возможно малым. Таблица 2.1 Возможные выводы при проверке гипотез Решение по критерию Фактически 0 H верна 0 H не верна 0 H отклоняется Ошибка первого рода Правильное решение 0 H не отклоняется Правильное решение Ошибка второго рода Си бА ДИ 22 2.3. Определение необходимого количества опытов при построении интервальной оценки для математического ожидания Увеличение количества измерений даже при неизменной их точности ( const ) может увеличить доверительную вероятность Р или сузить доверительный интервал для определения действи- тельного значения измеряемой величины (математического ожида- ния). Необходимое количество измерений n для достижения требуе- мой точности при заданной доверительной вероятности Р можно определить заранее в том случае, когда известно действительное зна- чение среднеквадратического отклонения (СКО) , а эксперимен- тальные данные подчиняются нормальному закону распределения. Действительно, при этих допущениях число измерений можно определить 2 2 2 t t n , ( 2.7) где t – критерий для нормального закона распределения вероятностей. Таким образом, число измерений n определяется требуемой до- верительной вероятностью (уровнем значимости) и относительным (по отношению к среднеквадратичному отклонению) значением по- ловины ширины доверительного интервала , т.е. требуемой точно- стью определения измеряемой величины. Так при t=1,96 для Р=0,95 или 05 , 0 , число измерений n = 4; при t=3 для Р=0,9973, , n = 9. При увеличении необходимой точности измерений в 2 раза, т.е. сужении доверительного интервала до величины 2 / , необходи- мое число измерений составит n =16. Нетрудно заметить, что необхо- димое число измерений с увеличением точности возрастает в квадра- тичной зависимости. Как правило, действительное значение среднеквадратической ошибки неизвестно, а имеется только её оценка S x . Тогда 2 2 2 x x S t S t n , (2.8) где t-критерий Стьюдента. Значение критерия Стьюдента зависит не только от выбранного уровня значимости , но и от числа степеней свободы d.f, которое Си бА ДИ 23 определяется числом измерений. В связи с этим последнее уравнение следует решать методом последовательных приближений. В качестве начального приближения можно задать, в частности, число измере- ний, рассчитанных по формуле для нормального закона распределе- ния. Далее решая уравнения методом последовательных приближе- ний при 05 , 0 , x S , для определения доверительного интервала требуется 7 измерений, при x S 5 , 0 n = 19. С повышением необхо- димой точности различие в числе измерений, рассчитанных при нор- мальном законе распределения и распределении Стьюдента, умень- шается и при x S 2 , 0 практически совпадает. Необходимое количество измерений при построении довери- тельного интервала для математического ожидания приведено в табл. 2.2. В скобках приведены данные для нормального закона распреде- ления. Таблица 2.2 Количество измерений, необходимое для построения доверительного интервала для математического ожидания x S / Р = 0,90 Р = 0,95 Р= 0,99 1 5 7 (4) 11 0,5 13 19 (16) 31 0,4 19 27 (24) 46 0,3 32 46 (48) 78 0,1 273 387 (384) 668 2.4. Исключение грубых погрешностей Даже тщательно поставленные эксперименты могут давать не- однородные данные, поскольку в процессе эксперимента могут изме- ниться условия проведения опытов. Если в полученной группе ре- зультатов наблюдений одно или два существенно отличаются от ос- тальных, а наличия ошибки в снятии показаний, описки и других промахов не обнаружено, то необходимо проверить, не являются ли они грубыми погрешностями, подлежащими исключению. Решение этой задачи выполняется общими методами проверки статистических гипотез в предположении нормального распределения результатов наблюдений. Проверяемая гипотеза состоит в утверждении, что ре- зультат i-го наблюдения i x не содержит грубой погрешности, т.е. яв- ляется одним из значений измеряемой величины. Пользуясь опреде- Си бА ДИ 24 ленными статистическими критериями, пытаются опровергнуть вы- двинутую гипотезу. Если это удается, то результат наблюдения рас- сматривают как грубую погрешность и его исключают. Критерий оценки анормальности результатов наблюдений при неизвестном СКО (критерий Н.В. Смирнова). При исключении по этому критерию грубых погрешностей из результатов наблюдений проводят следующие операции: результаты группы из n наблюдений упорядочивают по воз- растанию n x x x 2 1 . Выделяют предполагаемые промахи, обычно ими могут оказаться результаты 1 x и n x ; вычисляют оценки математического ожидания x и СКО S . Значения x и S вычисляют без учета экстремальных значений i x ; для предполагаемых промахов проводят расчет коэффициен- тов S x x t 1 1 ; S x x t n n ; (2.9) задаются уровнем значимости критерия ошибки . Очевид- но, этот уровень должен быть достаточно малым, чтобы вероятность ошибки была невелика; по заданным параметрам , n находят критическое значение T t из таблиц для распределения Стьюдента (n<20) (прил. 4) либо нормального распределения (n>20) (прил. 3); выполняют сравнение коэффициентов, определенных по формулам (2.9), с критическими значениями. Если выполняются ус- ловия Т t t 1 и Т n t t , то результаты 1 x и n x относят к промахам и ис- ключают из результатов наблюдений. Процедуру проверки повторяют для 2 x , 1 n x и т.д., пока все промахи не будут исключены из выборки. Критерий «трех сигм». Данный критерий применяется для ре- зультатов измерений, распределенных по нормальному закону, одним из граничных параметров служит оценка СКО измерений S . По это- му критерию считается, что результат, полученный с вероятностью 003 0, , маловероятен, и его можно считать промахом, если S x x i 3 . Данный критерий достаточно хорошо работает при числе измерений 50 20 n Си бА ДИ 25 2.5. Сравнение двух рядов наблюдений При анализе результатов экспериментальных исследований час- то приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Решение подобных задач осуществляется также с использова- нием аппарата проверки статистических гипотез. Гипотеза о равенстве средних выдвигается, когда необходимо определить, существенно ли расхождение между двумя выборочными средними. Для проверки этой гипотезы определяют среднюю (стан- дартную) случайную ошибку разности двух выборочных средних S Для двух независимых выборок она определяется по формуле 2 2 2 1 2 1 n S n S S , (2.10) где 2 1 S и 2 2 S – выборочные дисперсии соответственно в первой и вто- рой выборках. Фактическое значение критерия S x x t 2 1 (2.11) Критическое значение T t определяют по таблице распределения Стьюдента для заданного уровня значимости и числа степеней свобо- ды 2 2 1 n n f d . Если T t t , нулевая гипотеза принимается. Сле- довательно, можно считать, что математические ожидания в двух подгруппах одинаковы, эти подгруппы можно объединить в одну группу и характеризовать последнюю общим средним. 2.6. Сравнение двух дисперсий При выполнении измерений в различных условиях часто возни- кает задача сравнения степени разброса (дисперсий) исследуемых па- раметров (случайных величин). Проверка гипотезы о равенстве дисперсий имеет большое зна- чение, так как измеряемая дисперсией величина рассеяния характери- зует такие важные показатели, как точность машин, приборов, ста- бильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии Си бА ДИ 26 или о качестве выпускаемой продукции вывод можно сделать в ре- зультате сравнения дисперсий тех параметров, которые их характери- зуют. Таким образом, требуется установить, являются ли выборочные дисперсии 2 2 2 1 S S со степенями свободы d.f 1 и d.f 2 значимо отли- чающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупности или из генеральных совокупностей с равными дисперсиями 2 2 2 2 1 . В этом случае нулевая гипо- теза формулируется в виде Н 0 : 2 2 2 2 1 , т.е. при заданном уровне значимости между двумя генеральными дисперсиями нет различия. Для проверки этой гипотезы используется критерий, основан- ный на распределении Фишера, зависящий только от числа степеней свободы d.f 1 и d.f 2 . Аналитическое выражение критерия Фишера имеет вид 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 1 S S S S F (2.12) Плотность распределения вероятностей р(F) представлена на рис. 2.2. Значения F всегда больше единицы. Поскольку по условию основной гипотезы 2 2 2 2 1 , то вы- ражение для F-критерия имеет вид 2 2 2 1 S S F , (2.13) где 2 2 2 1 S S При проверке расчётное значение сравнивают с табличным, ес- ли Т F F , то нулевая гипотеза принимается. 4 3 2 1 0 F F p 1,0 0,8 0,6 0,4 0,2 Рис. 2.2. F-распределение для различных d. 1 f и d. 2 f , 10 50 , 10 10 , 10 4 , 10 Си бА ДИ 27 Следовательно, по двум выборочным дисперсиям можно найти оценку общей генеральной дисперсии 2 1 1 2 1 2 2 2 2 1 1 2 n n S n S n S (2.14) 2.7. Проверка гипотезы о законе распределения 2.7.1. Общие сведения Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в генеральной совокупности подчиняется какому-то определенному закону. При планировании эксперимента важно, чтобы наблюдаемые значения физических вели- чин подчинялись нормальному закону распределения. Поэтому нуле- вая гипотеза 0 H : результаты наблюдений подчиняются нормальному закону распределения; альтернативная 1 H : результаты наблюдений не подчиняются нормальному закону распределения. В качестве статистических характеристик гипотезы о законе распределения принимаются оценки параметров распределения. Если число наблюдений 20 n , строится интервальный вариа- ционный ряд. При его построении в первой графе отдельные значения признака указываются в интервалах «от – до», во второй графе – чис- ленность единиц, входящих в интервал. Величина интервала опреде- ляется по формуле m R i , (2.15) где R –размах варьирования признака, min max x x R ; m – число групп, которое приближенно определяется по формуле Стерджесса n m lg 32 , 3 1 (2.16) Полученную по этой формуле величину округляют до целого большего числа. Нижнюю границу первого интервала определяют, вычитая из min x половину последнего разряда. Оценка математического ожидания в этом случае вычисляется по формуле m j j m j j j f f x x * 1 * , (2.17) Си бА ДИ |