Черкесов Г. Н. Надежность аппаратно-программных комплексов.. Надежностьаппаратнопрограммных
Скачать 2.81 Mb.
|
П6.2.3. Доверительные границы для параметровгде — квантили распределения по уровням вероятностей соответственно. П6.3. Проверка параметрических гипотез П6.3.1. Постановка задачи Простая основная гипотеза относительно параметра а распределения F(x, формулируется в следующем виде а = Кроме того, формулируется простая конкурирующая (альтернативная) гипотеза о том, что а = Принятие решения о том, что гипотеза верна или неверна, проводится с помощью критерия значимости и численное значение которого определяется по результатам статистического эксперимента. Для формирования решающего правила область допустимых значений критерия разбивают на две части область принятия гипотезы и критическую область при попадании в которую значения критерия гипотеза отвергается. Гипотеза называется двусторонней, если альтернативное значению значение параметра может быть как больше, таки меньше В этом случае критическая область будет двухсвязной, и ее по- добласти будут разделены областью Гипотеза называется односторонней, если альтернативное значение параметра может быть либо только больше, чем либо только меньше этого значения. Тогда критическая область будет одно- связной. Поскольку решение о верности (или неверности) гипотезы принимается по ограниченной выборке, правильность решения не гарантируется и возможны ошибки первого и второго рода. Вероятность ошибки первого рода а есть вероятность отвергнуть верную гипотезу Вероятность ошибки второго рода есть вероятность принять неверную гипотезу когда на самом деле верна альтернативная гипотеза. Вероятности являются, по существу, условными веро- ятностями: (П6.24) Вероятность (П6.25) называется мощностью критерия. Она представляет собой условную вероятность того, что правильной будет признана альтернативная гипотеза (отвергнута основная гипотеза) при условии, что она и на самом деле верна. К критерию значимости предъявляются те же требования, что и при построении доверительного интервала При планировании статистического эксперимента для проверки гипотезы используют всего 6 параметров значения и вероятности граница щ областей и объем выборки п Для них известны два уравнения связи (П6.24), которые позволяют найти любые два параметра, если заданы остальные четыре. Если заданы пи щ то можно найти (прямая задача. Если заданы аир, то можно найти и п (обратная задача). П6.3.2. Проверка гипотез о параметрах нормального распределения Для нормального распределения F(x, m, проверке подлежат всего четыре ги- потезы: • о равенстве математического ожидания (МО) известному значению; • о равенстве двух неизвестных МО; • о равенстве дисперсии известному значению; • о равенстве двух неизвестных дисперсий. Проверка гипотезы о равенстве МО известному значению. Основная гипотеза состоит в том, что т = Заданы объем выборки пи вероятность ошибки первого рода а. При известной дисперсии а в качестве критерия используем величину В этом случае уравнения (П) для определения границ двусторонней критической области приобретают вид где — интеграл Лапласа. Отсюда находим квантиль нормального распределения по уровню вероятности = 1 - а. Критическая область состоит из двух частей z > и z < Правило принятия решения следующее если и е то есть < и < то гипотеза верна. если и е то есть и < или и > , то гипотеза неверна. Чтобы найти мощность критерия, надо ввести конкурирующую (альтернативную) гипотезу состоящую в том, что т = Тогда, согласно (П6.25), мощность критерия При справедливости критерий и уже не будет иметь нормального распределения с параметрами (0; 1). Это распределение теперь имеет и Величина независящая от результатов эксперимента, называется расстоянием между гипотезами. Оно тем больше, чем больше = те, - и объем выборки п При d = О мощность критерия равна ошибке первого рода а, то есть очень мала. При d 0 имеем: (П6.26) При d > 0 второе слагаемое очень мало, и мощность критерия fi(d) +С ростом мощность критерия асимптотически приближается к единице, что означает состоятельность критерия. При d < О главным, напротив, будет второе слагаемое. При выбранной границе критической области регулировать мощность критерия можно только изменением объема выборки пи значения - При > О, пренебрегая в (П) вторым слагаемым, найдем: Отсюда требуемый объем выборки для обеспечения заданных значений ошибок первого и второго рода При односторонней критической области Критическая область для среднего арифметического При ар критическая область При неизвестной дисперсии надо использовать критерий Проверка гипотезы о равенстве двух неизвестных математических ожиданий. Пусть случайные величины X Y распределены по нормальному закону сиз- вестными дисперсиями и Основная гипотеза состоит в том, что неизвестные математические ожидания равны между собой, то есть = В результате статистических испытаний получены две выборки ..., и Поскольку разность средних значений z = х - нормальное распределение с параметрами = - и = + тов качестве критерия естественно выбрать центрированную и нормированную разность При справедливости основной гипотезы критерий приобретает вид и не содержит в себе неизвестных величин. Двустороннюю критическую область находят из уравнения (П6.27) Отсюда критическая область и < или и > , = 1 - а. Правила принятия решения таковы: • если то верна; • если или - у > то неверна. Односторонняя критическая область имеет вид и > z-, если конкурирующая гипотеза следующая > и и < если Если дисперсии неизвестны, но одинаковы ст = ста, то используют критерий (П6.27) Величина нормальное распределение с параметрами т = 0 и 1, V 2 имеет с числом степеней свободы k = + - 2, а величина и = Т имеет распределение Стьюдента с параметром При справедливости гипотезы ЯО и равенстве дисперсий критерий (П) приобретает вид Отсюда находим двустороннюю критическую область и < и (Правило принятия решения если то верна если и , то неверна. Проверка гипотезы о равенстве дисперсии известному значению. Для проверки гипотезы а = используют критерий имеющий с числом степеней свободы = п - 1. При пользовании двусторонней конкурирующей гипотезы = двусторонняя критическая область определяется неравенствами их или и где и квантили по уровням вероятностей аи- а соответственно. При односторонней конкурирующей гипотезе критическая область такова ист о Мощность критерия при односторонней гипотезе: где Х = / — расстояние между гипотезами. При двусторонней гипотезе Проверка гипотезы о равенстве двух неизвестных дисперсий. По двум независимым выборкам ..., ..., том, что ах = В качестве критерия используется отношение Критерий имеет распределение Фишера с параметрами При справедливости гипотезы критерий приобретает вид и вычисляется как отношение несмещенных оценок (П) для дисперсий и Двустороннюю критическую область находят из уравнений Здесь = = — квантили распределения Фишера уровням вероятностей аи- а соответственно, определяемые по таблицам распределения Фишера. Поскольку в таблицах приводятся только значения квантилей для р > 0,5, квантиль по уровню а находят с помощью формулы П6.4. Критерии согласия П6.4.1. Постановка задачи В результате предварительной обработки статистических данных в форме вариационного ряда установлено, что эмпирическая функция распределения качественно близка к теоретическому распределению класса F(x, аи может быть аппроксимирована одной из кривых этого класса. В связи с этим формулируется основная гипотеза о том, что эмпирическая функция распределения согласуется с теоретическим распределением F(x, а в котором параметра либо задан, либо вычислен в виде точечной оценки Вероятность ошибки первого рода а, называемая также уровнем значимости, трактуется как вероятность того, что основная гипотеза будет отвергнута, тогда как на самом деле она верна. Выбирая критерий и находят границу односторонней критической области и используют следующее правило принятия решения если и е то есть и то гипотеза верна — имеется согласие теоретического и эмпирического распределений если то есть и > то гипотеза неверна и согласия нет. Критерий называют состоятельным, если при верности конкурирующей гипотезы с увеличением объема выборки значения критерия растет и рано или поздно, но гарантированно, гипотеза о согласии будет отвергнута. В зависимости от вида функции ха различают критерии согласия Пирсона (критерий х, Колмогорова и Мизеса (критерий П. Критерий Пирсона (критерий В качестве эмпирического распределения используется функция частостей. Область допустимых значений (ОДЗ) случайной величины X разбивается на / интервалов, называемых разрядами, с границами го интервала и i = При этом обычно принимают = = где их левая и правая границы ОДЗ. Частость есть отношение числа элементов вариационного ряда, попавших в г'-й разряд, к длине выборки п В качестве критерия используется функция (П6.28) Можно показать, что критерий Пирсона имеет асимптотически ние с числом степеней свободы k = n- 1. Если параметры теоретического распределения неизвестны, но они определяются по выборке в форме точечных оценок то распределение имеет число степеней свободы k = п - 1 - где — число параметров теоретического распределения. Чтобы проверить состоятельность критериях надо ввести альтернативную гипотезу согласно которой теоретическому распределению в тех же границах разрядов соответствует вектор вероятностей ..., р При справедливости будет иметь значение Тогда математическое ожидание критерия (ПС ростом п функция (П) растет линейно. При любой фиксированной границе критической области с ростом п значение критерия и гарантированно попадет в и гипотеза будет отвергнута. При использовании критерия Пирсона необходимо учитывать следующие практические рекомендации. Границы разрядов следует выбирать равными квантилям теоретического распределения по уровням р = i = 1.../ - 1. Это делает знаменатели дробей в слагаемых формулы (П) одинаковыми, не позволяя одним слагаемым подавлять другие. Число разрядов и объем выборки следует выбирать так, чтобы число степеней свободы k было не менее 10 и среднее число элементов выборки водном разряде было также не менее. Критерий Пирсона является оптимистическим, то есть он склонен давать скорее положительный, чем отрицательный ответ. Поэтому при положительном ответе желательно проверить гипотезу с помощью другого критерия. П6.4.3. Критерий Колмогорова (D-критерий) Критерий использует эмпирическую функцию распределения (П6.30) Критерий основан на максимальной разности между функциями распределения, аи а именно: А. Н. Колмогоров показал, что случайная величина имеет асимптотическое распределение Границей критической области является квантиль распределения Колмогорова по уровню р = 1 - а (табл. П1). Таблица_П_1_.'>Таблица П 1 . Квантили распределения Колмогорова (П6.29) а 0,30 0,20 0 , 9 7 а 0,05 1,235 а 0,01 а 0,001 1,731 1,950 Критерий Колмогорова пессимистический, то есть он склонен давать скорее отрицательный, чем положительный ответ. В этом дополняет критерий Пирсона. Если оба критерия дают одинаковый ответ, то этому ответу можно доверять. Если же критерий Пирсона дает положительный ответа критерий отрицательный, то следует обратиться к третьему критерию. П6.4.4. Критерий Мизеса (критерий со 2 ) Критерий использует эмпирическую функцию распределения (Пи метрику среднеквадратического отклонения (П6.31) Подставляя (П) в (Пи выполняя интегрирование, получим: Входящая в (П) случайная величина К имеет биномиальное распределение с математическим ожиданием МК = nF(x) и дисперсией DK = nF(x)(l - F(x)). Отсюда Теперь можно найти математическое ожидание случайной величины со 2 : Чтобы математическое ожидание не зависело от объема выборки, надо умножить со на п Тогда критерий и его математическое ожидание находят по формулам Аналогично находят дисперсию сои При увеличении п дисперсия критерия стремится асимптотически к значению. Уже при п > 40 можно считать, что Du 1/45. Квантили распределения Мизеса = < z) по уровню 1 - а, необходимые для нахождения границы критической области, приведены в табл. П Таблица а 0,20 П2. Квантили распределения Мизеса a 0,10 0,05 0,3473 0,4614 a 0,03 0,02 0,5489 0,6198 a 0,01 0,001 0,7435 Критерий Мизеса является нейтральными способен сглаживать отдельные даже большие, но маловероятные выбросы. Вместе стем он довольно сложен при вычислении значения критерия. П7. Таблицы стандартных распределений Таблица ПЗ. Распределение Пуассона 1 2 3 4 т 1 2 3 4 т 1 а) а = 0,1 0,9048 0,9953 0,9999 - - - Щт, а) а= 1,1 0,3329 0,6990 0,9004 0,9743 0,9946 0,9990 0,9999 Щт, а) а = 2,1 0,1225 0,3796 = 0,2 8187 9825 9989 9999 - - =1,2 3012 6626 8795 9662 9923 9985 9997 = 2,2 1108 3546 = 0,3 7408 9631 9964 9997 - - =1,3 2725 6268 8571 9569 9893 9978 9996 = 2,3 1003 3309 = 0,4 6703 9384 9921 9992 9999 - 1,4 2466 5918 8335 9463 9857 9968 9994 = 2,4 0907 3084 = 0,5 6065 9098 9856 9982 9998 - 1,5 2231 5578 8088 9344 9814 9955 9991 = 2,5 0821 2873 = 0,6 5488 8781 9769 9966 9996 - =1,6 2019 5249 7834 9212 9763 9940 9987 = 2,6 0743 2674 = 0,7 4966 8442 9659 9942 9992 9999 =1,7 1827 4932 7572 9068 9704 9920 9981 a = 2,7 0672 2487 = 0,8 4493 8088 9526 9909 9986 = 1,8 1653 4628 7306 8913 9636 9896 9974 = 2,8 0608 2311 = 0,9 4066 7725 9371 9865 9977 9997 1,9 1496 4337 7036 8747 9559 9868 9966 a = 2,9 0550 2146 a= 1,0 3679 7358 9197 9810 9963 9994 = 2,0 1353 4060 6767 8571 9473 9834 9955 a = 3,0 0498 1991 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 а = 0,975 0,025 0,242 0,619 1,090 1,623 2,202 2,815 3,454 4,115 5,491 6,201 6,922 7,654 8,396 9,145 9,903 10,668 12,217 а = 0,95 0,0515 0,8175 1,3665 1,970 2,613 3,286 3,981 4,695 5,426 6,169 6,924 7,689 8,474 9,297 10,036 10,832 12,442 13,255 а = 0,90 0,105 0,532 1,102 1,745 2,433 3,152 4,656 5,432 6,221 7,021 7,829 8,646 9,470 10,300 11,135 11,976 12,822 13,672 14,526 а = 0,80 0,223 0,824 1,535 2,297 3,090 3,904 4,734 5,576 6,428 7,289 8,157 9,031 9,910 10,794 11,682 12,574 13,469 14,368 15,268 16,173 а = 0,20 1,609 2,994 4,279 5,515 6,721 7,906 9,075 10,232 11,380 12,519 13,651 14,777 15,897 17,013 18,125 19,233 20,338 21,440 22,538 23,635 а = 0,10 2,303 3,890 5,322 6,681 7,994 9,275 10,532 11,771 12,995 14,206 15,407 16,598 17,782 18,958 20,128 21,292 22,452 23,606 25,903 а = 0,05 2,996 4,744 6,296 7,754 9,154 10,513 11,842 13,148 14,435 15,705 16,962 18,208 19,442 20,669 21,886 23,097 24,301 25,499 26,692 27,879 а = 0,025 3,689 5,572 7,225 8,767 10,242 11,668 13,059 14,423 15,763 17,085 18,390 19,682 20,962 22,230 23,490 24,740 25,983 27,219 28,448 29,671 Таблица П Квантили распределения Пуассона по уровню ат 3 4 5 6 7 8 а) а = 2,1 0,6496 0,8386 0,9379 0,9796 0,9941 0,9985 0,9997 = 2,2 6227 8194 9275 9751 9925 9980 9995 = 2,3 5960 7993 9162 9700 9906 9974 9994 = 2,4 5697 7787 9041 9653 9884 9967 а = 2,5 5438 7576 8912 9580 9858 9958 9989 = 2,6 5184 7360 8774 9510 9828 9947 а = 4936 7141 8629 9433 9794 9934 9981 = 2,8 4695 6919 8477 9349 9756 9919 9976 = 2,9 4460 6696 8318 9258 9713 9901 9969 = 3,0 4232 6472 8128 9161 9665 9881 9962 х 0 1 2 3 4 5 6 7 8 9 0,0 0000 0040 0080 0120 0160 0199 0239 0279 0319 0359 0,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754 0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 0,3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 0,4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879 0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549 0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852 0,8 2881 2910 2939 2967 3000 3023 3051 3079 3106 3133 3159 3186 3212 3238 3264 3289 3314 3340 3365 3389 1,0 3413 3438 3461 3485 3508 3531 3554 3577 3600 3621 1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830 1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015 4032 4049 4066 4082 4100 4115 4131 4147 4162 4177 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319 1,5 4332 4345 4357 4370 4382 4394 4406 4418 4430 4441 1,6 4452 4463 4474 4485 4495 4505 4515 4525 4535 4545 1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633 4641 4649 4656 4664 4671 4678 4686 4693 4700 4706 1,9 4713 4719 4726 4732 4738 4744 4750 4756 4762 4767 2,0 4773 4778 4783 4788 4793 4798 4803 4808 4812 4817 2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857 2,2 4861 4865 4868 4871 4875 4878 4881 4884 4887 4890 2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916 2,4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974 2,8 4974 4920 4922 4925 4927 4929 4931 4932 4934 4936 2,9 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 3,0 4918 4920 4922 4925 4927 4929 4931 4932 4934 Таблица П Функция Лапласа k 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 38 00 a = 0,20 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,383 1,372 1,356 1,345 1,337 1,330 1,325 1,321 1,318 1,315 1,313 1,310 1,283 a = 0,10 6,314 6,920 2,353 2,132 2,015 1,895 1,860 1,833 1,812 1,782 1,761 1,746 1,734 1,725 1,717 1,711 1,706 1,701 1,697 1,648 a = 0,05 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,179 2,145 2,120 2,101 2,086 2,074 2,064 2,056 2,048 2,042 1,965 a = 0,025 24,452 6,205 4,177 3,495 3,163 2,969 2,841 2,752 2,685 2,634 2,560 2,510 2,473 2,445 2,423 2,405 2,391 2,379 2,369 2,360 2,241 a = 0,02 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,681 2,624 2,583 2,552 2,528 2,508 2,492 2,479 2,467 2,457 2,326 a = 0,01 63,657 9,925 5,841 4,604 4,032 3,307 3,499 3,355 3,250 3,169 3,055 2,977 2,921 2,878 2,845 2,819 2,797 2,779 2,763 2,750 2,586 a = 0,005 127,3 14,089 7,453 5,597 4,773 4,317 4,029 3,833 3,690 3,581 3,428 3,326 3,252 3,193 3,153 3,119 3,092 3,067 3,047 3,030 2,820 a = 0,001 636,6 31,660 12,922 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,313 4,140 4,015 3,922 3,849 3,792 3,745 3,704 3,674 3,646 Список литературы В. А, Прудников А. П Справочник пооперационному вычислению. М Высш. шк, 1965. - 466 с А. Я Работы по математической теории массового обслуживания. М Физматлит, 1963. - 236 с И. А Черкесов Г. Н. Логико-вероятностные методы исследования надежности структурно-сложных систем. — М Радио и связь, 1981. 264 с Крамер Г Математические методы статистики. — М Мир, 1975. — 548 с Фишер Р. А Статистические методы для исследователей. — М Госстатиз- дат, 1958. - 326 с. |