Шпоры по матану(1 курс). 1. Функция, одз
Скачать 0.69 Mb.
|
5. Статистические оценки: несмещенные, эффективные, состоятельныеРассматривая x1, x2, … , xn как независимые случайные величины X1, X2, … , Xn, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Пусть Θ* - статистическая оценка неизвестного параметра Θ теоретического распределения. Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т. е. М(Θ*) = Θ. Возможные значения Θ* могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия D (Θ*) может быть значительной существует возможность допустить большую ошибку. По этой причине к статистической оценке предъявляется требование эффективности. Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. Состоятельной называют статистическую оценку, которая при n стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n стремится к нулю, то такая оценка оказывается и состоятельной. 6. Точность и надежность оценкиПусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Если Δ > 0 и Θ – Θ* < Δ, то чем меньше Δ, тем оценка точнее. Таким образом, положительное число Δ характеризует точность оценки. Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность , с которой осуществляется неравенство Θ – Θ* < Δ. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999. Доверительным называют интервал (Θ* - Δ, Θ* + Δ), который покрывает неизвестный параметр с заданной надежностью . Для определения необходимой численности выборки нужно задать уровень точности выборочной совокупности (Δ) с определенной вероятностью (). Ф ((Δ√n ) / σ) = / 2 можно найти значение t = (Δ√n ) / σ n = (t2σ2)/Δ2 7. Понятие о критериях согласия. Проверка гипотез о равенстве долей и средних. Проверка гипотезы о виде распределения.Статичтической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой. Правило, по которому принимают решение о том, принять или отклонить гипотезу Н0, называют критерием. Обычно критерием служит некая случайная величина, вычисляемая по выборке. (Критерием согласия называют критерий проверки гипотезы о предполагаемом законе не известного распределения.) В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов: 1)ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза; 2) ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность совершить ошибку первого рода принято обозначать через . Её называют уровнем значимости. Статичтическим критерием называют величину К, которая служит для проверки нулевой гипотезы. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Облать принятия гипотезы – совокупность значений критерия, при которых гипотезу принимают. Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают. облать значений К разбивается на две подоблати: подоблать принятия нулевой гипотезы (К кр.лев; К кр.прав); подобласть отклонения гипотезы Н0. Из определения уровня значимости следует, что = К кр.лев f(k)dk++f(k)dk - К кр.прав. Если плотность распределения К симметрична относительно оси ординат,то +f(k)dk=/2. Если f(k) и известны, то можно найти К кр.прав. К кр.прав. Проверка гипотезы по равенству математических ожиданий нормально распределённых совокупностей при известных дисперсиях. Пусть Х – нормально распределённая случайная величина с неизвестным М(х)=ах и известной D(x)=G2x ; Y - нормально распределённая случайная величина с неизвестным М(х)=ау и известной D(x)=G2y В результате проведённого эксперимента вычисляется хсредняя и усредняя. Выдвигаем гипотезу Н0: ах=ау и конкурирующую гипотезу Н1: ах не равно ау. Требуется оценить нулевую гипотезу с уровнем значимости . Решение. Хcр. распределена по нормальному закону М(х)=ах и D(x)=G2x/n. Уср. распределена по нормальному закону М(у)=ау и D(у)=G2y/m Хср.-Уср. распределена по нормальному закону М(х-у)=0 и D(x-у)=G2x/n+G2y/m. Введём случайную величину К= Хср .- У ср. G2x/n+G2y/m К имеет нормальное распределение с М(к)=0 и D(k)=1. нормальное распределение симетрично +f(k)dk=/2=0,5-Ф(К кр.прав.) К кр.прав. Далее находим по таблицам фукнции Лапласса К кр.прав. Далее находим Кнабл. Затем: 1) Если Кнабл.[Ккр.лев; К кр.прав.], то гипотеза Н0 принимается. 2) если Кнабл{критическая область}, то гипотеза Н0 отвергается. Проверка гипотезы о равенстве математическом ожидании нормально распределённой случайной величины при равных неизвестных диспрерсиях. Пусть Х – нормально распределённая случайная величина с неизвестным М(х)=ах и D(x)=G2 ; Y - нормально распределённая случайная величина с неизвестным М(х)=ау и D(x)=G2 В результате проведённого эксперимента вычисляется хсредняя и усредняя. Выдвигаем гипотезу Н0: ах=ау и конкурирующую гипотезу Н1: ах не равно ау. Требуется оценить нулевую гипотезу с уровнем значимости . Решение. Построим К. n . n . S2x=((xi-x)2)/(n-1), S2y=((yi-y)2)/(n-1). i=1 i=1 Х – случайная величина, распределённая по нормальному закону с числовыми характеристиками (ах, G/n). Y – случайная величина, распределённая по нормальному закону с числовыми характеристиками (аy, G/m) Оказывается случайная величина S2x и S2y имеют распределение 2(«хи-квадрат») со степенями свободы (n-1) и (m-1). Введём случайную величину U=((n-1)S2x)/G2+((m-1)S2y)/G2 имеет распределение 2 с числом степеней свободы n+m-2. Случайная величина Х-У имеет нормальный закон распределения с характеристиками (ах-ау, G2/n+G2/m) Поэтому нормализированная случайная величина U = (х-у)-(ах-ау) G2/n+G2/m Имеет нормальное распределение N(0,1), а отношение V = ( x- y) –(ax-ay) . U/(m+n-2) 1/m+1/n[(m-1)S2x/2+(n-1)S2y/2]*1/(m+n-2) имеет распределение Стьюдента с (m+n-2) степенями свободы. Таким образом можно найти Кнабл. Кнабл. =(х-у)/(1/m+1/n)*[(m-1)S2x+(n-1)S2y]/(m+n-2) Имеет распределение Стьдента с (m+n-2) степенями своды. Далеее вывод делается как в предыдудей задаче. 8. распределение 2Распределение 2 – закон распределения непрерывной случайной величины, плотность которой определяется формулой. f 2 (x)= 1* e-x/2x(k/2)-1, x>0 2k/2Г(k/2) 0, x0 чило к=n-1 - число степеней свободы. Г(х) – гамма-функция Г(х)= tx-1e-tdt 0 C увеличением степеней свободы распределение медленно приближается к нормальному. Причём для f 2 (x) М{ }=n, D{ }=n2 Для дальнейшего «въезжания» необходимо иметь хотя бы отдаленное представление о следующих понятиях 9. Распределение Стьюдента ( или t-распределение) .Пусть Z – нормальная случайная величина, причём M(Z)=0, (Z)=1, а V – независимая от Z величина, которая распределена по закону 2 с к степенями свободы. Тогда величина Т= Z V/k (отношение нормированной нормальной величины к квадратному корню из независимой случайной величины, которая распределена по закону 2 с к степенями свободы, делённой на к, распределено по закону Стьюдента с к степенями свободы.) 10. Распределение F Фишера – Снедекора.Если U и V- независимые случайные величины, распределённые по закону 2 со степенями свободы к1 и к2, то величина F=U/k1 V/k2 имеет распределение, которое называется распределением F Фишера-Снедекора со степенями свободы к1 и к2 (иногда его обозначают через V2) Плотность распределения. f(x) =Г((m+n)/2)*mm/2*nn/2 * xn/2-1 Г(m/2)*Г(n/2) (m+nx)(m+n)/2, x>0 При больших m и n переходит в нормальное распределение. Число степеней свободы k1=n-1,k2=m-1. (cправка закончена) 11. Проверка аналитических гипотез1. Сравнение двух средних норм генеральных совокупностей, дисперсии коттрых известны. 2. Сравнение двух средних нормальных генеральных совокупностей, дисперсии, которых неизвестны и одинаковы. Дано Х и У – случайные величины с нормальными распределениями. Найдены Хср. и Уср. Известно – G2x=G2y=G2 MX=MY при конкурирующей гипотезе. Н1: МХ не равно МУ с уровнем значимости . Схема решений. 1. Находим S2x и S2y - исправленные выборочные. 2. Вычисляем набд=людаемое значение критерия Т= ( x- y) * mn(m+n-2) (n-1)S2x+(m-1)S2Y m+n Оказывается критерий Т –случайная величина распределения Стьюдента. 3. По заданному уровню значений и числу степеней свободы k=m+n-2 по таблице критических точек распределения Стьюдента находим критическое значение параметра Ткр. (, к) 4. Сравниваетм Ткр. И Тнабл., делаем вывод: а) если |Тнабл.|< Ткр.(, к), то нет оснований отвергнуть Н0. б) если |Тнабл.|>Ткр.(, к), то гипотезу отвергаем. 3 . Сравнение двух дисперсий нормальных генеральных совокупностей. Х и У – нормальные генеральные совокупности. По выборкам найдены S2x и S2y Требуется проверить гипотезу Н0: DX=DY при конкурирующей гипотезе Н1 а) DX>DY б)DX не равно DY. Схема решение в случае а). 1. Вычисляется наблюдаемое значение критерия. Fнабл.= S2больша е/ S2меньшая =S2x/ S2y. Оказывается, что F – случайная величина, распределённая по закону Фишера-Снедекора. 2.По заданному уровню значимости и числу степеней свободы k1=n-1,k2=m-1 находим критическую точку Fкр. (,k1,k2) k1 – число степеней свободы большей дисперсии,k2 - число степеней свободы меньшей дисперсии. 3.Сравнивая Fкр. и Fнабл. ,делаем вывод: Если Fкр. < Fнабл., то гипотезу Н0 принимаем, если Fкр. > Fнабл., то гипотезу отвергаем. Схема решения в случае б) аналогична,только в №2 F(/2,k1,k2), в №3 k1=n-1,k2=m-1 или k2=n-1,k1=m-1 , так как k1 – число степеней свободы большей дисперсии,k2 - число степеней свободы меньшей дисперсии. Проверка статистической гипотезы о виде закона распределения (Критерий Пирсона). Х – случайная величина. Требуется но уровню значимости проверить гипотезу о нормальном распределении Х. Схема решения. 1. Весь интервал выборочных значений разделить на S частных интервалов одинаковой длины. Находим середины частичных интервалов, переходим к новому выборочному распрелению. ni –число фактических зачений попавших в i интервал. 2. Для получения последовательности равностоящих вариантов находим X* ср =(Si=1nixi)/n, G*=ni*(xi-x*)2/n. попадания х в i интервал. Если х – нормально распределённая случайная величина, то Z распределена по нормальному закону с нулевым математическим ожиданием и единичной дисперсией и pi=Ф(Zi+1) – Ф(Zi), а Zi=(xi-x*)/G* 3. Нормируем случайную величину х, рассматриваетм величину Z=(x-x*)/G* 4. вычисляем теоретические (вычисленные в предположении нормального распределения) частоты ni =n*pi ,pi - веростность 5. В качестве проверки нулевой гипотезы применим критерий Пирсона. 2=s(ni-ni)2 i=1 ni 6. По таблиые критических точек распределения 2 по заданному уровню значимости и числу степеней свободы k=s-3 находим критическую точку 2кр.(,к). 7. Сравнивая 2кр. и 2набл., делаем вывод: - если 2набл.< 2кр. , то гипотезу о нормальном распределении Х принимаем (с уровнем значимости ) - если 2набл.> 2кр. , то гипотезу о нормальном распределении Х отвергаем. (Аналогично проверяется,что гипотеза принадлежит любому другому распределению, только в № 4 рi будет считаться в соответствии с этим распределением.) |