x n ), b a = x − √ 3 b σ(x n ). Окончательно имеем bb(
X n ) = X + √ 3 b σ(
X n ), b a(
X n ) = X − √ 3 b σ(
X n ). Метод максимального правдоподобия Одним из наиболее универсальных методов оценивания параметров является метод максималь- ного правдоподобия (предложенный Р. Фишером), суть которого состоит в следующем. Рассмотрим функцию правдоподобия случайной выборки
X n из генеральной совокупности X, плотность распределения p ¡ x; θ ¢ которой известна с точностью до параметра θ ∈ Θ: L(X 1 , . . . , X n , θ) = n Y i=1 p ¡ X i ; θ ¢ . 70 По определению, оценкой максимального правдоподобия параметра θ называют статистику b θ( Xn), значения b θ которой для любой выборки xnудовлетворяют условию L( xn; b θ) = max θ∈Θ L( xn; θ) ,(15.2) т.е. для выборки функция правдоподобия, как функция аргумента θ, достигает максимума. Если функция L( xn; b θ) дифференцируема как функция аргумента θ при любом значении xnиз множества Xnзначений случайной выборки Xnи максимум L¡ xn; θ¢ достигается во внутрен- ней точке из Θ, то значение точечной оценки максимального правдоподобия в случае скалярного параметра удовлетворяет уравнению (необходимому условию экстремума) ∂L¡ xn; θ¢ ∂θ= 0 ,или ∂ ln L¡ xn; θ¢ ∂θ= 0 ,(15.3) так как при логарифмировании точки экстремума остаются теми же, а уравнение, как правило, упрощается. Если распределение случайной величины X зависит от вектора параметров θ = ( θ1 ; . . . ; θr), то второе из уравнений (15.3) заменяется системой уравнений∂ ln L¡ xn; θ¢ ∂θk= 0 ,k = 1 , r.(15.4) Уравнения (15.3) и (15.4) называют уравнениями правдоподобия. Для наиболее важных се- мейств распределений p¡ x; θ¢ уравнение правдоподобия имеет единственное решение b θ = b θ1 ; . . . ; b θrВо многих случаях решение системы (15.4), являющейся, как правило, нелинейной, приходится искать численными методами. Пример 15.3 Пусть Xn— случайная выборка из N ( θ1 , θ2 2 ). Методом максимального правдоподо- бия найдем оценку вектора параметров θ = ( θ1 ; θ2 ). В этом случае функция правдоподобия L¡ Xn; θ1 , θ2 ¢ = 1 ¡ θ2 √2 π¢ nexp ³ −1 2 θ2 2 nX i=1 ( Xi− θ1 ) 2 ´ и, как следствие, ln L¡ xn; θ1 , θ2 ¢ = −n ln √2 π − n ln θ2 −1 2 θ2 2 nX i=1 ( xi− θ1 ) 2 .Поскольку число неизвестных параметров r = 2, система уравнений правдоподобия (15.4) будет состоять из двух уравнений: ∂∂θ1 ln L = 1 θ2 2 nX i=1 ( xi− θ1 ) = 0 ,∂∂θ2 ln L = −nθ2 + 1 θ3 2 nX i=1 ( xi− θ1 ) 2 = 0 .Решая систему, получаем b θ1 = 1 nnX i=1 xi,b θ2 2 = 1 nnX i=1 ( xi− x) 2 .Следовательно, оценками максимального правдоподобия для математического ожидания M X = θ1 и дисперсии D X = θ2 2 случайной величины, распределенной по нормальному закону, являются со- ответственно выборочное среднее X = 1 nnX i=1 Xiи выборочная дисперсияb σ2 ( Xn) = 1 nnX i=1 ( Xi− X) 2 . # 71 Лекция 16 Интервальные оценки и доверительные интервалы Некоторые важные распределения Обозначим Γ( p) — гамма-функцию, определяемую формулой Γ( p) = ∞Z 0 tp−1 e−tdt,а B( x, y) — бета-функцию, определяемую формулой B( p, q) = Γ( p)Γ( q) Γ( p + q) = 1 Z 0 up−1 (1 − u) q−1 du.Определение 16.1 Случайную величину с плотностью p( x) = 1 2 m/2 Γ( m/2) xm/2 −1 e−x/2 , x > 0 ,0 ,x 6 0 ,называют случайной величиной, имеющей распределениеχ2 ( хи-квадрат) или χ2 -распределение с m степенями свободы. Определение 16.2 Случайную величину с плотностью p( x) = 1 √πmΓ(( m + 1) /2) Γ( m/2) 1 (1 + x2 /m) m/2 ,−∞ < x < ∞,называют случайной величиной, имеющей распределение Стьюдента с n степенями свободы. При n → ∞ плотность распределения Стьюдента стремится к плотности стандартного нормаль- ного распределения N (0 , 1). Для квантилей tp( m) распределения Стьюдента уровня p с m степенью свободы справедливо соотношение tp( m) = −t1 −p( m) ,которое следует из четности плотности распределения Стьюдента. Определение 16.3 Случайную величину с плотностью p( x) = ³ nm´ n/2 B³ n2 ,m2 ´ xn2 −1 ³ 1 + nxm´ n+ m2 , x > 0; 0 ,x < 0 ,назовем случайной величиной, имеющей распределение Фишера ( F -распределение, распределе- ние Снедекора) с числом степеней свободы n и m. 72 Для квантилей Fp( n, m) распределения Фишера уровня p с n и m степенями свободы имеет место соотношениеFp( n, m) = 1 F1 −p( m, n) .Справедливы следующие теоремы. Теорема 16.1 Пусть ( X1 , . . . , Xn) — выборка из распределения N ( µ, σ2 ) . Тогда выборочное среднееX = 1 nnP i=1 Xiи исправленная выборочная дисперсия S2 ( Xn) = 1 n − 1 nP i=1 ( Xi− X) 2 независимы; приэтом случайная величина√n( X − µ) σимеет стандартное нормальное распределение, случайнаявеличина√n( X − µ) S( Xn) — распределение Стьюдента с n − 1 степенью свободы, а случайная величина( n − 1) S2 ( Xn) σ2 — χ2 -распределение с n − 1 степенью свободы.Теорема 16.2 Пусть X = ( X1 , . . . , Xn) и Y = ( Y1 , . . . , Ym) — две независимые выборки из распреде-лений N ( µ1 , σ2 1 ) и N ( µ2 , σ2 2 ) соответственно,X = 1 nnX i=1 Xi,S2 ( Xn) = 1 n − 1 nX i=1 ( Xi− X) 2 ,Y = 1 mmX i=1 Yi,S2 ( Yn) = 1 m − 1 mX i=1 ( Yi− Y ) 2 .Тогда случайная величинаS2 ( Xn) S2 ( Yn) имеет распределение Фишера с числом степеней свободы n − 1 и m − 1 .Понятия интервальной оценки и доверительного интервала При оценивании неизвестных параметров наряду с рассмотренными выше точечными оценкамииспользуются также интервальные оценки. В отличие от точечной оценки интервальная оценка позволяет получить вероятностную характеристику точности оценивания неизвестного параметра. Пусть Xn— случайная выборка объема n из генеральной совокупности X с функцией распре- деления F¡ x; θ¢ , зависящей от параметра θ, значение которого неизвестно. Предположим, что для параметра θ построен интервал ¡ θ( Xn) , θ( Xn) ¢ , где θ( Xn) и θ( Xn) являются функциями случайной выборки Xn, такими, что выполняется равенство P n θ( Xn) < θ < θ( Xn) o = γ.(16.1) В этом случае интервал ¡ θ( Xn) , θ( Xn) ¢ называют интервальной оценкой для параметра θ с коэффициентом доверия γ (или, сокращенно, γ-доверительной интервальной оценкой), а θ( Xn) и θ( Xn) соответственно нижней и верхней границами интервальной оценки. Интервальная оценка ¡ θ( Xn) , θ( Xn) ¢ представляет собой интервал со случайными границами, который с заданной вероятностью γ накрывает неизвестное истинное значение параметра θ. Таким образом, для различных реализаций случайной выборки Xn, т.е. для различных элементов выбороч-ного пространства Xn, статистики θ( Xn) и θ( Xn) могут принимать различные значения. Более того, согласно (16.1), существует подмножество K ⊂ Xn, такое, что если xn∈ K, то θ /∈¡ θ( xn) , θ( xn) ¢ Вероятностной характеристикой точности оценивания параметра θ является случайная величина l( Xn) = θ( Xn) − θ( Xn) ,которая для любой реализации xnслучайной выборки Xnесть длина интервала ¡ θ( xn) , θ( xn) ¢ Интервал ¡ θ( xn) , θ( xn) ¢ называют доверительным интервалом для параметра θ с коэффи- циентом доверия γ или γ-доверительным интервалом. Наряду с термином “коэффициент доверия” широко используют также термины доверитель-ная вероятность и уровень доверия. При этом коэффициент доверия γ чаще всего выбирают равным 0 ,9, 0 ,95 или 0 ,99, т.е. близким к 1. В некоторых ситуациях (например, при рассмотрении дискретных случайных величин) вместо равенства (16.1) удается обеспечить лишь неравенствоP © θ( Xn) < θ < θ( Xn) ª > γ,т.е. построить интервальную оценку для параметра θ с коэффициентом доверия, не меньшим γ. 73
Примеры построения интервальных оценок для параметров нормальной случайной величины Доверительная оценка для математического ожидания при известной дис- персии Пусть X n = (X 1 , . . . , X n ) — случайная выборка объема n из генеральной совокупности X, распреде- ленной по нормальному закону с параметрами µ и σ 2 , σ 2 известна. В данном случае статистика X − µ σ √ n имеет стандартное нормальное распределение N (0, 1). Поэтому P ½ −u 1−α < X − µ σ √ n < u 1−α ¾ = 1 − 2α, где u 1−α — квантиль уровня 1 − α стандартного нормального распределения. Умножая все части двойного неравенства на − σ √ n , а затем прибавляя X, получим P ½ X − σ √ n u 1−α < µ < X + σ √ n u 1−α ¾ = 1 − 2α, т.е. случайный интервал ³ X − σ √ n u 1−α , X + σ √ n u 1−α ´ накрывает неизвестное математическое ожи- дание µ с необходимой доверительной вероятностью 1 − 2α. Доверительная оценка для математического ожидания при неизвестной дисперсии При неизвестной дисперсии σ 2 статистика X − µ S( X n ) √ n имеет распределение Стьюдента с n − 1 степенями свободы. Поэтому P ( t α (n − 1) < X − µ S( X n ) √ n < t 1−α (n − 1) ) = 1 − 2α, где t q (n − 1) — квантиль уровня q распределения Стьюдента с n − 1 степенями свободы. Поскольку плотность распределения Стьюдента — четная функция, то t q (n − 1) = −t 1−q (n − 1). Умножая все части двойного неравенства на − S( X n ) √ n , а затем прибавляя X, заключаем, что нижняя и верхняя границы интервальной оценки с коэффициентом доверия γ = 1 − 2α для параметра µ в случае с неизвестной дисперсией можно определить по формулам µ( X n ) = X − S( X n ) √ n t 1−α (n − 1), µ( X n ) = X + S( X n ) √ n t 1−α (n − 1). Доверительная оценка для разности математических ожиданий нормаль- ных случайных величин с известными дисперсиями Пусть X n = (X 1 , . . . , X n ) и Y n = (Y 1 , . . . , Y m ) — две независимые выборки из распределений N (µ 1 , σ 2 1 ) и N (µ 2 , σ 2 2 ) соответственно, X = 1 n n X i=1 X i , Y = 1 n n X i=1 Y i . Нетрудно показать, что случайная величина (X − Y ) − (µ 1 − µ 2 ) r σ 2 1 n + σ 2 2 m 74
|