ПСК. Теория вероятностей и математическая статистика
Скачать 0.64 Mb.
|
ЗАДАЧИ 11.1. Определить закон распределения вероятностей величины Y = sign(X1 +X2), если X1 и X2 – случайные величины, равномерно распределенные на интервалах (–1, 1) и (–1, 2) соответственно. Ответ: p(Y = 1) = 2/3; p(Y = –1) = 1/3. 11.2. Случайная точка (X1, X2) равномерно распределена в квадрате с вершинами в точках (0, 0), (0, 1), (1, 1) и (1, 0). Определить плотность вероятности величины 1 2 Y X X = Ответ: g(y) = –lny, 0 < y ≤ 1. 11.3. Независимые случайные величины X и Y имеют нулевое математическое ожидание и единичную дисперсию. Найти коэффициент корреляции случайных величин U = 2X + Y и V = 2X – Y. Ответ: R YZ = 0,6. 11.4. В треугольник с вершинами (0, 0), (0, 4), (4, 0) наудачу ставится точка (X, Y). Вычислить M [XY] и D[X + Y]. Ответ: M [XY] = 12/9, D[X + Y] = 8/9. 12. ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ Генеральной совокупностью называется множество объектов, из которых производится выборка. Каждый из объектов задает фиксированное значение случайной величины. Выборка – множество {x1, x2, ..., xn} случайно отобранных объектов (значений) из генеральной совокупности. Объемом выборки n называется число входящих в нее объектов. Вариационным рядом называется выборка { 1 2 ˆ ˆ ˆ , ,..., n x x x } , полученная в результате расположения значений исходной выборки в порядке возрастания. Значения ˆ i x называются вариантами. Эмпирическая функция распределения определяется формулой 1 * 1 ˆ 0, ; ˆ ˆ ( ) , ; ˆ 1, i i n x x i F x x x x n x x + ≤ ⎧ ⎪⎪ = < ≤ ⎨ ⎪ > ⎪⎩ (12.1) Эмпирическая функция распределения F*(x) является наилучшей оценкой функции распределения F(x) (несмещенной, состоятельной, эффективной). Если анализируемая СВ Х является дискретной с известным множеством значений { } 1 2 , , ..., m x x x , то по исходной выборке объемом n определяется статистический ряд распределения вероятностей : x j х 1 х 2 х m * j p k 1 k 2 .... k m где * j j k p n = – частота появления j-го значения, k j – числозначений x j в выборке. Если анализируемая СВ Х является непрерывной, то по исходной выборке строится интервальный статистический ряд вероятностей : j A j B j h j ν j * j p * j f 1 A 1 B 1 h 1 ν 1 * 1 p * 1 f M A M B M h M ν M * M p * M f где j – номер интервала; M – число непересекающихся и примыкающих друг к другу интервалов, на которые разбивается диапазон значений [ ] 1 ˆ ˆ , n x x : ( ) ( ) ( ) ( ) int , 100, M int 2 4 lg , 100, n n n n ⎧ ≤ ⎪ ≈ ⎨ − ⋅ > ⎪⎩ (12.2) где int(x) – целая часть числа x. Желательно, чтобы n без остатка делилось на M; A j , B j – левая и правая границы j-го интервала (Aj+1 = Bj), причем 1 1 ˆ A x = , ˆ M n B x = ; hj = Bj – Aj – длина j-го интервала; νj – количество чисел в выборке, попадающих в j-й интервал; * j j p n ν = – частота попадания в j-й интервал; * * j j j j j p f h nh ν = = – статистическая плотность вероятности в j-м интервале. При построении интервального статистического ряда вероятностей используют следующие методы разбиения диапазона значений на интервалы: 1) Равноинтервальный, т.е. все интервалы одинаковой длины: 1 ˆ ˆ , n j x x h h j M − = = ∀ , (12.3) 1 ˆ ( 1) , 2, j A x j h j M = + − = (12.4) 2) Равновероятностный, т.е. границы интервалов выбирают так, чтобы в каждом интервале было одинаковое число выборочных значений (необходимо, чтобы n без остатка делилось на M): * 1 , j j n p j M M ν ν = = = ∀ , (12.5) ( 1) ( 1) 1 ˆ ˆ , 2, 2 j j j x x A j M ν ν − − + + = = (12.6) Гистограмма – статистический аналог графика плотности вероятности * ( ) f x СВ и она строится по интервальному статистическому ряду. Гистограмма представляет собой совокупность прямоугольников, построенных, как на основаниях, на интервалах hj статистического ряда с высотой, равной статистической плотности вероятности * j f в соответствующем интервале. Для равноинтервального метода все прямоугольники гистограммы имеют одинаковую ширину, а для равновероятностного метода – одинаковую площадь. Сумма площадей всех прямоугольников гистограммы равна 1. Пример 12.1. Задана выборка случайной величины X: {4, 3, 3, 5, 2, 4, 3, 4, 4, 5}. Построить вариационный ряд и график эмпирической функции распределения F*(x). Решение. Вариационный ряд случайной величины имеет вид {2, 3, 3, 3, 4, 4, 4, 4, 5, 5}. Определяем значения эмпирическойфункции распределения F*(x) по формуле (12.1): * 0 , 2 ; 0 ,1, 2 3; ( ) 0 , 4 , 3 4 ; 0 , 8 , 4 5 ; 1, 5 . x x F x x x x ≤ ⎧ ⎪ < ≤ ⎪⎪ = < ≤ ⎨ ⎪ < ≤ ⎪ > ⎪⎩ График функции F*(x) имеет вид (рис. 12.1): 2 3 4 5 x F * (x ) 0 ,2 0 ,4 0 ,6 0 ,8 1 ,0 Рис. 12.1 Замечание. В каждой точке оси x, соответствующей значениям xi, функция F*(x) имеет скачок. В точке разрыва F*(x) непрерывна слева и принимает значение, выделенное знаком . Пример 12.2. Вариационный ряд случайной величины x имеет вид –6,237 –6,229 –5,779 –5,139 –4,950 –4,919 –4,636 –4,560 –4,530 –4,526 –4,523 –4,511 –4,409 –4,336 –4,259 –4,055 –4,044 –4,006 –3,972 –3,944 –3,829 –3,794 –3,716 –3,542 –3,541 –3,431 –3,406 –3,384 –3,307 –3,181 –3,148 –3,124 –3,116 –2,892 –2,785 –2,734 –2,711 –2,637 –2,633 –2,428 –2,381 –2,339 –2,276 –2,222 –2,167 –2,111 –2,034 –1,958 –1,854 –1,803 –1,774 –1,755 –1,745 –1,713 –1,709 –1,566 –1,548 –1,480 –1,448 –1,353 –1,266 –1,229 –1,179 –1,130 –1,102 –1,060 –1,046 –1,035 –0,969 –0,960 –0,903 –0,885 –0,866 –0,865 –0,774 –0,721 –0,688 –0,673 –0,662 –0,626 –0,543 –0,445 –0,241 –0,174 –0,131 0,115 0,205 0,355 0,577 0,591 0,795 0,986 1,068 1,099 1,195 1,540 2,008 2,160 2,534 2,848. Построить гистограмму равноинтервальным и равновероятностным методами. Решение. Объем выборки равен 100. Количество интервалов определяем по формуле (12.2): 100 10. M n ≈ = = Для равноинтервального метода построения интервального статистического ряда вероятностей величины hj, Aj, Bj рассчитаны по формулам (12.3), (12.4): j Aj Bj hj νj * j p * j f 1 –6,237 –5,3345 0,9085 3 0,03 0,033 2 –5,3345 –4,426 0,9085 9 0,09 0,099 3 –4,426 –3,5175 0,9085 13 0,13 0,143 4 –3,5175 –2,609 0,9085 14 0,14 0,154 5 –2,609 –1,7005 0,9085 16 0,16 0,176 6 1,7005 –0,792 0.9085 19 0,19 0,209 7 –0,792 0,1165 0,9085 12 0,12 0,132 8 0,1165 1,025 0,9085 6 0,06 0,066 9 1,025 1,9335 0,9085 4 0,04 0,044 10 1,9335 2,848 0,9085 4 0,04 0,044 Равноинтервальная гистограмма имеет вид (рис. 12.2): f* (x ) x 0 ,2 0 ,1 5 0 ,1 0 0 ,0 5 0 -2 -4 -6 0 2 Рис. 12.2 Для равновероятностного метода построения интервального статистического ряда вероятностей величины νj, * j p , Aj, Bj рассчитаны по формулам (12.5), (12.6): j Aj Bj hi ν j * j p * j f 1 –6,2370 –4,5245 1,7125 10 0,1 0,0584 2 –4,5245 –3,8865 0,6380 10 0,1 0,1567 3 –3,8865 –3,1645 0,7220 10 0,1 0,1385 4 –3,1645 –2,4045 0,7600 10 0,1 0,1316 5 –2,4045 –1,7885 0,6160 10 0,1 0,1623 6 –1,7885 –1,3095 0,4790 10 0,1 0,2086 7 –1,3085 –0,9319 0,3766 10 0,1 0,2655 8 –0,9319 –0,5843 0,3476 10 0,1 0,2877 9 –0,5843 0,6932 1,2775 10 0,1 0,0783 10 0,6932 2,8480 2,1548 10 0,1 0,0464 Равновероятностная гистограмма имеет вид (рис. 12.3): -6 -4 -2 0 2 x f*(x) 0,3 0,2 0,1 Рис. 12.3 ЗАДАЧИ 12.1. Построить эмпирическую функцию распределения по вариационному ряду из примера 12.2. 12.2. Построить эмпирическую функцию распределения, а также гистограмму равноинтервальным и равновероятностным методами для выборки, заданной вариационным рядом 2,60 2,62 2,74 2,76 3,17 3,18 3,29 3,35 3,40 3,42 3,46 3,54 3,68 4,06 4,07 4,09 4,15 4,23 4,24 4,28 4,30 4,43 4,46 4,68 4,77 5,19 5,22 5,45 5,51 5,57 5,59 5,64 5,66 5,67 5,73 5,76 5,88 6,11 6,13 6,23 6,55 6,70 7,30 7,62 7,72 7,80 7,91 7,94 7,97 8,00 8,10 8,47 8,63 8,80 8,84 8,97 9,01 9,02 9,20 9,22 9,41 9,57 9,65 9,92 9,98 10,02 10,07 10,16 10,24 10,27 10,38 10,62 10,63 10,73 10,96 10,98 10,99 11,00 11,01 11,01 11,11 11,23 11,35 11,56 11,58 11,73 11,77 11,99 12,10 12,13 12,18 12,24 12,53 12,57 12,96 12,98 13,04 13,22 13,35 13,45. 12.3. Построить равноинтервальным и равновероятностным методами интервальный статистический ряд вероятностей и гистограмму случайной величины по следующей выборке: 8,60 6,54 3,26 5,96 4,68 6,55 11,33 9,50 8,58 7,16 10,84 5,81 2,92 8,96 12,60 11,08 4,52 8,06 2,42 10,05 10,29 10,03 4,77 9,46 7,26 2,62 4,49 11,80 11,68 8,61 12,82 5,36 7,85 11,69 11,00 5,07 2,23 10,14 9,89 10,53 5,10 7,27 6,94 6,53 11,08 6,61 9,27 5,83 9,56 7,51 5,98 8,64 5,69 10,54 10,20 12,11 2,92 12,31 5,95 2,82 7,69 4,30 11,17 6,99 12,78 3,64 11,80 8,61 3,80 7,42 5,09 7,68 3,98 10,59 8,40 12,76 4,37 5,88 9,94 10,46 2,75 4,22 11,56 10,43 3,66 10,14 6,53 10,83 5,36 6,67 4,83 9,66 2,30 7,04 7,88 8,30 2,22 8,71 7,79 9,82. 13. ТОЧЕЧНЫЕ ОЦЕНКИ ЧИСЛОВЫХ ХАРАКТЕРИСТИК И ПАРАМЕТРОВ Статистической оценкой ˆ Q параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Точечной называется оценка, определяемая одним числом. Оценка ˆ Q называется состоятельной , если при увеличении объема выборки n она сходится по вероятности к значению параметра Q: ˆ ˆ lim( ( )) 1, 0 p n n Q Q P Q Q ε ε →∞ →∞ ⎯⎯⎯ → ⇒ − < = ∀ > . Оценка ˆ Q называется несмещенной, если ее математическое ожидание точно равно параметру Q для любого объема выборки: ˆ M [ ] , Q Q n = ∀ Несмещенная оценка ˆ Q является эффективной , если ее дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра. Состоятельная несмещенная оценка математического ожидания , называемая выборочным средним x , вычисляется по формуле * 1 1 n X i i m x x n = = = ∑ (13.1) Числовые характеристики x : M[ ] , D[ ] X X D x m x n = = Состоятельная несмещенная оценка дисперсии равна ( ) 2 * 2 2 2 0 1 1 1 1 1 1 1 n n X i i i i n D S x x x x n n n = = = = − = − − − − ∑ ∑ (13.2) Числовые характеристики 2 0 S : 2 2 2 4 0 0 ( ) 3 M [ ] , D [ ] ( 1) X X x n S D S D n n n µ − = = − − Состоятельная несмещенная оценка среднего квадратического отклонения: 2 0 0 S S = (13.3) Состоятельная оценка начального момента k-го порядка определяется по формуле ( ) 1 1 ˆ ( ) n k k i i x x n α = = ⋅ ∑ (13.4) Состоятельная оценка центрального момента k-го порядка равна ( ) 1 1 ˆ ( ) n k k i i x x x n µ = = ⋅ − ∑ (13.5) Несмещенная состоятельная и эффективная оценка вероятности случайного события A в схеме независимых опытов Бернулли: * ( ) m p A n = , (13.6) где m – число опытов, в которых произошло событие A; n – число проведенных опытов. Числовые характеристики * * ( ) p A p = : * * (1 ) M[ ] ( ) , D[ ] p p p p A p p n − = = = Для вычисления оценок параметров распределения чаще всего применяются методы моментов и максимального правдоподобия. Суть метода моментов заключается в следующем. Пусть имеется выборка {x1, ..., xn} независимых значений случайной величины с известным законом распределения f(x, Q1 , ..., Qm) и m неизвестными параметрами Q1, ..., Qm. Последовательность вычислений следующая: 1. Вычислить значения m начальных и/или центральных теоретических моментов ( ) ( ) , ( ) k k k k x x M X x M X m α µ ⎡ ⎤ ⎡ ⎤ = = − ⎣ ⎦ ⎣ ⎦ . 2. Определить m соответствующих выборочных начальных ˆ ( ) k x α и/или центральных ˆ ( ) k x µ моментов по формулам (13.4),( 13.5). 3. Составить и решить относительно неизвестных параметров Q1, ..., Qm систему из m уравнений, в которых приравниваются теоретические и выборочные моменты. Каждое уравнение имеет вид ˆ ( ) ( ) k k x x α α = или ˆ ( ) ( ) k k x x µ µ = . Найденные корни являются оценками 1 ˆ ˆ , ..., m Q Q неизвестных параметров. Замечание. Часть уравнений может содержать начальные моменты, а оставшаяся часть – центральные. Согласно методу максимального правдоподобия оценки 1 ˆ ˆ , ..., m Q Q получаются из условия максимума по параметрам Q1, ..., Qm положительной функции правдоподобия L(x1, ..., xn, Q1, ..., Qm). Если случайная величина X непрерывна, а значения xi независимы, то 1 1 1 1 ( ,..., , ,..., ) ( , ,..., ). n n m i m i L x x Q Q f x Q Q = = ∏ Если случайная величина X дискретна и принимает независимые значения xi с вероятностями 1 ( ) ( , ,..., ), i i i m p X x p x Q Q = = то функция правдоподобия равна 1 1 1 1 ( ,..., , ,..., ) ( , ,..., ). n n m i i m i L x x Q Q p x Q Q = = ∏ Система уравнений согласно этому методу может записываться в двух видах: 1 1 ( , ..., , , ..., ) 0, 1, 2, ..., n m i L x x Q Q i m Q ∂ ∂ = = или ( ) ( ) 1 1 ln , ..., , , ..., 0, 1, 2, ..., n m i L x x Q Q i m Q ∂ ∂ = = Найденные корни выбранной системы уравнений являются оценками 1 ˆ ˆ , ..., m Q Q неизвестных параметров Q1, ..., Qm. Пример 13.1. Случайная величина X распределена по равномерному закону, т.е. 1 , , ( ) 0, a x b f x b a x a x b ⎧ ≤ ≤ ⎪ = − ⎨ ⎪ < ∨ > ⎩ Необходимо определить оценки параметров a и b. Решение. Для данного закона распределения определяем теоретические выражения двух (по числу неизвестных параметров) моментов: ( ) 1 ( ) ( ) 2 b X a x a b x m dx b a α + = = = − ∫ ; 2 2 ( ) ( ) 12 X b a x D µ − = = По исходной выборке определяем оценки этих же моментов x и 2 0 S по формулам (13.1) и (13.2) соответственно. Составляем систему их двух уравнений: 0 ( ) , 2 2 3 X a b x b a D S + ⎧ = ⎪⎪ ⎨ − ⎪ = = ⎪⎩ Решив ее относительно неизвестных параметров a и b, получим оценки: 0 0 ˆ ˆ 3 , 3 a x S b x S = − ⋅ = + ⋅ Пример 13.2. Пусть xi – независимые значения случайной величины X, распределенной по экспоненциальному закону, т.е. , 0, ( ) 0, 0. x e x f x x λ λ − ⎧ ≥ ⎪ = ⎨ < ⎪⎩ Необходимо получить оценку параметра λ методом максимального правдоподобия. Решение. Функция правдоподобия имеет вид |