сборник. Сборник. сборник задач по теории вероятностей и математической статистике
Скачать 1.15 Mb.
|
Задачи 10.1. Одним и тем же прибором со средним квадратическим отклонением σ = 40 м произведено пять равноточных измерений расстояния от орудия до цели. Определить доверительный интервал для оценки истинного расстояния до цели с надежностью γ = 0,95, зная среднее арифметическое результатов из- мерения 2000 м. х Ответ: 1964,938 2035,06 х m 10.2. По данным семи измерений некоторой величины найдены средняя результатов измерений, равная 30, и выборочная дисперсия, равная 36. Найти границы, в которых с надежностью 0,99 заключено истинное значение измеря- емой величины. Ответ: 24,172 35,828 х m 10.3. С целью определения среднего трудового стажа на предприятии ме- тодом случайной повторной выборки проведено обследование трудового стажа рабочих. Из всего коллектива рабочих завода случайным образом выбрано 400 рабочих, данные о трудовом стаже которых и составили выборку. Средний стаж по выборке оказался равным 9,4 г. Считая, что трудовой стаж рабочих имеет нормальный закон распределения, определить с вероятностью 97 % гра- ницы, в которых окажется средний трудовой стаж для всего коллектива, если известно, что σ = 1,7 г. Ответ: 9, 21555 9,58445 x 50 11. Проверка статистических гипотез о законе распределения Критерием согласия называется случайная величина 1 , , , n U x x где x i – значение выборки, которая позволяет принять или отклонить гипотезу о предполагаемом законе распределения. Алгоритм проверки гипотезы при помощи критерия согласия 2 : 1. Построить интервальный статистический ряд вероятностей и гисто- грамму. 2. По виду гистограммы выдвинуть гипотезу H 0 : f(x) = f 0 (x), F(x) = F 0 (x); H 1 : f(x) f 0 (x), F(x) F 0 (x), где f 0 (x), F 0 (x) – плотность и функция гипотетического закона распределения. График эмпирической функции распределения F*(x)должен быть похож на график гипотетического закона, а гистограммы – на график плотности гипо- тетического закона f 0 (x). На рис. 11.1 – 11.3 приведены графики функций рас- пределения и плотностей распределения равномерного, экспоненциального и нормального законов распределения. Рис 11.1. Графики плотности распределения и функции распределения для равномерного закона распределения. Рис. 11.2. Графики плотности распределения и функции распределения для экспоненциального закона распределения. 51 Рис. 11.3. Графики плотности распределения и функции распределения для нормального закона распределения. 3. Используя метод моментов или максимального правдоподобия, опре- делить оценки неизвестных параметров 1 ˆ ˆ , ..., m Q Q гипотетического закона распределения. 4. Вычислить значение критерия по формуле 2 2 * 2 1 1 M M j j j j j j j j p p np n p np , (11.1) где pj – теоретическая вероятность попадания случайной величины в j-й интер- вал при условии, что гипотеза H 0 верна: 0 0 0 ( ) ( ) ( ) ( ) j j B j j j j j A p p A X B f x dx F B F A (11.2) Замечания. При расчете p 1 и p M в качестве крайних границ первого и по- следнего интервалов A 1 , B M следует использовать теоретические границы гипо- тетического закона распределения. Например, для нормального закона A 1 = –, B M = +. После вычисления всех вероятностей p i проверить, выполняется ли контрольное соотношение 1 1 0,01 M i j p 5. Из таблицы 2 (см. прил. 4) выбирается значение 2 ,k , где – заданный уровень значимости ( = 0,05 или 0,01), а k – число степеней свобо- ды, определяемое по формуле 1 k M s , где s – число параметров гипотетического закона распределения, значения ко- торых были определены в п. 3. 6. Если 2 2 ,k , то гипотеза H 0 отклоняется, в противном случае нет оснований ее отклонить. Последовательность действий при проверке гипотезы о законе распреде- ления при помощи критерия согласия Колмогорова следующая: 52 1. Построить вариационный ряд и график эмпирической функции распре- деления F*(x) (см. формулу(12.1)). 2. По виду графика F*(x) выдвинуть гипотезу: H 0 : F(x) = F 0 (x) , H 1 : F(x) F 0 (x) , где F 0 (x) – функция гипотетического закона распределения. 3. Используя метод моментов или максимального правдоподобия, опре- делить оценки неизвестных параметров 1 ˆ ˆ , ..., m Q Q гипотетического закона распределения. 4. Рассчитать 1020 значений функции F 0 (x) и построить ее график в од- ной системе координат с функцией F*(x). 5. По графику определить максимальное по модулю отклонение между функциями F*(x) и F 0 (x). * 0 1 max ( ) ( ) . n i i i Z F x F x (11.3) 6. Вычислить значение критерия Колмогорова n Z (11.4) 7. Из таблицы распределения Колмогорова (см. прил. 5) выбрать критиче- ское значение , 1 . Здесь – заданный уровень значимости ( = 0,05 или 0,01). 8. Если > , то нулевая гипотеза H 0 отклоняется, в противном случае нет оснований ее отклонить. Пример 11.1: В некоторой местности в течение 300 сут регистрировалась среднесуточная температура воздуха. В итоге было получено эмпирическое распределение, приведенное в табл. 11.1. Таблица 11.1 Эмпирическое распределение среднесуточной температуры x i–1 – x i v i x i–1 – x i v i –40 … –30 25 0 … 10 40 –30 … –20 40 10 … 20 46 –20 … –10 30 20 … 30 48 –10 … 0 45 30 … 40 26 Необходимо определить несмещенную оценку математического ожида- ния и дисперсию среднесуточной температуры, а также на уровне значимости 0,05 проверить гипотезу о том, что среднесуточная температура распределена по равномерному закону. Решение. На основании полученной информации построим интервальный статистический ряд вероятностей (таб. 11.2): 53 Таблица 11.2. Равноинтервальный ряд вероятностей для примера 11.1 j A j B j X Среднее h i i 1 –40 –30 10 –35 25 0,083333 0,010417 2 –30 –20 10 –25 40 0,133333 0,016667 3 –20 –10 10 –15 30 0,1 0,0125 4 –10 0 10 –5 45 0,15 0,01875 5 0 10 10 5 40 0,133333 0,016667 6 10 20 10 15 46 0,153333 0,019167 7 20 30 10 25 48 0,16 0,02 8 30 40 10 35 26 0,086667 0,010833 На основании построенного интервального ряда построим статистиче- ский аналог графика плотности распределения случайной величины Х, отобра- зим значения * * j j j j j p f h nh на рис. 11.4. Рис. 11.4. Равноинтервальная гистограмма Определим несмещенную оценку математического ожидания: 7 * * ср 1 1 1,5 300 X i j i m x x p Далее рассчитаем несмещенную оценку дисперсии: * 2 * 2 2 0 ср 1 1 300 453, 4167 300 1 300 1 n X i i i D S p x x На основании вида рис. 11.4(равноинтервальной гистограммы) выдвинем следующие гипотезы: 54 – H 0 : случайная величина распределена по равномерному закону распре- деления 0, , ( ) , , 1, ; x a x a F x a x b b a x b – H 1 : случайная величина распределена не по равномерному закону рас- пределения. Используя метод моментов, определим оценку неизвестных параметров a * и b * гипотетического (равномерного) закона распределения, решив систему уравнения: * * * * * * 2 2 0 , 2 35,3816, 38,3816 ( ) 12 b a x a b b a S Значение критерия Пирсона вычисляем по формуле (11.1): * 2 10 2 1 ( ) 300 j j j j p p p Теоретические вероятности pi рассчитываем по формуле (11.2) 0 0 35,3816 35,3816 ( ) ( ) (38,31816 35,3816) (38,31816 35,3816) j j j j j B A p F B F A , 1 0 0 30 35,3816 (10) ( ) 0 0,072958 (38,31816 35,3816) p F F , p 2 = 0,135569, p 3 = 0, 135569,p 4 = 0, 135569, p 5 = 0, 135569, p 6 = 0, 135569, p 7 = 0,135569, p 8 = 0, 135569; p 9 = 0, 135569, 10 0 0 30 35,3816 ( ) (30) 1 0,113628. (38,31816 35,3816) p F F Проверим выполнение контрольного соотношения 10 1 1 0 0,01. j j p Тогда получаем, что 2 7,6636. Далее определяем табличное значение критерия Пирсона (см. прил. 4) при 10 1 2 7 k : 2 0,05;7 14,07. Так как 2 2 ,k , то нет оснований не принять гипотезу Н 0 55 Задачи 11.1. Случайная величина Х задана таблицей значений: № п/п x i № п/п x i № п/п x i № п/п x i 1 2,13 10 3,84 19 4,77 28 5,42 2 2,15 11 3,88 20 5,15 29 5,53 3 2,28 12 4,11 21 5,17 30 5,59 4 2,45 13 4,31 22 5,23 31 5,73 5 2,95 14 4,34 23 5,26 32 5,85 6 3,25 15 4,41 24 5,28 33 6,02 7 3,28 16 4,42 25 5,38 34 6,22 8 3,41 17 4,65 26 5,4 35 6,53 9 3,73 18 4,69 27 5,42 36 7,2 Определить математические ожидание, дисперсию случайной величины Х. Определить несмещенные оценки и доверительные интервалы надежностью 96 % для математического ожидания и дисперсии случайной величины. Прове- рить гипотезу о нормальном распределении случайной величины на уровне значимости = 0,05. Ответ: 2 2 0 4,5, 4,595, 1,614, 4,159 5,031,0,819 2, 409. x x x S m D 11.2. Проверить гипотезу о равномерном законе распределения случайной величины, представленной в задаче 11.1, на уровне значимости = 0,05. Ответ: 2 12,88. 11.3. Вариационный ряд случайной величины Х имеет следующий вид: –5,58 -3,88 –1,9 0,14 1,24 –4,32 –3,65 –1,21 0,19 1,35 –4,23 –3,32 –1,09 0,38 1,47 –4,19 –3,3 –0,82 0,66 2,27 –4,1 –2,21 –0,15 0,95 4,31 Определить математические ожидание, дисперсию случайной величины Х. Определить несмещенные оценки и доверительные интервалы надежностью 95 % для математического ожидания и дисперсии случайной величины. Прове- рить гипотезу о нормальном распределении случайной величины на уровне значимости = 0,05. Ответ: 2 1, 24, 2, 24; 0, 24 , 6,52, 2,91;10,14 , 11,5. x x x m x D m I D I 56 11.4. Вариационный ряд случайной величины Х имеет вид: 0,02 0,24 0,68 1,43 2,16 0,06 0,37 0,94 1,47 2,22 0,17 0,51 0,97 1,65 3,26 0,17 0,57 1,03 1,72 6,25 0,22 0,58 1,18 1,74 6,7 Определить математические ожидание, дисперсию случайной величины Х. Определить несмещенные оценки и доверительные интервалы надежностью 95 % для математического ожидания и дисперсии случайной величины. Выдви- нуть гипотезу о распределении случайной величины и проверить ее на уровне значимости = 0,05. Ответ: 2 1, 45, 0,78;2,12 , 2,93, 1,31;4,55 , 10,1. x x x m x D m I D I 57 12. Оценка коэффициента корреляции и линейной регрессии. Пусть проводится n независимых опытов, в каждом из которых двухмер- ная СВ (Х,Y) принимает определенные значения и результаты опытов представ- ляют собой двухмерную выборку вида {(х 1 , у 1 ), (х 2 , у 2 ), (х n , у n )}. Состоятельная несмещенная оценка корреляционного момента равна: * 1 1 ( )( ), 1 n XY i i i K x x y y n (12.1) где xi, yi – значения, которые приняли случайные величины X, Y в i–м опыте; , x y – средние значения случайных величин X и Y соответственно. Состоятельная оценка коэффициента корреляции: * * 0 0 ( ) ( ) XY XY K R S x S y (12.2) Доверительный интервал с надежностью γ для коэффициента корреляции * XY R и случая двухмерного нормального распределения: 2 2 2 2 1 1 1 1 a b XY a b e e R e e , (12.3) где * * 1 0,5 ln 3 1 XY XY z R a n R ; * * 1 0,5 ln 3 1 XY XY z R b n R ; arg ( ) 2 z – значение аргумента функции Лапласа Ф(z) = 2 ; Алгоритм проверки гипотезы об отсутствии корреляционной зависимо- сти следующий (предполагается, что двухмерная случайная величина (X, Y) распределена по нормальному закону): 1. Формулируется гипотеза: H 0 : 0 XY R ; H 1 : 0 XY R . Здесь XY R – теоретический коэффициент корреляции. 2. Вычисляется оценка коэффициента корреляции * XY R по формуле (12.2). 3. Определяется значение критерия * 2 * 2 1 XY XY R n t R , (12.4) который распределен по закону Стьюдента с (n – 2) степенями свободы, если гипотеза H 0 верна. 58 4. По заданному уровню значимости вычисляется доверительная веро- ятность = 1 – и из таблицы Стьюдента выбирается критическое значение , 2 n t 5. Если , 2 n t t , то гипотеза H 0 отклоняется, а следовательно, величины X, Y коррелированы. В противном случае гипотеза H 0 принимается. Регрессией случайной величины Y на X называется условное математиче- ское ожидание случайной величины Y при условии, что X = x: / M[ / ] Y x m Y X x Регрессия Y на X устанавливает зависимость среднего значения величины Y от величины X. Если X и Y независимы, то / const. Y x Y m m Если величины X, Y распределены по нормальному закону, то регрессия является линейной: / 0 1 Y x m a a x Оценки параметров 0 ˆa и 1 ˆa по методу наименьших квадратов вычисля- ются по следующим формулам: * 1 2 0 ˆ , ( ) XY K a S x (12.5) 0 1 ˆ ˆ a y a x (12.6) где , x y – оценки математического ожидания величин X и Y; 2 0 ( ) S x – оценка дисперсии величины X; * XY K – оценки корреляционного момента величин X и Y. Для визуальной проверки правильности вычисления величин 0 1 ˆ ˆ , a a необходимо построить диаграмму рассеивания и график 0 1 ˆ ˆ ( ) y x a a x x x i y i y(x) _ Если оценки параметров a 0 , a 1 рассчитаны без грубых ошибок, то сумма квадратов отклонений всех точек (xi, yi) от прямой 0 1 ˆ ˆ ( ) y x a a x должна быть минимально возможной. Пример 12.1: Выборочный коэффициент корреляции, вычисленный по выборке объема 10, * 0,64 XY R . Найти 90 %-ный доверительный интервал для коэффициента корреляции XY R Решение. Из таблицы Лапласа выбирается значение 0,9 1,645 z . Тогда 59 1 1 0,64 1,645 ln 1,380 2 1 0,64 7 a , b = –0,136. Доверительный интервал вычисляем по формуле (12.3). 2 ( 1,38) 2 ( 0,136) 2 ( 1,38) 2 ( 0,136) 1 1 1 1 XY e e R e e , т. е. –0,881 < XY R < –0,135. Пример12.2: Проверить гипотезу об отсутствии корреляционной зависи- мости при следующих данных: * 0,2, XY R n = 20; = 0,05. Предполагается так- же, что двухмерный закон распределения – нормальный. Решение. Вначале вычислим значение критерия t по формуле (12.4) 2 0, 2 18 0,866. 1 0, 2 t Из таблицы Стьюдента выбираем критическое значение ; 2 1 ; 2 0,95;18 2,10. n n t t t Так как 2,10, t то гипотеза H 0 принимается, по- тому что нет оснований ее отклонить. |