X 1 , . . . , X n являются независимыми случайными величинами. Доказательство. Действительно, матрица e Σ = Σ −1 также является диагональной и имеет вид e Σ = σ −2 1 0 . . . 0 0 σ −2 2 . . . 0 . . . . . . . . . . . . . . . . . . . . 0 0 . . . σ −2 n , |Σ| = σ 2 1 . . . σ 2 n , и, следовательно, формула (12.1) для совместной (n-мерной) плотности распределения имеет вид p X 1 ,...,X n (x 1 , . . . , x n ) = 1 ( √ 2π) n σ 1 . . . σ n e − " (x 1 − m 1 ) 2 2σ 2 1 +...+ (x n − m n ) 2 2σ 2 n # = p X 1 (x 1 ) . . . p X n (x n ), т.е. случайные величины X 1 , . . . , X n являются независимыми (см. замечание 8.1). Заметим, что если σ i j = 0 для некоторых i и j или, что то же самое, коэффициент корреляции ρ i j = 0, то говорят, что случайные величины X i и X j являются некоррелированными. Таким образом, из некоррелированности координат случайного вектора, распределенного по нормальному закону, следует (в силу теоремы 8.3) их независимость. Поскольку независимые слу- чайные величины являются некоррелированными, то для нормально распределенных случайных векторов некоррелированность координат равносильна их независимости. 3. Если вектор X = (X 1 ; . . . ; X n ) имеет нормальный закон распределения с вектором средних
m = (m 1 ; . . . ; m n ) и матрицей ковариаций Σ, то вектор
X 0 = (X 1 ; . . . ; X n−1 ) также распределен по нормальному закону с вектором средних
m 0 = (m 1 ; . . . ; m n−1 ) и матрицей ковариаций Σ 0 , полученной из матрицы Σ вычеркиванием последних строки и столбца. Доказательство. Это свойство доказывается так же, как и свойство 1, но в силу громоздкости вывода оно здесь не приводится. Из свойства 3 методом математической индукции можно показать, что любой набор координат n-мерного случайного вектора
X = (X 1 ; . . . ; X n ), распределенного по нормальному закону, снова имеет нормальное распределение. В частности, двумерный случайный вектор (X 1 , X 2 ) распределен по нормальному закону с вектором средних (m 1 , m 2 ) и матрицей ковариаций Σ 0 = µ σ 11 σ 12 σ 21 σ 22 ¶ . Пример 12.1 Пусть двумерный случайный вектор (X; Y ) имеет нормальное распределение с век- тором средних значений (m 1 ; m 2 ) и матрицей ковариаций Σ = µ σ 2 1 ρσ 1 σ 2 ρσ 1 σ 2 σ 2 2 ¶ (σ 1 , σ 2 > 0, −1 < ρ < 1). Найдем условную плотность распределения случайной величины X при условии Y = y. Как известно (см. (12.1)–(12.2)), совместная двумерная плотность распределения случайных величин X и Y p X,Y (x, y) = 1 2πσ 1 σ 2 p 1 − ρ 2 exp ½ − 1 2(1 − ρ 2 ) ³ (x − m 1 ) 2 σ 2 1 − 2ρ(x − m 1 )(y − m 2 ) σ 1 σ 2 + (y − m 2 ) 2 σ 2 2 ´¾ , а плотность распределения случайной величины Y p Y (y) = 1 σ 2 √ 2π e −(y−m 2 ) 2 /(2σ 2 2 ) . Значит, p X (x|y) = p X,Y (x, y) p Y (y) = 1 σ 1 p 2π(1 − ρ 2 ) exp ½ − 1 2σ 2 1 (1 − ρ 2 ) h x − ¡ m 1 + ρσ 1 (y − m 2 ) σ 2 ¢i 2 ¾ . 58
Таким образом, условное распределение X при условии Y = y также является нормальным со сред- ним значением (которое обозначим g(y)) g(y) = m 1 + ρ σ 1 σ 2 (y − m 2 ) (12.7) и средним квадратичным отклонением (обозначим его σ X|y ) σ X|y = σ 1 p 1 − ρ 2 . (12.8) Аналогично условное распределение Y при условии X = x является нормальным со средним значением (которое обозначим h(x)) h(x) = m 2 + ρ σ 2 σ 1 (x − m 1 ) (12.9) и средним квадратичным отклонением (обозначим его σ Y |x ) σ Y |x = σ 2 p 1 − ρ 2 . (12.10) Пример 12.2 Известно, что рост X 1 и вес X 2 взрослого мужчины (и женщины), проживающего в одном регионе, достаточно хорошо описывается двумерным нормальным законом распределения. В частности, рост (в сантиметрах) и вес (в килограммах) мужчин некоторой страны Нормалии подчинены нормальному закону с вектором средних значений m = (172, 74) и матрицей ковариаций Σ = µ 45 28 28 40 ¶ Пусть известно, что вес случайно встреченного нормальца равен x 2 . Тогда его рост будет иметь нормальное распределение со средним значением (в см) g(x 2 ) = 172 + 0,66 √ 45(x 2 − 74) √ 40 ≈ 120 + 0,70x 2 и средним квадратичным отклонением σ X 1 |x 2 = √ 45 p 1 − 0,66 2 ≈ 5,0. Таким образом, p X 1 (x 1 |x 2 ) = 1 √ 50π e −(x 1 −120−0,7x 2 ) 2 /50 . В частности, весу 70 кг соответствует среднее значение роста 169 см, весу 75 кг — около 173 см и т.д. Отметим, что в отличие от среднего роста g(x 2 ), зависящего линейно от x 2 , среднее квадратичное отклонение роста σ X 1 |x 2 является постоянным, т.е. не за- висит от x 2 . Графическое изображение зависимости роста от веса приведено на рис. 12.2. Здесь по оси абсцисс отложены значения роста нормальца, а по оси ординат — его веса. Прямая линия x 1 = g(x 2 ) показывает зависимость сред- него роста от веса. Условная плотность распределения p X 1 (x 1 |x 2 ) роста, как функции от веса x 2 , изображена в виде “срезов”. Рис. 12.2. Аналогичные вычисления показывают, что условная плотность распреде- ления p X 2 (x 2 |x 1 ) веса нормальца X 2 в зависимости от его роста x 1 является плотностью нормального распределения с параметрами h(x 1 ) ≈ 0,62x 1 − 33 и σ X 2 |x 1 ≈ 4,8, т.е. имеет вид Рис. 12.3. p X 2 (x 2 |x 1 ) = 1 √ 46π e −(x 2 +33−0,62x 1 ) 2 /46 . Графическое изображение зависимости веса от роста приведено на рис. 12.3. 59
Лекция 13 Предельные теоремы теории вероятностей С самого начала изучения курса теории вероятностей мы говорили о том, что практическое приме- нение методов этой математической дисциплины основывается на законе предельного постоянства частоты события, установленном эмпирически. Согласно этому закону, если один и тот же опыт повторяется многократно, то частота появления конкретного случайного события теряет свойства случайности и приближается к некоторому пределу, который в соответствии со статистическимопределением вероятности (см. лекцию 2) и называют вероятностью. Однако для того чтобы теория согласовывалась с практикой, при аксиоматическом определениивероятности, которое мы использовали, этот закон предельного постоянства частоты должен быть обоснован теоретически. Иначе говоря, он должен быть сформулирован и доказан в виде одной или нескольких теорем. В теории вероятностей теоремы такого типа обычно называют различными формами закона больших чисел. В этой лекции мы докажем некоторые формы этого закона, кото- рые, в частности, поясняют смысл математического ожидания случайной величины, и то, почему его называют также средним значением. Далее доказывается простейший вариант центральной предельной теоремы, уточняющей закон больших чисел. Центральная предельная теорема, в свою очередь, объясняет то широкое распро- странение, которое получило на практике нормальное распределение. Определение 13.1 Если последовательность X1 , X2 , . . . , Xn, . . . случайных величин для любого ε > 0 удовлетворяет условию lim n→∞P {|Xn− X| < ε} = 1 ,то говорят о сходимости этой последовательности к случайной величине X по вероятности. Сходимость к X по вероятности записывается в видеXnP −→n→∞X.Определение 13.2 Если последовательность X, X1 , X2 , . . . , Xn, . . . случайных величин удовле- творяет условию P { lim n→∞Xn= X} = 1 ,то говорят о сходимости этой последовательности к X с вероятностью 1 или почти на-верное и обозначают Xnп.н. −→n→∞X.Неравенства Чебышева. Закон больших чисел Прежде чем приступить к рассмотрению закона больших чисел, докажем два неравенства Чебы-шева. Заметим, что неравенства Чебышева представляют и самостоятельный интерес, поскольку в современной теории вероятностей широко используются неравенства такого типа. Теорема 13.1 Для каждой неотрицательной случайной величины X, имеющей математическоеожидание M X, при любом ε > 0 справедливо соотношениеP {X > ε} 6 M Xε,называемое первым неравенством Чебышева.60 Доказательство. Доказательство проведем для непрерывной случайной величины X с плотно-стью распределения p( x) Поскольку случайная величина X является неотрицательной, то M X = + ∞Z 0 xp( x) dx.Так как подынтегральное выражение неотрицательное, то при уменьшении области интегриро- вания интеграл может только уменьшиться. Поэтому M X = εZ 0 xp( x) dx + + ∞Z εxp( x) dx > + ∞Z εxp( x) dx.Заменяя в подынтегральном выражении сомножитель x на ε, имеем + ∞Z εxp( x) dx > ε+ ∞Z εp( x) dx.Остается заметить, что последний интеграл (равный площади области, заштрихованной на 13.1) представляет собой вероятность события X > ε, и, значит, M X > εP {X > ε}, откуда и вытекает пер- вое неравенство Чебышева. Аналогично первое неравенство Чебы- шева доказывается и для дискретной случайной величины, при этом нужно только заменить интеграл суммой. Ясно, что применять первое неравенство Чебышева имеет смысл только тогда, когда ε > M X; в противном случае оно дает тривиальную оценку. Рис. 13.1. Пример 13.1 Пусть X — время опоздания студента на лекцию, причем известно, что M X = 1 мин. Воспользовавшись первым неравенством Чебышева, оценим вероятность P {X > 5 } того, что студент опоздает не менее, чем на 5 мин. Имеем P {X > 5 } 6 M X5 = 0 ,2 .Таким образом, искомая вероятность не более 0 ,2, т.е. в среднем из каждых пяти студентов опаз- дывает, по крайней мере, на 5 мин не более чем один студент. # Рассмотрим теперь случайную величину X, имеющую дисперсию D X = σ2 . Мы уже говорили, что дисперсия является показателем разброса X вокруг математического ожидания M X. Однако с точки зрения исследователя разброс естественнее характеризовать вероятностью P {|X − M X| > ε}отклонения случайной величины X от M X на величину, большую некоторого заданного ε. Следу- ющее неравенство позволяет оценить эту вероятность с помощью дисперсии σ2 Теорема 13.2 Для каждой случайной величины X, имеющей дисперсию D X = σ2 , при любом ε > 0 справедливо второе неравенство ЧебышеваP {|X − M X| > ε} 6 σ2 ε2 .Доказательство. Для доказательства воспользуемся утверждением первого неравенства Чебы- шева. Применяя к случайной величине Y = ( X − M X) 2 это неравенство, в котором ε заменено на ε2 , получаем P {|X − M X| > ε} = P {( X − M X) 2 > ε2 } = P {Y > ε2 } 6 M Yε2 = D Xε2 = σ2 ε2 ,что и доказывает второе неравенство Чебышева. Геометрический смысл второго неравенства Чебы- шева понятен из рис. 13.2. Второе неравенство Чебышева имеет содержатель- ный смысл лишь при ε > σ. Рис. 13.2. 61 Пример 13.2 Пусть в условиях предыдущего примера известно дополнительно, что σ = √D X = 1. Оценим минимальное значение x0 , при котором вероятность опоздания студента на время не менее x0 не превышает заданного значения Pз = 0 ,1. Для решения поставленной задачи воспользуемся вторым неравенством Чебышева. Тогда Pз 6 P {X > x0 } = P {X − M X > x0 − M X} 6 P {|X − M X| > x0 − M X} 6 σ2 ( x0 − M X) 2 .Значит, ( x0 − M X) 2 6 σ2 Pз и x0 6 M X + q σ2 Pз . Подставляя конкретные значения, имеем x0 6 1 + q 1 0 ,1 ≈4 ,16 . Таким образом, вероятность опоздания студента на время более 4 ,16 мин не более 0 ,1. Сравнивая полученный результат с результатом примера 13.1, видим, что дополнительная ин- формация о дисперсии времени опоздания позволяет дать более точную оценку искомой вероятно- сти. Рассмотрим некоторые формы закона больших чисел. Пусть X1 , X2 , . . . , Xn, . . . — последовательность случайных величин, имеющих математические ожидания mi= M XiОпределение 13.3 Последовательность X1 , X2 , . . . , Xn, . . . случайных величин удовлетворяет закону больших чисел ( слабому), если для любого ε > 0 P ( ¯ ¯ ¯ 1 nnX i=1 Xi−1 nnX i=1 mi¯ ¯ ¯ > ε) −→n→∞0 ,т.е. 1 nnX i=1 Xi−1 nnX i=1 miP −→n→∞0 .Иными словами, выполнение закона больших чисел отражает предельную устойчивость средних арифметических случайных величин: при большом числе испытаний они практически перестают быть случайными и совпадают со своими средними значениями. Очевидно, что последовательность X1 , X2 , . . . , Xn, . . . удовлетворяет закону больших чисел тогда и только тогда, когда среднее арифметическое случайных величин X1 − m1 , X2 − m2 , . . . , Xn−mnсходится по вероятности к нулю при n → ∞. Теорема 13.3 Если последовательность X1 , X2 , . . . , Xn, . . . независимых случайных величин тако-ва, что существуют M |