Лекции теория вероятностей 2019. Вероятностное пространство
Скачать 2.67 Mb.
|
в R. Можем ли мы, как и прежде, рассматривать произвольные функции? Будем понимать под 𝑓 −1 (𝐴) , где 𝐴 — некоторое множество, а 𝑓 — отображение, множество вида {𝑥 : 𝑓(𝑥) ∈ 𝐴}. Для наших величин мы бы хотели считать вероятности попадания их в разные множества 𝐴, по-крайней мере в отрезки или полуинтервалы. Но ведь P(𝜔 : 𝑋(𝜔) ∈ [𝑎, 𝑏]) = P(𝑋 −1 ([𝑎, 𝑏])) , а P — отображение из ℱ в [0, 1], а, значит, множества вида 𝑋 −1 ([𝑎, 𝑏]) должны лежать в ℱ. С другой стороны, если я возьму 𝑋 −1 (𝐴) ∪ 𝑋 −1 (𝐵) , то это будет 𝑋 −1 (𝐴 ∪ 𝐵) , а 𝑋 −1 (𝐴) — это 𝑋 −1 (𝐴) . следовательно, пробраз сигма-алгебры при 𝑋 будет сигма- алгеброй. Следовательно, если прообразы [𝑎, 𝑏] лежат в ℱ, то и прообразы множеств из ℬ(R) (борелевской сигма-алгебры) также лежат в ℱ. Таким образом, мы приходим к следующему естественному определению случайной величины: Определение 9.2. Случайная величина — это отображение из Ω в R, такое, что прообраз любого борелевского множества R есть событие из сигма-алгебры ℱ. Такое отображение называется измеримым. Пример 9.2. Простейшим примером случайной величины является индикатор события 𝐴 ∈ ℱ: 𝐼 𝐴 (𝜔) = {︂ 1, 𝜔 ∈ 𝐴, 0, 𝜔 ̸∈ 𝐴. 58 Рис. 13: Полный прообраз любого борелевского множества на оси абсцисс должен быть множеством из ℱ Это действительно случайная величина, поскольку прообраз любого множества из R является либо 𝐴, либо 𝐴, либо Ω, либо ∅, а все эти множества лежат в ℱ, поскольку там лежит А. Пример 9.3. Пусть Ω = [0, 1], ℱ = ℬ([0, 1]), 𝑋 1 (𝜔) = 𝜔 . Тогда 𝑋 1 (𝜔) , очевидно, будет случайной величиной, поскольку прообраз 𝑋 −1 1 ([𝑎, 𝑏]) имеет вид [𝑎, 𝑏] ∩ [0, 1]. Вопрос 9.1. Будет ли случайной величиной на том же пространстве 𝑌 (𝜔) = 𝜔 2 ? 𝑍(𝜔) = arcsin 𝜔? Пример 9.4. Пусть Ω = [0, 1], ℱ = {∅, Ω}. Тогда 𝑋 1 (𝜔) = 𝜔 уже не будет случайной величиной, поскольку 𝑋 −1 1 ([0, 1/2]) = [0, 1/2] , а [0, 1/2] не лежит в нашей сигма-алгебре ℱ. Как мы видим, многое зависит от сигма- алгебры, с которой мы работаем. Проверять то, что некоторое отображение 𝑋 — случайная величина, удобнее проверяя то, что {𝜔 : 𝑋(𝜔) ≤ 𝑥} при любом 𝑥 лежит в ℱ, поскольку множества (−∞, 𝑥] порождают сигма-алгебру. 9.4 Случайные векторы Определение 9.3. Случайный вектор — это такое отображение из Ω в R 𝑛 , что прообраз любого множества из ℬ(R 𝑛 ) есть событие из сигма-алгебры ℱ. Для проверки того, что отображение ⃗ 𝑋 : Ω → R 𝑛 есть случайный вектор, достаточно убедиться, что {𝜔 : ⃗ 𝑋(𝜔) ∈ [𝑎 1 , 𝑏 1 ] × · · · × [𝑎 𝑛 , 𝑏 𝑛 ]} = 𝑛 ⋂︁ 𝑖=1 {𝜔 : 𝑋 𝑖 (𝜔) ∈ [𝑎 𝑖 , 𝑏 𝑖 ]} ∈ ℱ , где ⃗ 𝑋 = (𝑋 1 , . . . , 𝑋 𝑛 ) . Но последнее соотношение равносильно тому, что все 𝑋 𝑖 являются случайными величи- нами. Поэтому случайный вектор – это просто набор случайных величин 𝑋 1 , . . . , 𝑋 𝑛 9.5 Случайные элементы Если мы захотим рассматривать отображения не в R или R 𝑛 , а в некоторое другое пространство 𝑈 с сигма- алгеброй 𝒱, то определение будет похожим: Определение 9.4. Случайный элемент — это такое отображение из Ω в 𝑈, что прообраз любого множества из 𝒱 есть событие из сигма-алгебры ℱ. Определение 9.5. Борелевской функцией назовем отображение из R 𝑛 в R 𝑚 , измеримое около борелевской сигма-алгебры (то есть прообраз любого борелевского множества борелевский). 59 Борелевскими функциями из R 𝑛 в R в частности будут все непрерывные функции, поскольку у них прообраз открытых множеств — открытые, а значит борелевские множества, а значит прообраз любого борелевского борелевский, поскольку открытые множества порождают борелевскую сигма-алгебру. Если 𝑋 1 , ..., 𝑋 𝑛 — случайные величины, то любая борелевская функция из R 𝑛 в R от них также будет случай- ной величиной. Это следует из того, что {𝜔 : 𝑓 (𝑋 1 , ..., 𝑋 𝑛 ) ∈ 𝐵} = {𝜔 : (𝑋 1 , ..., 𝑋 𝑛 ) ∈ 𝑓 −1 (𝐵)}, а 𝑓 −1 (𝐵) лежит в ℬ(R 𝑛 ) , если 𝐵 было из ℬ(R), поскольку 𝑓 — борелевская функция. В частности, если 𝑋 1 , ..., 𝑋 𝑛 — случайные величины, то 𝑋 (1) = min 𝑖≤𝑛 𝑋 𝑖 , 𝑋 (2) = max 𝑖≤𝑛 min 𝑖̸=𝑗 𝑋 𝑖 , ..., 𝑋 (𝑛) = max 𝑋 𝑖 (то есть упорядоченные по возрастанию 𝑋 𝑖 ) тоже будут случайными величинами. Такой ряд величин называется вариационным рядом. Пример 9.5. Пусть Ω = [0, 1], ℬ([0, 1]). Положим 𝑋 1 (𝜔) = 𝜔 , 𝑋 2 (𝜔) = 1 − 𝜔 , 𝑋 3 (𝜔) = 1/4 . Тогда 𝑋 (1) (𝜔) = ⎧ ⎨ ⎩ 𝜔, 𝜔 ∈ [︀0, 1 4 ]︀ , 1 4 , 𝜔 ∈ (︀ 1 4 , 3 4 )︀ , 1 − 𝜔, 𝜔 ∈ [︀ 3 4 , 1 ]︀ . 𝑋 (2) (𝜔) = ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ 1 4 , 𝜔 ∈ [︀0, 1 4 ]︀ , 𝜔, 𝜔 ∈ (︀ 1 4 , 1 2 ]︀ , 1 − 𝜔, 𝜔 ∈ (︀ 1 2 , 3 4 )︀ , 1 4 , 𝜔 ∈ [︀ 3 4 , 1 ]︀ . 𝑋 (3) (𝜔) = {︂ 1 − 𝜔, 𝜔 ∈ [︀0, 1 2 ]︀ , 𝜔, 𝜔 ∈ (︀ 1 2 , 1 ]︀ . 9.6 Расширенные случайные величины Определение 9.6. Расширенной (или несобственной) случайной величиной называют измеримое отображение, действующее в R = R ∪ {−∞} ∪ {+∞}. Иначе говоря, мы искусcтвенно добавляем к нашим значениям +∞ и −∞, а в борелевскую сигма-алгебру вместе с каждым множеством 𝐴 добавляем 𝐴 ∪ {−∞}, 𝐴 ∪ {−∞}, 𝐴 ∪ {+∞} ∪ {−∞}. Если 𝑋 1 , 𝑋 2 , . . . — случайные величины, то не только 𝑋 1 +· · ·+𝑋 𝑛 , 𝑋 1 ·𝑋 2 , sup 𝑖≤𝑛 𝑋 𝑖 , являющиеся борелевскими функциями от 𝑋 1 , . . . , 𝑋 𝑛 , но и, скажем, lim sup 𝑋 𝑖 также будет случайной величиной (возможно, расширенной). Как в этом убедиться? Пример 9.6. Рассмотрим 𝑋 1 , . . . , 𝑋 𝑛 , . . . и 𝑌 (𝜔) = lim sup 𝑛→∞ 𝑋 𝑛 (𝜔) . Тогда {𝜔 : 𝑌 (𝜔) < 𝑥} = ∞ ⋃︁ 𝑁 =1 ∞ ⋂︁ 𝑛=𝑁 {𝜔 : 𝑋 𝑛 (𝜔) < 𝑥}. В силу полученного представления и того, что 𝑋 𝑛 случайные величины, имеем, что и 𝑌 – случайная величина. Как получить такое представление? Нужно записать то, что верхний предел меньше 𝑥: ∃𝑁 : ∀𝑛 > 𝑁 𝑋 𝑛 < 𝑥, а затем ∀ заменить на пересечение, а ∃ на объединение. Подумайте, почему это законно. 9.7 Распределение случайной величины Определение 9.7. Распределением случайной величины 𝑋 будем называть набор вероятностей P(𝜔 : 𝑋(𝜔) ∈ 𝐵) для 𝐵 ∈ ℬ(R). Как мы поняли на прошлой лекции, чтобы задать такие меры, достаточно задать вероятности всех полу- интервалов P(𝜔 : 𝑋(𝜔) ∈ (𝑎, 𝑏]). Более удобно задавать вероятности лучей (−∞, 𝑥], откуда легко получить вероятности попадания в полуинтервал P(𝜔 : 𝑋(𝜔) ∈ (𝑎, 𝑏]) = P(𝜔 : 𝑋(𝜔) ≤ 𝑏) − P(𝜔 : 𝑋(𝜔) ≤ 𝑎). Определение 9.8. Величина F 𝑋 (𝑥) = P(𝜔 : 𝑋(𝜔) ≤ 𝑥) называется функцией распределения (ф.р.). Пример 9.7. Для случайной величины 𝑋 1 (𝜔) из примера 9.3 функцией распределения будет 𝑥𝐼 𝑥∈[0,1] + 1𝐼 𝑥>1 Такое распределение называется равномерным на [0, 1]. Для величины 𝑋 2 (𝜔) на том же вероятностном про- странстве, равной 𝑋 2 (𝜔) = 1 − 𝜔 , функция распределения окажется точно такой же. 60 Какими свойствами обладает функция распределения? 1. F(𝑥) → 0 при 𝑥 → −∞, F(𝑥) → 1 при 𝑥 → +∞; 2. F(𝑥) монотонно неубывает; 3. F(𝑥) непрерывна справа (по свойству непрерывности меры). При этом слева функция F непрерывна не будет, поскольку из непрерывности меры lim 𝑥 𝑛 →𝑥−0 𝐹 𝑋 (𝑥 𝑛 ) = P(𝑋 ∈ (−∞, 𝑥)), а вероятность в правой части не будет равна 𝐹 𝑋 (𝑥) , если P(𝑋 = 𝑥) > 0. Таким образом, ф.р. будет разрывна в тех и только тех точках 𝑥, для которых P(𝑋 = 𝑥) > 0. При этом высота разрыва в каждом случае будет в точности P(𝑋 = 𝑥). Оказывается, что условия 1)–3) необходимы и достаточны для того, чтобы F была ф.р. некоторой вероят- ностной меры P. Лемма 9.2. Любая функция F, удовлетворяющая 1)–3), соответствует некоторой величине 𝑋, то есть существует такая случайная величина 𝑋, что F — ее ф.р. При этом P(𝑋 ∈ 𝐵), 𝐵 ∈ ℬ, однозначно будет соответствовать ф.р. F(𝑥). Доказательство. Зададим меру на простых множествах вида 𝐴 = ⋃︀ 𝑛 𝑖=1 (𝑎 𝑖 , 𝑏 𝑖 ] , где (𝑎 𝑖 , 𝑏 𝑖 ] не пересекаются, формулой P(𝐴) = 𝑛 ∑︁ 𝑖=1 (F(𝑏 𝑖 ) − F(𝑎 𝑖 )). Благодаря монотонности заданная мера будет неотрицательной, а мера прямой будет единицей: P((−∞, ∞)) = lim 𝑛→∞ P((−𝑛, 𝑛)) = F(𝑛) − F(−𝑛) → 1. Проверим, что на этом множестве множеств мера 𝜎-аддитивна. Тогда по теореме Каратеодори ее можно будет продолжить на всю борелевскую сигма-алгебру, причем единственным образом. Доказательство аналогично доказательству сигма-аддитивности на простых множествах меры Лебега. Действительно, конечная аддитивность вытекает из того, что если простое множество 𝐴 представляется в виде непересекающегося объединения множеств 𝐴 1 , . . . , 𝐴 𝑛 , то полуинтервалы, входящие в 𝐴, разбиваются в объединение полуинтервалов, входящих в 𝐴 𝑖 . При этом как мера самого полуинтервала (𝑎, 𝑏], так и сумма мер полуинтервалов, на которые он разбит, задаются одной и той же формулой: F(𝑏) − F(𝑎). Для доказательства счетной аддитивности, как и прежде, покажем непрерывность в нуле нашей меры: если простые множества 𝐴 𝑛 вложены (𝐴 𝑛 ⊃ 𝐴 𝑛+1 ) и их пересечение пусто, то P(𝐴 𝑛 ) стремится к нулю. Действительно, пусть 𝐴 𝑛 лежат в некотором компакте [−𝑁, 𝑁]. Тогда поскольку F непрерывна справа, то P((𝑎, 𝑏]) = F(𝑏) − F(𝑎) = lim 𝑥→𝑎+0 (F(𝑏) − F(𝑥)). Дальше доказательство практически повторяет доказательство леммы 8.3 Как и прежде найдутся такие вложенные простые множества 𝐵 𝑛 , что замыкания [𝐵 𝑛 ] содержатся в 𝐴 𝑛 и P(𝐵 𝑛 ) > P(𝐴 𝑛 ) − 𝜀/2 𝑛 Тогда замыкания [𝐵 𝑛 ] имеют пустое пересечение. Если взглянуть на множества [−𝑁, 𝑁] ∖ [𝐵 𝑛 ] , то они образуют открытое покрытие [−𝑁, 𝑁], а значит из него можно выделить конечное подпокрытие. Но тогда соответствующие ему [𝐵 𝑛 ] имеют пустое пересечение. Значит с какого-то момента пересечение первых 𝑛 0 множеств 𝐵 𝑖 пусто. Но тогда P(𝐴 𝑛 ) < 𝜀/2 𝑛 при всех 𝑛 > 𝑛 0 , что и требуется. Пусть 𝐴 𝑛 имеют общий вид и не лежат в отрезке [−𝑁, 𝑁]. Рассмотрим такое 𝑁, что P((−𝑁, 𝑁]) > 1 − 𝜀. Тогда P(𝐴 𝑛 ∩ (−𝑁, 𝑁 ]) стремятся к нулю в силу доказанного, а P(𝐴 𝑛 ∩ (−𝑁, 𝑁 ]) < 𝜀 . В силу произвольности 𝜀 > 0 имеем требуемое. 61 9.8 Абсолютно неперерывные распределения Помимо рассмотренного нами ранее дискретного случая, важным случаем, в котором удобно работать, явля- ется случай абсолютно непрерывного распределения. Определение 9.9. Величина с ф.р. 𝐹 (𝑥) называется абсолютно непрерывной, когда существует функция 𝑓 𝑋 (𝑥) , называемая плотностью, такая, что 𝐹 (𝑥) = ∫︀ 𝑥 −∞ 𝑓 𝑋 (𝑡)𝑑𝑡 Мы понимаем, что ∫︀ ∞ −∞ 𝑓 𝑋 (𝑥)𝑑𝑥 = 1 и 𝑓 𝑋 (𝑥) ≥ 0 . При этом для любого 𝐴 ∈ ℬ(R) P(𝑋 ∈ 𝐴) = ∫︁ 𝐴 𝑓 𝑋 (𝑥)𝑑𝑥, правда, возникает сложный вопрос, что такое интеграл по произвольному множеству, на который мы ответим в следующий раз. Функция 𝑓 𝑋 (𝑥) определяется с точностью до множества меры Лебега 0 и равна (с точностью до такого мно- жества) F ′ (𝑥) Пример 9.8. Для примера 2 функцию распределения 𝑋 можно представить в виде ∫︀ 𝑥 −∞ 𝑓 𝑋 (𝑥)𝑑𝑥 , где 𝑓 𝑋 (𝑥) = F ′ (𝑥) = 1 при 𝑥 ∈ (0, 1), 𝑓 𝑋 (𝑥) = F ′ (𝑥) = 0 при 𝑥 < 0 и 𝑓 𝑋 (𝑥) = F ′ (𝑥) = 0 при 𝑥 > 1. При 𝑥 = 0 и 𝑥 = 1 для определенности положим 𝑓 𝑋 (𝑥) = 1 . Мы видим, что плотность будет постоянной на отрезке функцией, равной вне отрезка нулю, что соответствует интуитивному понятию о равномерности. Соответствующее распределение называется стандартным равномерным распределением и представляет собой частный случай равномерного распределения на отрезке [𝑎, 𝑏], описанного ниже. Рис. 14: Плотность и функция распределения равномерного распределения на отрезке [𝑎, 𝑏] Плотность выполняет роль, схожую с P(𝑋 = 𝑥 𝑖 ) для дискретных величин. В силу определения производной 𝑓 𝑋 (𝑥) = lim 𝑢→∞ P(𝑋 ∈ (𝑥 − 𝑢, 𝑥 + 𝑢]) 2𝑢 , то есть плотность — это ’удельная вероятность’ попадания в окрестность точки. Большее значение плотности делает попадание в маленькую окрестность точки более вероятным. Приведем список основных абсолютно-непрерывных распределений: 1. 𝑓(𝑥) = 1/(𝑏 − 𝑎), 𝑥 ∈ [𝑎, 𝑏] - равномерное распределение на отрезке [𝑎, 𝑏]. Обозначают его 𝑅[𝑎, 𝑏] или 𝑈[𝑎, 𝑏]; 2. 𝑓(𝑥) = 𝜆𝑒 −𝜆𝑥 , 𝑥 > 0, 𝜆 > 0 — экспоненциальное распределение с параметром 𝜆. Обозначение exp(𝜆); 62 3. 𝑓(𝑥) = 𝜆/2𝑒 −𝜆|𝑥| , 𝜆 > 0 — распределение Лапласа; 4. 𝑓(𝑥) = ( √ 2𝜋) −1 𝑒 −𝑥 2 /2 — стандартное нормальное распределение. С ним мы уже встречались, когда стал- кивались с центральной предельной теоремой. Обозначение 𝒩 (0, 1); 5. 𝑓(𝑥) = ( √ 2𝜋𝜎 2 ) −1 𝑒 −(𝑥−𝑎) 2 /(2𝜎 2 ) — нормальное распределение с параметрами 𝑎, 𝜎 2 . Это распределение вели- чины 𝜎𝑋 + 𝑎, где 𝑋 — стандартная нормальная величина. Обозначение 𝒩 (𝑎, 𝜎 2 ) ; 6. 𝑓(𝑥) = 𝑥 𝑎−1 𝑒 −𝑥/𝑏 𝑏 −𝑎 /Γ(𝑎) , 𝑥 > 0, 𝑏 > 0, 𝑎 > 0 — гамма-распределение. Заметим, что экспоненциальное есть 𝐺𝑎𝑚𝑚𝑎(1, 1/𝜆) . Обозначение 𝐺𝑎𝑚𝑚𝑎(𝑎, 𝑏); 7. 𝑓(𝑥) = 𝑥 𝑏−1 (1 − 𝑥) 𝑎−1 /𝐵(𝑎, 𝑏) , 0 < 𝑥 < 1, 𝑎, 𝑏 > 0 — бета-распределение. Обозначение 𝐵𝑒𝑡𝑎(𝑎, 𝑏); 8. 𝑓(𝑥) = 1/(𝜋(1 + 𝑥 2 )) — распределение Коши. Обозначение 𝐶𝑎𝑢𝑐ℎ𝑦. 10 Математическое ожидание в общем случае 10.1 Общее определение математического ожидания Сегодня мы обобщим введенное нами для дискретных величин понятие математического ожидания на общий случай. Для этого воспользуемся следующей конструкцией: 1. Для неотрицательной величины 𝑋 с конечным множеством значений {𝑥 0 , . . . , 𝑥 𝑛 } (такие величины будем называть простыми) положим E𝑋 = 𝑛 ∑︁ 𝑘=0 𝑥 𝑘 P(𝑋 = 𝑥 𝑘 ), как это было раньше. 2. Для произвольной неотрицательной величины рассмотрим последовательность 𝑋 𝑛 , монотонно сходящуюся к 𝑋 (𝑋 𝑛 ↑ 𝑋 ) при каждом 𝜔, где 𝑋 𝑛 принимают конечное число значений. Например, можно взять 𝑋 𝑛 (𝜔) = 𝑛2 𝑛 ∑︁ 𝑘=0 (𝑘/2 𝑛 )𝐼 𝑋(𝜔)∈(𝑘/2 𝑛 ,𝑘+1/2 𝑛 ] + 𝑛𝐼 𝑋(𝜔)>𝑛 Рис. 15: Случайная величина 𝑋 (зеленым цветом) и ее дискретные приближения 𝑋 1 (синим цветом) и 𝑋 2 (красным цветом). В силу монотонности у последовательности E𝑋 𝑛 есть предел (возможно бесконечный), его и назовем E𝑋. 63 3. Для произвольной величины представим ее в виде 𝑋 = 𝑋 + − 𝑋 − , где 𝑋 + = max(𝑋, 0) , 𝑋 − = − min(𝑋, 0) как и прежде. Опять же, в случае E𝑋 + = E𝑋 − = +∞ будет говорить, что математического ожидания у 𝑋 не существует В случае, если E𝑋 + = +∞ , E𝑋 − < +∞ , будем говорить, что математическое ожидание равно +∞. В случае, если E𝑋 + < +∞ , E𝑋 − = +∞ , будем говорить, что математическое ожидание равно −∞. Ключевым моментом, разумеется является пункт 2. Чтобы определение стало легальным, мы должны показать, что для разных последовательностей 𝑋 𝑛 , сходящихся к 𝑋, предел E𝑋 𝑛 будет одним и тем же. Нам понадобится следующая лемма Лемма 10.1. Если 𝑋 𝑛 ↑ 𝑋 и 𝑋 ≥ 𝑌 , где 𝑋 𝑛 , 𝑌 — дискретные неотрицательные величины с конечным числом значений, то lim E𝑋 𝑛 ≥ E𝑌 . Доказательство. Пусть 𝐴 𝑛 = {𝜔 : 𝑋 𝑛 (𝜔) ≥ 𝑌 (𝜔) − 𝜀} . Поскольку 𝑋 𝑛 ↑ 𝑋 , а 𝑋 ≥ 𝑌 , то 𝐴 𝑛 ↑ Ω , а значит P(𝐴 𝑛 ) → 1 в силу непрерывности вероятностной меры. С другой стороны, E𝑋 𝑛 ≥ E𝑋 𝑛 𝐼 𝐴 𝑛 ≥ E(𝑌 − 𝜀)𝐼 𝐴 𝑛 = E𝑌 − E𝑌 𝐼 𝐴 𝑛 − 𝜀P(𝐴 𝑛 ) ≥ E𝑌 − 𝑦 𝑚 (1 − P(𝐴 𝑛 )) − 𝜀, где 𝑦 𝑚 — наибольшее из значений, принимаемых 𝑌 с положительной вероятностью. Устремляя 𝑛 к бесконечно- сти, а 𝜀 к нулю, имеем требуемое. Отсюда для двух последовательностей 𝑋 𝑛 ↑ 𝑋 , 𝑌 𝑛 ↑ 𝑋 получим, что lim 𝑛→∞ E𝑋 𝑛 ≥ E𝑌 𝑚 при всех 𝑚. В силу произвольности 𝑚 lim 𝑛→∞ E𝑋 𝑛 ≥ lim 𝑚→∞ E𝑌 𝑚 Из симметрии выполнено обратное неравенство, откуда пределы математическим ожиданий обеих последова- тельностей одинаковы. Значит, определение E𝑋 во втором пункте не привязано к выбору последовательности 𝑋 𝑛 , монотонно стремящейся к 𝑋. Таким образом, можно посмотреть на определение математического ожидания (в более общем случае, если 𝑃 — не обязательно вероятностная мера, оно называется интеграл Лебега) как на предел lim 𝑛→∞ (︃ 𝑛2 𝑛 ∑︁ 𝑘=1 𝑘 2 𝑛 P (︂ 𝜔 : 𝑋(𝜔) ∈ [︂ 𝑘 2 𝑛 , 𝑘 + 1 2 𝑛 ]︂)︂ + 𝑛P(𝜔 : 𝑋(𝜔) ≥ 𝑛) )︃ Здесь можно провести аналогию с интегралом Римана, только разбиваем на отрезки мы не область интегриро- вания, а область значений. Пример 10.1. Рассмотрим пространство ([0, 1], ℬ([0, 1]), 𝜆), где 𝜆 — мера Лебега. Рассмотрим величину 𝑋(𝜔) = 𝐼 𝜔∈Q . Как функция из [0, 1] эта функция не интегрируема по Риману, поскольку верхняя сумма Дарбу для нее всегда равна 1, а нижняя — всегда равна 0. Однако, интеграл Лебега на [0, 1] у нее определен и равен 0, поскольку 𝑋 — простая случайная величина, принимающая 2 значений: единицу с вероятностью P(𝜔 ∈ Q) = 𝜆([0, 1] ∩ Q) = 0, ноль с вероятностью единица. Будем использовать для E𝑋 также форму записи ∫︀ Ω 𝑋(𝜔)𝑃 (𝑑𝜔) 10.2 Свойства математического ожидания Определение математического ожидания выглядит довольно сложным. Как же убедиться в том, что для него выполнены простые свойства, справедливые в дискретном случае, например линейность? 1. E(𝑎𝑋 + 𝑏𝑌 ) = 𝑎E𝑋 + 𝑏E𝑌 . 64 Доказательство. Разобьем доказательство на несколько шагов. • E(−𝑋) = −E𝑋, поскольку (−𝑋) + = 𝑋 − , (−𝑋) − = 𝑋 + • E(𝑎𝑋) = 𝑎E𝑋 для положительных 𝑎. – Для дискретных величин мы такое свойство уже проверяли. – Для произвольных неотрицательных величин оно прямо следует из того, что если 𝑋 𝑛 ↑ 𝑋 , то 𝑎𝑋 𝑛 ↑ 𝑎𝑋 , 𝑛 → ∞. – Для величин произвольного знака следует из того что (𝑎𝑋) + = 𝑎𝑋 + , (𝑎𝑋) − = 𝑎𝑋 − • E(𝑋 + 𝑌 ) = E𝑋 + E𝑌 – Для дискретных величин 𝑋, 𝑌 мы уже получали это соотношение. – Для неотрицательных величин 𝑋, 𝑌 оно следует из того, что для 𝑋 𝑛 ↑ 𝑋 , 𝑌 𝑛 ↑ 𝑌 , 𝑛 → ∞, верно соотношение 𝑋 𝑛 + 𝑌 𝑛 ↑ 𝑋 + 𝑌 , 𝑛 → ∞. – Если величина 𝑋 неотрицательна, а 𝑌 — неположительна, а 𝑋 + 𝑌 при этом неотрицательна, то E(𝑋 + 𝑌 ) + E(−𝑌 ) = E𝑋 в силу аддитивности для положительных величин. Следовательно, E(𝑋 + 𝑌 ) = E𝑋 + E𝑌 Аналогичный результат получаем для случая неположительной 𝑋 + 𝑌 . – Если 𝑋 неотрицательна, а 𝑌 неположительна, то по определению E(𝑋 + 𝑌 ) = E(𝑋 + 𝑌 )𝐼 𝑋+𝑌 ≥0 + E(𝑋 + 𝑌 )𝐼 𝑋+𝑌 ≤0 Но величины 𝑋𝐼 𝑋+𝑌 ≥0 , 𝑌 𝐼 𝑋+𝑌 ≥0 удовлетворяют условиям предыдущего пункта. Следовательно, E(𝑋 + 𝑌 )𝐼 𝑋+𝑌 ≥0 = E𝑋𝐼 𝑋+𝑌 ≥0 + E𝑌 𝐼 𝑋+𝑌 ≥0 Аналогичным образом расписывая вторую сумму, получим E(𝑋 + 𝑌 )𝐼 𝑋+𝑌 ≤0 = E𝑋𝐼 𝑋+𝑌 ≤0 + E𝑌 𝐼 𝑋+𝑌 ≤0 Остается сложить полученные выражения и воспользоваться предыдущим пунктом, откуда E(𝑋 + 𝑌 ) = E𝑋 + E𝑌 и в этом случае. – Для произвольных величин нам необходимо доказать, что E(𝑋 + 𝑌 ) + − E(𝑋 + 𝑌 ) − = E𝑋 + + E𝑌 + + E𝑋 − + E𝑌 − Представим (𝑋 + 𝑌 ) + в виде суммы (𝑋 + 𝑌 )𝐼 𝐴 1 + (𝑋 + 𝑌 )𝐼 𝐴 2 + (𝑋 + 𝑌 )𝐼 𝐴 3 , где 𝐴 1 = {𝜔 : 𝑋 ≥ 0, 𝑌 ≥ 0}, 𝐴 2 = {𝜔 : 𝑋 ≥ 0, 𝑌 < 0, 𝑋+𝑌 ≥ 0}, 𝐴 3 = {𝜔 : 𝑋 < 0, 𝑌 ≥ 0, 𝑋+𝑌 ≥ 0}. При этом каждая из величин 𝑋𝐼 𝐴 𝑖 , 𝑌 𝐼 𝐴 𝑖 — постоянного знака, откуда для них справедлива аддитивность. Аналогичным образом представим (𝑋 + 𝑌 ) − с помощью событий 𝐵 1 , ..., 𝐵 3 , где 𝐵 𝑖 отличается от 𝐴 𝑖 тем, что все знаки неравенств заменены на противоположные. Таким образом, E(𝑋 + 𝑌 ) = E𝑋(𝐼 𝐴 1 + 𝐼 𝐴 3 + 𝐼 𝐵 2 ) + E𝑋(𝐼 𝐵 1 + 𝐼 𝐵 3 + 𝐼 𝐴 2 ) + E𝑌 (𝐼 𝐴 1 + 𝐼 𝐴 2 + 𝐼 𝐵 3 ) + E𝑌 (𝐼 𝐵 1 + 𝐼 𝐵 2 + 𝐼 𝐴 3 ) Пользуясь тем, что первые две величины являются неотрицательной и неположительной, мы можем привести E𝑋(𝐼 𝐴 1 + 𝐼 𝐴 3 + 𝐼 𝐵 2 ) + E𝑋(𝐼 𝐵 1 + 𝐼 𝐵 3 + 𝐼 𝐴 2 ) к виду E𝑋. Аналогично со второй частью. Линейность доказана. 2. Для 𝑋 ≥ 𝑌 п.н. и E𝑋, E𝑌 конечны, то E𝑋 ≥ E𝑌 . Доказательство. В силу аддитивности достаточно доказать, что если 𝑋 − 𝑌 ≥ 0, то E(𝑋 − 𝑌 ) ≥ 0. Это так непосредственно по определению математического ожидания неотрицательной величины. 65 3. E𝑋 ≤ E|𝑋|. Свойство вытекает из предыдущего, поскольку −|𝑋| ≤ 𝑋 ≤ |𝑋|. 4. Если 𝑋 = 𝑌 п.н. (то есть P(𝜔 : 𝑋(𝜔) = 𝑌 (𝜔)) = 1), то и E𝑋 = E𝑌 . 5. (Теорема о монотонной сходимости). Если 𝑋 𝑛 (𝜔) ↑ 𝑋(𝜔) (как числовая последовательность при каждом 𝜔 ) и E𝑋 0 > −∞ , то E𝑋 𝑛 → E𝑋 (конечному или бесконечному). Аналогичный результат справедлив для монотонно убывающих последовательностей. Доказательство. Пусть 𝑋 ≥ 0. Тогда рассмотрим последовательности простых функций 𝑌 𝑚,𝑛 (𝜔) , мо- нотонно сходящиеся к 𝑋 𝑛 при 𝑚 → ∞. Рассмотрим 𝑌 𝑛 (𝜔) = max 𝑚≤𝑛 𝑌 𝑚,𝑛 (𝜔) . Это монотонно сходя- щаяся последовательность простых случайных величин, причем 𝑌 𝑛 (𝜔) ≤ 𝑋 𝑛 (𝜔) ≤ 𝑋 , поскольку все 𝑌 𝑚,𝑛 (𝜔) ≤ 𝑋 𝑛 (𝜔) . Следовательно, 𝑌 𝑛 имеет предел 𝑌 при каждом 𝜔, причем E𝑌 = lim 𝑛→∞ E𝑌 𝑛 ≤ lim 𝑛→∞ E𝑋 𝑛 (𝜔) ≤ E𝑋. С другой стороны, 𝑌 = 𝑋, поскольку а) 𝑌 (𝜔) ≤ 𝑋(𝜔) при всех 𝜔 и б) 𝑌 (𝜔) ≥ 𝑋 𝑛 (𝜔) при всех 𝑛, а 𝑋 𝑛 (𝜔) → 𝑋(𝜔) . Значит, E𝑋 ≤ lim 𝑛→∞ E𝑋 𝑛 (𝜔) ≤ E𝑋, откуда вытекает требуемое рассуждение. Для произвольной случайной величины 𝑋 c −∞ < E𝑋 0 < +∞ можно рассмотреть последовательность 𝑋 𝑛 − 𝑋 0 , которая удовлетворяет условиям предыдущей теоремы. Наконец для случая E𝑋 0 = +∞ всех 𝑋 𝑛 , 𝑋 также имеют бесконечное математическое ожидание, посколь- ку их положительные части не меньше чем у 𝑋 0 , а все отрицательные части не больше. Заметим, что без требования монотонноcти теорема, вообще говоря, не верна. Пример 10.2. Если 𝑋 𝑛 (𝜔) → 𝑋(𝜔) при 𝑛 → ∞ при всех 𝜔, то E𝑋 𝑛 может к E𝑋 и не стремиться. Пусть, например, Ω = [0, 1], ℱ = ℬ([0, 1]), P — мера Лебега, 𝑋 𝑛 = 𝑛𝐼 (0,1/𝑛) . Тогда 𝑋 𝑛 (𝜔) → 0 для всякого 𝜔, но E𝑋 𝑛 = 1 ̸→ 0 6. (Лемма Фату). Если |𝑋 𝑛 (𝜔)| ≤ 𝑌 (𝜔) , E𝑌 < ∞, то E lim inf 𝑛→∞ 𝑋 𝑛 ≤ lim inf 𝑛→∞ E𝑋 𝑛 ≤ lim sup 𝑛→∞ E𝑋 𝑛 ≤ E lim sup 𝑛→∞ 𝑋 𝑛 Доказательство. Рассмотрим 𝑌 𝑛 (𝜔) = inf 𝑚≥𝑛 𝑋 𝑚 (𝜔) . Тогда 𝑌 𝑛 (𝜔) монотонно возрастает по 𝑛 и 𝑌 0 (𝜔) ≥ 𝑌 (𝜔) не может иметь математическое ожидание минус бесконечность. Значит E lim inf 𝑛→∞ 𝑋 𝑛 = E lim 𝑛→∞ inf 𝑚≥𝑛 𝑋 𝑚 = lim 𝑛→∞ E𝑌 𝑛 ≤ lim 𝑛→∞ inf 𝑚≥𝑛 E𝑋 𝑚 = lim inf 𝑛→∞ E𝑋 𝑛 Аналогично доказывается верхняя оценка. 7. (Теорема о мажорируемой сходимости) Пусть 𝑋 𝑛 → 𝑋 при 𝑛 → ∞ при каждом 𝜔 и |𝑋 𝑛 | ≤ 𝑌 , где E𝑌 конечно. Тогда E𝑋 𝑛 → E𝑋 Доказательство. В силу леммы Фату E lim inf 𝑛→∞ 𝑋 𝑛 ≤ lim inf 𝑛→∞ E𝑋 𝑛 ≤ lim sup 𝑛→∞ E𝑋 𝑛 ≤ E lim sup 𝑛→∞ 𝑋 𝑛 Однако, левая и правая части совпадают, откуда E lim 𝑋 𝑛 = lim E𝑋 𝑛 , что и требовалось доказать. 8. Пусть 𝑋, 𝑌 — независимые величины, тогда E𝑋𝑌 = E𝑋E𝑌 . 66 Доказательство. Напомним, что под независимыми величинами подразумеваются такие 𝑋, 𝑌 , что P(𝑋 ∈ 𝐴, 𝑌 ∈ 𝐵) = P(𝑋 ∈ 𝐴)P(𝑌 ∈ 𝐵). при всех 𝐴, 𝐵 из ℬ(R). • Пусть 𝑋, 𝑌 неотрицательные и простые. Тогда данная формула уже доказывалась в первой части курса. • Пусть 𝑋, 𝑌 неотрицательны и необязательно простые. Тогда мы можем рассмотреть последователь- ности простых 𝑋 𝑛 , 𝑌 𝑛 (например, заданных в пункте 2) определения математического ожидания), которые также будут независимыми, причем 𝑋 𝑛 ↑ 𝑋 , 𝑌 𝑛 ↑ 𝑌 , 𝑋 𝑛 𝑌 𝑛 ↑ 𝑋𝑌 . Тогда E𝑋 𝑛 𝑌 𝑛 = E𝑋 𝑛 E𝑌 𝑛 , причем E𝑋 𝑛 𝑌 𝑛 → E𝑋𝑌 , E𝑋 𝑛 → E𝑋 , E𝑌 𝑛 → E𝑌 , 𝑛 → ∞, что и требовалось доказать. • Если же 𝑋, 𝑌 произвольны, то разобьем 𝑋 на 𝑋 + − 𝑋 − , 𝑌 на 𝑌 + − 𝑌 − , 𝑋𝑌 на 𝑋 + 𝑌 + + 𝑋 − 𝑌 − − 𝑋 + 𝑌 − − 𝑌 + 𝑋 − . Применяя к каждому случаю уже известные равенства, получим требуемое. 9. (Неравенство Иенсена) Если 𝑋 — случайная величина, 𝑔 — выпуклая вниз функция, E𝑔(𝑋) и E𝑋 суще- ствуют, то E𝑔(𝑋) ≤ 𝑔(E𝑋). Доказательство. Доказательство, приведенное в дискретном случае, остается без изменений. 10. (Неравенство Ляпунова) Если 0 < 𝑝 < 𝑞, то для любой 𝑌 (E|𝑌 | 𝑝 ) 1/𝑝 ≤ (E|𝑌 | 𝑞 ) 1/𝑞 Доказательство. Доказательство, приведенное в дискретном случае, остается без изменений. 11. (Неравенство Гельдера) Если 𝑝, 𝑞 > 0, 1/𝑝+1/𝑞 = 1 и E|𝑋| 𝑝 , E|𝑌 | 𝑞 конечны, то E𝑋𝑌 ≤ (E|𝑋| 𝑝 ) 1/𝑝 (E|𝑌 | 𝑞 ) 1/𝑞 При этом равенство возможно только если |𝑋| 𝑝 = |𝑌 | 𝑝 п.н. или одна из 𝑋, 𝑌 есть 0 п.н. Доказательство. Доказательство, приведенное в дискретном случае, остается без изменений. 12. (Неравенство Коши-Буняковского). Пусть E𝑋 2 < ∞ , E𝑌 2 < ∞ , тогда E𝑋𝑌 ≤ (E𝑋 2 ) 1/2 (E|𝑌 | 2 ) 1/2 13. (Неравенство Минковского). Пусть 𝑝 ≥ 1. Тогда (E|𝑋 + 𝑌 | 𝑝 ) 1/𝑝 ≤ (E|𝑋| 𝑝 ) 1/𝑝 + (E|𝑌 | 𝑝 ) 1/𝑝 Оставим это неравенство без доказательства. 10.3 Интеграл в форме Стилтьеса Определение 10.1. Пусть 𝑔(𝑥) — непрерывная функция, обращающаяся в ноль вне [𝑎, 𝑏], 𝐹 (𝑥) — функция распределения. Пусть 𝜆 — разбиение [𝑎, 𝑏] точками 𝑥 𝑘 , 0 ≤ 𝑘 ≤ 𝑛 и ̃︀ 𝑥 𝑘 — отмеченные точки. Если сушествует предел при диаметре разбиения, стремящееся к нулю, величин 𝑛 ∑︁ 𝑘=1 𝑔( ̃︀ 𝑥 𝑘 )(𝐹 (𝑥 𝑘 ) − 𝐹 (𝑥 𝑘−1 )), то этот предел называется интегралом Римана-Стилтьеса функции 𝑔(𝑥) и обозначается ∫︀ 𝑏 𝑎 𝑔(𝑥)𝑑𝐹 (𝑥) 67 Предельным переходом можно доопределить несобственный интегралы Римана-Стильтеса. Оказывается, что для неперывных на прямой функций 𝑔 выполнено соотношение. E𝑔(𝑋) = ∫︁ ∞ −∞ 𝑔(𝑥)𝑑𝐹 (𝑥). По существу эта связь обеспечивается предельным переходом к 𝑋 от простых величин 𝑋 𝑛 , описанных в на- чале построения математического ожидания. Более подробно останавливаться на этом мы не можем, но будем активно использовать полученную формулу. Наиболее удобная ситуация возникает, если 𝑋 — абсолютно непрерывна. Тогда ∫︀ 𝑔(𝑥)𝑑𝐹 (𝑥) = ∫︀ 𝑔(𝑥)𝑓 𝑋 (𝑥)𝑑𝑥 Таким образом, для абсолютно-непрерывных величин подсчет математического ожидания сводится к подсчету обычного риманова интеграла. Пример 10.3. Величина, распределенная по закону Коши (то есть c плотностью 𝑓 𝑋 (𝑥) = 1 𝜋(1+𝑥 2 ) ), математи- ческого ожидания не имеет. Действительно, ее матожидания от положительной и отрицательной частей пред- ставляют собой один и тот же интеграл ∞ ∫︀ 0 𝑥𝑑𝑥 𝜋(1+𝑥 2 ) , который расходится в плюс бесконечность. Пример 10.4. Пусть 𝑋 — равномерно распределена на отрезке [𝑎, 𝑏]. Тогда ее среднее равно ∫︁ 𝑏 𝑎 𝑥 1 𝑏 − 𝑎 𝑑𝑥 = 𝑏 2 − 𝑎 2 2(𝑏 − 𝑎) = 𝑏 + 𝑎 2 Вопрос 10.1. Математическое ожидание 𝑋 2 |