Теория вероятностей и математическая статистика. Закон распределения случайной величины. Математическое ожидание 28 Дисперсия случайной величины 32
Скачать 361.49 Kb.
|
Плотность и функция распределения. Непрерывные случайные величиныВыше были рассмотрены законы распределения дискретных случайных величин. Каким образом можно представить закон распределения непрерывной случайной величины, т.е. величины, которая может принимать любые значения на некотором промежутке числовой оси, и число ее возможных значений всегда бесконечно? Для непрерывной случайной величины вероятность того, что она примет какое-то одно определенное значение, всегда равна нулю. Но можно определить вероятность того, что эта величина примет значение из некоторого промежутка. Для этого можно использовать функцию плотности распределения вероятности f(x) (ее еще называют плотностью вероятности или плотностью распределения). Вероятность того, что непрерывная случайная величина х примет значение из некоторого промежутка [a;b], определяют по формуле: где подынтегральную функцию f(x) называют плотностью распределения. Из формулы для видно, что эта вероятность представляет собой не что иное, как площадь под кривой графика плотности вероятности f(x) на промежутке [a;b]. Это следует из геометрического смысла определенного интеграла. Если случайная величина х может принимать значения на всей числовой оси, то ее плотность распределения f(x) должна удовлетворять условиям: Если х распределена не на всей числовой оси, а на некотором ее промежутке, соответственно берутся границы этого промежутка. Первое из условий для плотности вероятности означает, что вероятность не может быть отрицательной, а второе – что сумма вероятностей на всем пространстве событий должна быть равна 1. Отметим, что для дискретной случайной величины функцию Р(х), определяющую закон ее распределения (вероятность, что она примет заданное значение), тоже называют плотностью вероятности: . Кроме того, закон распределения случайной величины может быть задан функцией распределения вероятности (или просто функцией распределения) F(а). Эта функция определена на множестве действительных чисел и представляет собой вероятность того, что случайная величина примет значение х, меньшее а: F(а) = P(х < а). Для дискретной случайной величины, причем эта функция будет ступенчатой, так как плотность вероятности определена только для дискретных значений (а функция распределения определена на всей числовой оси для любых случайных величин). Поэтому строгое определение непрерывной случайной величины вводится через понятие функции распределения: случайную величину называют непрерывной, если непрерывна ее функция распределения. Представим графически функцию распределения дискретной случайной величины для рассмотренного ранее примера, в котором игрок мог выиграть или проиграть определенную сумму с заданными вероятностями. Плотность вероятности выигрыша х была задана таблично (во второй строке таблицы 1). Припишем к таблице 1 значения функции распределения для дискретных значений х (табл.3), а кроме того, поменяем столбцы местами, чтобы расположить значения случайной величины по возрастанию (для удобства построения графика). Вероятность того, что выигрыш составит меньше, чем (-300), нулевая. Поэтому для а ≤ -300 F(a) = 0. Меньше выиграть (больше проиграть) просто нельзя. Вероятность того, что выигрыш будет менее 500, равна 0,7, т.е. F(500) = = 0,7. В самом деле, такой выигрыш можно получить, только проиграв 300 с вероятностью 0,7. Вероятность выиграть менее 499, 400, 350 и т.д. от -300 до 500 (включая 500) также равна 0,7 по той же причине. Поэтому для -300 < а ≤ 500 F(a) = 0,7. Вероятность выиграть менее 1000 равна 0,9, так такой выигрыш означает, что выиграно либо -300, либо 500, и по аксиоме сложения 0,2 + 0,7 = 0,9. Следовательно, F(1000) = 0,9. По той же причине F(501) = F(510,5) = = F(800) = … = 0,9, т.е. для 500 < а ≤ 1000 F(a) = 0,9. И, наконец, для любого выигрыша свыше 1000 вероятность выиграть меньше этого значения случайной величины равна 1. Поэтому что это событие – достоверное. Все возможные значения выигрыша меньше 1000. Итак для а > 1000 F(a) = 1. Таблица 3
Итак, Построим график этой функции распределения, который будет иметь вид ступенчатой функции (рисунок 12). 1 0,9 0,7 0,2 -300 500 1000 х F(х) Рис.1 -300 500 1000 х F(х) 0 0,7 0,9 1 Рисунок 12 – Функция распределения дискретной случайной величины Функция распределения F(x) обладает следующими свойствами: 1) 0 ≤ F(x) ≤ 1 (по свойствам вероятности); 2) , т.е. F(x) монотонно не убывает на всей числовой оси (доказательство опустим); 3) , как вероятность невозможного события; 4) , как вероятность достоверного события; 5) вероятность можно вычислить с помощью функции распределения, как приращение этой функции: (доказательство опустим). Таким образом, вероятность можно вычислить как с помощью функции распределения, так и с помощью плотности распределения: . Между плотностью вероятности и функцией распределения непрерывной случайной величины существует следующая связь: . Иными словами, значение функции распределения будет представлять собой площадь под кривой графика плотности вероятности f(x) на промежутке ]-;а]. С другой стороны, плотность вероятности непрерывной случайной величины, является производной ее функции распределения: f(x) = F`(х). Поэтому функцию распределения иногда называют интегральной функцией распределения, а плотность распределения – дифференциальной функцией распределения. График плотности распределения принято называть кривой распределения. Для непрерывной случайной величины несколько иной вид примет формула математического ожидания (вместо суммы берется интеграл, который должен абсолютно сходиться, иначе математическое ожидание не существует): . Равномерное распределение непрерывной случайной величиныРассмотрим пример непрерывной случайной величины. Служащий ездит на работу, и дорога отнимет у него 20-30 мин., причем любое время на дорогу в этих пределах равновероятно. Случайная величина – время, потраченное на дорогу, - является непрерывной. Если случайная величина принимает равновероятные значения на некотором промежутке [a; b], то ее распределение называют равномерным, и его плотность определяется по формуле: ; а функция распределения: Для рассматриваемого примера: . Построим графики этих функций (рисунок 13): Рисунок 13 – Функция и плотность равномерного распределения Отметим, что площадь под кривой графика плотности вероятности f(x) равна 1. В самом деле, 0,1*(30-20) = 1, т.е. Определим, например, вероятность того, что дорога на работу займет от 22 до 25 минут, т.е.. Для этого найдем , т.е. площадь под графиком плотности распределения на промежутке [22; 25]: 0,1*(25 - 22) = 0,3. С помощью функции распределения эту же вероятность можно найти, как F(25) - F(22) = (25 - 20)*0,1 - (22 - 20)*0,1 = 0,3. Для равномерного распределения математическое ожидание . Для рассмотренного примера М(х) = (20 + 30)/2 = 25, т.е. ожидаемое время на дорогу – 25 минут. Найдем дисперсию равномерного распределения: Для рассмотренного примера D(х) = (30 + 20)2/12 = 8 1/3, среднеквадратическое отклонение времени на дорогу составляет минуты. Нормальное распределениеСлучайная величина имеет нормальное (гауссовское) распределение с параметрами а и , если ее плотность распределения задается формулой: . Его обозначают N(а, ); саму случайную величину также называют нормальной. На практике распределение случайных величин чаще всего приближается именно к этому закону распределения. График плотности нормального распределения (его еще называют нормальной, или гауссовской кривой) представлен на рисунке 14. Рисунок 14 – Нормальная кривая Как видно из рисунка 14, нормальное распределение является симметричным относительно прямой x = а. Можно доказать, что параметр а представляет собой математическое ожидание случайной величины (центр распределения). Поскольку параметр а определяет положение графика плотности на числовой оси, его еще называют параметром положения. В точке x = а плотность распределения достигает максимума, который равен . Дисперсия нормального распределения равна . Параметр характеризует степень сжатия или растяжения графика плотности, поэтому его называют параметром масштаба. Ось абсцисс является горизонтальной асимптотой нормальной кривой, т.е. . Также этот график имеет две точки перегиба , ординаты которых равны . График функции нормального распределения приведен на рисунке 15. Этот график центрально симметричен относительно своей точки перегиба, имеющей координаты (а; 0,5). Он имеет две горизонтальные асимптоты – ось абсцисс и параллельную ей прямую с ординатой, равной единице. Рисунок 15 – Функция нормального распределения Непосредственно найти функцию нормального распределения представляется затруднительным, поскольку интеграл от плотности нормального распределения является «неберущимся» в элементарных функциях. Поэтому для проведения расчетов используют частный случай нормального распределения – стандартное нормальное распределение, которое будет рассмотрено далее. Нормальное распределение используется при моделировании разнообразных ситуаций, связанных с измерениями веса и объема товаров, срока работы электроламп, роста мужчин, проходящих медкомиссию и т.п. Во всех этих случаях случайная величина – результат измерения – распределена симметрично относительно своего среднего случайного значения. Ясно, что на практике эти величины обычно принимают значения из некоторого интервала, а не на всей числовой оси. Тем не менее, это не препятствует использованию нормального распределения. При исследовании случайных величин, который подчиняются нормальному закону, используют “правило трех сигм”, согласно которому отклонение нормальной случайной величины от своего математического ожидания более чем на 3 практически невозможно (его вероятность ничтожно мала). Это позволяет ограничиться рассмотрением интервала [a - 3; a + 3]. Пусть случайная величина у распределена по N(а, ). Поставим в соответствие этой случайной величине другую случайную величину х, значения которой вычисляются по формуле х = (у - а)/. В соответствии с известными свойствами математического ожидания и дисперсии М(х) = М((у - а)/) = М(у - a)/ = (а - а)/ = 0; D(x) = D((у - а)/) = D(у - a)/2 = (2 - 0)/2 = 1. Величина х будет иметь нормальное распределение с параметрами а = 0, 2 = 1, т.е. N(0, 1). Его называют стандартным (или нормированным) нормальным распределением. Плотность распределения N(0, 1) определяется формулой: . Функция распределения N(0, 1) определяется: . Отметим, что для N(0, 1) центром распределения является 0. Поэтому f(-x) = f(x), а F(-x) = 1 - F(x) (смотри рисунок 16). Рисунок 16 – Функция и плотность стандартного нормального распределения Значения функции стандартного нормального распределения табулированы для неотрицательных х. При этом обычно табулируется даже не сама функция распределения, а функция , которая называется функцией Лапласа. В этом случае, чтобы получить функцию распределения, необходимо к значению, приведенному в таблице, прибавить ½ (ведь, так как 0 – центр распределения). Соответственно для отрицательных х функцию распределения можно найти по формуле F( -x) = 1/2 - Ф(x). Часто в справочных таблицах приводят удвоенную функцию Лапласа, которую рассчитывают по формуле . В этом случае ее значения необходимо разделить на 2. Например, производителю электроламп известно, что средний срок работы лампы составляет 600 часов, а стандартное отклонение срока работы – 40 часов. Определим вероятность того, что лампа проработает: а) менее 700 часов; б) менее 550 часов; в) от 550 до 700 часов. г) пусть 2% ламп работают не более определенного срока (имеют минимальный срок работы). Определим его величину. Случайная величина х – срок работы электролампы в часах – распределена нормально с математическим ожиданием 600 и дисперсией 1600. а) Р (х < 700) = F`(700), где F`(х) – функция распределения N(600, 1600). Чтобы найти эту вероятность, перейдем к N(0, 1): Р(х < 700) = F((700 - 600)/40) = F(2,5). Эту величину находят по таблице: Р(х < 700) = 0,5 + Ф(2,5) = = 0,5 + 0,4938 = 0,9938. Следовательно, не более 700 часов работают 99,38% ламп. б) Р(х < 550) = F`(550) = F((550 - 600)/40) = F(-1,25) = 1 - F(1,25) = ½ - Ф(1,25) = 0,5 - 0,3914= 0,1056. Следовательно, не более 550 часов работают 10,56% ламп. в) Р(550 < х < 700) = F`(700) - F`(550) = 0,9938 - 0,1056 = 0,8882. Следовательно, от 550 до 700 часов работают 88,81 % ламп. г) Определим вначале, какому значению стандартной нормальной величины х* соответствует значение функции распределения 0,02. Поскольку речь идет о лампах с самым коротким сроком работы, это значение будет меньше среднего, а значит, при переходе к стандартному нормальному распределению будет получено отрицательное значение (меньшее 0). Тот же вывод можно было сделать на основании того, что 0,02 < 0,5 (функция распределения монотонно возрастает, и равна 0,5 в точке 0). Тогда F(х*) = 1 - F( - х*) = 0,5 - Ф( - х*) = 0,02. Отсюда Ф( - х*) = 0,5 - 0,02 = 0,48. По таблице находим х* = - 2,05. Необходимо снова перейти к N(600, 1600) и найти х*`, для которого х* = (х*` - 600)/40. Отсюда х*` = 40*х* + 600 = 600 - 82 = 518. Следовательно, 2% ламп работают не более 518 часов. Если бы было необходимо определить срок работы 2% лучших ламп, то нужно было бы найти х*, для которого F(х*) = 1 - 0,02 = 0,98 = 0,5 + Ф(х*), т.е. Ф(х*) = 0,48. По таблице х* = 2,05; х*` = 40*х* + 600 = 600 + 82 = 682. Следовательно, 2% ламп работают не менее 682 часов. |