Вероятность 8. 6. распределения вероятностей дискретных случайных величин биномиальное распределение
Скачать 0.72 Mb.
|
ЛЕКЦИЯ 8Распределения вероятностей дискретных случайных величин. Биномиальное распределение. Распределение Пуассона. Геометрическое распределение. Производящая функция. 6. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ |
X | n | n–1 | … | k | … | 0 |
P | pn | npn–1q | … | | … | qn |
Найдем числовые характеристики этого распределения.
По определению математического ожидания для ДСВ имеем
.
Запишем равенство, являющееся бином Ньютона
.
и продифференцируем его по p. В результате получим
.
Умножим левую и правую часть на p:
.
Учитывая, что p+q=1, имеем
(6.2)
Итак, математическое ожидание числа появлений событий в n независимых испытаниях равно произведению числа испытаний n на вероятность p появления события в каждом испытании.
Дисперсию вычислим по формуле
.
Для этого найдем
.
Предварительно продифференцируем формулу бинома Ньютона два раза по p:
и умножим обе части равенства на p2:
находим
Следовательно,
Итак, дисперсия биномиального распределения равна
. (6.3)
Данные результаты можно получить и из чисто качественных рассуждений. Общее число X появлений события A во всех испытаниях складываются из числа появлений события в отдельных испытаниях. Поэтому если X1 – число появлений события в первом испытании, X2 – во втором и т.д., то общее число появлений события A во всех испытаниях равно X=X1+X2+…+Xn. По свойству математического ожидания:
.
Каждое из слагаемых правой части равенства есть математическое ожидание числа событий в одном испытании, которое равно вероятности события. Таким образом,
.
По свойству дисперсии:
.
Так как , а математическое ожидание случайной величины , которое может принимать только два значения, а именно 12 с вероятностью p и 02 с вероятностью q, то . Таким образом, В результате, получаем
.
Воспользовавшись понятием начальных и центральных моментов, можно получить формулы для асимметрии и эксцесса:
. (6.4)
Рис. 6.1
Многоугольник биномиального распределения имеет следующий вид (см. рис. 6.1). Вероятность Pn(k) сначала возрастает при увеличении k, достигает наибольшего значения и далее начинает убывать. Биномиальное распределение асимметрично, за исключением случая p=0,5. Отметим, что при большом числе испытаний n биномиальное распределение весьма близко к нормальному. (Обоснование этого предложения связано с локальной теоремой Муавра-Лапласа.)
Число m0 наступлений события называется наивероятнейшим, если вероятность наступления события данное число раз в этой серии испытаний наибольшая (максимум в многоугольнике распределения). Для биномиального распределения
. (6.5)
Замечание. Данное неравенство можно доказать, используя рекуррентную формулу для биномиальных вероятностей:
(6.6)
Пример 6.1. Доля изделий высшего сорта на данном предприятии составляет 31%. Чему равно математического ожидание и дисперсия, также наивероятнейшее число изделий высшего сорта в случайно отобранной партии из 75 изделий?
Решение. Поскольку p=0,31, q=0,69, n=75, то
M[X] = np = 750,31 = 23,25; D[X] = npq = 750,310,69 = 16,04.
Для нахождения наивероятнейшего числа m0, составим двойное неравенство
.
Отсюда следует, что m0 = 23.
6.2. Распределение Пуассона
Как было уже отмечено, биномиальное распределение приближается к нормальному при n. Однако это не имеет места, если наряду с увеличением n одна из величин p или q стремится к нулю. В этом случае имеет место асимптотическая формула Пуассона, т.е. при n, p0
, (6.7)
где =np. Эта формула определяет закон распределения Пуассона, который имеет самостоятельное значение, а не только как частный случай биномиального распределения. В отличие от биномиального распределения здесь случайная величина k может принимать бесконечное множество значений: k=0,1,2,…
Закон Пуассона описывает число событий k, происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью, которая характеризуется параметром . Многоугольник распределения Пуассона показан на рис. 6.2. Отметим, что при больших расп
Рис. 6.2
ределение Пуассона приближается к нормальному. Поэтому распределение Пуассона применяется, как правило, в тех случаях, когда имеет порядок единицы, при этом число испытаний n должно быть велико, а вероятность появления события p в каждом испытании мала. В связи с этим закон Пуассона часто называют еще законом распределения редких явлений.
Примерами ситуаций, в которых возникает распределение Пуассона, могут служить распределения: 1) числа определенных микробов в единице объема; 2) числа вылетевших электронов с накаленного катода за единицу времени; 3) числа -частиц, испускаемых радиоактивным источником за определенных промежуток времени; 4) числа вызовов, поступающих на телефонную станцию за определенное время суток и т.д.
Запишем закон Пуассона в виде таблицы
X | 0 | 1 | 2 | 3 | … | k | … |
P | | | | | … | | … |
Проверим, что сумма всех вероятностей равна единице:
Найдем числовые характеристики этого распределения. По определению математического ожидания для ДСВ имеем
.
Отметим, что в последней сумме суммирование начинается с k=1, т.к. первый член суммы, соответствующий k=0, равен нулю.
Для нахождения дисперсии найдем предварительно математического ожидание квадрата случайной:
Тогда
Таким образом, математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона, совпадают и равны параметру этого распределения
. (6.8)
В этом состоит отличительная особенность распределения Пуассона. Так, если на основании опытных данных было получено, что математическое ожидание и дисперсия некоторой величины близки между собой, то есть основания предполагать, что данная случайная величина распределена в соответствии с законом Пуассона.
Воспользовавшись понятием начальных и центральных моментов, можно показать, что для распределения Пуассона коэффициент асимметрии и эксцесс равны:
. (6.9)
Поскольку параметр всегда положителен, то у распределения Пуассона всегда положительная асимметрия и эксцесс.
Покажем теперь, что формулу Пуассона можно рассматривать как математическую модель простейшего потока событий.
Потоком событий называют последовательность событий, которые наступают в случайные моменты времени. Поток называется простейшим, если он обладает свойствами стационарности, отсутствия последействия и ординарности.
Интенсивностью потока называют среднее число событий, которые появляются в единицу времени.
Если постоянная интенсивности потока известна, то вероятность появления k событий простейшего потока за время t определяется формулой Пуассона:
. (6.10)
Эта формула отражает все свойства простейшего потока. Более того, любой простейший поток описывается формулой Пуассона, поэтому простейшие потоки часто называют пуассоновскими.
Свойство стационарности состоит в том, что вероятность появления k событий в любом промежутке времени зависит только от числа k и от длительности t промежутка времени и не зависит от начала его отсчета. Другими словами, если поток обладает свойством стационарности, то вероятность появления k событий за промежуток времени t есть функция, зависящая только от k и от t.
В случае простейшего потока из формулы Пуассона (6.10) следует, что вероятность k событий за время t, при заданной интенсивности является функцией только двух аргументов: k и t, что характеризует свойство стационарности.
Свойство отсутствия последействия состоит в том, что вероятность появления k событий в любом промежутке времени зависит от того, появлялись или не появлялись события в моменты времени, предшествующие началу рассматриваемого промежутка. Другими словами, предыстория потока не влияет на вероятности появления событий в ближайшем будущем.
В случае простейшего потока в формуле Пуассона (6.10) не используется информация о появлении событий до начала рассматриваемого промежутка времени, что характеризует свойство отсутствия последействия.
Свойство ординарности состоит в том, что появление двух или более событий за малый промежуток времени практически невозможно. Другими словами, вероятность появление более одного события за малый промежуток времени пренебрежимо мала по сравнению с вероятностью появления только одного события.
Покажем, что формула Пуассона (6.10) отражает свойство ординарности. Положив k=0 и k=1, найдем соответственно вероятности не появления событий и появления одного события:
Следовательно, вероятность появления более одного события равна
.
Используя разложение функции в ряд Маклорена, после элементарных преобразований получим
.
Сравнивая Pt(1) и Pt(k>1), заключаем, что при малых значениях t вероятность появления более одного события пренебрежимо мала по сравнению с вероятностью наступления одного события, что характеризует свойство ординарности.
Пример 6.2. В наблюдениях Резерфорда и Гейгера радиоактивное вещество за промежуток времени 7,5 сек испускало в среднем 3,87 -частицы. Найти вероятность того, что за 1 сек это вещество испустит хотя бы одну частицу.
Решение. Как мы уже отмечали, распределение числа -частиц, испускаемых радиоактивным источником за определенных промежуток времени описывается формулой Пуассона, т.е. образует простейший поток событий. Поскольку интенсивность испускания -частиц за 1 сек равно
,
то формула Пуассона (6.10) примет вид
Таким образом, вероятность того, что за t=1 сек вещество испустит хотя бы одну частицу будет равно
.
6.3. Геометрическое распределение
Пусть производится стрельба по заданной мишени до первого попадания, при этом вероятность p попадания в цель в каждом выстреле одна и та же и не зависит от результатов предыдущих выстрелов. Другими словами, в рассматриваемом опыте осуществляется схема Бернулли. В качестве случайной величины X будем рассматривать число произведенных выстрелов. Очевидно, что возможными значениями случайной величины X являются натуральные числа: x1=1, x2=2, … тогда вероятность того, что понадобится k выстрелов будет равна
. (6.11)
Полагая в этой формуле k=1,2, … получим геометрическую прогрессию с первым членом p и множителем q:
.
По этой причине распределение, определяемое формулой (6.11) называется геометрическим.
Используя формулу суммы бесконечно убывающей геометрической прогрессии, легко убедится, что
.
Найдем числовые характеристики геометрического распределения.
По определению математического ожидания для ДСВ имеем
.
Дисперсию вычислим по формуле
.
Для этого найдем
.
Следовательно,
.
Итак, математическое ожидание и дисперсия геометрического распределения равна
. (6.12)
6.4.* Производящая функция
При решении задач, связанных с ДСВ, часто используются методы комбинаторики. Одним из наиболее развитых теоретических методов комбинаторного анализа является метод производящих функций, который является одним из самых сильных методов и в применениях. Кратко познакомимся с ним.
Если случайная величина принимает только целые неотрицательные значения, т.е.
,
то производящей функцией распределения вероятностей случайной величины называется функция
, (6.13)
где z – действительная или комплексная переменная. Отметим, что между множеством производящих функций (x) и множеством распределений {P(=k)} существует взаимно однозначное соответствие.
Пусть случайная величина имеет биномиальное распределение
.
Тогда, используя формулу бинома Ньютона, получим
,
т.е. производящая функция биномиального распределения имеет вид
. (6.14)
Добавление. Производящая функция распределения Пуассона
имеет вид
. (6.15)
Производящая функция геометрического распределения
имеет вид
. (6.16)
При помощи производящих функций удобно находить основные числовые характеристики ДСВ. Например, первый и второй начальный моменты связаны с производящей функцией следующими равенствами:
, (6.17)
. (6.18)
Метод производящих функций часто бывает удобен тем, что в некоторых случаях функцию распределения ДСВ очень трудно определить, тогда как производящую функцию порой легко найти. Например, рассмотрим схему последовательных независимых испытаний Бернулли, но внесем в нее одно изменение. Пусть вероятность осуществления события A от испытания к испытанию меняется. Это означает, что формула Бернулли для такой схемы становится неприменимой. Задача нахождения функции распределения в таком случае представляет значительные трудности. Однако для данной схемы легко находится производящая функция, а, следовательно, легко находятся и соответствующие числовые характеристики.
Широкое применение производящих функций основано на том, что изучение сумм случайных величин можно заменить изучением произведений соответствующих производящих функций. Так, если 1, 2, …, n независимы, то
. (6.19)
Пусть pk=Pk(A) – вероятность "успеха" в k-м испытании в схеме Бернулли (соответственно, qk=1–pk – вероятность "неуспеха" в k-м испытании). Тогда, в соответствие с формулой (6.19), производящая функция будет иметь вид
. (6.20)
Пользуясь данной производящей функцией, можем написать
.
Здесь учтено, что pk+qk=1. Теперь по формуле (6.1) найдем второй начальный момент. Для этого предварительно вычислим
.
Тогда
и .
В частном случае p1=p2=…=pn=p (т.е. в случае биномиального распределения) из полученных формул следует, что M=np, D=npq.