8. Лабораторная работа №8. Генерация случайных чисел
с заданным законом распределения
8.1. Основные понятия и соотношения
Множество всех возможных значений случайной величины
ξ , распределенной по закону F , называется генеральной совокупностью F .
Множество
}
,
,
,
{
2 1
n
x
x
x
…
отдельных значений случайной величины
ξ , полученных в серии из n независимых экспериментов (наблюдений), называется
выборочной совокупностью или выборкой объема n из генеральной совокупности.
Выборка
}
,
,
,
{
)
(
)
2
(
)
1
(
n
x
x
x
…
, в которой элементы упорядочены по возрастанию, называется вариационным рядом.
Совокупность пар чисел
(
)
i
i
n
x
,
, где
i
x
,
m
i
,
1
=
- наблюдаемые, неповторяющиеся (для непрерывного распределения) в выборке значения, а
i
n
- число этих значений в выборке, называется статистическим рядом
абсолютных частот. Совокупность пар чисел
(
)
i
i
x
ω
,
, где
n
n
i
i
/
=
ω
называется
статистическим рядом относительных частот. Совокупность пар чисел
∑
=
i
k
k
i
x
1
,
ω
называется статистическим рядом накопленных частот.
Статистические ряды отображают в виде таблицы 8.1
Таблица 8.1.
i
x
1
x
2
x
…
m
x
i
n
1
n
2
n
…
m
n
i
ω
1
ω
2
ω
…
m
ω
∑
=
i
k
k
1
ω
1
ω
2 1
ω
ω
+
…
1
Подобного вида статистический ряд используют обычно для описания выборки из генеральной совокупности с дискретным распределением. В этом случае статистический ряд относительных частот приближенно оценивает ряд распределения дискретной случайной величины.
102
Ломаная, отрезки которой соединяют точки
(
)
iixω
,
, называется
полигоном частот. Для дискретной случайной величины полигон частот является оценкой многоугольника распределения.
ω
3
ω
2
ω
1
ω
1x2x3xmx x Рис. 8.1
Для описания выборки из совокупности с непрерывным распределением используют
сгруппированные статистические ряды. Для этого интервал, в
котором содержатся все элементы выборки, делится на
m равных (или неравных) последовательных, непересекающихся интервалов
mmxxxxxx,
,
,
1 2
1 1
0
÷
÷
÷
−
…
, и подсчитывают частоты
in - число элементов выборки, попавших в
i-ый интервал.
Число интервалов группирования определяют, например, по формуле
Стерджесса:
[
]
2 1
log
1 4 lg
mnn= +
≈ + ⋅
. В результате получаем следующий статистический ряд:
ix1
x 2
x …
mxin1
n 2
n …
mniω
1
ω
2
ω
…
mω
iρ
1
ρ
2
ρ
…
mρ
∑
iω
1
ω
2 1
ω
ω
+
…
1
Здесь
2
1
iiixxx+
=
−
- середины интервалов группирования,
1
−
−
=
∆
=
iiiiiixxxω
ω
ρ
- плотность частоты.
В качестве оценки кривой плотности непрерывного распределения используется
гистограмма частот - ступенчатая фигура, состоящая из
m прямоугольников, опирающихся на частичные интервалы (см. рисунок). Высота
i-го прямоугольника полагается равной плотности частоты
iρ
. Соответственно площадь каждого прямоугольника равна
iiixω
ρ
=
∆
⋅
- относительной частоте.
103
Рис 8.2. Гистограмма частот
Эмпирической функцией распределения, полученной по выборке
}
,
,
,
{
2 1
n
x
x
x
…
, называется функция, при каждом
R
x ∈
равная:
n
x
x
x
F
i
n
<
=
количество
)
(
*
)
(
*
x
F
n
есть ступенчатая функция. Эмпирическая функция распределения является оценкой теоретической функции распределения (рис 3).
F
*
1
1
x
2
x
3
x
4
x
m
x x
Рис 8.3. Эмпирическая функция распределения.
В качестве числовых характеристик выборки используются:
1. Выборочное среднее:
1 1
n
i
i
m
x
n
=
=
∑
2. Выборочная дисперсия
(
)
2 1
1
n
i
i
D
x
m
n
=
=
−
∑
ρ
3
ρ
2
ρ
3
ω
1
ρ
0
x
1
x
2
x
3
x
m
x
x
104 3. Несмещенная выборочная дисперсия
(
)
2 2
1 1
1
n
i
i
s
x
m
n
=
=
−
−
∑
4. Коэффициент асимметрии
3 3
1
/ 2 1
(
)
1
( )
N
i
i
A
D
x
m
N
=
=
−
−
∑
5. Коэффициент эксцесса
4 2
1 1
(
)
3 1
N
i
i
E
D
x
m
N
=
−
−
=
−
∑
6. Выборочные начальные и центральные моменты
1 1
n
k
k
i
m
x
n
=
=
∑
,
(
)
1 1
n
k
k
i
x
m
n
µ
=
=
−
∑
Выборочные характеристики являются приближенными значениями соответствующих числовых характеристик случайной величины
ξ
8.2. Практическое задание
1. Задан закон распределения
F
дискретной случайной величины (приложение
1). Требуется: a) Сгенерировать средствами пакета Mathcad выборку из 100 значений случайной величины с законом
F
b) Представить выборку в виде вариационного ряда. c) Построить статистический ряд абсолютных частот, относительных частот и накопленных частот. d) Построить полигон частот и сравнить его с многоугольником теоретического распределения F. e) Найти основные выборочные характеристики –
m
,
2
s
,
A
,
E
и сравнить их с математическим ожиданием, дисперсией коэффициентом асимметрии и коэффициентом эксцесса теоретического распределения
F
2. Задан закон распределения
F
непрерывной случайной величины (приложение
1). Требуется: a) Сгенерировать средствами пакета Mathcad выборку из 100 значений случайной величины с законом
F
b) Представить выборку в виде вариационного ряда. c) Построить сгруппированный статистический ряд абсолютных частот, относительных частот и плотностей частот.
105
d) Построить гистограмму и сравнить ее с графиком плотности теоретического распределения
F
. Для корректного сопоставления гистограммы с графиком плотности теоретического распределения, следует помнить, что EXCEL при одновременном отображении графика и гистограммы, помещает точки графика в середину столбца гистограммы. Следовательно, значения плотности должны быть подсчитаны для середин столбцов гистограммы. e) Построить график эмпирической функцию распределения и сравнить с графиком теоретического распределения F (для построения графиков использовать не менее 40 точек). f) Найти основные выборочные характеристики –
m
,
2
s
,
A
,
E
и сравнить их с математическим ожиданием, дисперсией коэффициентом асимметрии и коэффициентом эксцесса теоретического распределения
F
8.3. Варианты заданий по лабораторной работе №8
Вариант 1.
1).
F
- биномиальное распределение с параметрами
20
=
n
и
7
,
0
=
p
2).
F
- распределение
2
χ
с одной степенью свободы.
Вариант 2.
1).
F
- биномиальное распределение с параметрами
100
=
n
и
15
,
0
=
p
2).
F
- закон равномерной плотности на (-2; 5).
Вариант 3.
1)
F
- биномиальное распределение с
50
=
n
и
42
,
0
=
p
2)
F
- нормальный закон с параметром
1;
1
m
σ
=
=
Вариант 4.
1).
F
- закон Пуассона с параметром
8
=
λ
2).
F
- распределение
2
χ
с 2 степенями свободы.
Вариант 5..
1).
F
- биномиальное распределение с параметрами
80
=
n
и
2
,
0
=
p
106 2).
F
- распределение Стьюдента с 3 степенями свободы.
Вариант 6.
1).
F
- закон Пуассона с параметром
12
=
λ
2).
F
- показательное распределение Коши с параметром
2
λ
=
Вариант 7.
1).
F
- биномиальное распределение с параметрами
30
=
n
и
6
,
0
=
p
2).
F
- нормальный закон с параметрами
0
=
a
и
3
=
σ
Вариант 8.
1).
F
- закон Пуассона с параметром
12
=
λ
2).
F
- нормальный закон с параметрами
2
−
=
a
и
3
=
σ
Вариант 9.
1).
F
- закон Пуассона с параметром
10
=
λ
2).
F
- показательный закон с параметром
1
,
0
=
λ
Вариант 10.
1).
F
- биномиальное распределение с параметрами
50
=
n
и
3
,
0
=
p
2).
F
- распределение
2
χ
с одной степенью свободы.
107
9. Лабораторная работа №9. Метод статистических
испытаний Монте-Карло
Цель работы:
Ознакомиться с методом Монте-Карло и научиться вычислять площадь заданной фигуры и объём тела этим методом.
9.1. Метод Монте-Карло
В последнее время область приложений метода численного моделирования или метода Монте-Карло существенно расширилась в связи с бурным развитием вычислительной техники. Особо следует отметить значительный прогресс, связанный с увеличением быстродействия вычислительных машин, что особенно важно при использовании метода Монте-Карло.
Определение. Методом Монте-Карло (ММК) называется численный метод решения математических задач при помощи моделирования случайных величин.
Необходимо отметить, что ММК используется для решения любых математических задач, а не только задач вероятностного происхождения.
Название «Монте-Карло» произошло от города Монте-Карло, известного своими казино, т. к. простейшим прибором для генерирования случайных чисел служит игральная рулетка. Возникновение метода Монте-Карло связывают с именами Дж.
Неймана, С. Улама, Н. Метрополиса, Г. Канна и Э. Ферми, которые в 40-х годах работали в Лос-Аламосе. Официальной датой рождения ММК считают 1949 год, когда появилась статья под заглавием «Метод Монте-Карло» (Metropolis N., Ulam
S.M. The Monte Carlo method. J. Amer. Statist. Assoc.,1949, 44, №247. P. 335−341).
Построение алгоритмов
ММК основано на сведении задач к расчету математических ожиданий. Это означает, что для вычисления скалярной величины
Α
нужно придумать такую случайную величину
ξ
, для которой ее математическое ожидание
( )
M
A
ξ
=
. Тогда, получив в численном эксперименте
N
независимых значений
1 2
,
,...,
,
N
ξ ξ
ξ
можно найти, что
1 2
1
(
)
N
A
N
ξ ξ
ξ
≈
+
+ ⋅⋅⋅ +
(9.1)
Пример.
Требуется оценить объем
G
V
некоторой ограниченной пространственной фигуры
G
, показанной на рис. 1.1
108
Возьмем прямоугольный параллелепипед
Π
, содержащий область
G
. Объем параллелепипеда П известен и равен
c
b
a
V
×
×
=
Π
. Разыграем координаты
N
случайных точек, равномерно распределенных в области
Π
, и обозначим через
G
N
количество точек, попавших в область G. При большом
N
будет приближенно выполняться соотношение
Π
≈
V
V
N
N
G
G
/
/
, из которого найдем
(
)
N
N
V
V
G
G
/
Π
≈
(9.2)
В нашем примере случайная величина
,
,
0,
,
V
G
G
ξ
ξ
ξ
Π
∈
=
∉
а среднее арифметическое равно
1 1
(
/
)
G
N
i
G
i
V
N
N
N
ξ
Π
=
=
∑
(9.3)
При решении задач ММК необходимо генерировать случайные величины
ξ
, равномерно распределенные в интервале [0; 1].
9.2. Оценка точности результатов, полученных методом
Монте-Карло
Оценка точности результатов, полученных методом Монте-Карло, основана на центральной предельной теореме теории вероятностей, из которой следует, что при большом объеме выборки
N
относительная частота события
A
сходится по вероятности к вероятности события
A
p , а среднее арифметическое выборочных данных сходится по вероятности к их математическому ожиданию. Используя
ММК, можно провести большое число независимых опытов и с заданной точностью найти оценки искомых величин. При расчетах ММК возникает вопрос оценки точности полученных результатов. Ответ на этот вопрос можно получить на основе центральной предельной теоремы, из которой следует, что при
Рис. 9.1
109
большом объеме выборки плотность вероятности выборочного среднего приближается к нормальному распределению.
Пусть производится большое число
N
независимых опытов, в каждом из которых событие
A
появляется с вероятностью
A
p
. Введем СВ
1,
если A,
0,
если A,
X
=
Оценка вероятности
A
p
события
A
определяется формулой
1
N
i
i
A
A
x
N
p
N
N
=
=
=
∑
,
(9.4) где
A
N
−
число опытов, в которых появилось событие
A
. Отношение
N
N
A
/
определяет относительную частоту события
A
. Распределение
A
p
при большом значении
N
близко к нормальному с математическим ожиданием
1
(
)
A
A
m p
p
=
и среднеквадратическим отклонением
(1
)
(
)
A
A
A
p
p
p
N
−
σ
=
(9.5)
Если СВ
X
является непрерывной, то оценка математического ожидания имеет вид
1
N
i
i
x
x
m
N
=
=
∑
,
(9.6) где
{ }
i
x
−
выборочные данные. Оценка (1.8) при большом значении
N
является приближенно нормальной СВ со средним
[ ]
x
M m
M X
=
и среднеквадратическим отклонением
(
)
x
x
m
N
σ
= σ
Рассмотрим два примера по определению точности результатов расчетов, полученных ММК.
110
Пример 1. Проведено
N независимых опытов, в каждом из которых событие
Aпоявляется с некоторой неизвестной нам вероятностью
p. В результате этих опытов получена оценка
Apˆ по формуле (3.4). Найти вероятность
(
)
AAP pp−
< ε
того, что
Apˆ отличается от вероятности
Ap не больше чем на заданную величину
0
>
ε
. Так как оценка
Ap – при большом
N нормальная СВ с математическим ожиданием
Ap и среднеквадратическим отклонением (3.5), то искомая вероятность равна
(
)
2
(1
)
AAAANP pppp
−
<
= Φ
−
ε
ε
(9.7)
Здесь
∫
−
=
Φ
xtdtex0 2
2 2
1
)
(
π
(9.8)
−
функция Лапласа. Как пользоваться формулой (3.7), если вероятность
Ap нам неизвестна и мы ее находим? В выражение (3.7)
Ap нужно заменить на
ApЗадавая достаточно большую величину вероятности, например, равную 0,95,
0,98, можно найти необходимое значение
N для достижения заданной точности.