X от значения случайной величины Y характеризуется функцией g(y) = M(X|y).
Условное математическое ожидание, как обычное (безусловное) математическое ожидание, ха- рактеризует центр рассеивания случайной величины. Однако оно не дает никакой информации о степени рассеивания случайной величины относительно среднего значения.
Поскольку степень рассеивания случайной величины X можно оценить с помощью дисперсии,
то в качестве меры рассеивания случайной величины X относительно Y можно принять условную
дисперсию, которую естественно определить аналогично обычной дисперсии, но используя условное распределение случайной величины X при условии Y = y.
Определение 11.7 Условной дисперсией D(X|Y ) случайной величины X относительно (слу- чайной величины) Y называют случайную величину, задаваемую формулой
D(X|Y ) = M
¡£
X − M(X|Y )
¤
2
|Y
¢
.
Приведенное определение применимо как для двумерной дискретной случайной величины, так и для непрерывной.
Для двумерной дискретной случайной величины (X; Y ) значение D(X|y
j
) условной диспер-
сии X при условии Y = y
j
определяется формулой
D(X|y
j
) = M
¡
[X−M(X|y
j
)]
2
¯
¯Y
¢
=
n
X
i=1
£
x
i
−M(X|y
j
)
¤
2
π
ij
,
а для двумерной непрерывной случайной величины (X; Y ) значение D(X|y) условной дисперсии
X при условии Y = y задается формулой
D(X|y) = M
¡
[X−M(X|y)]
2
¯
¯y
¢
=
+∞
Z
−∞
£
x−M(X|y)
¤
2
p
X
(x|y) dx.
Условная дисперсия случайной величины X так же, как и условное математическое ожидание этой случайной величины, зависит от того значения, которое приняла случайная величина Y . Поэто- му условная дисперсия D(X|Y ) является функцией от случайной величины Y , область определения которой совпадает с множеством возможных значений случайной величины Y .
54
Лекция 12
Многомерное нормальное распределение
Нормальное распределение одномерной случайной величины рассматривалось в лекции 7. Сейчас обратимся к многомерному случаю. При этом сначала введем двумерное нормальное распределение
случайного вектора
X = (X
1
; X
2
), а затем обобщим полученные результаты на случайный вектор
X произвольной размерности n > 2.
Пусть координаты X
1
и X
2
случайного вектора
X = (X
1
; X
2
) являются случайными величинами,
распределенными по нормальному закону, т.е. имеют плотности распределения
p
X
1
(x) = ϕ
m
1
,σ
1
(x) =
1
√
2πσ
1
exp
µ
−
(x − m
1
)
2 2σ
2 1
¶
и p
X
2
(x) = ϕ
m
2
,σ
2
(x) =
1
√
2πσ
2
exp
µ
−
(x − m
2
)
2 2σ
2 2
¶
Напомним, что параметры m
i
и σ
i
> 0, i = 1, 2, этих распределений называют математическими
ожиданиями и средними квадратическими отклонениями случайных величин X
1
и X
2
Если X
1
и X
2
являются независимыми случайными величинами, то, согласно теореме 8.3,
p
X
1
,X
2
(x
1
, x
2
) = p
X
1
(x
1
)p
X
2
(x
2
)
и в этом случае плотность двумерного нормального распределения имеет вид
p
X
1
,X
2
(x
1
, x
2
) =
1
(
√
2π)
2
σ
1
σ
2
exp
µ
−
(x
1
− m
1
)
2 2σ
2 1
−
(x
2
− m
2
)
2 2σ
2 2
¶
.
В общем случае вектор
X = (X
1
; X
2
) имеет (невырожденное) двумерное нормальное рас-
пределение, если его плотность распределения определяется формулой
p
X
1
,X
2
(x
1
, x
2
) =
1
(
√
2π)
2
σ
1
σ
2
p
1 − ρ
2
e
−
1 2
Q(x
1
−m
1
, x
2
−m
2
)
,
(12.1)
где функция двух переменных
Q(y
1
, y
2
) =
1 1 − ρ
2
µ
y
2 1
σ
2 1
−
2ρy
1
y
2
σ
1
σ
2
+
y
2 2
σ
2 2
¶
,
(12.2)
y
i
= x
i
− m
i
, i = 1, 2, есть положительно определенная квадратичная форма (т.е. Q(y
1
, y
2
) > 0 для любых (y
1
; y
2
) ∈ R, (y
1
; y
2
) 6= (0; 0)).
Двумерное нормальное распределение зависит от пяти параметров: m
1
, m
2
, σ
1
, σ
2
, ρ. Можно показать, что m
1
= MX
1
, m
2
= MX
2
, σ
2 1
= DX
1
, σ
2 2
= DX
2
, ρ — коэффициент корреляции случайных величин X
1
и X
2
Последние три параметра запишем для дальнейшего обобщения на случай n > 2 в виде мат-
рицы ковариаций (ковариационной матрицы) Σ вектора
X = (X
1
; X
2
):
Σ =
µ
σ
11
σ
12
σ
21
σ
22
¶
,
где σ
ii
= σ
2
i
, i = 1, 2, а σ
12
= σ
21
= ρσ
1
σ
2
.
Если ввести матрицу e
Σ, обратную матрице Σ, т.е.
e
Σ = Σ
−1
и вектор
y = (y
1
, y
2
),
55
то квадратичную форму (12.2) можно записать в матричной форме в виде
Q(y) = y e
Σy
T
,
(12.3)
где знак “T ” означает транспонирование. Действительно, если учитывать, что e
Σ =
1 1 − ρ
2
1
σ
2 1
−
ρ
σ
1
σ
2
−
ρ
σ
1
σ
2 1
σ
2 2
,
то, подставляя e
Σ в (12.3), приходим к выражению (12.2).
Далее, если заметить, что множитель
σ
1
σ
2
p
1 − ρ
2
=
p det Σ,
где det Σ — определитель матрицы Σ, то выражение (12.1) можно записать в виде
p
X
(x) =
1
(
√
2π)
2
(det Σ)
1 2
e
−
1 2
(
x−
m)e
Σ(
x−
m)
T
.
(12.4)
Теперь можно записать плотность (невырожденного) нормального распределения для случай-
ного вектора
X = (X
1
; . . . ; X
n
) произвольной размерности n > 2.
Определение 12.1 Случайный вектор
X = (X
1
; . . . ; X
n
) назовем случайным вектором, имеющим нормальное распределение с вектором математических ожиданий
m = (m
1
; . . . ; m
n
) и ковариацион- ной матрицей Σ = (σ
i j
), i, j = 1, n, если его плотность имеет вид
p
X
(x) =
1
(
√
2π)
n
(det Σ)
1 2
e
−
1 2
(
x−
m)e
Σ(
x−
m)
T
,
где e
Σ — матрица, обратная к матрице Σ.
Если матрица Σ (а значит, и матрица e
Σ = Σ
−1
) совпадает с единичной матрицей I, а вектор
m = (0; . . . ; 0), то
p
X
1
,...,X
n
(x
1
, . . . , x
n
) =
1
(
√
2π)
n
e
−
1 2
(x
2 1
+...+x
2
n
)
.
Такую плотность по аналогии с одномерным случаем называют плотностью стандартного
многомерного (n-мерного) нормального распределения.
Дадим геометрическую интерпретацию плотности нормального распределения.
Начнем с двумерного случая. При этом (X
1
, X
2
) будем трактовать как координаты брошенной случайным образом на плоскость точки.
Функция p
X
1
,X
2
(x
1
, x
2
) задает некоторую поверхность в трехмерном пространстве. Линии уровня этой поверхности имеют уравнение p
X
1
,X
2
(x
1
, x
2
) = a , которое с учетом (12.1) можно записать в виде
Q(x
1
− m
1
, x
2
− m
2
) = b,
(12.5)
где b = −2 ln{2πa(det Σ)
1 2
}, а Q(x
1
− m
1
, x
2
− m
2
) определяет- ся формулой (12.2).
Последнее уравнение (см. рис. 12.1) представляет собой уравнение эллипса (точнее говоря, семейства эллипсов при разных значениях b). Оси симметрии O
0
x
1
и O
0
x
2
этого эл- липса проходят через точку O
0
(m
1
; m
2
), а их направления совпадают с направлениями собственных векторов матрицы e
Σ. В свою очередь, собственные векторы e
i
, i = 1, 2, матрицы e
Σ определяются из уравнений
e
i
e
Σ = λ
i
e
i
где λ
i
— собствен- ные значения матрицы e
Σ, т.е. решения характеристического
Рис. 12.1.
уравнения det(e
Σ − λI) = 0 ,
или
λ
2
σ
2 1
σ
2 2
(1 − ρ
2
) − λ(σ
2 1
+ σ
2 2
) + 1 = 0.
Углы α
i
, i = 1, 2, между осями симметрии эллипса и осью Ox
1
можно найти из уравнения tg 2α =
2ρσ
1
σ
2
σ
2 1
− σ
2 2
.
(12.6)
56
Это уравнение дает два значения углов:
α1
и
α2
различающиеся на
π2
Оси симметрии эллипса (12.5) называют
осями рассеивания, сам эллипс —
эллипсом рассе-ивания (или
эллипсом равной вероятности), а центр эллипса — точку
O0(
m1
;
m2
) —
центромрассеивания.
Из формулы (12.6), в частности, следует, что при
ρ = 0,
σ1
6=
σ2
оси рассеивания параллельны координатным, при
σ1
=
σ2
=
σ эллипс рассеивания представляет собой окружность радиуса
σ и в качестве осей рассеивания можно взять любые две перпендикулярные прямые, проходящие через точку
O0Вводя новую (прямоугольную) систему координат, оси которой совпадают с осями рассеивания,
т.е. каноническую систему координат для эллипса рассеивания, можно показать, что в этой систе- ме координаты (
X01
;
X02
) случайной точки имеют нормальное распределение с нулевым вектором средних значений
m0= (0; 0) и матрицей ковариаций Σ
0=
µ
σ02 1
0 0
σ02 2
¶
, где
σ01
=
1
√λ1
,
σ02
=
1
√λ2
Если изменить масштабы на осях канонической системы координат, взяв за единицы отсчета
σ01
и
σ02
соответственно, то в такой системе координат координаты случайной точки будут иметь нормальное распределение с нулевым
вектором средних и единичной матрицей ковариаций, т.е.
иметь двумерное стандартное нормальное распределение.
Аналогично в случае
n > 2 уравнение
pX(
x) =
a или эквивалентное ему уравнение
(
x − m)e
Σ(
x − m)
T=
b,b =
−2 ln
{(
√2
π)
na(det Σ)
1 2
}в силу положительной определенности матрицы Σ представляет собой уравнение
n-мерного эл- липсоида, называемого
эллипсоидом рассеивания, его оси симметрии по-прежнему называются
осями рассеивания.
Будем трактовать
n-мерный случайный вектор
X как координаты случайной точки в
n-мерном пространстве. Пусть
x01
, . . . , x0n— каноническая система координат эллипсоидов рассеивания, тогда новые координаты (
X01
, . . . , X0n) случайной точки снова будут описываться
n-мерным нормальным законом, имеющим нулевой вектор средних
m0и диагональную матрицу ковариаций Σ
0, причем ее диагональные элементы
σ02
i= 1
/λi, где
λi,
i = 1
, n, — собственные значения матрицы e
Σ с учетом их кратностей. Еще раз вводя новые координаты
yi=
σ0ix0i(т.е изменяя масштабы на осях канонической системы координат), получаем, что в последней системе координат
y1
, . . . , ynкоординаты случайной точки будут распределены по стандартному нормальному закону.
Таким образом, делая обратные преобразования, можно трактовать (невырожденный) нормаль- но распределенный вектор
X с произвольным вектором средних
m и матрицей ковариаций Σ как ко- ординаты случайной точки в некоторой (вообще говоря, не ортонормированной, но ортогональной)
прямолинейной системе координат, причем эта точка имеет стандартное нормальное распределение.
Рассмотрим основные свойства многомерного нормального распределения.
1.
Закон распределения каждой из координат случайного вектора
X, имеющего
n-мерное нор- мальное распределение с вектором средних
m = (
m1
;
. . . ;
mn) и матрицей ковариаций Σ =
σij, явля- ется нормальным с параметрами
miи
σiДоказательство. Докажем это утверждение для случая
n = 2 (общий случай требует более гро- моздких преобразований).
Найдем плотность распределения
pX1
(
x1
), если
pX1
,X2
(
x1
, x2
) определяется формулами (12.1) и
(12.2). Воспользовавшись свойством 7 двумерной плотности распределения, имеем
pX1
(
x1
) =
+
∞Z
−∞1 2
πσ1
σ2
p
1
− ρ2
e− e
Q(
x1
, x2
)
dx2
,где e
Q(
x1
, x2
) =
−1 2(1
− ρ2
)
·³
x1
− m1
σ1
´
2
− 2
ρ³
x1
− m1
σ1
´ ³
x2
− m2
σ2
´
+
³
x2
− m2
σ2
´
2
¸
.Делая замену
y =
x2
−m2
σ2
−ρ(
x1
−m1
)
σ1
p
1
− ρ2
,после преобразований получаем
pX1
(
x1
) =
+
∞Z
−∞1 2
πσ1
e−y2 2
−(
x1
−m1)
2 2
σ2 1
dy.Поскольку
+
∞Z
−∞e−y2
/2
dy =
√2
π,57
приходим к окончательному ответу
pX1
(
x1
) =
1
√2
πσ1
e−(
x1
−m1
)
2
/2
σ2 1
,что и доказывает требуемое утверждение.
Аналогично можно показать, что
pX2
(
x2
) =
1
√2
πσ2
e−(
x2
− m2
)
2 2
σ2 2
.2. Если ковариационная матрица Σ случайного вектора
X, распределенного по нормальному закону (невырожденному), является диагональной, то координаты вектора