Главная страница

лабораторные работы. Обработки данных


Скачать 1.26 Mb.
НазваниеОбработки данных
Анкорлабораторные работы.pdf
Дата03.09.2018
Размер1.26 Mb.
Формат файлаpdf
Имя файлалабораторные работы.pdf
ТипИсследование
#24001
страница4 из 8
1   2   3   4   5   6   7   8
4.2.2. Моделирование случайных чисел с многомерным распределени-
ем,
равным
произведению
одномерных
гамма-распределений
))
,
(
),...,
,
((
1 1
m
m
m
b
a
b
a
Γ
( )
,
0
,
0 0
,
0
,
0
,
)
(
1 1
1






>
>
>
Γ
=


=

i
i
i
i
b
x
a
i
a
i
i
m
i
x
a
b
x
e
x
b
a
x
f
i
i
i
i
ξ
4.2.3. Моделирование случайных чисел с многомерным распределени-
ем, равным произведению одномерных распределений Уишарта
))
,
(
),...,
,
((
2 2
1 1
m
m
m
k
k
W
σ
σ
При
2 2
i
i
b
σ
=
,
2
i
i
k
a
=
произведение гамма-распределений представляет собой произведение одномерных распределений Уишарта.
4.2.4. Моделирование случайных чисел с многомерным распределени-
ем, равным произведению одномерных распределений хи-квадрат
)
,...,
(
1
m
m
k
k
H
При
2
=
i
b
,
2
i
i
k
a
=
произведение гамма-распределений представляет собой произведение распределений хи-квадрат.

4.2.5. Моделирование случайных чисел с многомерным распределени-
ем, равным произведению одномерных экспоненциальных распределений
)
,...,
(
1
m
m
E
λ
λ
При
i
i
b
λ
=
,
1
=
i
a
произведение гамма-распределений представляет собой произведение экспоненциальных распределений.
4.2.6. Моделирование случайных чисел с многомерным равномерным
распределением в гиперпрямоугольнике
)
,
(
)
,
(
)
,
(
2 2
1 1
m
m
b
a
b
a
b
a
×
×
×
Λ
))
,
(
),...,
,
(
),
,
((
2 2
1 1
m
m
m
b
a
b
a
b
a
U
( )
⎪⎩



<
<
<

=

=
,
0
,
,
,
)
(
1 1
иначе
b
a
b
x
a
a
b
x
f
i
i
i
i
i
i
i
m
i
ξ
4.3. Средства Matlab для моделирования многомерных случайных чисел
В Matlab имеется программа для моделирования многомерных случайных чисел с нормальным распределением.
r=mvnrnd(mu,sigma,cases) возвращает матрицу случайных чисел, выбран- ных из многомерного нормального распределения с вектором средних mu и ко- вариационной матрицей sigma. Параметр cases является количеством строк в r
(количеством многомерных случайных чисел). Описание этой функций можно найти в справочной системе в разделе "Инструментарий статистики" (ката- лог \MATLAB\toolbox\stats\)
Для моделирования многомерных случайных чисел с распределениями, опи- санными в пп. 4.2.2 – 4.2.6, необходимо пользоваться программами моделиро- вания скалярных случайных чисел, приведенными в работе № 3.

4.4. Порядок выполнения работы
4.4.1.
Выполнить моделирование случайных чисел с указанными в пп. 4.2.1– 4.2.6 распределениями. Для каждого распределения при
2
=
m
вывес- ти диаграмму рассеивания, на которую нанести 100 случайных чисел, исполь- зуя собственную программу, реализующую предложенный алгоритм, и стан- дартную программу Matlab. Собственные программы оформить в виде m-файлов-функций. Диаграмма рассеивания – это рисунок, на который нанесе- ны смоделированные значения двухмерного случайного вектора.
4.4.2.
На диаграмму рассеивания двухмерного нормального закона вывести также функцию регрессии
)
(
,
x
x
y
y
x
y
a
x
r
a
y

+
=
σ
σ
Здесь
x
x
a
σ
,
– математическое ожидание и среднее квадратичное отклонение аргумента;
y
y
a
σ
,
– математическое ожидание и среднее квадратичное откло- нение функции;
y
x
r
,
– коэффициент корреляции между аргументом и функци- ей.
4.4.3.
Исследовать изменение диаграмм рассеивания в зависимости от пара- метров распределений.

ЛАБОРАТОРНАЯ РАБОТА № 5. ОЦЕНИВАНИЕ ЗАКОНОВ
РАСПРЕДЕЛЕНИЯ СКАЛЯРНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
5.1. Цель работы
5.1.1.
Изучение оценок законов распределения скалярных случайных вели- чин.
5.1.2.
Приобретение навыков получения оценок законов распределения ска- лярных случайных величин с помощью системы программирования Matlab.
5.2. Теоретические положения
5.2.1. Эмпирическая функция распределения
Пусть имеется выборка
n
x
x ,...,
1
из распределения
)
(x
F
ξ
. Простейший взгляд на нее состоит в том, что числа
n
x
x ,...,
1
считаются возможными значе- ниями некоторой дискретной случайной величины

ξ
,
причем вероятности этих значений одинаковы и равны
n
/
1
. Ряд распределения этой случайной ве- личины имеет вид табл. 5.1.
Таблица 5.1
Ряд распределения случайной величины

ξ
i
x
1
x
2
x
...
n
x
i
p
n
/
1
n
/
1
...
n
/
1
Эмпирической или выборочной функцией распределения
)
(x
F

ξ
называется функция распределения дискретной случайной величины

ξ
:
)
(
)
(
x
F
x
F

=

ξ
ξ
.

В соответствии с этим определением эмпирическая функция распределения задается формулой
n
m
x
F
=

)
(
ξ
, где m – количество выборочных значений, меньших x ; n – объем выборки.
Эмпирическую функцию распределения удобно строить с использованием порядковых статистик. В этом случае она определяется формулой





>

=

<

=
+

,
1
,
1
,
,
,
1
,
,
0
)
(
)
(
)
1
(
)
(
)
1
(
n
i
i
x
x
если
n
i
x
x
x
если
x
x
если
n
i
x
F
ξ
В этой формуле
)
(i
x
i
порядковая статистика,
n
i
,
1
=
Эмпирическая функция распределения
)
(x
F

ξ
представляет собой ступенча- тую функцию, поскольку это функция распределения дискретной случайной ве- личины (рис. 5.1).
Рис. 5.1. Эмпирическая функция распределения

Эмпирическая функция распределения является состоятельной оценкой ге- неральной (теоретической) функции распределения
)
(x
F
ξ
. Более того, согласно теореме Гливенко–Кантелли имеет место следующая сходимость почти навер- ное:
0
|
)
(
)
(
|
sup
.н
п
n
x
x
F
x
F





ξ
ξ
5.2.2. Гистограмма
Гистограмма – это фигура
)
(x
f

ξ
, контур которой является оценкой гене- ральной плотности вероятности
)
(x
f
ξ
. Гистограмма строится следующим об- разом. Весь интервал выборочных значений
]
,
[
)
(
)
1
(
n
x
x
делится на некоторое количество l непересекающихся интервалов длиной
i
,
l
i
,
1
=
, и подсчитыва- ется количество выборочных значений
i
m , попавших в
i
-й интервал. Если на каждом интервале как на основании построить прямоугольник высотой
i
i
i
n
m
h

=
, то мы получим фигуру, которая называется гистограммой. Вид гистограммы приведен на рис. 5.2. Гистограммаявляется состоятельной оценкой генераль- ной плотности вероятности при увеличении объема выборки n и числа интер- валов l , если только при этом стремится к нулю максимальная из длин интер- валов разбиения.
Существуют два способа построения гистрограммы.
1. Равноинтервальный способ. Выбирают количество интервалов l, а длину

каждого интервала определяют по формуле
l
x
x
n
)
1
(
)
(

=

. (5.1)

2. Равновероятный способ. Выбирают количество выборочных значений m , попавших в каждый интервал. Объем выборки должен быть кратен m . Тогда число интервалов
m
n
l
/
=
, и интервалы будут следующими:
]
,
[
)
(
)
1
(
m
x
x
,
]
,
[
)
2
(
)
(
m
m
x
x
, …,
]
,
[
)
(
)
)
1
((
lm
m
l
x
x

, где
)
(i
x i-я порядковая статистика. При этом способе интервалы имеют различную длину, и границы интервалов попадают на выборочные значения. Принято считать, что граничное значение делится по- ровну между двумя интервалами, то есть
2
/
1
значения попадает в левый ин- тервал и
2
/
1
– в правый. Понятно, что при этом в крайний левый интервал по- падает
2
/
1

m
значений, в крайний правый –
2
/
1
+
m
значений, а в средние интервалы – по m значений.
Рис. 5.2. Гистограмма

5.3. Средства Matlab для получения и исследования оценок законов
распределения скалярных случайных величин
Для моделирования выборок из различных распределений используются программы, описанные в лабораторной работе № 3. Для моделирования раз- личных плотностей вероятности и функций распределения используются про- граммы, описанные в лабораторной работе № 1. Опишем также программы для получения и отображения на экран оценок законов распределения.
5.3.1. Сортировка в Matlab
y=sort(x)
сортирует элементы вектора x в возрастающем порядке. Здесь x – исходный вектор, y – отсортированный вектор. В случае, когда x – матрица, функция y=sort(x) сортирует каждый столбец x в возрастающем порядке.
y=sort(x,d) сортирует матрицу x вдоль измерения d.
[y,i]=sort(x,d)
возвращает также индексную матрицу i. Если x – вектор, то элементы индексной матрицы указывают номера элементов вектора y в исход- ном векторе x (см. toolbox\matlab\datafun).
Программа сортировки используется для формирования вариационного ряда из имеющейся выборки.
5.3.2. Лестничные графики в Matlab
stairs(y)
строит лестничный (ступенчатый) график по значениям элементов вектора y.
stairs(x,y)
строит лестничный график по значениям элементов вектора y в точках скачков, определенных в x. Значения x должны располагаться в возрас- тающем порядке (см. toolbox\matlab\specgraph).

Функция stairs(x,y) используется для получения и графического отображе- ния эмпирической функции распределения. В этом случае x – вариационный ряд, а
,
/
)
(
n
i
i
y
=
n
i
,
1
=
5.3.3. Гистограммы в Matlab
n=hist(y)
распределяет элементы вектора y в 10 интервалов одинаковой дли- ны

(5.1) и возвращает количество элементов, попавшихв каждый интервал, в виде вектора n. Если y – матрица, то hist работает со столбцами.
n=hist(y,l),
где l – скаляр, использует l интервалов одинаковой длины (5.1).
n=hist(y,x)
, где x – вектор, возвращает количество элементов вектора y, по- павших в интервалы с центрами, заданными вектором x. Число интервалов в этом случае равно числу элементов вектора x.
[n,x]=hist(…)
возвращает числа попаданий в интервалы (в векторе n), а так- же положения центров интервалов (в векторе x).
hist(…)
строит гистограмму без возвращения параметров, то есть строит прямоугольники высотой
i
i
m
h
=
, где
i
m – число элементов, попавших в
i
-й интервал,
l
i
,
1
=
(см. toolbox\matlab\datafun).
Функция hist используется для получения и отображения гистограммы.
5.4. Порядок выполнения работы
5.4.1.
Получить (смоделировать) выборки из приведенных в п. 1.2.8 лабора- торной работы № 1 одномерных распределений. Для этого использовать про- граммы, описанные в п. 3.3.2.7 лабораторной работы № 3.
5.4.2.
Для каждого распределения вывести на экран в одно графическое окно гистограмму и генеральную плотность вероятности, а в другое графическое ок-
но – эмпирическую функцию распределения и генеральную функцию распре- деления. Для вывода генеральных плотностей вероятности и функций распре- деления использовать программы, описанные в п. 1.2.9 работы № 1.
Для согласования масштабов гистограммы и генеральной плотности вероят- ности необходимо генеральную плотность вероятности умножить на коэффи- циент
l
x
x
n
n
k
n
)
1
(
)
(

=

=
5.4.3.
Исследовать сходимость эмпирических распределений к генеральным при увеличении объема выборки n .

ЛАБОРАТОРНАЯ РАБОТА № 6. ПОЛУЧЕНИЕ ТОЧЕЧНЫХ ОЦЕНОК
ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ
6.1. Цель работы
6.1.1.
Изучение методов получения точечных оценок параметров распреде- лений.
6.1.2.
Приобретение навыков получения точечных оценок параметров рас- пределений в системе Matlab.
6.2. Теоретические положения
6.2.1. Методы нахождения точечных оценок параметров распределений
Задача точечного оценивания формулируется следующим образом.
Известна плотность вероятности генеральной совокупности с точностью до векторного параметра
)
,...,
(
1
m
θ
θ
θ
=
, что мы будем обозначать как
)
,
(
θ
ξ
x
f
Требуется по выборке
)
,...,
(
1
n
x
x
из этого распределения найти оценку
)
,...,
(
1
m
θ
θ
θ
)
)
)
=
параметра
θ
Изложим два метода решения этой задачи.
6.2.1.1.
Метод моментов
Этот метод заключается в следующем. Находим m начальных теоретиче- ских моментов
m
j
dx
x
f
x
E
j
j
j
,
1
,
)
,
(
)
(
=
=
=




θ
ξ
ν
ξ
Из формулы видно, что теоретические моменты являются функциями неизвест- ных параметров, то есть
)
,...,
(
1
m
j
j
θ
θ
ν
ν
=
. Далее находим m выборочных на- чальных моментов

m
j
x
n
n
i
j
i
j
,
1
,
1 1
=
=

=
ν
Приравнивая соответствующие теоретические и выборочные моменты, получа- ем систему m уравнений
m
j
j
m
j
,
1
,
)
,...,
(
1
=
=
ν
θ
θ
ν
Оценки
m
θ
θ
)
)
,...,
1
определяются как решение этой системы.
Достоинство метода – простота. Недостаток – неизвестно, являются ли по- лученные оценки достаточно хорошими. Этот вопрос придется решать отдель- но. Метод рекомендуется для получения оценок не более двух-трех параметров.
6.2.1.2.
Метод максимума правдоподобия
Этот метод использует понятие функции правдоподобия. Функцией правдо- подобия называется совместная плотность вероятности
)
,...,
(
1
n
x
x
f
выбороч- ных значений
n
x
x ,...,
1
, рассматриваемых как случайные величины. Функция правдоподобия зависит как от переменных
n
x
x ,...,
1
, так и от неизвестных па- раметров
m
θ
θ
,...,
1
. Обычно она обозначается зависящей только от неизвестных параметров в виде L(
m
θ
θ
,...,
1
). Для простого случайного выбора функция прав- доподобия рассчитывается по формуле

=
=
n
i
m
i
m
x
f
L
1 1
1
)
,...
,
(
)
,...,
(
θ
θ
θ
θ
ξ
, где
)
,...
,
(
1
m
i
x
f
θ
θ
ξ
– плотность вероятности генеральной совокупности, в кото- рую вместо аргумента x подставлено
i
x .
Метод максимума правдоподобия заключается в том, что оценки отыскива- ются из условия максимума функции правдоподобия:
m
m
L
θ
θ
θ
θ
,...,
1 1
max
)
,...,
(


Полученные таким образом оценки называются максимально правдоподобны- ми, или м.п.-оценками.
Часто решение задачи упрощается с помощью следующего приема. По- скольку любая функция и ее логарифм достигают экстремума на одних и тех же значениях аргументов, то можно максимизировать не функцию правдоподобия, а ее натуральный логарифм, то есть логарифмическую функцию правдоподо- бия:
m
m
L
θ
θ
θ
θ
,...,
1 1
max
)
,...,
(
ln

Чтобы найти м.п.-оценки, необходимо приравнять к нулю частные произ- водные функции правдоподобия или логарифмической функции правдоподобия и решить полученную систему уравнений:
m
j
L
m
j
,
1
,
0
)
,...,
(
1
=
=
θ
θ
∂θ

, (6.1) или
m
j
L
m
j
,
1
,
0
)
,...,
(
ln
1
=
=
θ
θ
∂θ

. (6.2)
Если учесть, что логарифмическая функция правдоподобия представляется в виде суммы

=
=
n
i
m
i
m
x
f
L
1 1
1
)
,...,
,
(
)
,...,
(
ln
θ
θ
θ
θ
ξ
, то последняя система преобразуется к виду
m
j
x
f
m
i
n
i
j
,
1
,
0
)
,...,
,
(
ln
1 1
=
=

=
θ
θ
∂θ

ξ
. (6.3)
Доказано, что м.п.-оценки являются состоятельными, асимптотически не- смещенными и асимптотически эффективными.
Пример. Найти оценки параметров a и
σ
2
нормальной генеральной сово- купности
)
,
(
2
σ
a
N

Решение. Нам известна плотность вероятности генеральной совокупности с точностью до двух параметров a ,
2
σ
:
2 2
2
)
(
2 2
2 1
)
,
,
(
σ
ξ
πσ
σ
a
x
e
a
x
f


=
Оценки по методу моментов получаем весьма просто. Теоретические момен- ты
a
E
=
=
)
(
1
ξ
ν
,
2 2
)
(
σ
ξ
µ
=
= D
. Приравнивая их к соответствующим выбо- рочным моментам, получим
x
x
n
a
n
i
i
=
=

=
1 1
)
,
2 2
1 2
)
(
1
s
x
x
n
n
i
i
=

=

=
σ
)
Воспользуемся теперь методом максимума правдоподобия. Будем максими- зировать логарифмическую функцию правдоподобия, для чего найдем
2 2
2 2
2
)
(
ln
2 1
)
2 1
ln(
)
,
,
(
ln
σ
σ
π
σ
ξ
a
x
a
x
f
i
i



=
Найдем частные производные по оцениваемым параметрам
2 2
)
,
,
(
(ln
σ
σ


ξ
a
x
a
x
f
a
i
i

=
,
4 2
2 2
2 2
)
(
2 1
)
,
,
(
ln
σ
σ
σ
∂σ

ξ
a
x
a
x
f
i
i

+

=
Для получения оценок необходимо решать систему уравнений (6.3), которая имеет вид







=


=



=
=
n
i
i
n
i
i
a
x
a
x
1 4
2 2
1 2
0 2
)
(
,
0
σ
σ
σ
Из первого уравнения находим


=
=
=
n
i
i
x
x
n
a
1 1
)
Подставляя
x
вместо a во второе уравнение, получим
2 1
2 2
)
(
1
s
x
x
n
n
i
i
=

=

=
σ
)
1   2   3   4   5   6   7   8


написать администратору сайта