Указание. Для того чтобы определить точность коэффициента асимметрии, выделенное выражение для него щелкните в строке
Floating Point в меню Symbolics и укажите в окне диалога число десятичных знаков в выводе.
Эксцесс
Нормальное распределение наиболее часто используется в теории вероятностей и математической статистке, и поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие сравниваемого распределения от нормального, является эксцесс.
Эксцесс случайной величины определяется равенством
3
)
D
(
2 4
По известным нам свойствам математического ожидания и определению центрального момента получим формулу для
4
54 3
6 4
4 1
2 1
2 1
3 4
4
У нормального распределения, естественно,
0
. Если
0
, то это означает, что график плотности вероятностей p(x) сильнее
«заострен», чем у нормального распределения, если же
0
, то
«заостренность» графика p(x) меньше, чем у нормального распределения.
Порядок выполнения работы
Задание 1.
Постройте с помощью
MathCAD график функции распределения для случайной величины:
Х
1 0
7 4
-2
Р
0.1 0.5 0.1 0.1 0.2
Порядок выполнения задания
1.
Задайте случайную величину А в виде матрицы.
2.
Определите функцию распределения случайной величины
F(x).
3.
Определите функцию распределения G(x) той же случайной величины с использованием конкретных значений переменных.
4.
Постройте графики функций распределений F(x) и G(x).
Отредактируйте и сравните графики.
В отчете представить два графика F(x) и G(x), сделать выводы о их сходстве и объясните, почему так произошло.
Задание 2.
Порядок выполнения задания
1.
Задайте случайные величины, имеющие биномиальное распределение. Параметры распределения задайте самостоятельно.
Постройте графики распределения и функции распределения случайной величины. (Подберите удобные параметры отображения графиков). Удобно строить оба графика в одной системе координат.
55 2.
Проверьте для них
n
0
k k
1
p
3.
Вычислите вероятность попадания значений случайной величины в выбранный интервал.
4.
Найдите значение k, для которого величина
)
k
(
P
максимальна (медиану). Исследуйте (понаблюдайте) зависимость этой вероятности от параметров распределения.
Указание. Для того, чтобы определить по графику распределения
наиболее вероятное значение случайной величины, щелкните в меню Format (Формат) в пункте Graph (График) по строке Trace (Следование), установите перекрестье маркера на точке максимума распределения и выведите в рабочий документ вероятность значения, указанного в окне X-Value (Величина X).
5.
Измените значения параметров распределения и повторите вычисления. Сравните полученные результаты. Выводы привести в отчете.
Повторить п. 1-5 для других распределений (геометрическое и пуассоновское).
В отчете представьте по одному варианту для каждого распределения: параметры распределения, графики вероятности и функции распределения, значение наиболее вероятного значения СВ и значение вероятности попадания СВ в указанный диапазон. В отчет вставлять фрагменты из MathCAD.
Задание 3. Порядок выполнения задания 1.
Введите параметры равномерного распределения.
(Можно использовать любые).
2.
Определите плотность вероятности и функцию распределения случайной величины.
3.
Постройте графики.
4.
Поэкспериментируйте с параметрами различных распределений.
5.
Сделайте выводы о зависимости выходных данных от входных параметров.
56
Повторить п.
1-5 для других распределений
(экспоненциального, нормального распределения и распределения
Стьюдента).
В отчете представьте по одному варианту для каждого распределения: параметры распределения, графики вероятности и функции распределения и выводы о зависимости выходных данных от входных параметров. В отчет вставлять фрагменты из MathCad.
Задание 4. Порядок выполнения задания 1.
Вычислите математическое ожидание и дисперсии для случайных величин, имеющих дискретные распределения
(биномиальные, геометрические и пуассоновские распределения). В качестве исходных параметров возьмите: n=10 – число испытаний; p=0.1*h – вероятность наступления события; k
4
- параметр пуассоновского распределения;
N=1000 – число испытаний стремится к
; k –
номер варианта студента по журналу;
2.
Сверите полученные значения со справочными данными.
В отчете привести все расчетные формулы и результаты сравнения для каждого распределения в виде фрагментов из
MathCad.
Задание 5. Порядок выполнения задания 1.
Вычислите математические ожидания и дисперсии для случайных величин, имеющих непрерывные распределения
(равномерное, экспоненциальное, нормальное, распределение
Стьюдента). В качестве исходных параметров возьмите (при желании можно использовать любые другие) следующие параметры: a=1*h, b=3*h, n=5,
=0.1*h,
=0.05*h – необходимые параметры распределений; h – порядковый номер студента по журналу.
2.
Сверите полученные значения со справочными данными.
57
В отчете привести все расчетные формулы и результаты для каждого распределения в виде фрагментов из MathCad.
Задание 6 (Дополнительное).
Вычислите коэффициент асимметрии случайной величины X с равномерным распределением (или любого другого).
Порядок выполнения задания
1.
Определите значения параметров распределения случайной величины.
2.
Вычислите коэффициент асимметрии.
3.
Сверьте полученное значение со справочными данными для данного распределения.
4.
Постройте график плотности вероятности.
5.
Сделайте выводы, опираясь на значение коэффициента асимметрии и форму распределения.
Задание 7. (Дополнительное)
Вычислите эксцесс случайной величины с равномерным распределением (или любым другим).
Порядок выполнения задания
1.
Определите значения параметров распределения случайной величины.
2.
Вычислите коэффициент асимметрии.
3.
Сверьте полученное значение со справочными данными для данного распределения.
4.
Постройте график плотности вероятности.
5.
Сделайте выводы, опираясь на значение коэффициента асимметрии и форму распределения.
Справочный материал приведен ниже.
58
Рисунок 5.2 – Законы распределения случайных величин
59
Рисунок 5.3 – Законы распределения случайных величин
60
4 семестр
Лабораторная работа №1. Интервальное оценивание
1.1 Понятие доверительного интервала
Пусть имеется выборка
n
1
X
,
,
X
X
из распределения F
θ
с неизвестным параметром
R
. Задача интервального оценивания заключается в том, чтобы найти интервал, который накрывает оцениваемый параметр с заданной наперед вероятностью.
Интервал
,
называется доверительным интервалом для параметра
уровня доверия
1
, если для любого
1
(1.1)
Если в соотношении (1.1) вероятность в точности равна
1
(или стремится к
1
), то интервал называют точным (или асимптотически точным) доверительным интервалом уровня доверия
1
1.2 Построение точных доверительных интервалов для
параметров нормального распределения
Пусть
n
1
X
,
,
X
X
- выборка объема n из нормального распределения
2
,
a
N
Рассмотрим возможные задачи интервального оценивания:
1.
Пусть известно
2
, а
R
a
- неизвестный параметр.
Требуется построить точный доверительный интервал для параметра а.
1
n a
n
2
/
1 2
/
1
,
a
2
,
(1.2)
61 где
2
/
1
- квантиль уровня
2
/
1
стандартного нормального распределения (см. Приложение Б, таблица 1).
2.
Пусть известен параметр a , требуется построить доверительный интервал для
2
.
1
g s
n g
s n
1 2
1 2
2 2
1
,
a
2
,
(1.3) где
2 1
s
- выборочная дисперсия,
1
g и
2
g - квантили распределения "хи- квадрат" с n степенями свободы (
2
n
,
) уровня
2
/
a
и
2
/
1
a
соответственно (см. Приложение Б, таблица 3).
3.
Доверительный интервал для
2
при неизвестном a :
1
g s
1
n g
s
1
n
1 2
0 2
2 2
0
,
a
2
,
(1.4) где
2 0
s
- несмещенная выборочная дисперсия.
4.
Доверительный интервал для a при неизвестном
2
:
1
n s
t a
n s
t
0 1
n
,
2
/
1 0
1
n
,
2
/
1
,
a
2
, (1.5) где
1
n
,
2
/
1
t
- квантиль распределения Стьюдента с
1
n
степенью свободы уровня
2
/
1
(см. Приложение Б, таблица 2).
Приведем пример построения доверительного интервала.
Пусть имеется выборка объема N из нормального распределения, для которого известен параметр
4 2
, а параметр а неизвестен. Требуется построить точный доверительный интервал для параметра а. На рисунке 1.1 приведен текст программы, реализующей метод построения доверительного интервала в среде
62
Mathcad.
Рисунок 1.1. Построение доверительного интервала для параметра aнормального распределения при известном
1.3 Задание к лабораторной работе
Даны две выборки одной случайной величины с нормальным распределением
2
,
a
N
объема
1
n и
2
n соответственно.
Для вариантов с нечетным номером:
1.
Для обеих выборок построить точный доверительный интервал уровня доверия
0
q для параметра a , считая: а)
неизвестным, б)
известным и равным
0
.
63 2. В одной системе координат построить графики зависимости длины доверительного интервала от уровня доверия q для всех четырех случаев (объем выборки равен
1
n , неизвестно; объем выборки равен
1
n , известно; объем выборки равен
2
n
, неизвестно; объем выборки равен
2
n , известно). При этом q придать минимум 50 разных значений через равные промежутки.
Проанализировать взаимное расположение полученных графиков и объяснить его.
Для вариантов с четным номером: 1.
Для обеих выборок построить точный доверительный интервал уровня доверия
0
q для параметра
2
, считая: а) a
неизвестным, б) a
известным и равным
0
a
2.
В одной системе координат построить графики зависимости длины доверительного интервала от уровня доверия q для всех четырех случаев (объем выборки равен
1
n , a
неизвестно; объем выборки равен
1
n , a
известно; объем выборки равен
2
n , a
неизвестно; объем выборки равен
2
n , a
известно). При этом q придать минимум 50 разных значений через равные промежутки.
Проанализировать взаимное расположение полученных графиков и объяснить его.
Указания: Выборки необходимо считать с двух текстовых файлов - "di-V.txt "di-V-1 .txt"(V - номер вашего варианта).
Для написания программы можно пользоваться следующими встроенными функциями: функцией length(x) для
определения объема выборки, функциями для нахождения значений квантилей распределений qnorm(р,а,а)
(возвращает значение квантиля нормального распределения
2
,
a
,
N
уровня р), qchisq(p,d) (возвращает значение квантиля распределения "хи-квадрат" c d степенями свободы уровня р), qt(p,d)(возвращает значение квантиля распределения Стьюдента с d степенями свободы уровня р). Остальные статистические функции должны быть запрограммированы.
Варианты заданий
1.
9
,
0
q
;
2 0
0
64 2.
8
,
0
q
;
0 0
0
3.
7
,
0
q
;
3 0
0
4.
5
,
0
q
;
2 0
0
5.
6
,
0
q
;
1 0
0
6.
9
,
0
q
;
3 0
0
7.
8
,
0
q
;
5
,
0 0
0
8.
8
,
0
q
;
1 0
0
9.
7
,
0
q
;
5
,
1 0
0
10.
8
,
0
q
;
5
,
0 0
0
11.
5
,
0
q
;
1 0
0
12.
6
,
0
q
;
5 0
0
13.
7
,
0
q
;
2
,
1 0
0
14.
8
,
0
q
;
4 0
0
15.
75
,
0
q
;
5
,
2 0
0
16.
6
,
0
q
;
10 0
0
17.
9
,
0
q
;
2
,
3 0
0
18.
75
,
0
q
;
0 0
0
19.
75
,
0
q
;
3 0
0
20.
5
,
0
q
;
3 0
0
65
Лабораторная работа №2. Проверка гипотезы о виде
распределения с помощью критерия согласия Смирнова
2.1 Статистическая гипотеза и статистический критерий.
Критерий согласия.
Пусть в результате некоторого эксперимента получена выборка
n
2
,
1
X
,
,
X
X
X
из некоторого распределения
F
Статистической гипотезой H называется любое утверждение о виде неизвестного распределения, или о параметрах известного распределения наблюдаемой в эксперименте случайной величины.
Гипотеза
H
называется простой, если она однозначно определяет распределение выборки:
1
F
F
H
, иначе
H
называют сложной,например,
F
F
H
, где
F - некоторое семейство распределений:
,
,
x
F
F
Если выдвигаются всего две гипотезы, то одну из них принято называть основной (
0
H
), а другую альтернативной
(конкурирующей) (
1
H ).
Правило, согласно которому проверяемая гипотеза
0
H
принимается или отвергается, называется статистическим критерием. Дадим формальное определение критерия.
Статистическим критерием для проверки гипотез k
1
H
,
,
H
называется любое измеримое отображение
k
1
n
H
,
,
H
R
:
Если i
H
)
(
, то мы принимаем гипотезу i
H (или считаем i
в параметрическом случае).
Качество критерия характеризуется набором вероятностей ошибочных решений.
Будем говорить, что произошла ошибка i-го рода, если гипотеза i
H
отвергнута, когда она верна. Вероятностью ошибки i-го рода критерия р называется
i
H
i
H
)
(
p q
i
Если удастся выбрать критерий p так, что все числа
p q
i
66 малы, то мы
будем объявлять, что верна гипотеза k
H
, если k
H
)
(
. При этом мы будем ошибаться примерно в доле случаев i
q
, если верна гипотеза i
H .
Уровнем значимости статистического критерия называют вероятность ошибочно отвергнуть основную проверяемую гипотезу, когда она верна (вероятность ошибки первого рода).
Рассмотрим случай, когда о распределении наблюдений X имеется две гипотезы:
1 0
F
F
H
при альтернативе
1 1
F
F
H
В этом случае любой критерий
1 0
n
H
,
H
R
:
X
принимает не более двух значений, то есть область n
R
делится на две части
S
\
R
S
R
n n
так, что
,
H
,
H
)
(
1 0
S
X
,
S
\
R
n
Область S, в которой принимается альтернативная гипотеза, называется критической областью критерия .
Обозначим q = q(
) - уровень значимости критерия
, тогда
S
H
P
H
q q
0 0
0
H
1
H
0
H
1
По своему смыслу критическая область должна строиться так, чтобы событие Х ∈ S было маловероятным. В конкретных задачах
выбирают обычно равной 0,1; 0,05; 0, 01 и так далее.
Критериями согласия называют критерии для проверки простой гипотезы H
0
при сложной альтернативе H
1
= {H
0
неверна}.
Критерии согласия принимают или отвергают основную гипотезу исходя из величины некоторой статистики T(Х), характеризующей отклонение эмпирических данных от соответствующих (гипотезе H
0
) гипотетических значений, распределение которой в случае справедливости H
0
можно было бы определить.
Предположим, такая статистика и ее распределение при гипотезе H
0
найдены. Пусть T - множество всевозможных значений
67 статистики T. Определим для фиксированного заранее достаточно малого числа α > 0 подмножество
T
, так чтобы вероятность осуществления события T (Х) ∈
в случае справедливости гипотезы H
0
удовлетворяла условию
0
|