Главная страница

лабораторные работы. Обработки данных


Скачать 1.26 Mb.
НазваниеОбработки данных
Анкорлабораторные работы.pdf
Дата03.09.2018
Размер1.26 Mb.
Формат файлаpdf
Имя файлалабораторные работы.pdf
ТипИсследование
#24001
страница5 из 8
1   2   3   4   5   6   7   8
6.3. Средства Matlab для получения точечных оценок параметров
распределений
normfit(x,alpha)
возвращает оценки параметров нормального распределения по выборке, размещенной в x.
[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)
возвращает оценки пара- метров нормального распределения и 100(1-alpha)-процентные доверительные интервалы. По умолчанию необязательный параметр alpha=0,05, что соответст- вует 95-процентным доверительным интервалам.
expfit(x)
возвращает максимально правдоподобную оценку параметра экс- поненциального распределения по данным в x.
[muhat, muci]=expfit(x,альфа)
дает максимально правдоподобную оценку и
100(1-alpha)-процентный интервал доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия.
gamfit(x)
возвращает максимально правдоподобные оценки параметров гам- ма-распределения по данным в x.
[phat,pci]=gamfit(x,alpha)
дает максимально правдоподобные оценки и
100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия.
unifit(x,alpha)
возвращает максимально правдоподобные оценки параметров равномерного распределения по данным в x.
[ahat,bhat,aci,bci]=unifit(x,alpha)
дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. alpha – необязательный пара-
метр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу доверия.
binofit(x,n)
возвращает максимально правдоподобную оценку вероятности успеха для биномиального распределения по данным в векторе x (x – число ус- пехов в n испытаниях).
[phat,pci]=binofit(x,n,alpha)
дает максимально правдоподобную оценку и
100(1-alpha)-процентный интервал доверия. alpha – необязательный параметр.
По умолчанию alpha=0,05, что соответствует 95-процентному интервалу дове- рия.
phat=mle('dist',data)
возвращает максимально правдоподобные оценки па- раметров распределения, определенного в dist, по данным в векторе data.
[phat,pci]=mle(dist,data,alpha,p1)
возвращает максимально правдоподобную оценку и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что соответствуюет 95-процентному интервалу доверия. p1 – до- полнительный параметр для использования с биномиальным распределением для задания количества испытаний.
function [x,options]=fmins(funfcn,x,options,grad,varargin)
минимизирует функцию многих переменных.
x=fmins('f',x0)
пытается возвратить вектор x, который является локальным минимумом функции f(x) около стартового вектора x0. 'f' – строка, содержащая имя функции, которая должна минимизироваться. f(x) должна быть скалярной функцией векторной переменной.
x=fmins('f',x0,options)
использует вектор управляющих параметров. Если
options(1)
является положительным, то отображаются промежуточные шаги решения. По умолчанию options(1)=0. options(2) является допуском завершения для x; по умолчанию опция равна 1.e-4. options(3) – допуск завершения для f(x); по умолчанию – 1.e-4. options(14) является максимальным количеством оценок функции; по умолчанию options(14) = 200*n, где n – длина x. Другие компонен- ты options функцией fmins не используются.

x=fmins('f',x0.options,[],p1,p2,...)
предусматривает дополнительные аргу- менты, которые передаются в минимизируемую функцию, f(x,p1,p2,...).
[x,options]=fmins(...)
возвращает количество оценок функции в options(10).
fmins
использует симплекс-метод (прямой поиск) Нелдера–Мида.
Пример. Пусть сформирована следующая m-файл-функция, содержащая ми- нимизируемую функцию: function y=funobj(x) y=(x(1)-1)^2+(x(2)-2)^2+(x(3)-1)^2; return
Минимизация этой функции может быть выполнена с помощью следующей программы: x=[0 0 0]; y = fmins('funobj',x) y =
1.0000 2.0000 1.0000
6.4. Порядок выполнения работы
6.4.1.
Для приведенных в п. 1.2.8 лабораторной работы № 1 распределений записать функции правдоподобия и получить м.п.-оценки параметров, оформив функции правдоподобия в виде m-файлов-функций и максимизировав их. Мак- симизация функции
)
(x
f
эквивалентна минимизации функции ))
(
(
x
f

6.4.2.
Оценки сравнить с оценками, полученными с помощью стандартных функций Matlab.

ЛАБОРАТОРНАЯ РАБОТА № 7. ПОЛУЧЕНИЕ ИНТЕРВАЛЬНЫХ
ОЦЕНОК ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ
7.1. Цель работы
7.1.1.
Изучение задачи получения интервальных оценок параметров распре- делений.
7.1.2.
Приобретение навыков получения интервальных оценок параметров распределений в системе Matlab.
7.2. Теоретические положения
Интервальные оценки параметров распределений
Доверительным интервалом для некоторого параметра
θ
называется интер- вал
)
,
(
в
н
θ
θ
, накрывающий параметр
θ
с доверительной вероятностью
γ
:
γ
θ
θ
θ
=
<
<
)
(
в
н
P
. (7.1)
Задачаполучения интервальной оценки параметра распределения заключа- ется в определении по выборке
)
,...,
,
(
2 1
n
x
x
x
нижней и верхней границ интер- вала
н
θ
,
в
θ
. Доверительная вероятность
γ выбирается близкой к 1 из набора чи- сел
}
975
,
0
;
95
,
0
;
9
,
0
{
Для придания задаче однозначности уравнение (7.1) представляют в виде двух уравнений



=
<
=
>
,
)
(
,
)
(
2 1
α
θ
θ
α
θ
θ
н
в
P
P
(7.2) где
γ
α
α

=
+
1 2
1
Доверительный интервал называется симметричным, если в (7.2)
2
/
)
1
(
2 1
γ
α
α
α

=
=
=
. Таким образом, симметричный доверительный интервал удовлетворяет следующей системе уравнений:




⎪⎪



=
<

=
>
2 1
)
(
,
2 1
)
(
γ
θ
θ
γ
θ
θ
н
в
P
P
(7.3)
Для построения симметричного доверительного интервала для неизвестного параметра
θ
обычно используется статистика, представляющая собой точеч- ную оценку
θ
)
этого параметра,или некоторая функция точечной оценки
)
(
θ
)
g
g
=
. Должен быть известен закон распределения этой статистики, то есть плотность вероятности
)
(x
f
g
. В силу того что параметр
θ
нам неизвестен, эта плотность вероятности будет зависеть от
θ
, то есть нам известна плотность ве- роятности статистики с точностью до параметра
)
,
(
θ
x
f
g
. Для построения до- верительного интервала для параметра
θ
строят «доверительный интервал» для статистики g , то есть находят
н
g ,
в
g из системы уравнений



⎪⎪



=
<

=
>
2 1
)
(
,
2 1
)
(
γ
γ
н
в
g
g
P
g
g
P
Решение этой системы уравнений относительно
в
н
g
g ,
эквивалентно решению системы уравнений (7.3) относительно
в
н
θ
θ
,
Приведем доверительные интервалы для некоторых параметров.
7.2.1. Доверительный интервал для математического ожидания
a нор-
мальной генеральной совокупности
)
,
(
2
σ
a
N
при известной дисперсии
2
σ
n
u
x
a
n
u
x
σ
σ
γ
γ
2 1
2 1


+
<
<

, где

=
=
n
n
i
x
n
x
1 1
,

2 1
γ

u

2 1
100
γ

-процентное отклонение нормального распределения
)
1
,
0
(
N
(рис. 7.1).
Рис. 7.1. Иллюстрация
2 1
100
γ

-процентного отклонения нормального распределения
7.2.2. Доверительный интервал для математического ожидания
a нор-
мальной генеральной совокупности
)
,
(
2
σ
a
N
при неизвестной дисперсии
2
σ
1 1
2 1
2 1

+
<
<




n
s
t
x
a
n
s
t
x
γ
γ
, где
2 1
2
)
(
1
x
x
n
s
n
n
i

=

=
,
2
s
s
=
,

2 1
γ

t

2 1
100
γ

-процентное отклонение распределения
)
1
(
1

n
T
. В силу сим- метричности распределения Стьюдента
)
1
(
1

n
T
величина
2 1
γ

t
имеет ту же графическую иллюстрацию, что и величина
2 1
γ

u
(рис. 7.1).
7.2.3. Доверительный интервал для дисперсии
2
σ
нормальной гене-
ральной совокупности
)
,
(
2
σ
a
N
при известном математическом ожида-
нии
a
2 1
2 0
2 2
1 2
0
γ
γ
σ
+

<
<
v
s
n
v
s
n
, где
2 1
2 0
)
(
1
a
x
n
s
n
n
i

=

=
,
2 1
2 1
,
γ
γ
+

v
v

2 1
100
γ

- и
2 1
100
γ
+
-процентные отклонения распределения
)
(
1
n
H
(рис. 7.2).
7.2.4. Доверительный интервал для дисперсии
2
σ
нормальной гене-
ральной совокупности
)
,
(
2
σ
a
N
при неизвестном математическом ожида-
нии
a
2 1
2 2
2 1
2
γ
γ
σ
+

<
<
w
s
n
w
s
n
, где
2 1
2 1
,
γ
γ
+

w
w

2 1
100
γ

- и
2 1
100
γ
+
-процентные отклонения распределения
)
1
(
1

n
H
(рис. 7.2).

Рис. 7.2. Иллюстрация
2 1
100
γ

- и
2 1
100
γ
+
-процентных отклонений распределения хи-квадрат
7.2.5. Доверительный интервал для вероятности появления случайного
события A
Пусть выполнено n независимых испытаний Бернулли, в результате кото- рых событие А появилось m раз. Границы доверительного интервала для веро- ятности
)
(A
P
p
=
события A определяются выражением












+
±
+
+




2 2
2 1
2 1
2 2
1 2
2 1
4 2
n
u
n
q
p
u
n
u
p
u
n
n
γ
γ
γ
γ
)
)
)
, где
2 1
100 2
1
γ


γ

u
-процентное отклонение распределения
)
1
,
0
(
N
,
=
p
n
m
p
=
)
– частота события,
p
q
)
)

= 1
. При знаке минус эта формула дает нижний довери- тельный предел, а при знаке плюс – верхний.

Приведем также приближенное выражение для доверительного интервала:
n
q
p
u
p
p
n
q
p
u
p
)
)
)
)
)
)
2 1
2 1
γ
γ


+
<
<

7.3. Средства Matlab для получения интервальных оценок параметров
распределений
7.3.1. Интервальные оценки параметров распределений
normfit(x,alpha)
возвращает оценки параметров нормального распределения по выборке, размещенной в x.
[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)
возвращает оценки пара- метров нормального распределения и 100(1-alpha)-процентные доверительные интервалы. По умолчанию необязательный параметр alpha=0,05, что соответст- вует 95-процентным доверительным интервалам.
expfit(x)
возвращает максимально правдоподобную оценку параметра экс- поненциального распределения по данным в x.
[muhat,muci]=expfit(x,alpha)
дает максимально правдоподобную оценку и
100(1-alpha)-процентный интервал доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия.
gamfit(x)
возвращает максимально правдоподобные оценки параметров гам- ма-распределения по данным в x.
[phat,pci]=gamfit(x,alpha)
дает максимально правдоподобные оценки и
100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия.
unifit(x,alpha)
возвращает максимально правдоподобные оценки параметров равномерного распределения по данным в x.
[ahat,bhat,aci,bci]=unifit(x,alpha)
дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. alpha – необязательный пара-
метр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу доверия.
binofit(x,n)
возвращает максимально правдоподобную оценку вероятности успеха для биномиального распределения по данным в векторе x. (x – число успехов в n испытаниях).
[phat,pci]=binofit(x,n,alpha)
дает максимально правдоподобную оценку и
100(1-alpha)-процентный интервал доверия. alpha – необязательный параметр.
По умолчанию alpha=0,05, что соответствует 95-процентному интервалу дове- рия.
phat=mle(‘dist’,data)
возвращает максимально правдоподобные оценки па- раметров распределения, определенного в dist, по данным в векторе data.
[phat,pci]=mle(‘dist’,data,alpha,p1)
возвращает максимально правдоподоб- ную оценку и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,5, что соответствует 95-процентному интервалу доверия. p1 – дополни- тельный параметр для использования с биномиальным распределением для за- дания количества испытаний.
7.3.2. Определение процентных отклонений распределений
x=norminv(p,mu,sigma)
возвращает значение аргумента функции нормаль- ного распределения с математическим ожиданием mu и средним квадратичным отклонением sigma по значениям функции в p.
x=chi2inv(p,n)
возвращает значение аргумента функции распределения хи- квадрат с n свободы по значениям функции в p.
x=tinv(p,n)
возвращает значение аргумента функции распределения Стью- дента с n степенями свободы по значениям функции в p.
x=finv(p,m,n )
возвращает значение аргумента функции распределения Фи- шера с m, n степенями свободы по значениям функции в p.

Замечание.Для определения
α
100 -процентного отклонения любого распре- деления необходимо использовать значение
α

= 1
p
7.4. Порядок выполнения работы
7.4.1.
Смоделировать выборку из нормального распределения
)
,
(
2
σ
a
N
с самостоятельно выбранными значениями параметров
2
,
σ
a
и получить приве- денные в п. 7.2.1 доверительные интервалы для этих параметров, создав для этого собственные m-файлы-функции.
7.4.2.
Результаты сравнить с оценками, полученными стандартными средст- вами Matlab.

ЛАБОРАТОРНАЯ РАБОТА № 8. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ
РАСПРЕДЕЛЕНИЯ
8.1. Цель работы
8.1.1
Изучение методов проверки гипотезы о законе распределения.
8.1.2.
Получение навыков проверки гипотезы о законе распределения в сис- теме Matlab.
8.2. Теоретические положения
8.2.1. Понятие статистической гипотезы. Классификация гипотез
Статистической гипотезой называется любое непротиворечивое множество утверждений
{
}
1 1
0
,...,
,

=
k
H
H
H
H
относительно распределения генеральной совокупности. Такая гипотеза назы- вается k-альтернативной. Каждое утверждение гипотезы
1
,
0
,

= k
i
H
i
, назы- вается альтернативой k -альтернативной гипотезы или также гипотезой.
Проверить гипотезу – это значит по выборке
n
x
x ,...,
1
из генеральной сово- купности принять обоснованное решение об истинности одной из альтернатив.
Если какая-то из альтернатив принята, то все остальные альтернативы от- клоняются, то есть считаются ложными.
Гипотеза проверяется на основе так называемого критерия проверки гипоте- зы. Критерий – это правило, позволяющее принять или отклонить ту или иную альтернативу по имеющейся выборке. Обычно принимают или отклоняют ну- левую гипотезу
0
H .
Альтернатива
i
H называется параметрической, если она задает значение некоторого параметра
θ
распределения. В противном случае она называется непараметрической.

Многоальтернативная гипотеза H называется параметрической, если все ее альтернативы параметрические, и непараметрической, если хотя бы одна аль- тернатива непараметрическая.
Альтернатива
i
H называется простой, если она однозначно определяет рас- пределение генеральной совокупности, и сложной – в противном случае.
Многоальтернативная гипотеза H называется простой, если все ее альтерна- тивы простые, и сложной, если хотя бы одна из альтернатив сложная.
1   2   3   4   5   6   7   8


написать администратору сайта