лабораторные работы. Обработки данных
Скачать 1.26 Mb.
|
6.3. Средства Matlab для получения точечных оценок параметров распределений normfit(x,alpha) возвращает оценки параметров нормального распределения по выборке, размещенной в x. [muhat,sigmahat,muci,sigmaci]=normfit(x,alpha) возвращает оценки пара- метров нормального распределения и 100(1-alpha)-процентные доверительные интервалы. По умолчанию необязательный параметр alpha=0,05, что соответст- вует 95-процентным доверительным интервалам. expfit(x) возвращает максимально правдоподобную оценку параметра экс- поненциального распределения по данным в x. [muhat, muci]=expfit(x,альфа) дает максимально правдоподобную оценку и 100(1-alpha)-процентный интервал доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия. gamfit(x) возвращает максимально правдоподобные оценки параметров гам- ма-распределения по данным в x. [phat,pci]=gamfit(x,alpha) дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия. unifit(x,alpha) возвращает максимально правдоподобные оценки параметров равномерного распределения по данным в x. [ahat,bhat,aci,bci]=unifit(x,alpha) дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. alpha – необязательный пара- метр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу доверия. binofit(x,n) возвращает максимально правдоподобную оценку вероятности успеха для биномиального распределения по данным в векторе x (x – число ус- пехов в n испытаниях). [phat,pci]=binofit(x,n,alpha) дает максимально правдоподобную оценку и 100(1-alpha)-процентный интервал доверия. alpha – необязательный параметр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу дове- рия. phat=mle('dist',data) возвращает максимально правдоподобные оценки па- раметров распределения, определенного в dist, по данным в векторе data. [phat,pci]=mle(dist,data,alpha,p1) возвращает максимально правдоподобную оценку и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что соответствуюет 95-процентному интервалу доверия. p1 – до- полнительный параметр для использования с биномиальным распределением для задания количества испытаний. function [x,options]=fmins(funfcn,x,options,grad,varargin) минимизирует функцию многих переменных. x=fmins('f',x0) пытается возвратить вектор x, который является локальным минимумом функции f(x) около стартового вектора x0. 'f' – строка, содержащая имя функции, которая должна минимизироваться. f(x) должна быть скалярной функцией векторной переменной. x=fmins('f',x0,options) использует вектор управляющих параметров. Если options(1) является положительным, то отображаются промежуточные шаги решения. По умолчанию options(1)=0. options(2) является допуском завершения для x; по умолчанию опция равна 1.e-4. options(3) – допуск завершения для f(x); по умолчанию – 1.e-4. options(14) является максимальным количеством оценок функции; по умолчанию options(14) = 200*n, где n – длина x. Другие компонен- ты options функцией fmins не используются. x=fmins('f',x0.options,[],p1,p2,...) предусматривает дополнительные аргу- менты, которые передаются в минимизируемую функцию, f(x,p1,p2,...). [x,options]=fmins(...) возвращает количество оценок функции в options(10). fmins использует симплекс-метод (прямой поиск) Нелдера–Мида. Пример. Пусть сформирована следующая m-файл-функция, содержащая ми- нимизируемую функцию: function y=funobj(x) y=(x(1)-1)^2+(x(2)-2)^2+(x(3)-1)^2; return Минимизация этой функции может быть выполнена с помощью следующей программы: x=[0 0 0]; y = fmins('funobj',x) y = 1.0000 2.0000 1.0000 6.4. Порядок выполнения работы 6.4.1. Для приведенных в п. 1.2.8 лабораторной работы № 1 распределений записать функции правдоподобия и получить м.п.-оценки параметров, оформив функции правдоподобия в виде m-файлов-функций и максимизировав их. Мак- симизация функции ) (x f эквивалентна минимизации функции )) ( ( x f − 6.4.2. Оценки сравнить с оценками, полученными с помощью стандартных функций Matlab. ЛАБОРАТОРНАЯ РАБОТА № 7. ПОЛУЧЕНИЕ ИНТЕРВАЛЬНЫХ ОЦЕНОК ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 7.1. Цель работы 7.1.1. Изучение задачи получения интервальных оценок параметров распре- делений. 7.1.2. Приобретение навыков получения интервальных оценок параметров распределений в системе Matlab. 7.2. Теоретические положения Интервальные оценки параметров распределений Доверительным интервалом для некоторого параметра θ называется интер- вал ) , ( в н θ θ , накрывающий параметр θ с доверительной вероятностью γ : γ θ θ θ = < < ) ( в н P . (7.1) Задачаполучения интервальной оценки параметра распределения заключа- ется в определении по выборке ) ,..., , ( 2 1 n x x x нижней и верхней границ интер- вала н θ , в θ . Доверительная вероятность γ выбирается близкой к 1 из набора чи- сел } 975 , 0 ; 95 , 0 ; 9 , 0 { Для придания задаче однозначности уравнение (7.1) представляют в виде двух уравнений ⎩ ⎨ ⎧ = < = > , ) ( , ) ( 2 1 α θ θ α θ θ н в P P (7.2) где γ α α − = + 1 2 1 Доверительный интервал называется симметричным, если в (7.2) 2 / ) 1 ( 2 1 γ α α α − = = = . Таким образом, симметричный доверительный интервал удовлетворяет следующей системе уравнений: ⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ − = < − = > 2 1 ) ( , 2 1 ) ( γ θ θ γ θ θ н в P P (7.3) Для построения симметричного доверительного интервала для неизвестного параметра θ обычно используется статистика, представляющая собой точеч- ную оценку θ ) этого параметра,или некоторая функция точечной оценки ) ( θ ) g g = . Должен быть известен закон распределения этой статистики, то есть плотность вероятности ) (x f g . В силу того что параметр θ нам неизвестен, эта плотность вероятности будет зависеть от θ , то есть нам известна плотность ве- роятности статистики с точностью до параметра ) , ( θ x f g . Для построения до- верительного интервала для параметра θ строят «доверительный интервал» для статистики g , то есть находят н g , в g из системы уравнений ⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ − = < − = > 2 1 ) ( , 2 1 ) ( γ γ н в g g P g g P Решение этой системы уравнений относительно в н g g , эквивалентно решению системы уравнений (7.3) относительно в н θ θ , Приведем доверительные интервалы для некоторых параметров. 7.2.1. Доверительный интервал для математического ожидания a нор- мальной генеральной совокупности ) , ( 2 σ a N при известной дисперсии 2 σ n u x a n u x σ σ γ γ 2 1 2 1 − − + < < − , где ∑ = = n n i x n x 1 1 , 2 1 γ − u – 2 1 100 γ − -процентное отклонение нормального распределения ) 1 , 0 ( N (рис. 7.1). Рис. 7.1. Иллюстрация 2 1 100 γ − -процентного отклонения нормального распределения 7.2.2. Доверительный интервал для математического ожидания a нор- мальной генеральной совокупности ) , ( 2 σ a N при неизвестной дисперсии 2 σ 1 1 2 1 2 1 − + < < − − − − n s t x a n s t x γ γ , где 2 1 2 ) ( 1 x x n s n n i − = ∑ = , 2 s s = , 2 1 γ − t – 2 1 100 γ − -процентное отклонение распределения ) 1 ( 1 − n T . В силу сим- метричности распределения Стьюдента ) 1 ( 1 − n T величина 2 1 γ − t имеет ту же графическую иллюстрацию, что и величина 2 1 γ − u (рис. 7.1). 7.2.3. Доверительный интервал для дисперсии 2 σ нормальной гене- ральной совокупности ) , ( 2 σ a N при известном математическом ожида- нии a 2 1 2 0 2 2 1 2 0 γ γ σ + − < < v s n v s n , где 2 1 2 0 ) ( 1 a x n s n n i − = ∑ = , 2 1 2 1 , γ γ + − v v – 2 1 100 γ − - и 2 1 100 γ + -процентные отклонения распределения ) ( 1 n H (рис. 7.2). 7.2.4. Доверительный интервал для дисперсии 2 σ нормальной гене- ральной совокупности ) , ( 2 σ a N при неизвестном математическом ожида- нии a 2 1 2 2 2 1 2 γ γ σ + − < < w s n w s n , где 2 1 2 1 , γ γ + − w w – 2 1 100 γ − - и 2 1 100 γ + -процентные отклонения распределения ) 1 ( 1 − n H (рис. 7.2). Рис. 7.2. Иллюстрация 2 1 100 γ − - и 2 1 100 γ + -процентных отклонений распределения хи-квадрат 7.2.5. Доверительный интервал для вероятности появления случайного события A Пусть выполнено n независимых испытаний Бернулли, в результате кото- рых событие А появилось m раз. Границы доверительного интервала для веро- ятности ) (A P p = события A определяются выражением ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ + ± + + − − − − 2 2 2 1 2 1 2 2 1 2 2 1 4 2 n u n q p u n u p u n n γ γ γ γ ) ) ) , где 2 1 100 2 1 γ − − γ − u -процентное отклонение распределения ) 1 , 0 ( N , = p n m p = ) – частота события, p q ) ) − = 1 . При знаке минус эта формула дает нижний довери- тельный предел, а при знаке плюс – верхний. Приведем также приближенное выражение для доверительного интервала: n q p u p p n q p u p ) ) ) ) ) ) 2 1 2 1 γ γ − − + < < − 7.3. Средства Matlab для получения интервальных оценок параметров распределений 7.3.1. Интервальные оценки параметров распределений normfit(x,alpha) возвращает оценки параметров нормального распределения по выборке, размещенной в x. [muhat,sigmahat,muci,sigmaci]=normfit(x,alpha) возвращает оценки пара- метров нормального распределения и 100(1-alpha)-процентные доверительные интервалы. По умолчанию необязательный параметр alpha=0,05, что соответст- вует 95-процентным доверительным интервалам. expfit(x) возвращает максимально правдоподобную оценку параметра экс- поненциального распределения по данным в x. [muhat,muci]=expfit(x,alpha) дает максимально правдоподобную оценку и 100(1-alpha)-процентный интервал доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия. gamfit(x) возвращает максимально правдоподобные оценки параметров гам- ма-распределения по данным в x. [phat,pci]=gamfit(x,alpha) дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,05, что со- ответствует 95-процентному интервалу доверия. unifit(x,alpha) возвращает максимально правдоподобные оценки параметров равномерного распределения по данным в x. [ahat,bhat,aci,bci]=unifit(x,alpha) дает максимально правдоподобные оценки и 100(1-alpha)-процентные интервалы доверия. alpha – необязательный пара- метр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу доверия. binofit(x,n) возвращает максимально правдоподобную оценку вероятности успеха для биномиального распределения по данным в векторе x. (x – число успехов в n испытаниях). [phat,pci]=binofit(x,n,alpha) дает максимально правдоподобную оценку и 100(1-alpha)-процентный интервал доверия. alpha – необязательный параметр. По умолчанию alpha=0,05, что соответствует 95-процентному интервалу дове- рия. phat=mle(‘dist’,data) возвращает максимально правдоподобные оценки па- раметров распределения, определенного в dist, по данным в векторе data. [phat,pci]=mle(‘dist’,data,alpha,p1) возвращает максимально правдоподоб- ную оценку и 100(1-alpha)-процентные интервалы доверия. По умолчанию alpha=0,5, что соответствует 95-процентному интервалу доверия. p1 – дополни- тельный параметр для использования с биномиальным распределением для за- дания количества испытаний. 7.3.2. Определение процентных отклонений распределений x=norminv(p,mu,sigma) возвращает значение аргумента функции нормаль- ного распределения с математическим ожиданием mu и средним квадратичным отклонением sigma по значениям функции в p. x=chi2inv(p,n) возвращает значение аргумента функции распределения хи- квадрат с n свободы по значениям функции в p. x=tinv(p,n) возвращает значение аргумента функции распределения Стью- дента с n степенями свободы по значениям функции в p. x=finv(p,m,n ) возвращает значение аргумента функции распределения Фи- шера с m, n степенями свободы по значениям функции в p. Замечание.Для определения α 100 -процентного отклонения любого распре- деления необходимо использовать значение α − = 1 p 7.4. Порядок выполнения работы 7.4.1. Смоделировать выборку из нормального распределения ) , ( 2 σ a N с самостоятельно выбранными значениями параметров 2 , σ a и получить приве- денные в п. 7.2.1 доверительные интервалы для этих параметров, создав для этого собственные m-файлы-функции. 7.4.2. Результаты сравнить с оценками, полученными стандартными средст- вами Matlab. ЛАБОРАТОРНАЯ РАБОТА № 8. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ 8.1. Цель работы 8.1.1 Изучение методов проверки гипотезы о законе распределения. 8.1.2. Получение навыков проверки гипотезы о законе распределения в сис- теме Matlab. 8.2. Теоретические положения 8.2.1. Понятие статистической гипотезы. Классификация гипотез Статистической гипотезой называется любое непротиворечивое множество утверждений { } 1 1 0 ,..., , − = k H H H H относительно распределения генеральной совокупности. Такая гипотеза назы- вается k-альтернативной. Каждое утверждение гипотезы 1 , 0 , − = k i H i , назы- вается альтернативой k -альтернативной гипотезы или также гипотезой. Проверить гипотезу – это значит по выборке n x x ,..., 1 из генеральной сово- купности принять обоснованное решение об истинности одной из альтернатив. Если какая-то из альтернатив принята, то все остальные альтернативы от- клоняются, то есть считаются ложными. Гипотеза проверяется на основе так называемого критерия проверки гипоте- зы. Критерий – это правило, позволяющее принять или отклонить ту или иную альтернативу по имеющейся выборке. Обычно принимают или отклоняют ну- левую гипотезу 0 H . Альтернатива i H называется параметрической, если она задает значение некоторого параметра θ распределения. В противном случае она называется непараметрической. Многоальтернативная гипотеза H называется параметрической, если все ее альтернативы параметрические, и непараметрической, если хотя бы одна аль- тернатива непараметрическая. Альтернатива i H называется простой, если она однозначно определяет рас- пределение генеральной совокупности, и сложной – в противном случае. Многоальтернативная гипотеза H называется простой, если все ее альтерна- тивы простые, и сложной, если хотя бы одна из альтернатив сложная. |