лабораторные работы. Обработки данных
Скачать 1.26 Mb.
|
4.2.2. Моделирование случайных чисел с многомерным распределени- ем, равным произведению одномерных гамма-распределений )) , ( ),..., , (( 1 1 m m m b a b a Γ ( ) , 0 , 0 0 , 0 , 0 , ) ( 1 1 1 ⎪ ⎩ ⎪ ⎨ ⎧ ≤ > > > Γ = − − = ∏ i i i i b x a i a i i m i x a b x e x b a x f i i i i ξ 4.2.3. Моделирование случайных чисел с многомерным распределени- ем, равным произведению одномерных распределений Уишарта )) , ( ),..., , (( 2 2 1 1 m m m k k W σ σ При 2 2 i i b σ = , 2 i i k a = произведение гамма-распределений представляет собой произведение одномерных распределений Уишарта. 4.2.4. Моделирование случайных чисел с многомерным распределени- ем, равным произведению одномерных распределений хи-квадрат ) ,..., ( 1 m m k k H При 2 = i b , 2 i i k a = произведение гамма-распределений представляет собой произведение распределений хи-квадрат. 4.2.5. Моделирование случайных чисел с многомерным распределени- ем, равным произведению одномерных экспоненциальных распределений ) ,..., ( 1 m m E λ λ При i i b λ = , 1 = i a произведение гамма-распределений представляет собой произведение экспоненциальных распределений. 4.2.6. Моделирование случайных чисел с многомерным равномерным распределением в гиперпрямоугольнике ) , ( ) , ( ) , ( 2 2 1 1 m m b a b a b a × × × Λ )) , ( ),..., , ( ), , (( 2 2 1 1 m m m b a b a b a U ( ) ⎪⎩ ⎪ ⎨ ⎧ < < < − = ∏ = , 0 , , , ) ( 1 1 иначе b a b x a a b x f i i i i i i i m i ξ 4.3. Средства Matlab для моделирования многомерных случайных чисел В Matlab имеется программа для моделирования многомерных случайных чисел с нормальным распределением. r=mvnrnd(mu,sigma,cases) возвращает матрицу случайных чисел, выбран- ных из многомерного нормального распределения с вектором средних mu и ко- вариационной матрицей sigma. Параметр cases является количеством строк в r (количеством многомерных случайных чисел). Описание этой функций можно найти в справочной системе в разделе "Инструментарий статистики" (ката- лог \MATLAB\toolbox\stats\) Для моделирования многомерных случайных чисел с распределениями, опи- санными в пп. 4.2.2 – 4.2.6, необходимо пользоваться программами моделиро- вания скалярных случайных чисел, приведенными в работе № 3. 4.4. Порядок выполнения работы 4.4.1. Выполнить моделирование случайных чисел с указанными в пп. 4.2.1– 4.2.6 распределениями. Для каждого распределения при 2 = m вывес- ти диаграмму рассеивания, на которую нанести 100 случайных чисел, исполь- зуя собственную программу, реализующую предложенный алгоритм, и стан- дартную программу Matlab. Собственные программы оформить в виде m-файлов-функций. Диаграмма рассеивания – это рисунок, на который нанесе- ны смоделированные значения двухмерного случайного вектора. 4.4.2. На диаграмму рассеивания двухмерного нормального закона вывести также функцию регрессии ) ( , x x y y x y a x r a y − + = σ σ Здесь x x a σ , – математическое ожидание и среднее квадратичное отклонение аргумента; y y a σ , – математическое ожидание и среднее квадратичное откло- нение функции; y x r , – коэффициент корреляции между аргументом и функци- ей. 4.4.3. Исследовать изменение диаграмм рассеивания в зависимости от пара- метров распределений. ЛАБОРАТОРНАЯ РАБОТА № 5. ОЦЕНИВАНИЕ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СКАЛЯРНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН 5.1. Цель работы 5.1.1. Изучение оценок законов распределения скалярных случайных вели- чин. 5.1.2. Приобретение навыков получения оценок законов распределения ска- лярных случайных величин с помощью системы программирования Matlab. 5.2. Теоретические положения 5.2.1. Эмпирическая функция распределения Пусть имеется выборка n x x ,..., 1 из распределения ) (x F ξ . Простейший взгляд на нее состоит в том, что числа n x x ,..., 1 считаются возможными значе- ниями некоторой дискретной случайной величины ∗ ξ , причем вероятности этих значений одинаковы и равны n / 1 . Ряд распределения этой случайной ве- личины имеет вид табл. 5.1. Таблица 5.1 Ряд распределения случайной величины ∗ ξ i x 1 x 2 x ... n x i p n / 1 n / 1 ... n / 1 Эмпирической или выборочной функцией распределения ) (x F ∗ ξ называется функция распределения дискретной случайной величины ∗ ξ : ) ( ) ( x F x F ∗ = ∗ ξ ξ . В соответствии с этим определением эмпирическая функция распределения задается формулой n m x F = ∗ ) ( ξ , где m – количество выборочных значений, меньших x ; n – объем выборки. Эмпирическую функцию распределения удобно строить с использованием порядковых статистик. В этом случае она определяется формулой ⎪ ⎩ ⎪ ⎨ ⎧ > − = ≤ < ≤ = + ∗ , 1 , 1 , , , 1 , , 0 ) ( ) ( ) 1 ( ) ( ) 1 ( n i i x x если n i x x x если x x если n i x F ξ В этой формуле ) (i x – i -я порядковая статистика, n i , 1 = Эмпирическая функция распределения ) (x F ∗ ξ представляет собой ступенча- тую функцию, поскольку это функция распределения дискретной случайной ве- личины (рис. 5.1). Рис. 5.1. Эмпирическая функция распределения Эмпирическая функция распределения является состоятельной оценкой ге- неральной (теоретической) функции распределения ) (x F ξ . Более того, согласно теореме Гливенко–Кантелли имеет место следующая сходимость почти навер- ное: 0 | ) ( ) ( | sup .н п n x x F x F ∞ → ∗ → − ξ ξ 5.2.2. Гистограмма Гистограмма – это фигура ) (x f ∗ ξ , контур которой является оценкой гене- ральной плотности вероятности ) (x f ξ . Гистограмма строится следующим об- разом. Весь интервал выборочных значений ] , [ ) ( ) 1 ( n x x делится на некоторое количество l непересекающихся интервалов длиной i ∆ , l i , 1 = , и подсчитыва- ется количество выборочных значений i m , попавших в i -й интервал. Если на каждом интервале как на основании построить прямоугольник высотой i i i n m h ∆ = , то мы получим фигуру, которая называется гистограммой. Вид гистограммы приведен на рис. 5.2. Гистограммаявляется состоятельной оценкой генераль- ной плотности вероятности при увеличении объема выборки n и числа интер- валов l , если только при этом стремится к нулю максимальная из длин интер- валов разбиения. Существуют два способа построения гистрограммы. 1. Равноинтервальный способ. Выбирают количество интервалов l, а длину ∆ каждого интервала определяют по формуле l x x n ) 1 ( ) ( − = ∆ . (5.1) 2. Равновероятный способ. Выбирают количество выборочных значений m , попавших в каждый интервал. Объем выборки должен быть кратен m . Тогда число интервалов m n l / = , и интервалы будут следующими: ] , [ ) ( ) 1 ( m x x , ] , [ ) 2 ( ) ( m m x x , …, ] , [ ) ( ) ) 1 (( lm m l x x − , где ) (i x – i-я порядковая статистика. При этом способе интервалы имеют различную длину, и границы интервалов попадают на выборочные значения. Принято считать, что граничное значение делится по- ровну между двумя интервалами, то есть 2 / 1 значения попадает в левый ин- тервал и 2 / 1 – в правый. Понятно, что при этом в крайний левый интервал по- падает 2 / 1 − m значений, в крайний правый – 2 / 1 + m значений, а в средние интервалы – по m значений. Рис. 5.2. Гистограмма 5.3. Средства Matlab для получения и исследования оценок законов распределения скалярных случайных величин Для моделирования выборок из различных распределений используются программы, описанные в лабораторной работе № 3. Для моделирования раз- личных плотностей вероятности и функций распределения используются про- граммы, описанные в лабораторной работе № 1. Опишем также программы для получения и отображения на экран оценок законов распределения. 5.3.1. Сортировка в Matlab y=sort(x) сортирует элементы вектора x в возрастающем порядке. Здесь x – исходный вектор, y – отсортированный вектор. В случае, когда x – матрица, функция y=sort(x) сортирует каждый столбец x в возрастающем порядке. y=sort(x,d) сортирует матрицу x вдоль измерения d. [y,i]=sort(x,d) возвращает также индексную матрицу i. Если x – вектор, то элементы индексной матрицы указывают номера элементов вектора y в исход- ном векторе x (см. toolbox\matlab\datafun). Программа сортировки используется для формирования вариационного ряда из имеющейся выборки. 5.3.2. Лестничные графики в Matlab stairs(y) строит лестничный (ступенчатый) график по значениям элементов вектора y. stairs(x,y) строит лестничный график по значениям элементов вектора y в точках скачков, определенных в x. Значения x должны располагаться в возрас- тающем порядке (см. toolbox\matlab\specgraph). Функция stairs(x,y) используется для получения и графического отображе- ния эмпирической функции распределения. В этом случае x – вариационный ряд, а , / ) ( n i i y = n i , 1 = 5.3.3. Гистограммы в Matlab n=hist(y) распределяет элементы вектора y в 10 интервалов одинаковой дли- ны ∆ (5.1) и возвращает количество элементов, попавшихв каждый интервал, в виде вектора n. Если y – матрица, то hist работает со столбцами. n=hist(y,l), где l – скаляр, использует l интервалов одинаковой длины (5.1). n=hist(y,x) , где x – вектор, возвращает количество элементов вектора y, по- павших в интервалы с центрами, заданными вектором x. Число интервалов в этом случае равно числу элементов вектора x. [n,x]=hist(…) возвращает числа попаданий в интервалы (в векторе n), а так- же положения центров интервалов (в векторе x). hist(…) строит гистограмму без возвращения параметров, то есть строит прямоугольники высотой i i m h = , где i m – число элементов, попавших в i -й интервал, l i , 1 = (см. toolbox\matlab\datafun). Функция hist используется для получения и отображения гистограммы. 5.4. Порядок выполнения работы 5.4.1. Получить (смоделировать) выборки из приведенных в п. 1.2.8 лабора- торной работы № 1 одномерных распределений. Для этого использовать про- граммы, описанные в п. 3.3.2.7 лабораторной работы № 3. 5.4.2. Для каждого распределения вывести на экран в одно графическое окно гистограмму и генеральную плотность вероятности, а в другое графическое ок- но – эмпирическую функцию распределения и генеральную функцию распре- деления. Для вывода генеральных плотностей вероятности и функций распре- деления использовать программы, описанные в п. 1.2.9 работы № 1. Для согласования масштабов гистограммы и генеральной плотности вероят- ности необходимо генеральную плотность вероятности умножить на коэффи- циент l x x n n k n ) 1 ( ) ( − = ∆ = 5.4.3. Исследовать сходимость эмпирических распределений к генеральным при увеличении объема выборки n . ЛАБОРАТОРНАЯ РАБОТА № 6. ПОЛУЧЕНИЕ ТОЧЕЧНЫХ ОЦЕНОК ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 6.1. Цель работы 6.1.1. Изучение методов получения точечных оценок параметров распреде- лений. 6.1.2. Приобретение навыков получения точечных оценок параметров рас- пределений в системе Matlab. 6.2. Теоретические положения 6.2.1. Методы нахождения точечных оценок параметров распределений Задача точечного оценивания формулируется следующим образом. Известна плотность вероятности генеральной совокупности с точностью до векторного параметра ) ,..., ( 1 m θ θ θ = , что мы будем обозначать как ) , ( θ ξ x f Требуется по выборке ) ,..., ( 1 n x x из этого распределения найти оценку ) ,..., ( 1 m θ θ θ ) ) ) = параметра θ Изложим два метода решения этой задачи. 6.2.1.1. Метод моментов Этот метод заключается в следующем. Находим m начальных теоретиче- ских моментов m j dx x f x E j j j , 1 , ) , ( ) ( = = = ∫ ∞ ∞ − θ ξ ν ξ Из формулы видно, что теоретические моменты являются функциями неизвест- ных параметров, то есть ) ,..., ( 1 m j j θ θ ν ν = . Далее находим m выборочных на- чальных моментов m j x n n i j i j , 1 , 1 1 = = ∑ = ν Приравнивая соответствующие теоретические и выборочные моменты, получа- ем систему m уравнений m j j m j , 1 , ) ,..., ( 1 = = ν θ θ ν Оценки m θ θ ) ) ,..., 1 определяются как решение этой системы. Достоинство метода – простота. Недостаток – неизвестно, являются ли по- лученные оценки достаточно хорошими. Этот вопрос придется решать отдель- но. Метод рекомендуется для получения оценок не более двух-трех параметров. 6.2.1.2. Метод максимума правдоподобия Этот метод использует понятие функции правдоподобия. Функцией правдо- подобия называется совместная плотность вероятности ) ,..., ( 1 n x x f выбороч- ных значений n x x ,..., 1 , рассматриваемых как случайные величины. Функция правдоподобия зависит как от переменных n x x ,..., 1 , так и от неизвестных па- раметров m θ θ ,..., 1 . Обычно она обозначается зависящей только от неизвестных параметров в виде L( m θ θ ,..., 1 ). Для простого случайного выбора функция прав- доподобия рассчитывается по формуле ∏ = = n i m i m x f L 1 1 1 ) ,... , ( ) ,..., ( θ θ θ θ ξ , где ) ,... , ( 1 m i x f θ θ ξ – плотность вероятности генеральной совокупности, в кото- рую вместо аргумента x подставлено i x . Метод максимума правдоподобия заключается в том, что оценки отыскива- ются из условия максимума функции правдоподобия: m m L θ θ θ θ ,..., 1 1 max ) ,..., ( → Полученные таким образом оценки называются максимально правдоподобны- ми, или м.п.-оценками. Часто решение задачи упрощается с помощью следующего приема. По- скольку любая функция и ее логарифм достигают экстремума на одних и тех же значениях аргументов, то можно максимизировать не функцию правдоподобия, а ее натуральный логарифм, то есть логарифмическую функцию правдоподо- бия: m m L θ θ θ θ ,..., 1 1 max ) ,..., ( ln → Чтобы найти м.п.-оценки, необходимо приравнять к нулю частные произ- водные функции правдоподобия или логарифмической функции правдоподобия и решить полученную систему уравнений: m j L m j , 1 , 0 ) ,..., ( 1 = = θ θ ∂θ ∂ , (6.1) или m j L m j , 1 , 0 ) ,..., ( ln 1 = = θ θ ∂θ ∂ . (6.2) Если учесть, что логарифмическая функция правдоподобия представляется в виде суммы ∑ = = n i m i m x f L 1 1 1 ) ,..., , ( ) ,..., ( ln θ θ θ θ ξ , то последняя система преобразуется к виду m j x f m i n i j , 1 , 0 ) ,..., , ( ln 1 1 = = ∑ = θ θ ∂θ ∂ ξ . (6.3) Доказано, что м.п.-оценки являются состоятельными, асимптотически не- смещенными и асимптотически эффективными. Пример. Найти оценки параметров a и σ 2 нормальной генеральной сово- купности ) , ( 2 σ a N Решение. Нам известна плотность вероятности генеральной совокупности с точностью до двух параметров a , 2 σ : 2 2 2 ) ( 2 2 2 1 ) , , ( σ ξ πσ σ a x e a x f − − = Оценки по методу моментов получаем весьма просто. Теоретические момен- ты a E = = ) ( 1 ξ ν , 2 2 ) ( σ ξ µ = = D . Приравнивая их к соответствующим выбо- рочным моментам, получим x x n a n i i = = ∑ = 1 1 ) , 2 2 1 2 ) ( 1 s x x n n i i = − = ∑ = σ ) Воспользуемся теперь методом максимума правдоподобия. Будем максими- зировать логарифмическую функцию правдоподобия, для чего найдем 2 2 2 2 2 ) ( ln 2 1 ) 2 1 ln( ) , , ( ln σ σ π σ ξ a x a x f i i − − − = Найдем частные производные по оцениваемым параметрам 2 2 ) , , ( (ln σ σ ∂ ∂ ξ a x a x f a i i − = , 4 2 2 2 2 2 ) ( 2 1 ) , , ( ln σ σ σ ∂σ ∂ ξ a x a x f i i − + − = Для получения оценок необходимо решать систему уравнений (6.3), которая имеет вид ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = − − = − ∑ ∑ = = n i i n i i a x a x 1 4 2 2 1 2 0 2 ) ( , 0 σ σ σ Из первого уравнения находим |