Статистическая обработка результатов эксперимента в MathCAD. Законы распределения случайных чисел Для непрерывных случайных величин
Скачать 2.86 Mb.
|
Статистическая обработка результатов эксперимента в MathCAD методические рекомендации 1. Законы распределения случайных чисел • Распределение случайной величины – это функция, позволяющая определить вероятность появления заданного значения случайной величины. • В теории вероятностей сформулировано несколько законов распределения как для дискретных, так и для непрерывных случайных величин. • Наблюдаемые на практике случайные величины часто не вполне соответствуют теоретическим распределениям, но с некоторой точностью могут быть приближенно ими представлены. Законы распределения случайных чисел Для непрерывных случайных величин рассмотрим следующие законы: • Равномерное распределение • Нормальное распределение • Экспоненциальное распределение • Гамма-распределение Равномерное распределение 2 параметра: a, b – границы отрезка a = min(X i ) b = max(X i ) 0 5 10 15 20 0 0.2 0.4 0.6 0.8 dunif x 5 15 ( ) dunif x 7 12 ( ) x 0 5 10 15 20 0 0.2 0.4 0.6 0.8 punif x 5 15 ( ) punif x 7 12 ( ) x Плотность вероятности Интегральная функция распределения Равномерное распределение t 0 1000 Y1 t runif 1 5 15 ( ) 0 Y2 t runif 1 5 15 ( ) 0 0 5 10 15 20 0 5 10 15 20 Y2 Y1 Нормальное распределение n i i X n X 1 1 n i i X n X 1 2 2 1 2 параметра: μ – мат. ожидание σ – стандартное, или среднеквадратическое, отклонение 0 5 10 15 20 0 0.2 0.4 0.6 0.8 dnorm x 10 2 ( ) dnorm x 10 1 ( ) dnorm x 10 5 ( ) x 0 5 10 15 20 0 0.2 0.4 0.6 0.8 pnorm x 10 2 ( ) pnorm x 10 1 ( ) pnorm x 10 5 ( ) x Нормальное распределение 0 5 10 15 20 0 5 10 15 20 16.24 3.277 rnorm 1000 10 2.2 ( ) 17.847 3.086 rnorm 1000 10 2.2 ( ) t 0 1000 Экспоненциальное распределение 1 параметр масштаба λ λ = 1 / μ 0 5 10 15 20 0 0.2 0.4 0.6 0.8 dexp x 0.5 ( ) dexp x 1 ( ) dexp x 2 ( ) x 0 5 10 15 20 0 0.2 0.4 0.6 0.8 pexp x 0.5 ( ) pexp x 1 ( ) pexp x 2 ( ) x Экспоненциальное распределение 0 5 10 15 20 0 5 10 15 13.65 2.029 10 3 rexp 1000 0.5 ( ) 15.395 2.175 10 3 rexp 1000 0.5 ( ) t 0 1000 Гамма-распределение 2 k 2 параметра: k – параметр формы θ – параметр масштаба При k = 1 получается экспоненциальное распределение, где λ = 1 / θ При k → ∞ получается нормальное распределение с параметрами k∙θ и k∙θ 2 0 5 10 15 20 0 0.2 0.4 0.6 0.8 1 2 dgamma x 2 4 1 2 dgamma x 2 1.5 1 1 dgamma x 1 4 x 0 5 10 15 20 0 0.2 0.4 0.6 0.8 pgamma x 2 4 pgamma x 2 1.5 pgamma x 1 4 x Гамма-распределение t 0 1000 Y1 t rgamma 3 5 ( ) 0 Y2 t rgamma 3 5 ( ) 0 0 5 10 15 20 0 5 10 15 20 Y2 Y1 2. Построение гистограмм плотности вероятности и интегральной функции распределения Исходный вектор значений случайной величины: i 0 99 X i rnd 1 ( ) rnorm 1 1 0.7 ( ) 0 0 20 40 60 80 100 1 0 1 2 3 X i i Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы плотности вероятности: 1 0 1 2 3 0 0.1 0.2 0.3 0.4 1 100 histogram 5 X ( ) 1 1 100 histogram 10 X ( ) 1 1 100 histogram 20 X ( ) 1 histogram 5 X ( ) 0 histogram 10 X ( ) 0 histogram 20 X ( ) 0 Построение гистограмм плотности вероятности и интегральной функции распределения Для выбора числа интервалов (бинов) у гистограммы рекомендуется использовать формулу Стерджесса Ширина каждого из интервалов Ширину интервалов рекомендуется округлять. Функция histogram выбирает ширину автоматически. Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы интегральной функции распределения: j 0 length histogram 15 X ( ) 0 1 1 0 1 2 3 0 0.2 0.4 0.6 0.8 1 1 100 0 j k histogram 15 X ( ) 1 k histogram 15 X ( ) 0 j 4. Вычисление математического ожидания, стандартного отклонения, дисперсии • Математическое ожидание случайной величины вычисляется как её среднее значение, в mathCad вычисляется функцией mean • Среднеквадратическое (стандартное) отклонение – корень из дисперсии, в mathCad вычисляется функцией stdev Обозначается σ • Дисперсия – среднее значение квадрата отклонений от среднего значения (σ 2 ), в mathCad вычисляется функцией var mean X ( ) 0.486 var X ( ) 0.225 stdev X ( ) 0.475 5. Критерии достоверности гипотез Гипотеза – предположение о виде или параметрах неизвестного распределения. Например: гипотеза «случайная величина X подчиняется нормальному закону распределения» Для каждой гипотезы есть вероятность p, что она верна, и вероятность 1 – p, что гипотеза ошибочна. При проверке гипотез заранее задают уровень значимости α = 1 – p, то есть вероятность недостоверности гипотезы. Критерии достоверности гипотез Для проверки гипотез вычисляют значение критерия, зависящее от значений проверяемой случайной величины, и проверяют его на нахождение в области значений, соответствующей достоверности гипотезы при заданном уровне значимости. Наиболее часто используют критерий Колмогорова и критерий Пирсона (критерий «хи-квадрат» - χ 2 ). Использование критерия Колмогорова • Упорядочить случайные числа по возрастанию. • Вычислить значения D i и выбрать максимальное из них D Значение критерия λ = D √n • Найти вероятность совпадения законов распределения P(λ). Использование критерия Колмогорова при заданном уровне значимости • Задавшись α и зная n, выбрать критическое значение критерия D кр • Упорядочить случайные числа по возрастанию. • Вычислить значения критерия D i и выбрать максимальное из них D • Гипотезу о принадлежности случайной величины распределению можно принять, если D < D кр Поиск критической точки для критерия Колмогорова Для нахождения критической величины критерия D кр надо знать уровень значимости α и число опытов n Для заданного α выбираем λ кр : 2.03 1.95 1.73 1.63 1.48 1.36 1.22 1.07 0.97 0.89 0.0005 0.001 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.4 кр 1 кр n D кр При больших n (n > 35) Для малых n пользоваться табличными значениями D кр Критерий Колмогорова: пример Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал своё время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 мин. Проверить гипотезу о том, что время ожидания автобуса равномерно распределено на отрезке [0; 10] на уровне значимости 0,05. Решение Решение задачи в MathCAD Использование критерия Пирсона Критерий используется для дискретных величин, либо непрерывных величин, разбитых на интервалы. Например, он может быть использован, если построена гистограмма результатов эксперимента. Использование критерия Пирсона • Определить число степеней свободы k = l – r – 1, где l – число интервалов гистограммы r – число параметров предполагаемого распределения, оцениваемых по выборке (2 для нормального, 1 для экспоненциального…) • Найти критическое значение критерия: χ 2 кр = qchisq(1 – α, k) • Вычислить критерий χ 2 по экспериментальным данным. Гипотеза верна, если χ 2 < χ 2 кр Использование критерия Пирсона Вычисление χ 2 : где • n i – эмпирические частоты (фактическое количество попаданий случайной величины в заданный интервал гистограммы) • np i – теоретические частоты (количество попаданий случайной величины в заданный интервал гистограммы, вычисленное по предполагаемому закону её распределения) l i i i i np np n 1 2 2 ) ( Пример Измерены интервалы в минутах между 100 поездами метро, прибывшими на станцию. Результаты измерений представлены статистическим рядом: На уровне значимости проверить гипотезу о том, что интервалы можно описать нормальным распределением. 05 , 0 Неравенство χ 2 < χ 2 кр выполнено, гипотезу можно принять. 6. Коэффициент линейной корреляции Коэффициент линейной корреляции – величина, показывающая наличие линейной связи между значениями двух случайных величин. Для линейно зависящих величин он равен 1 или -1, для независимых величин – 0. В MathCad вычисляется как функция от двух векторов случайных чисел. X rgamma 100 2 ( ) X1 rgamma 100 2 ( ) corr X 2X 5 ( ) 1 corr X1 X1 ( ) 1 corr X X1 ( ) 0.151 corr X X 2 0.948 corr X1 X1 2 0.948 corr X X 3 0.868 corr X1 X1 3 0.863 corr X exp X ( ) ( ) 0.686 corr X1 exp X1 ( ) ( ) 0.661 corr X sin X ( ) ( ) 0.468 corr X1 sin X1 ( ) ( ) 0.547 |