Кирьянов. Самоучитель MathCad 11. Кирьянов д в
Скачать 10.75 Mb.
|
0.2 , 1 0 , 2 ) ( x , 20) 0 . 1 Л < * A J ' х \ \ / is 10 20 3D X 14.7. Плотность вероятности некоторых распределений — е — параметры — биномиальное распределение (п — целый параметр и о<р<1 — параметр, равный вероятности успеха единичного испытания распределение Коши (1 — параметр разложения — параметр масштаба — распределение — число степеней свободы — экспоненциальное распределение — показатель экспоненты распределение Фишера числа степеней свободы гамма-распределение (s>o — параметр формы — геометрическое распределение — параметр, равный вероятности успеха единичного испытания Часть III. Численные методы — гипергеометрическое распределение целые параметры — логарифмически нормальное распределение — натуральный логарифм математического ожидания — натуральный логарифм среднеквадратичного отклонения — логистическое распределение математическое ожидание, s>o — параметр масштаба — отрицательное биномиальное распределение (по целый параметр — нормальное распределение среднее значение отклонение — распределение Пуассона — параметр — распределение (d>o — число степеней свободы *unif(x,a,b) — равномерное распределение (а<ь — границы интервала распределение Вейбулла (s>o — параметр). Вставку рассмотренных статистических функций в программы удобно осуществлять с помощью диалогового окна Insert Function (Вставка функции). Для этого необходимо выполнить следующие действия. Установите курсор на место вставки функции в документе. Вызовите диалоговое окно Insert Function нажатием кнопки f(x) на стандартной панели инструментов или командой меню Insert / Вставка / Функция, или нажатием клавиш Insert Function and Exponential Piecewise Continuous Probability Distribution • i . 14.8. Диалоговое окно Insert Function Глава 14. Математическая статистика 359 3. В списке Function Category (Категория функции) (рис. 14.8) выберите одну из категорий статистических функций. Категория Probability Плотность вероятности) содержит встроенные функции для плотности Probability Distribution (Функция распределения) — для вставки функций или квантилей распределения Random Numbers (Случайные числа) — для вставки функции генерации случайных чисел. В списке Function Name (Имя функции) выберите функцию, в зависимости от требующегося закона распределения. При выборе того или иного элемента списка в текстовых полях в нижней части окна будет появляться информация о назначении выбранной функции. Нажмите кнопку для вставки функции в документ. Статистические характеристики В большинстве статистических расчетов Вы имеете дело либо со случайными данными, полученными входе какого-либо эксперимента (которые выводятся из файла или печатаются непосредственно в документе, либо с результатами генерации случайных чисел, рассмотренными в предыдущих разделах встроенными функциями, моделирующими то или иное явление методом Монте-Карло. Рассмотрим возможности Mathcad по оценке функций распределения и расчету числовых характеристик случайных данных. Построение гистограмм Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы область значений случайной величины разбивается на некоторое количество bin сегментов, а затем подсчитывается процент попадания данных в каждый сегмент. Для построения гистограмм в Mathcad имеется несколько встроенных функций. Рассмотрим их, начиная с самой сложной по применению, чтобы лучше разобраться в возможностях каждой из функций. Гистограмма с произвольными сегментами разбиения — вектор частоты попадания данных в интервалы гистограммы — вектор, элементы которого задают сегменты построения гистограммы в порядке возрастания • х вектор случайных данных. Если вектор intvls имеет bin элементов, то и результат hist имеет столько же элементов. Построение гистограммы иллюстрируется листингом 14.8 ирис Часть III. Численные методы Листинг 14.8. Построение гистограммы N:=1000 bin:=3 х := (N , 0 , 1) lower := floor {x) ) upper := ceil (max (x) ) upper - lower bin j := 0 .. bin lower + h • j 1 f :=• h hist Для анализа взято данных с нормальным законом распределения, созданных генератором случайных чисел (третья строка листинга. Далее определяются границы интервала содержащего внутри себя все случайные значения, и осуществляется его разбиение на количество) одинаковых сегментов, начальные точки которых записываются в вектор int (предпоследняя строка листинга). Внимание! В векторе i n t можно задать произвольные границы сегментов разбиения так, чтобы они имели разную ширину :- int + — 2 0.4 f i -4 -2 14.9. Построение гистограммы (листинг 14.8) Глава 14. Математическая статистика Обратите внимание, что в последней строке листинга осуществлена нормировка значений гистограммы, стем чтобы она правильно аппроксимировала плотность вероятности, также показанную на графике. Очень важно переопределение вектора int в самом верху рис. 14.9, которое необходимо для перехода от левой границы каждого элементарного сегмента к его центру. Гистограмма с разбиением на равные сегменты Если нет необходимости задавать сегменты гистограммы разной ширины, то удобнее воспользоваться упрощенным вариантом функции hist. h i s t x) — вектор частоты попадания данных в интервалы гистограммы количество сегментов построения гистограммы; • х — вектор случайных данных. Для того чтобы использовать этот вариант функции h i s t вместо предыдущего, достаточно заменить первый из ее аргументов в листинге 14.8 следующим образом ( х Недостаток упрощенной формы функции h i s t в том, что по-прежнему необходимо дополнительно определять вектор сегментов построения гистограммы. От этого недостатка свободна появившаяся в Mathcad 2001 функция матрица гистограммы размера binx2, состоящая из столбца сегментов разбиения и столбца частоты попадания в них данных количество сегментов построения гистограммы; • х — вектор случайных данных. Примеры использования функции histogram приведены в листинге 14.9 ирис. Сравнение с предыдущим листингом подчеркивает простоту построения гистограммы этим способом (стоит отметить, что в листинге в отличие от предыдущего, мы не нормировали гистограмму). Листинг 14.9. Упрощенный вариант построения гистограммы х := rnorm , 0 , 1) f (bin , x) Часть III. Численные методы 1>Рис. 14.10. Графики матрица гистограммы (листинг Создание графика гистограммы Для того чтобы создать график в виде гистограммы Постройте двумерный график, задайте переменные по осями пределы оси х (в примере из листинга это числа lower и upper). 2. Войдите в диалоговое окно Formatting Currently Selected Graph (Форматирование) выбранного графика (например, двойным щелчком мыши) и перейдите на вкладку Traces (Графики 200 100 •"11 • -• Currently -4 -4 - trace 2 trace 3 trace 4 6 trace 1 | none none none none • •- - - d o t d a s h s o l i d mag • lines err« step 1 1 Установка типа графика для построения гистограммы Глава 14. Математическая статистика. Установите для серии данных гистограммы в поле (Тип) элемент списка (столбцы) или solidbar (гистограмма) (рис. Нажмите кнопку ОК. На рис. 14.9 и были применены установки графика (столбцы). В Mathcad 2001 появилась новая возможность построения гистограммы в более привычном виде — закрашенными столбиками (solidbar). Такой тип графика иллюстрируется рис. 14.11. Среднее значение и дисперсия В Mathcad имеется ряд встроенных функций для расчетов числовых статистических характеристик рядов случайных данных — выборочное среднее значение median (x) — выборочная медиана (median) — значение аргумента, которое делит гистограмму плотности вероятностей на две равные части var{x) — выборочная дисперсия (variance); — среднеквадратичное (или "стандартное) отклонение (standard deviation); max(x), — максимальное и минимальное значения выборки mode(x) — наиболее часто встречающееся значение выборки — выборочная дисперсия и среднеквадратичное клонение в другой нормировке; • х — вектор (или матрица) с выборкой случайных данных. Пример использования первых четырех функций приведен в листинге 14.10. i Листинг Расчет числовых характеристик случайного векторах { 1 0 0 0 , 1 . 5 ) N := ( x ) N = х 10 m e a n (x) = 0 . 9 1 7 m e d i a n ( x ) = 0 . 7 8 1 v a r ( x ) = 0 . 4 0 2 s t d e v = 0 . 6 3 4 < = h i : = ( х ) + s t d e v ( x ) m e a n ( x ) - s t d e На 14.12 приведена гистограмма выборки случайных чисел, распределенных согласно закону Пунктирные вертикальные прямые, показанные на графике, рассчитаны в последней строке листинга и Часть III. Численные методы ют стандартное отклонение от среднего значения. Гистограмма получена с помощью листинга 14.8, рассмотренного в предыдущем разделе. Обратите внимание, что поскольку распределение в отличие, например, от Гауссова, несимметричное, то медиана не совпадает со средним значением 14.12. Гистограмма распределения Вейбулла (листинг Определение статистических характеристик случайных величин приведено в листинге 14.11 на еще одном примере обработки выборки малого объема (по пяти данным. В том же листинге иллюстрируется применение еще двух функций, которые имеют смысл дисперсии и стандартного отклонения в несколько другой нормировке. Сравнивая различные выражения, Вы без труда освоите связь между встроенными функциями. Внимание! Осторожно относитесь к написанию первой литеры в этих функциях, особенно при обработке малых выборок (листинг Листинг К определению статистических характеристик х := ( 5 2 14 3 2 ) N := length (x) N = 5 N-1 m := mean { = 5.2 N i = 0 median =3 =2 max =14 = 2 Глава 14. Математическая статистиках N - 1 14.2.3. Генерация коррелированных случайных чисел До сих пор мы рассматривали наиболее простой случай применения генераторов независимых случайных чисел. В методах Монте-Карло часто требуется создавать случайные числа с определенной корреляцией Приведем пример программы, создающей два вектора xl их одинакового размера и одними тем же распределением, случайные элементы которых попарно коррелированы с коэффициентом корреляции R (ЛИСТИНГ 14.12), Листинг 14.12. Генерация попарно коррелированных случайных чисел а := 3 N := 1000 R := 0.4 xl := (N , 0 ха, х ) = 0 . Результат действия программы для показан на рис. 14.13 (слева). Сравните полученную выборку с правым графиком, полученным для высокой корреляции (R=O.9) И С рис. 14.3 (см. разд. 14.1.1) для независимых данных, те Часть III. Численные методы ю 1 1 + ох Рис. 14.13. Псевдослучайные числа с корреляцией R=0 .4 листинги Ковариация и корреляция Функции, устанавливающие связь между парами двух случайных векторов, называются и корреляцией (или, по-другому, коэффициентом Они различаются нормировкой, как следует из их определения (листинг 14.13). — коэффициент корреляции двух выборок cvar(x) — ковариация двух выборок — векторы (или матрицы) одинакового размера с выборками случайных данных Листинг Расчет и корреляции (продолжение листинга mean ( CT1 s t d e v ( x l ) m2 :- mean ( x2 ) ( x2 = 3.823 c v a r ( x l , x2) = 3.823 c v a r ( xl , x2 ) 0.415 (xl , x2 ) 0 . 415 Глава 14. Математическая статистика. Коэффициенты асимметрии и эксцесса Коэффициент асимметрии задает степень асимметричности плотности вероятности относительно оси, проходящий через ее центр тяжести. Коэффициент асимметрии определяется третьим центральным моментом распределения. В любом симметричном распределении с нулевым математическим ожиданием, например нормальным, все нечетные моменты, в том числе и равны нулю, поэтому коэффициент асимметрии тоже равен нулю. Степень сглаженности плотности вероятности окрестности главного максимума задается еще одной величиной — коэффициентом эксцесса Он показывает, насколько острую вершину имеет плотность вероятности по сравнению с нормальным распределением. Если коэффициент эксцесса больше нуля, то распределение имеет более острую вершину, чем распределение Гаусса, если меньше нуля, то более плоскую. Для расчета коэффициентов асимметрии и эксцесса в Mathcad имеются две встроенные функции — коэффициент эксцесса (kurtosis) выборки случайных данных х коэффициент асимметрии выборки случайных данных х. Примеры расчета коэффициентов асимметрии и эксцесса для распределения (см. рис. 14.10) приведены в листинге Листинг 14.14. Расчет выборочных коэффициентов асимметрии и эксцессах := rweibull (1000 ,1.5) skew (x) 1.216 1.89 14.2.6. Другие статистические характеристики В предыдущих разделах были рассмотрены встроенные функции, рассчитывающие наиболее часто используемые статистические характеристики выборок случайных данных. Иногда в статистике встречаются и иные функции, например, помимо арифметического среднего, применяются другие средние значения — геометрическое среднее выборки случайных чисел — гармоническое среднее выборки случайных чисел. Математическое определение этих функций и пример их использования в приведены в листинге 14.15. 368 Часть III. Численные методы Листинг 14.15. Вычисление различных средних значений := — . N f N N 10 runif (N , 0 , i 0 • i 0 0.012 mean (x) 0.012 ( x> = 0 i = 0 Действие статистических функций на матрицы Все рассмотренные примеры работы статистических функций относились к векторам, элементы которых были случайными числами. Но точно также все эти функции применяются и по отношению к выборкам случайных данных, сгруппированных в матрицы. При этом статистические характеристики рассчитываются для совокупности всех элементов матрицы, без разделения ее на строки и столбцы. Например, если матрица имеет размерность то и объем выборки будет равен мы. Соответствующий пример вычисления среднего значения приведен в листинге. В его первой строке определяется матрица данных х размера. Действие встроенной функции mean матричного аргумента (последняя строка листинга) иллюстрируется явным суммированием элементов матрицы х (предпоследняя строка. Действие прочих встроенных функций на матрицы совершенно аналогично действию их на векторы (листинг Листинг 14.16. Вычисление среднего значения элементов матрицы 4 1.5 хм Глава 14. Математическая статистика 369 Xj 3 . 6 —• i = = 3 . 6 i = 0 j = 0 Листинг Действие различных статистических функций на матрицу • median (x) = 1.35 mode ( =1.2 var (x) = 14.033 Var (x) = 16.037 stdev (x) = 3.746 Stdev = 4.005 ( Примечание Некоторые статистические функции (например, вычисления ковариации) имеют два аргумента. Они также могут быть матрицами, нов соответствии со смыслом функции, должны иметь одинаковую размерность. Большинству статистических функций позволяется иметь в качестве аргументов даже не одну матрицу, а любое количество матриц, векторов иска- ляров. Числовые характеристики будут рассчитаны для всей совокупности значений аргументов функции. Соответствующий пример приведен в листинге функции нескольких аргументов I x:= ( 1 1 1 m e a n s t d e v ( m e d i a n mode -1 7 4 . У, 5 , z) J z = 4 ) ) = 4 . 77) = 2 3 444 29.976 14.3. Случайные процессы Встроенные функции для генерации случайных чисел создают выборку из случайных данных Часто требуется создать непрерывную или дискрет- Часть III. Численные методы случайную функцию A(t) одной или нескольких переменных (случайный процесс или поле значения которой будут упорядочены относительно своих переменных. Создать псевдослучайный процесс можно способом, представленным в листинге 14.19. ) Листинг 14.19. Генераций псевдослучайного процесса Т :=0.5 N • г 0 N - 1 Tj := j т х ( N , 0 , KS1 (T , х) А ( t) (KS1 , Т , х , Впервой строке листинга 14.19 определено количество независимых случайных чисел, которые будут впоследствии сгенерированы, и радиус временной корреляции т. В следующих трех строках определяются моменты времени которым будут отвечать случайные значения Создание нормального случайного процесса сводится к генерации обычным способом вектора независимых случайных чисел хи построению интерполяционной зависимости в промежутках между ними. В листинге 14.19 используется сплайн-интерполяция (см. гл. 15). 14.14. Псевдослучайный процесс листинг 14.19) Глава 14. Математическая статистика В результате получается случайный процесс A ( t ) , радиус корреляции которого определяется расстоянием т между точками, для которых строится интерполяция. График случайного процесса A(t) вместе с исходными случайными числами показан на рис. 14.14. Случайное поле можно создать несколько более сложным способом с помощью многомерной ин- терполяции. К случайным процессам, сгенерированным таким способом, как и к данным эксперимента, применяются любые статистические методы обработки, например корреляционный или спектральный анализ. Приведем в качестве примера листинг 14.20, показывающий, как организовать расчет корреляционной функции случайного процесса. Листинг Дискретизация случайного процесса и вычисление корреляционной функции (продолжение листинга Д п 475 n := \ j 0 п := mean ( D:= v a r ( Y) D = 0 .785 ( n - 2 i Дискретизация интервала (0,ттах) для случайного процесса A(t) произведена с различным элементарным интервалом Д (первая строка листинга). В зависимости от значения Д, получается различный объем п выборки случайных чисел являющихся значениями случайной функции A(t) в точках дискретизации. В последних четырех строках определяются различные характеристики случайной величины Y, являющиеся, по сути, характеристиками случайного процесса A ( t ) . График рассчитанной в точках корреляционной функции R(j) показан на рис. 14.15. Примечание Внимательному читателю предлагается самостоятельно ответить на вопрос: почему при таком расчете корреляционной функции ее значение R неравно как должно быть по определению Часть III. Численные методы ИГР Корреляционная функция (листинги. Некоторые примеры Приведем два характерных статистических примера, которые легко решаются с помощью Mathcad. |