Кирьянов. Самоучитель MathCad 11. Кирьянов д в
Скачать 10.75 Mb.
|
14.4.1. Интервальная оценка дисперсии Требуется определить числовой интервал внутри которого будет лежать с вероятностью дисперсия нормальной случайной величины, исходя из объема выборки в N чисел. Эта задача решается в статистике с помощью (листинг Листинг 14.21. Интервальное оценивание дисперсии х :- ( N , 0 , 1) a 0.2 5 fa — , N - 1 , N - 1 1 ) • S t d e v ( x ) 1 = 0 . 7 5 = 6 0 . 5 3 1 ) • S t d e v ( x ) 0 . 6 6 2 Глава 14. Математическая статистика Указанный интервал называется доверительным интервалом Обратите внимание на использование при решении данной задачи функции с прописной буквы) для расчета выборочного стандартного отклонения. В статистике часто встречаются выражения, которые более удобно записывать через функции в такой нормировке, именно для этого они и появились в. Проверка статистических гипотез В статистике рассматривается огромное число задач, связанных с проверкой тех или иных гипотез н. Разберем пример простой гипотезы. Пусть имеется выборка N чисел с нормальным законом распределения и неизвестными дисперсией и математическим ожиданием. Требуется принять или отвергнуть гипотезу но том, что математическое ожидание закона распределения равно некоторому числу Задачи проверки гипотез требуют задания уровня критерия проверки гипотезы а, который описывает вероятность ошибочного отклонения истинной н. Если взять а очень малым, то гипотеза, даже если она ложная, будет почти всегда приниматься если, напротив, взять а близким кто критерий будет очень строгими гипотеза, даже верная, скорее всего, будет отклонена. В нашем случае гипотеза состоит в том, что а альтернатива — что Оценка математического ожидания, как следует из курса классической статистики, решается с помощью распределения Стьюдента с параметром (этот параметр называется степенью свободы распределения). Для проверки гипотезы (листинг 14.22) рассчитывается (а) — квантиль распределения Стьюдента т, который служит критическим значением для принятия или отклонения гипотезы. Если соответствующее выборочное значение t по модулю меньше т, то гипотеза принимается (считается верной. В противном случае гипотезу следует отвергнуть. Листинг 14.22. Проверка гипотезы о математическом ожидании при неизвестной х := 0 , а := 1 - а = 0 . 9 := 0 . 2 mean (x) - t = - 1 . 8 8 3 S t d e v (x) Часть III. Численные методы 1 . 6 7 Т , 1 J | tj < то В последней строке листинга вычисляется истинность или ложность условия, выражающего решение задачи. Поскольку условие оказалось ложным (равным не 1, а 0), то гипотезу необходимо отвергнуть. На рис. 14.16 показано распределение с степенью свободы вместе с критическими значениями, определяющими соответствующий интервал. Если t (оно тоже показано на графике) попадает в него, то гипотеза принимается если не попадает (как произошло в данном случае) — отвергается. Если увеличить а, ужесточив критерий, то границы интервала будут сужаться, по сравнению с показанными на рисунке. В листинге 14.23 приводится альтернативный способ проверки той же самой гипотезы, связанный с вычислением значения не квантиля, а самого распределения Стьюдента. -4 - 1 D Рис. 1 4 . 1 6 . К задаче проверки статистических гипотез (листинг Листинг Другой вариант проверки гипотезы (продолжение листинга 14.22) pt , N- 1} 0 . 0 3 3 — < p t ( t , N -а 0 2 Глава 14. Математическая статистика Мы разобрали только два характерных примера статистических вычислений. Однако с помощью Mathcad легко решаются самые разнообразные задачи математической статистики. П р им е чан и е Большое количество задач разобрано в Ресурсах в рубрике Statistics (Статистика) справочной системы Mathcad ГЛАВА Обработка данных Когда Вы имеете дело с выборкой экспериментальных данных, то они, чаще всего, представляются в виде массива, состоящего из пар чисел Поэтому возникает задача аппроксимации дискретной зависимости непрерывной функцией f(x). Функция f(x), в зависимости от специфики задачи, может отвечать различным требованиям) должна проходить через точки те В этом случае (см. разд. 15.1) говорят об интерполяции данных функцией f (х) во внутренних точках между или экстраполяции за пределами интервала, содержащего всех) должна некоторым образом (например в виде определенной аналитической зависимости) приближать необязательно проходя через точки Такова постановка задачи регрессии (см. разд. 15.2), которую во многих случаях также можно назвать сглаживанием данных (х) должна приближать экспериментальную зависимость учитывая к тому же, что данные получены с некоторой погрешностью, выражающей шумовую компоненту измерений. При этом функция f (х), с помощью того или иного алгоритма, уменьшает погрешность, присутствующую в данных Такого типа задачи называют задачами фильтрации (см. разд. 15.3). Сглаживание частный случай ции. Различные виды построения аппроксимирующей зависимости f (х) иллюстрирует рис. 15.1. На нем исходные данные обозначены кружками, интерполяция отрезками прямых линий — пунктиром, линейная регрессия — наклонной прямой линией, а фильтрация — жирной гладкой кривой. Эти зависимости приведены в качестве примера и отражают лишь малую часть возможностей Mathcad по обработке данных. Вообще говоря, в Mathcad имеется целый арсенал встроенных функций, позволяющий осуществлять самую различную регрессию, интерполяцию-экстраполяцию и сглаживание данных Часть III. Численные методы 0.2 0.4 0.45 15.1. Разные задачи аппроксимации данных Как в целях подавления шума, таки для решения других проблем обработки данных, широко применяются различные интегральные преобразования. Они ставят в соответствие всей совокупности данных ух некоторую функцию другой координаты (или координат Примерами интегральных преобразований являются преобразование Фурье (см. разд. 15.4.1) и вейвлетное преобразование (см. разд. 15.4.2). Напомним, что некоторые преобразования, например Фурье и Лапласа, можно осуществить в режиме символьных вычислений (см. гл. 5). Каждое из интегральных преобразований эффективно для решения своего круга задач анализа данных. Интерполяция Для построения интерполяции-экстраполяции в имеются несколько встроенных функций, позволяющих "соединить" точки выборки данных кривой разной степени гладкости. По определению интерполяция означает построение функции АХ, аппроксимирующей зависимость ух) в промежуточных точках (между Поэтому интерполяцию еще по-другому называют аппроксимацией В точках значения интерполяционной функции должны совпадать с исходными данными, те Примечание Везде в этом разделе при рассказе о различных типах интерполяции будем использовать вместо обозначения АХ) другое имя ее аргумента A ( t ) , чтобы не путать вектор данных хи скалярную переменную t. 15.1.1. Линейная интерполяция Самый простой вид интерполяции — линейная, которая представляет искомую зависимость АХ В виде ломаной линии. Интерполирующая функция состоит из отрезков прямых, соединяющих точки (рис Глава 15. Обработка данных 379 Рис. Линейная интерполяция (листинг Для построения линейной интерполяции служит встроенная функция t e r p (ЛИСТИНГ 15.1). t) — функция, аппроксимирующая данные векторов хи у кусочно-линейной зависимостью; • х — вектор действительных данных аргумента; • у вектор действительных данных значений того же размера — значение аргумента, при котором вычисляется интерполирующая функция. Внимание! Элементы векторах должны быть определены в порядке возрастания, т. е. Листинг 15.1. Линейная интерполяциях : = { 0 1 2 3 4 у ( 4 2 . 4 3 4 . 3 3 . 6 5 . Ау Как видно из листинга, чтобы осуществить линейную интерполяцию, надо выполнить следующие действия. Введите векторы данных хи у (первые две строки листинга. Определите функцию t ) . Часть ill. Численные методы. Вычислите значения этой функции в требуемых точках, например =3.52 или или постройте ее график, как показано на рис. 15.2. Примечание Обратите внимание, что функция A ( t ) на графике имеет аргумента не х. Это означает, что функция A ( t ) вычисляется не только при значениях аргумента (те. всеми точках, а при гораздо большем числе аргументов винтер- вале что автоматически обеспечивает Просто в данном случае эти различия незаметны, т. к. при обычном построении графика функции А(х) от векторного аргументах (рис. 15.3) Mathcad, умолчанию, соединяет точки графика прямыми линиями (те. скрытым образом осуществляет их линейную интерполяцию). Рис. 15.3. Обычное построение графика функции от векторной переменной х (листинг 15.1) 15.1.2. Кубическая сплайн-интерполяция В большинстве практических приложений желательно соединить экспериментальные точки не ломаной линией, а гладкой кривой. Лучше всего для этих целей подходит интерполяция кубическими сплайнами, те. отрезками кубических парабол (рис. О t) — функция, аппроксимирующая данные векторов хи у кубическими сплайнами; • з — вектор вторых производных, созданный одной из сопутствующих ФУНКЦИЙ cspline, pspline ИЛИ • х — вектор действительных данных аргумента, элементы которого расположены в порядке возрастания Глава 15. Обработка данных 381 у — вектор действительных данных значений того же размера — значение аргумента, при котором вычисляется интерполирующая функция 15.4. Сплайн-интерполяция см. листинг 15.2) Сплайн-интерполяция в Mathcad реализована чуть сложнее линейной. Перед применением функции interp необходимо предварительно определить первый из ее аргументов — векторную переменную s. Делается это при помощи одной из трех встроенных функций тех же аргументов (х,у). D — вектор значений коэффициентов линейного сплайна — вектор значений коэффициентов квадратичного сплайна вектор значений коэффициентов кубического сплайна; • х,у — векторы данных. Выбор конкретной функции сплайновых коэффициентов влияет на интерполяцию вблизи конечных точек интервала. Пример сплайн-интерполяции приведен в листинге Листинг 15.2. Кубическая сплайн-интерполяция { Ох, у) А i n t e r p ( s , х , у , 3.6 5.2 5.9 Часть III. Численные методы Смысл сплайн-интерполяции заключается в том, что в промежутках между точками осуществляется аппроксимация в виде зависимости А = • • t+d. Коэффициенты a,b,c,d рассчитываются независимо для каждого промежутка, исходя из значений в соседних точках. Этот процесс скрыт от пользователя, поскольку смысл задачи интерполяции состоит в выдаче значения A(t) в любой точке t (рис. 15.4). 6 5 4 3 - - \ \ 0 (гс х 15.5. Сплайн-интерполяция с выбором коэффициентов линейного сплайна Рис. 15.6. Ошибочное построение графика сплайн-интерполяции (см. листинг Чтобы подчеркнуть различия, соответствующие разным вспомогательным функциям покажем результат действия Глава 15. Обработка данных га 15.2 при замене функции в предпоследней строке на линейную (рис. 15.5). Как видно, выбор вспомогательных функций существенно влияет на поведение A(t) вблизи граничных точек рассматриваемого интервала и особенно разительно меняет результат экстраполяции данных за его пределами. В заключение остановимся на уже упоминавшейся в предыдущем разделе распространенной ошибке при построении графиков функции 15.3). Если на графике, например являющемся продолжением листинга 15.2, задать построение функции АХ) вместо A(t), то будет получено просто соединение исходных точек ломаной (рис. 15.6). Так происходит потому, что в промежутках между точками вычисления интерполирующей функции не производятся. Полиномиальная сплайн-интерполяция Более сложный тип интерполяции — так называемая интерполяция нами. В отличие от обычной сплайн-интерполяции (см. разд. 15.1.2), сшивка элементарных В-сплайнов производится не в точках а в других точках координаты которых предлагается ввести пользователю. Сплайны могут быть полиномами 1, 2 или з степени (линейные, квадратичные или кубические. Применяется интерполяция В-сплайнами точно также, как и обычная сплайн-интерполяция, различие состоит только в определении вспомогательной функции коэффициентов сплайна — функция, аппроксимирующая данные векторов хи ус помощью В-сплайнов; — вектор значений коэффициентов В-сплайна; • — вектор вторых производных, созданный функцией • х — вектор действительных данных аргумента, элементы которого расположены в порядке возрастания; • у — вектор действительных данных значений того же размера — значение аргумента, при котором вычисляется интерполирующая функция вектор значений аргумента, в которых производится сшивка В-сплайнов; • п — порядок полиномов сплайновой интерполяции 2 з). Примечание Размерность вектора и должна быть на 1, 2 ИЛИ 3 меньше размерности векторов х у. Первый элемент вектора должен быть меньше ИЛИ равен первому элементу векторах, а последний элемент ц — больше или равен последнему элементу х Часть III. Численные методы Интерполяция В-сплайнами иллюстрируется листингом 15.3 ирис Листинг Интерполяция В-сплайнами х := 0 туи . 5 2 . 2 3 . 3 4 . 1 5 . 5 7 s := b s p l i n e ( х , у , и , 2 Ах г 15.7. В-сплайн-интерполяция (листинг 15.3) 15.1.4. Экстраполяция функцией предсказания Все рассмотренные выше (см. разд функции осуществляли экстраполяцию данных за пределами их интервала с помощью соответствующей зависимости, основанной на анализе расположения нескольких исходных точек на границах интервала. В Mathcad имеется более развитый инструмент экстраполяции, который учитывает распределение данных вдоль всего интервала. В функцию predict встроен линейный алгоритм предсказания поведения функции, основанный на анализе, в том числе осцил- — функция предсказания вектора, экстраполирующего выборку данных; • у — вектор действительных значений, взятых через равные промежутки значений аргумента Глава 15. Обработка данных — количество последовательных элементов вектора у, согласно которым строится экстраполяция; • п — количество элементов вектора предсказаний. Пример использования функции предсказания на примере экстраполяции осциллирующих данных сменяющейся амплитудой приведен в листинге. Полученный график экстраполяции, наряду с самой функцией, показан на рис. 15.8. Аргументы и принцип действия функции predict отличаются от рассмотренных выше встроенных функций интерполяции- экстраполяции. Значений аргумента для данных не требуется, поскольку по определению функция действует на данные, идущие друг за другом с равномерным шагом. Обратите внимание, что результат функции predict вставляется "в хвост" исходных данных Листинг 15.4. Экстраполяция при помощи функции предсказания : = 1 0 0 j :=0 .. к i — 10 m:=50 А := predict (у , m , n) n:=150 15.8. Экстраполяция при помощи функции предсказания (листинг 15.4) Часть III. Численные методы Как видно из рис. 15.9, функция предсказания может быть полезна при экстраполяции данных на небольшие расстояния. Вдали от исходных данных результат часто бывает неудовлетворительным. Кроме того, функция pre- dict хорошо работает в задачах анализа подробных данных с четко прослеживающейся закономерностью (типа рис. 15.8), в основном осциллирующего характера. Если данных мало, то предсказание может оказаться бесполезным. В листинге приведена экстраполяция небольшой выборки данных (из примеров, рассмотренных в предыдущих разделах. Соответствующий результат показан на рис. 15.9 для различных крайних точек массива исходных данных, для которых строится экстраполяция Листинг 15.5. Экстраполяция при помощи функции предсказания у ( 4 2 . 4 3 k := rows (у 1 га:=5 А := p r e d i c t { у , m , п . 3 3 . 6 5.2 5 . 9 0 0 XXX 3 i г . / + 20 15.9. Работа функции предсказания в случае малого количества данных 15.5) 15.1.5. Многомерная интерполяция Двумерная сплайн-интерполяция приводит к построению поверхности z(x,y), проходящей через массив точек, описывающий сетку на координат Глава 15. Обработка данных 387 ной плоскости (х,у). Поверхность создается участками двумерных кубических сплайнов, являющихся функциями (х,у) и имеющих непрерывные первые и вторые производные по обеим координатам. Многомерная интерполяция строится с помощью тех же встроенных функций, что и одномерная (см. разд. 15.1.2), но имеет в качестве аргументов не векторы, а соответствующие матрицы. Существует одно важное ограничение, связанное с возможностью интерполяции только квадратных NXN массивов данных — скалярная функция данные выборки двумерного поля по координатам хи у кубическими сплайнами вектор вторых производных, созданный одной из сопутствующих cspline, pspline ИЛИ • х — матрица размерности NX2, определяющая диагональ сетки значений аргумента (элементы обоих столбцов соответствуют меткам хи у и расположены в порядке возрастания — матрица действительных данных размерности NXN; • v вектор из двух элементов, содержащий значения аргументов и у, для которых вычисляется интерполяция. Примечание Вспомогательные функции построения вторых производных имеют те же матричные аргументы, что и l s p l i n e (X, c s p l i n e ( X , Y ) Пример исходных данных приведен на рис. 15.10 в виде графика линий уровня, программная реализация двумерной интерполяции показана в листинге, а ее результат — на рис. Листинг Двумерная интерполяциях У := 1 1 1.3 1.3 1.5 1 2 3.3 3 2 0 3 5 3.7 2.5 1 . 1 2 . 1 1.7 2 . 1 2 . 8 1.2 1 . 5 2 2 . 9 4 i n t e r p ( S , X , V ) = 1 . 6 3 6 Часть III. Численные методы := 0 .. к := S. X. Y j := 0 .. к i — к 15.10. Исходное двумерное поле данных (листинг Рис. 15.11. Результат двумерной интерполяции (листинг 15.6) 15.2. Регрессия Задачи математической рефессии имеют смысл приближения выборки данных некоторой функцией f ( x ) , определенным образом минимизи- Глава 15. Обработка данных совокупность ошибок | f |. Регрессия сводится к подбору неизвестных коэффициентов, определяющих аналитическую зависимость f (x). В силу производимого действия большинство задач регрессии являются частным случаем более общей проблемы сглаживания данных. Как правило, регрессия очень эффективна, когда заранее известен (или, по крайней мере, хорошо угадывается) закон распределения данных. Линейная регрессия Самый простой и наиболее часто используемый вид регрессии — линейная. Приближение данных осуществляется линейной функцией На координатной плоскости (х,у) линейная функция, как известно, представляется прямой линией (рис. 15.12). Еще линейную регрессию часто называют методом наименьших квадратов поскольку коэффициенты аи вычисляются из условия минимизации суммы квадратов ошибок Примечание Чаще всего такое же условие ставится ив других задачах регрессии, те. приближения массива данных другими зависимостями ух. Исключение рассмотрено в листинге |