Аппроксимация данных методом наименьших квадратов - Иванов. Аппроксимация данных методом наименьших квадратов
![]()
|
Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования РЕФЕРАТ по дисциплине «Научно-исследовательский семинар» на тему: «Аппроксимация данных методом наименьших квадратов» Студент гр. 2801б………………...……… /Иванов С.О./ Преподаватель (доц.)..………………………/Гришин С.Н./ Оценка:……………………. Дата: …………………….. Подписи: ………………….. Ханты-Мансийск 2022 Оглавление Аппроксимация. Постановка задачи 2 Метод наименьших квадратов 6 Список литературы 11 Аппроксимация. Постановка задачиАппроксимация – построение приближённой функции, наиболее близко проходящей около данных точек или около данной непрерывной функции. Такая задача возникает, когда в исходных данных существует погрешность или желательно упростить сложную математическую зависимость. В практике известны 3 способа задания функции: аналитический, графический, табличный. В инженерной практике наиболее распространенным является случай, когда вид связи между параметрами X и Y неизвестен, т.е. невозможно записать эту связь в виде некоторой зависимости y = f(x). Как правило, даже при известной зависимости y = f(x), она настолько громоздка, что ее использование в практических расчетах затруднительно. Чаще всего эта связь представлена в виде таблицы, т.е. дискретному множеству значений аргумента {xi} поставлено в соответствие множество значений функции {yi}(i = 1, 2, .., п). Эти значения – либо результаты расчетов, либо экспериментальные данные. На практике нам могут понадобиться значения величины y и в других точках, отличных от узлов xi . Часто эти значения можно получить лишь путем сложных расчетов или проведением дорогостоящих экспериментов. Таким образом, необходимо использовать имеющиеся табличные данные для приближенного вычисления искомого параметра y при любом значении (из некоторой области) определяющего параметра х, поскольку точная связь y = f(x) неизвестна. Задачи исследования в большинстве случаев требуют установить определенный вид функциональной зависимости между характеристиками изучаемого явления. Этой цели и служит задача о приближении функции. Т.е. задача о приближении (аппроксимации) функции состоит в том, чтобы данную функцию f(x) приближенно заменить (аппроксимировать) некоторой функцией φ(х), значения которой в заданной области мало отличались от опытных данных – f(x) ≈ φ(х). Методы решения такой задачи относятся к категории численных методов или методов вычислительной математики. Один из способов аппроксимации функций – интерполяция. Он используется в тех случаях, когда основная информация о приближаемой функции дается в виде таблицы ее значений. В результате решения задачи интерполяции линия, соответствующая интерполирующей функции, будет обязательно проходить через все точки исходных данных. В этом случае точки являются узлами интерполяции. При интерполяции от приближения требуется, чтобы оно имело ту же таблицу значений, что и приближаемая функция: φ(хi) = f(xi), i = 0, 1, 2, …, n. Это условие называется условием интерполяции. Функция, удовлетворяющая условиям интерполяции, называется интерполяционной, а точки х0, х1, х2, …, хп - узлами интерполяции. Чаще всего в качестве интерполяционных функций выбирают алгебраические многочлены, так как их значения вычисляются проще всего. Таким образом, решается следующая задача определяется алгебраический многочлен n-й степени: ![]() удовлетворяющий условиям интерполяции: Рп(xi) = f(xi), i = 0, 1, 2, …, n. Алгебраический многочлен, удовлетворяющий этим условиям, называется интерполяционным многочленом. Геометрический смысл интерполяции состоит в том, что графики функции у = f(x) и интерполяционного многочлена у = Рп(x) должны проходить через все табличные точки (xi , уi), i = 0, 1, 2,…, n. На рис. 1, а эти точки выделены. Именно это условие должно обеспечить близость графиков этих функций на рассматриваемом отрезке, чтобы можно было использовать интерполяционный многочлен Pn(x) в качестве приближения для функции f(x). Кроме построения интерполяционных зависимостей, можно использовать более общий вариант приближения функции – построение аппроксимирующих зависимостей на основе различных функциональных взаимосвязей между двумя рассматриваемыми величинами. Приближенная функциональная зависимость, полученная на основании экспериментальных данных, называется аппроксимирующей функцией или эмпирической формулой. ![]() Построение эмпирической формулы состоит из 2 этапов: 1. Подбор общего вида формулы. Иногда он известен из физических соображений. Если характер зависимости неизвестен, то первоначально его выбирают геометрически: экспериментальные точки наносятся на график и примерно угадывается общий вид зависимости путем сравнения полученной кривой с графиками известных функций (многочлена, логарифмической, показательной функций и т.п.). Выбор вида эмпирической зависимости – наиболее сложная часть решения задачи, ибо класс известных аналитических зависимостей необъятен. Практика, однако, показывает, что при выборе аналитической зависимости достаточно ограничиться довольно узким кругом функций: линейные, степенные и показательные. 2. Определение значений параметров аппроксимирующей функции. Метод наименьших квадратов Ранее были рассмотрены две задачи восстановления функциональных зависимостей: первая – вычисление значений трансцендентных функций, вторая – интерполяция. Решения обеих этих задач представлялись в виде алгебраического многочлена ![]() Исходными данными для определения коэффициентов многочлена в первом случае были значения производных разных порядков, заданных в какой-то одной точке, а во втором случае значения самой функции, заданные в нескольких точках. При решении задачи аппроксимации также задаются значения функции в разных точках в виде таблицы xj, yj, j=1,…,m. Однако в этом случае считается, что значения функции содержат значительную долю случайной погрешности. Самих значений задается, как правило, больше, чем при решении задачи интерполяции (рис.1). Поэтому в результате решения задачи аппроксимации полученная функция может не пройти ни через одну из заданных точек. Она должна пройти между ними наилучшим (в каком-либо смысле) образом. Очевидно, что решать задачу интерполяции в случае, рассмотренном на рис.1, не имеет смысла. ![]() Рис. 1. К задаче аппроксимации функций Переходим к математической постановке задачи. Для этого нужно математически определить критерий качества аппроксимации. Один из подходов к формированию критерия качества сводится к построению так называемой функции штрафа. В начале необходимо решить, что является нарушением, которое может вызвать штрафование, и от чего зависит размер штрафа. Очевидно, что в данной задаче нарушением может быть непрохождение кривой, соответствующей аппроксимирующей функции, через одну из заданных точек. Причем, можно считать, что эти нарушения независимы, т.е. величины штрафов, накладываемые за каждое из нарушений в отдельности, не зависят друг от друга. Отсюда следует первый важный вывод, что функцию штрафа следует искать в виде суммы штрафов за каждое отдельное нарушение ![]() Остается найти вид функции локального штрафа. Нужно решить от какого параметра зависит величина штрафа. На этот вопрос ответить легко, поскольку взаимное расположение кривой и точки удобнее всего характеризовать расстоянием по оси ординат, то есть ![]() Теперь перейдем к построению зависимости ![]() При этом необходимо учитывать два условия: - задача, которая получится в результате нашего выбора, должна иметь достаточно простое решение; - полученное решение должно быть разумным с общей точки зрения, (например, кривая не должна проходить вне всей группы точек и т.п.). В связи с этим поиск подходящей функциональной зависимости следует начинать с наиболее простых. Самыми простыми являются зависимости вида y=const, y=x. Первая нас, очевидно, не устраивает. Попытаемся представить функцию локального штрафа в виде ![]() Проанализируем последствия этого выбора. Во–первых, наличие абсолютной величины в зависимости (2) приводит к ее негладкости (разрыву первой производной). Поэтому для минимизации штрафа невозможно применять методы, основанные на поиске стационарных точек ![]() Во вторых, рассмотрим ситуацию, изображенную на рис.2. Одному и тому же значению x=xi=xj соответствуют разные значения yi и yj. Такая ситуация очень часто случается при проведении повторных экспериментов с целью уменьшения влияния случайной составляющей погрешности. В данном случае ![]() ![]() Рис. 2. Расположение кривой между точками Таким образом, функция штрафа не зависит от положения кривой относительно этих двух точек. Мы пришли к некорректной задаче, что дополнительно осложняет ее решение. К тому же, исходя из здравого смысла, в этой ситуации наилучшим может быть только одно решение, когда кривая проходит точно посередине между двумя точками. Значит, выбор ![]() Следующей по уровню сложности функциональной зависимостью является функция вида y=xx=x2. Тогда ![]() Данная функция является гладкой, и, следовательно, этот способ выбора j(j) не препятствует применению методов, связанных с дифференцированием. Теперь найдем решение задачи в ситуации, показанной на рис.2. ![]() Продифференцируем это выражение по P ![]() Отсюда имеем: ![]() В результате этого анализа мы приходим к заключению, что данный выбор удовлетворяет нашим требованиям. Теперь окончательно сформулируем задачу в виде метода наименьших квадратов: минимизировать функцию ![]() При этом значение Ф зависит только от значений коэффициентов многочлена (1), то есть Ф=Ф(a0,a1,…,an). Тогда с учетом (1) ![]() Для минимизации этой функции необходимо найти решение системы уравнений ![]() Преобразуем это выражение ![]() Эта система уравнений имеет вид ![]() т. е. решение задачи методом наименьших квадратов сводится к решению системы линейных алгебраических уравнений. Если число различных точек xj m>n, то матрица системы не вырождена и решение системы существует и единственно. Это означает, что найденное решение доставляет функции Ф именно минимум, поскольку функция, имеющая вид суммы квадратов некоторых величин с положительными коэффициентами не может иметь единственной стационарной точки другого типа максимума. При практическом применении метода наименьших квадратов степень многочлена n не следует выбирать слишком большой, так как это может привести к появлению осциллирующего характера у искомой функции Pn(x). Поскольку, при постановке задачи предполагалось наличие значительной доли случайной погрешности (эта погрешность относится к погрешности исходных данных), то для оценки погрешности результата решения можно применить статистические способы, например, оценку среднеквадратичной погрешности ![]() Список литературыЛекционный материал / Шерыхалина Н.М. Малышева Т.А. Численные методы и компьютерное моделирование. Лабораторный практикум по аппроксимации функций: Учеб.-метод. пособие. СПб.: Университет ИТМО, 2016. 33 с. http://libraryno.ru/3-3-approksimaciya-funkcii-matmodosipkina/ |