Методы решения некорректно поставленных задач. Методы_решения_некорректно_поставленных_задач_-_StudentLib. Рассмотрим систему линейных алгебраических уравнений
Скачать 270.5 Kb.
|
3.МЕТОД РЕГУЛЯРИЗАЦИИ РЕШЕНИЯ ОПЕРАТОРНЫХ УРАВНЕНИЙ В главе предыдущем разделе рассмотрены случаи, когда класс возможных решений уравнения (2; 0,1) является компактом. Однако для ряда прикладных задач характерна ситуация, когда этот класс F не является компактом, и, кроме того, изменения правой части уравнения Аz= u, (3; 0,1) связанные с ее приближенным характером, могут выводить за пределы множества AF — образа множества F при отображении его с помощью оператора А. Такие задачи называются существенно некорректными. Был разработан новый подход к решению некорректно поставленных задач, позволяющий строить приближенные решения уравнения (3; 0,1), устойчивые к малым изменениям исходных данных, для существенно некорректных задач. В основе этого подхода лежит фундаментальное понятие регуляризирующего оператора (P.O.) . Для упрощения изложения в настоящей главе мы будем полагать, что в уравнении (3; 0,1) приближенной может быть лишь правая часть и, а оператор А известен точно. 3.1. Понятие регуляризирующего оператора 3.1.1. Пусть оператор А в уравнении (3; 0,1) таков, что обратный ему оператор A-1 не является непрерывным на множестве AF и множество возможных решений F не является компактом. Пусть zT есть решение уравнения Az =uT, т. е. AzT=uT. Часто вместо uT мы имеем некоторый элемент u и известное число > 0 такие, что U(u,uT)<=, т. е. вместо точных исходных данных (uT,А) мы имеем приближенные исходные данные (u, А) и оценку их погрешности . Задача состоит в том, чтобы по известным исходным данным (u, A, ) найти приближение z к элементу zt, обладающее свойством устойчивости к малым изменениям u. Очевидно, что в качестве приближенного решения z уравнения (3; 0,1) нельзя брать точное решение этого уравнения с приближенной правой частью и= u, т. е. элемент zT, определяемый по формуле z=A-1 u так как оно существует не для всякого элемента uU ине обладает свойством устойчивости к малым изменениям правой части и. Числовой параметр характеризует погрешность правой части уравнения (3;0,1). Поэтому представляется естественным определить z с помощью оператора, зависящего от параметра, значения которого надо брать согласованными с погрешностью исходных данных u . Эта согласованность должна быть такой, чтобы при 0, т. е. при приближении (в метрике пространства U) правой части u уравнения (3; 0,1) к точному значению uT, приближенное решение z стремилось бы (в метрике пространства F) к искомому точному решению zt уравнения AzT =uT. Пусть элементы zT F и uT U связаны соотношением AzT = uT. Определение 1. Оператор R(и,), действующий из пространства U в пространство F, называется регуля-ризирующим для уравнения Az = и (относительно элемента uT), если он обладает свойствами: 1) существует такое число 1 > 0, что оператор R(u, ) определен для всякого , 0<=<=1, и любого uU такого, что U(u,uT)<=; 2) для всякого > 0 существует 0=0(, u)<=1 такое, что из неравенства U(u,uT)<=<=0; следует неравенство F(z,zT)<=, где z=R(u,). Здесь не предполагается, вообще говоря, однозначность оператора R(u,). Через z обозначается произвольный элемент из множества {R(u,)} значений оператора R(u,). 3.1.2. В ряде случаев целесообразнее пользоваться другим определением регуляризирующего оператора (P.O.). Определение 2. Оператор R(u,), зависящий от параметра и действующий из U в F, называется регуляризирующим для уравнения Az=и (относительно элемента uT), если он обладает свойствами: 1) существуют такие числа 1>0,1>0, что оператор R(u,) определен для всякого , принадлежащего промежутку (0,1), и любого uU, для которого U(u,uT)<=1; 2) существует такой функционал =(u,), определенный на множестве U1{u;(u,uT)<=1} элементов иU, что для любого > 0 найдется число ()<=1 такое, что если u1U и U(u1,uT)<=<=(), то F(z,zT)<= , где z=R(u1,(u1,)). В этом определении не предполагается однозначность оператора R(u1,(u1,)). Следует отметить, что при = получаем определение 1 . 3.1.3. Если U(u,uT)<=, то известно, что в качестве приближенного решения уравнения (3; 0,1) с приближенно известной правой частью u можно брать элемент z=R(,), полученный с помощью регуляризирующего оператора R(u,), где =(u)=1() согласовано с погрешностью исходных данных u. Это решение называется регуляризованным решением уравнения (3; 0,1). Числовой параметр называется параметром регуляризации. Очевидно, что всякий регуляризирующий оператор вместе с выбором параметра регуляризации , согласованного с погрешностью исходных данных u , =(u), определяет устойчивый к малым изменениям правой части и метод построения приближенных решений уравнения (3;0,1). Если известно, что U(u,uT)<=, то согласно определению регуляризирующего оператора можно так выбрать значение параметра регуляризации =(u) , что при 0 регуляризованное решение R(u,(u)) стремится (в метрике F) к искомому точному решению zT, т. е. F(zT,z(u)). Это и оправдывает предложение брать в качестве приближенного решения уравнения (3; 0,1) регуляризованное решение. Таким образом, задача нахождения приближенного решения уравнения (3; 0,1), устойчивого к малым изменениям правой части, сводится: а) к нахождению регуляризирующих операторов; б) к определению параметра регуляризации по дополнительной информации о задаче, например, по величине погрешности, с которой задается правая часть u. Описанный метод построения приближенных решений называется методом регуляризации. 3.2. О решении вырожденных и плохо обусловленных систем линейных алгебраических уравнений 3.2.1. Известно, с какими трудностями связано решение так называемых плохо обусловленных систем линейных алгебраических уравнений: малым изменениям правых частей таких систем могут отвечать большие (выходящие за допустимые пределы) изменения решения. Рассмотрим систему уравнений Аz=u, (3; 2,1) где А — матрица с элементами aij, А ={aij}, z — искомый вектор с координатами zj , z={zj}, и — известный вектор с координатами иi ,u= {ui}, i, j =1, 2, ..., п.Система (3; 2,1) называется вырожденной, если определитель системы равен нулю, detA = 0. В этом случае матрица А имеет равные нулю собственные значения. У плохо обусловленных систем такого вида матрица А имеет близкие к нулю собственные значения. Если вычисления производятся с конечной точностью, то в ряде случаев не представляется возможным установить, является ли заданная система уравнений вырожденной или плохо обусловленной. Таким образом, плохо обусловленные и вырожденные системы могут быть неразличимыми в рамках заданной точности. Очевидно, такая ситуация имеет место в случаях, когда матрица А имеет достаточно близкие к нулю собственные значения. В практических задачах часто правая часть и и элементы матрицы А, т. е. коэффициенты системы (3; 2,1), известны приближенно. В этих случаях вместо системы (3;2,1) мы имеем дело с некоторой другой системой Az=и такой, что ||A-A||<=h, ||u-u||<=, где смысл норм обычно определяется характером задачи. Имея вместо матрицы А матрицу A, мы тем более не можем высказать определенного суждения о вырожденности или невырожденности системы (3; 2,1). В этих случаях о точной системе Аz=u, решение которой надо определить, нам известно лишь то, что для матрицы А и правой части и выполняются неравенства ||A-A||<=h, ||u-u||<=. Но систем с такими исходными данными (А, и) бесконечно много, и в рамках известного нам уровня погрешности они неразличимы. Поскольку вместо точной системы (3; 2,1) мы имеем приближенную систему Аz= и, то речь может идти лишь о нахождении приближенного решения. Но приближенная система Аz=и может быть неразрешимой. Возникает вопрос: что надо понимать под приближенным решением системы (3; 2,1) в описанной ситуации? Среди «возможных точных систем» могут быть и вырожденные. Если они разрешимы, то имеют бесконечно много решений. О приближенном нахождении какого из них должна идти речь? Таким образом, в большом числе случаев мы должны рассматривать целый класс неразличимых между собой (в рамках заданного уровня погрешности) систем уравнений, среди которых могут быть и вырожденные, и неразрешимые. Методы построения приближенных решений систем этого класса должны быть одними и теми же, общими. Эти решения должны быть устойчивыми к малым изменениям исходных данных (3; 2,1). В основе построения таких методов лежит идея «отбора». Отбор можно осуществлять с помощью специальных, заранее задаваемых функционалов [ z ] , входящих в постановку задачи. Неотрицательный функционал [ z ] , определенный на всюду плотном в F подмножестве F1 множества F, называется стабилизирующим функционалом, если: а) элемент zT принадлежит его области определения; б) для всякого числа d>0 множество F1,d элементов z из F1 , для которых [ z ]<=d, компактно на F. 3.2.2. Итак, рассмотрим произвольную систему линейных алгебраических уравнений (короче — СЛАУ) Аz =u, (3; 2,2) в которой z и u—векторы, z=(z1, z2, ...,zn)Rn, и=(u1,u2, ...,un)Rm, А—матрица с элементами aij, А = {aij}, где j =1, 2, ..., n; i= 1, 2, ..., т, и число п не обязано быть равным числу т. Эта система может быть однозначно разрешимой, вырожденной (и иметь бесконечно много решений) и неразрешимой. Псевдорешением системы (3; 2,2) называют вектор z, минимизирующий невязку || Az – u || на всем пространстве Rn. Система (3; 2,2) может иметь не одно псевдорешение. Пусть FA есть совокупность всех ее псевдорешений и z1 — некоторый фиксированный вектор из Rn, определяемый обычно постановкой задачи. Нормальным относительно вектора z1 решением системы (3;2,2) будем называть псевдорешение z0 с минимальной нормой || z – z1 ||, т. е. такое, что || z0 – z1 || = Здесь . В дальнейшем для простоты записи будем считать z1= 0 и нормальное относительно вектора z1=0 решение называть просто нормальным решением. Для любой системы вида (3; 2,2) нормальное решение существует и единственно. Замечание 1. Нормальное решение z° системы (3;2,2) можно определить также как псевдорешение, минимизирующее заданную положительно определенную квадратичную форму относительно координат вектора z—z1. Все излагаемые ниже результаты остаются при этом справедливыми. Замечание 2. Пусть ранг матрицы А вырожденной системы (3; 2,1) равен r < n и zr+1,zr+2, … , zn— базис линейного пространства NA, состоящего из элементов z, для которых Аz=0, NA = {z; Аz= 0}. Решение z° системы (3; 2,1), удовлетворяющее n—r условиям ортогональности (z0 – z1, zS)= 0, S= r + 1, r + 2, .. ,n, (3; 2,3) определяется однозначно и совпадает с нормальным решением. 3.2.3. Нетрудно видеть, что задача нахождения нормального решения системы (3; 2,2) является некорректно поставленной. В самом деле, пусть А — симметричная матрица. Если она невырожденная, то ортогональным преобразованием z = Vz*, u = Vu* ее можно привести к диагональному виду и преобразованная система будет иметь вид izi*=ui* , i= 1, 2,. .., п, где i — собственные значения матрицы А. Если симметричная матрица А — невырожденная и имеет ранг r, то n – r ее собственных значений равны нулю. Пусть i0 для i=1, 2, ..., r; и i=0 для i=r+1,r+2, …, n. Полагаем, что система (3; 2,2) разрешима. При этом ui*= 0 для i =r + 1, ..., n. Пусть «исходные данные» системы (А и и) заданы с погрешностью, т. е. вместо А и и заданы их приближения А и u: || A – A ||<=h, ||u – u||<= . При этом (3;2,4) Пусть i — собственные значения матрицы А. Известно, что они непрерывно зависят от А в норме (3; 2,4). Следовательно, собственные значения r+1 , r+2, …,nмогут быть сколь угодно малыми при достаточно малом h. Если они не равны нулю, то zi*= . Таким образом, найдутся возмущения системы в пределах любой достаточно малой погрешности А и и, для которых некоторые zi* будут принимать любые наперед заданные значения. Это означает, что задача нахождения нормального решения системы (3; 2,2) является неустойчивой. Ниже дается описание метода нахождения нормального решения системы (3; 2,2), устойчивого к малым (в норме (3; 2,4)) возмущениям правой части и , основанного на методе регуляризации. 3.3. Метод регуляризации нахождения нормального решения 3.3.1. Пусть z° есть нормальное решение системы Аz = и. (3; 3,1) Для простоты будем полагать, что приближенной может быть лишь правая часть, а оператор (матрица) А — точный. Итак, пусть вместо и мы имеем вектор и, || и — и || <=; т. е. вместо системы (3;3,1) имеем систему (3; 3,2) Аz = u. Требуется найти приближение z к нормальному решению системы (3;3,1), т. е. к вектору z° такое, что z z° при 0. Отметим, что векторы u и u (один из них или оба) могут не удовлетворять классическому условию разрешимости. Поскольку система (3; 3,1) может быть неразрешимой, то inf ||Az-u|| = >=0, где inf берется по всем векторам z Rn. Естественно искать приближения z в классе Q векторов z, сопоставимых по точности с исходными данными, т. е. таких, что || Az – u ||<=+. Но поскольку вместо вектора u мы имеем вектор u, то мы можем найти лишь =inf || Az – u ||. z Rn Отметим, что из очевидных неравенств ||Az – u ||<=||Az – u || + || u – u || , ||Az – u ||<= || Az – u || + ||u – u || следуют оценки <=+, <=+, приводящие к неравенству | — | <=. Поэтому будем искать приближение z к нормальному решению z° в классе Q векторов z, для которых || Аz — и || <= +2. Отметим, что если имеется информация о разрешимости системы (3;3,1), то = 0 и в качестве класса Q можно брать класс векторов z, для которых || Аz — и|| <= . Класс Q есть класс формально возможных приближенных решений. Но нельзя в качестве z брать произвольный вектор из класса Q, так как такое «приближение» будет неустойчивым к малым изменениям правой части уравнения (3;3,2). Необходим принцип отбора. Он естественным образом вытекает из постановки задачи. В самом деле согласно определению нормального решения искомое решение z° должно быть псевдорешением с минимальной нормой. Поэтому в качестве приближения к z° естественно брать вектор z из Q, минимизирующий функционал [ z ] = ||z||2 на множестве Q . Таким образом, задача сводится к минимизации функционала [ z ] = ||z||2 на множестве Q векторов z, для которых выполняется условие || Аz — u || <= +2. 3.3.2. Пусть z — вектор из Q, на котором функционал ||z||2 достигает минимума на множестве Q. Его можно рассматривать как результат применения к правой части u уравнения (3; 3,2) некоторого оператора R1(u,), зависящего от параметра . Справедлива Теорема 1. Оператор R1(u,) обладает следующими свойствами: 1) он определен для всякого uRm и любого > 0; 2) при 0 z== R1(u,) стремится к нормальному решению z° уравнения Аz=u, т. е. он является регуляризирующим для уравнения Аz=u . 3.3.3. Пусть z — вектор, на котором функционал [ z ] = ||z||2 достигает минимума на множестве Q. Легко видеть из наглядных геометрических представлений, что вектор z лежит на границе множества Q, т.е. ||Az - u ||= +2=1. Это следует непосредственно также из того, что функционал [ z ] = ||z||2 является сстабилизирующим и квазимонотонным. Стабилизирующий функционал [ z ] называется квазимонотонным , если каков бы ни был элемент z из F1 , не принадлежащий множеству M0 , в любой его окрестности найдется элемент z1 из F1, для которого [ z1 ]<[ z ], т.е. если функционал не имеет локальных минимумов на множестве F1\ M0. Задачу нахождения вектора z можно поставить так: среди векторов z, удовлетворяющих условию ||Az – u ||= +2, найти вектор z с минимальной нормой, т. е. минимизирующий функционал [ z ]=||z||2. Последнюю задачу можно решать методом Лагранжа, т. е. в качестве z брать вектор z, минимизирующий функционал М [z, u] = ||Az - u ||2+||z||2, >0, с параметром , определяемым по невязке, т. е. из условия ||Аz— u||=1. При этом параметр определяется однозначно . 3.3.4. Поскольку М [z, u] — квадратичный функционал, то для любых uRm и > 0 существует лишь один минимизирующий его вектор z. В самом деле, допустим, что существуют два вектора z и z, минимизирующие его. Рассмотрим векторы z, расположенные на прямой (пространства Rn), соединяющей z и z: z = z + (z - z). Функционал М [z, u] на элементах этой прямой есть неотрицательная квадратичная функция от . Следовательно, она не может достигать наименьшего значения при двух различных значениях : = 0 (z = z) и =1 (z = z). Компоненты zj вектора z являются решением системы линейных алгебраических уравнений получающихся из условий минимума функционала М [z, u]: Здесь Компоненты zj могут быть определены и с помощью какого-нибудь другого алгоритма минимизации функционала М [z, u]. Вектор z можно рассматривать как результат применения к u некоторого оператора z=R(u, ), зависящего от параметра . Покажем, что оператор R0(u, ) является регуляризирующим для системы (3;3,1), т. е. обладает свойствами 1) и 2) определения 2 (см. 3.1.2.). В п. 3.3.2. было сказано, что он определен для всяких uRm и > О и, следовательно, обладает свойством 1). Теперь покажем справедливость свойства 2), т. е. существование таких функций = , что векторы z = R0(u, ) сходятся к нормальному решению z° системы (3; 3,1) при 0. Это непосредственно следует из приводимой ниже теоремы 2. Теорема 2( Тихонова). Пусть z° есть нормальное решение системы Az= u и вместо вектора u мы имеем вектор u такой, что ||u—u||<=. Пусть, далее, и — какие-либо непрерывные на [0, 2] и положительные на (02] функции, монотонно стремящиеся к нулю при 0 и такие, что Тогда для любой .положительной на (0, ] функции , удовлетворяющей условиям векторы z = R0(u, ) сходятся к нормальному решению z0 системы Az = u при 0, т. е. Примечание. Доказательства теорем в данном разделе опущены, т.к. основной теоретической частью работы является раздел «Метод Подбора. Квазирешения». Метод Тихонова описан из-за использования его в численном эксперименте. ЗАКЛЮЧЕНИЕ Для реализации численного примера был выбран метод Тихонова решения плохо обусловленных СЛАУ. В качестве исходной была взята СЛАУ Az=u, имеющая в матричной записи вид: Определитель матрицы коэффициентов этой системы близок к нулю – он равен 0.000125. Попробуем решить эту систему с помощью обратной матрицы: z=A-1u Получим z1=316 z2=-990 z3=832 Теперь предположим, что правая часть нам известна приближенно, с погрешностью 0.1 Изменим, к примеру, третий элемент вектора-столбца с 1 на 1.1 : Попробуем решить новую систему также с помощью обратного оператора. Мы получаем другой результат: z1=348 z2=-1090 z3=916. Мы видим, что малому изменению правой части данной системы отвечают весьма значительные изменения решения. Очевидно, эта система – плохо обусловленная, и здесь не может идти речи о нахождении решения близкого к точному с помощью обратного оператора. Будем искать решение методом Тихонова. В теоретической части было показано, что целесообразно использовать регуляризирующий оператор следующего вида: (E + ATA)z=ATu , где E – единичная матрица, zприближенное нормальное решение, AT – транспонированная исходная матрица, параметр регуляризации, u -- правая часть, заданная неточно. Эту задачу можно решать стандартными методами, задав предварительно функцию удовлетворяющую условиям теоремы Тихонова. В моем примере это функция =/4Далее будем решать регуляризованную задачу с точностью .001 ,последовательно изменяя значения . В качестве контр-примера можно подставить в программу любую функцию , не удовлетворяющую условиям теоремы Тихонова. Любая положительная функция монотонно возрастающая, не обладающая свойством 0 при 0, не будет минимизировать невязку. Текст программы приведен в приложении 1. Полная распечатка результатов приведена в приложении 2. Здесь же представлены окончательные значения на выходе из программы. Приближение к нормальному решению Z(1)= 3.47834819174013E+0002 Z(2)=-1.08948394975175E+0003 Z(3)= 9.15566443137791E+0002 Значение правой части при подстановке прибл. решения U1(1)= 9.99997717012495E-0001 U1(2)= 1.00000741970775E+0000 U1(3)= 1.09948402394883E+0000 Значение параметра регуляризации: 2.61934474110603E-0010 |