Главная страница
Навигация по странице:

  • 3.2. О решении вырожденных и плохо обусловленных систем линейных алгебраических уравнений

  • ||Az – u ||

  • Методы решения некорректно поставленных задач. Методы_решения_некорректно_поставленных_задач_-_StudentLib. Рассмотрим систему линейных алгебраических уравнений


    Скачать 270.5 Kb.
    НазваниеРассмотрим систему линейных алгебраических уравнений
    АнкорМетоды решения некорректно поставленных задач
    Дата13.07.2022
    Размер270.5 Kb.
    Формат файлаdoc
    Имя файлаМетоды_решения_некорректно_поставленных_задач_-_StudentLib.com[1.doc
    ТипДокументы
    #630246
    страница3 из 4
    1   2   3   4

    3.МЕТОД РЕГУЛЯРИЗАЦИИ РЕШЕНИЯ ОПЕРАТОРНЫХ УРАВНЕНИЙ

    В главе предыдущем разделе рассмотрены случаи, когда класс возможных решений уравнения (2; 0,1) является компактом. Однако для ряда прикладных задач характерна ситуация, когда этот класс F не является компактом, и, кроме того, изме­нения правой части уравнения

    Аz= u, (3; 0,1)

    связанные с ее приближенным характером, могут выво­дить за пределы множества AF образа множества F при отображении его с помощью оператора А. Такие задачи называются существенно некорректными. Был разработан новый подход к решению некорректно поставленных задач, позволяющий строить приближенные решения уравнения (3; 0,1), устойчивые к малым изме­нениям исходных данных, для существенно некорректных задач. В основе этого подхода лежит фундаментальное понятие регуляризирующего оператора (P.O.) . Для упрощения изложения в настоящей главе мы будем полагать, что в уравнении (3; 0,1) приближенной может быть лишь пра­вая часть и, а оператор А известен точно.
    3.1. Понятие регуляризирующего оператора

    3.1.1. Пусть оператор А в уравнении (3; 0,1) таков, что обратный ему оператор

    A-1 не является непрерывным на множестве AF и множество возможных решений F не является компактом.

    Пусть zT есть решение уравнения Az =uT, т. е. AzT=uT. Часто вместо uT мы имеем некоторый элемент u и известное число  > 0 такие, что U(u,uT)<=, т. е. вместо точных исходных данных (uT,А) мы имеем при­ближенные исходные данные (u, А) и оценку их погрешности . Задача состоит в том, чтобы по известным исход­ным данным (u, A, ) найти приближение z к элементу zt, обладающее свойством устойчивости к малым измене­ниям u. Очевидно, что в качестве приближенного реше­ния z уравнения (3; 0,1) нельзя брать точное решение этого уравнения с приближенной правой частью и= u, т. е. элемент zT, определяемый по формуле

    z=A-1 u

    так как оно существует не для всякого элемента uU ине обладает свойством устойчивости к малым изменениям правой части и.

    Числовой параметр  характеризует погрешность пра­вой части уравнения (3;0,1). Поэтому представляется естественным определить z с помощью оператора, зави­сящего от параметра, значения которого надо брать согла­сованными с погрешностью  исходных данных u . Эта согласованность должна быть такой, чтобы при 0, т. е. при приближении (в метрике пространства U) правой части u уравнения (3; 0,1) к точному значению uT, при­ближенное решение z стремилось бы (в метрике прост­ранства F) к искомому точному решению zt уравнения AzT =uT.

    Пусть элементы zTF и uT U связаны соотношением AzT = uT.

    Определение 1. Оператор R(и,), действующий из пространства U в пространство F, называется регуля-ризирующим для уравнения Az = и (относительно эле­мента uT), если он обладает свойствами:

    1) существует такое число 1 > 0, что оператор R(u, ) определен для всякого , 0<=<=1, и любого uU такого, что

    U(u,uT)<=;

    2) для всякого  > 0 существует 0=0(, u)<=1 такое, что из неравенства

    U(u,uT)<=<=0;

    следует неравенство

    F(z,zT)<=,

    где

    z=R(u,).

    Здесь не предполагается, вообще говоря, однозначность оператора R(u,). Через z обозначается произвольный элемент из множества {R(u,)} значений оператора R(u,).

    3.1.2. В ряде случаев целесообразнее пользоваться другим определением регуляризирующего оператора (P.O.).

    Определение 2. Оператор R(u,), зависящий от параметра  и действующий из U в F, называется регуляризирующим для уравнения Az (относительно эле­мента uT), если он обладает свойствами:

    1) существуют такие числа 1>0,1>0, что опера­тор R(u,) определен для всякого , принадлежащего промежутку (0,1), и любого uU, для которого

    U(u,uT)<=1;

    2) существует такой функционал =(u,), опреде­ленный на множестве U1{u;(u,uT)<=1} эле­ментов иU, что для любого  > 0 найдется число ()<=1 такое, что если u1U и U(u1,uT)<=<=(), то

    F(z,zT)<= , где

    z=R(u1,(u1,)).

    В этом определении не предполагается однозначность оператора R(u1,(u1,)). Следует отметить, что при =  получаем определение 1 .

    3.1.3. Если U(u,uT)<=, то известно, что в качест­ве приближенного решения уравнения (3; 0,1) с прибли­женно известной правой частью u можно брать элемент z=R(,), полученный с помощью регуляризирующе­го оператора R(u,), где =(u)=1() согласовано с погрешностью исходных данных u. Это решение назы­вается регуляризованным решением уравнения (3; 0,1). Числовой параметр называется параметром регуляриза­ции. Очевидно, что всякий регуляризирующий оператор вместе с выбором параметра регуляризации , согласо­ванного с погрешностью исходных данных u , =(u), определяет устойчивый к малым изменениям правой час­ти и метод построения приближенных решений уравнения (3;0,1). Если известно, что U(u,uT)<=, то согласно определению регуляризирующего оператора можно так выбрать значение параметра регуляризации =(u) ,

    что при 0 регуляризованное решение R(u,(u)) стремится (в метрике F) к искомому точному ре­шению zT, т. е. F(zT,z(u)). Это и оправдывает пред­ложение брать в качестве приближенного решения урав­нения (3; 0,1) регуляризованное решение.

    Таким образом, задача нахождения приближенного решения уравнения (3; 0,1), устойчивого к малым изме­нениям правой части, сводится:

    а) к нахождению регуляризирующих операторов;

    б) к определению параметра регуляризации  по до­полнительной информации о задаче, например, по величи­не погрешности, с которой задается правая часть u.

    Описанный метод построения приближенных решений называется методом регуляризации.
    3.2. О решении вырожденных и плохо обусловленных систем линейных алгебраических уравнений
    3.2.1. Известно, с какими трудностями связано решение так называемых плохо обусловленных систем линей­ных алгебраических уравнений: малым изменениям пра­вых частей таких систем могут отвечать большие (выхо­дящие за допустимые пределы) изменения решения.

    Рассмотрим систему уравнений

    Аz=u, (3; 2,1)

    где А — матрица с элементами aij, А ={aij}, z — иско­мый вектор с координатами zj , z={zj}, и — известный вектор с координатами иi ,u= {ui}, i, j =1, 2, ..., п.Система (3; 2,1) называется вырожденной, если опреде­литель системы равен нулю, detA = 0. В этом случае матрица А имеет равные нулю собственные значения. У плохо обусловленных систем такого вида матрица А имеет близкие к нулю собственные значения.

    Если вычисления производятся с конечной точностью, то в ряде случаев не представляется возможным уста­новить, является ли заданная система уравнений вырож­денной или плохо обусловленной. Таким образом, плохо обусловленные и вырожденные системы могут быть не­различимыми в рамках заданной точности. Очевидно, такая ситуация имеет место в случаях, когда матрица А имеет достаточно близкие к нулю собственные значения.

    В практических задачах часто правая часть и и эле­менты матрицы А, т. е. коэффициенты системы (3; 2,1), известны приближенно. В этих случаях вместо системы (3;2,1) мы имеем дело с некоторой другой системой Az=и такой, что ||A-A||<=h, ||u-u||<=, где смысл норм обычно определяется характером задачи. Имея

    вместо матрицы А матрицу A, мы тем более не можем высказать определенного суждения о вырожденности или невырожденности системы (3; 2,1).

    В этих случаях о точной системе Аz=u, решение которой надо определить, нам известно лишь то, что для матрицы А и правой части и выполняются неравенства

    ||A-A||<=h, ||u-u||<=. Но систем с такими исходными данными (А, и) бесконечно много, и в рамках извест­ного нам уровня погрешности они неразличимы. Поскольку вместо точной системы (3; 2,1) мы имеем приближенную систему Аz= и, то речь может идти лишь о нахождении приближенного решения. Но приближенная система Аz может быть неразрешимой. Возникает вопрос:

    что надо понимать под приближенным решением систе­мы (3; 2,1) в описанной ситуации?

    Среди «возможных точных систем» могут быть и вы­рожденные. Если они разрешимы, то имеют бесконечно много решений. О приближенном нахождении какого из них должна идти речь?

    Таким образом, в большом числе случаев мы должны рассматривать целый класс неразличимых между собой (в рамках заданного уровня погрешности) систем урав­нений, среди которых могут быть и вырожденные, и неразрешимые. Методы построения приближенных реше­ний систем этого класса должны быть одними и теми же, общими. Эти решения должны быть устойчивыми к малым изменениям исходных данных (3; 2,1).

    В основе построения таких методов лежит идея «от­бора». Отбор можно осуществлять с помощью специальных, заранее задаваемых функционалов [ z ] , входящих в постановку задачи.

    Неотрицательный функционал [ z ] , определенный на всюду плотном в F подмножестве F1 множества F, называется стабилизирующим функционалом, если:

    а) элемент zT принадлежит его области определения;

    б) для всякого числа d>0 множество F1,d элементов z из F1 , для которых

    [ z ]<=d, компактно на F.

    3.2.2. Итак, рассмотрим произвольную систему линейных алгебраических уравнений (короче — СЛАУ)

    Аz =u, (3; 2,2)

    в которой z и u—векторы, z=(z1, z2, ...,zn)Rn, и=(u1,u2, ...,un)Rm, А—матрица с элементами aij, А = {aij}, где j =1, 2, ..., n; i= 1, 2, ..., т, и число п не обязано быть равным числу т.

    Эта система может быть однозначно разрешимой, вы­рожденной (и иметь бесконечно много решений) и не­разрешимой.

    Псевдорешением системы (3; 2,2) называют вектор z, минимизирующий невязку || Az – u || на всем пространстве Rn. Система (3; 2,2) может иметь не одно псевдоре­шение. Пусть FA есть совокупность всех ее псевдореше­ний и z1 — некоторый фиксированный вектор из Rn, оп­ределяемый обычно постановкой задачи.

    Нормальным относительно вектора z1 решением си­стемы (3;2,2) будем называть псевдорешение z0 с ми­нимальной нормой || z – z1 ||, т. е. такое, что

    || z0 – z1 || =
    Здесь . В дальнейшем для простоты записи будем считать z1= 0 и нормальное относительно вектора z1=0 решение называть просто нормальным ре­шением.

    Для любой системы вида (3; 2,2) нормальное решение существует и единст­венно.

    Замечание 1. Нормальное решение z° системы (3;2,2) можно определить также как псевдорешение, минимизирующее заданную положительно определенную квадратичную форму относительно координат вектора z—z1. Все излагаемые ниже результаты остаются при этом справедливыми.

    Замечание 2. Пусть ранг матрицы А вырожден­ной системы (3; 2,1) равен r < n и zr+1,zr+2, … , zn— базис линейного пространства NA, состоящего из элемен­тов z, для которых Аz=0, NA = {z; Аz= 0}. Решение z° системы (3; 2,1), удовлетворяющее n—r условиям ортогональности

    (z0 – z1, zS)= 0, S= r + 1, r + 2, .. ,n, (3; 2,3)

    определяется однозначно и совпадает с нормальным ре­шением.

    3.2.3. Нетрудно видеть, что задача нахождения нормаль­ного решения системы (3; 2,2) является некорректно поставленной. В самом деле, пусть А — симметричная матрица. Если она невырожденная, то ортогональным преобразованием

    z = Vz*, u = Vu*

    ее можно привести к диагональному виду и преобразо­ванная система будет иметь вид

    izi*=ui* , i= 1, 2,. .., п,

    где i — собственные значения матрицы А.

    Если симметричная матрица А — невырожденная и имеет ранг r, то n – r ее собственных значений равны нулю. Пусть

    i0 для i=1, 2, ..., r;

    и

    i=0 для i=r+1,r+2, …, n.

    Полагаем, что система (3; 2,2) разрешима. При этом ui*= 0 для i =r + 1, ..., n.

    Пусть «исходные данные» системы и и) заданы с погрешностью, т. е. вместо А и и заданы их прибли­жения А и u:

    || A – A ||<=h, ||u – u||<= . При этом

    (3;2,4)

    Пусть i собственные значения матрицы А. Извест­но, что они непрерывно зависят от А в норме (3; 2,4). Следовательно, собственные значения r+1 , r+2, …,nмогут быть сколь угодно малыми при достаточно малом h.

    Если они не равны нулю, то
    zi*= .

    Таким образом, найдутся возмущения системы в пре­делах любой достаточно малой погрешности А и и, для которых некоторые zi* будут принимать любые наперед заданные значения. Это означает, что задача нахожде­ния нормального решения системы (3; 2,2) является неустойчивой.

    Ниже дается описание метода нахождения нормального решения системы (3; 2,2), устойчивого к малым (в норме (3; 2,4)) возму­щениям правой части и , основанного на методе регуляризации.
    3.3. Метод регуляризации нахождения нормального решения
    3.3.1. Пусть z° есть нормальное решение системы

    Аz = и. (3; 3,1)

    Для простоты будем полагать, что прибли­женной может быть лишь правая часть, а оператор (матрица) А — точный.

    Итак, пусть вместо и мы имеем вектор и, || и — и || <=; т. е. вместо системы (3;3,1) имеем систему


    (3; 3,2)


    Аz = u.




    Требуется найти приближение z к нормальному реше­нию системы (3;3,1), т. е. к вектору z° такое, что z z° при  0. Отметим, что векторы u и u (один из них или оба) могут не удовлетворять классическому ус­ловию разрешимости.

    Поскольку система (3; 3,1) может быть неразреши­мой, то inf ||Az-u|| =  >=0, где inf берется по всем векторам z  Rn.

    Естественно искать приближения z в классе Q век­торов z, сопоставимых по точности с исходными данны­ми, т. е. таких, что || Az – u ||<=+. Но поскольку вместо вектора u мы имеем вектор u, то мы можем найти лишь

    =inf || Az – u ||.

    z Rn

    Отметим, что из очевидных неравенств

    ||Az – u ||<=||Az – u || + || u – u || ,

    ||Az – u ||<= || Az – u || + ||u – u ||

    следуют оценки <=+, <=+, приводящие к не­равенству |  —  | <=. Поэтому будем искать прибли­жение z к нормальному решению z° в классе Q векто­ров z, для которых || Аz — и || <= +2. Отметим, что если имеется информация о разрешимости системы (3;3,1), то  = 0 и в качестве класса Q можно брать класс векторов z, для которых || Аz и|| <= . Класс Q есть класс формально возможных приближенных решений.

    Но нельзя в качестве z брать произвольный вектор из класса Q, так как такое «приближение» будет неустойчивым к малым изменениям правой части уравнения (3;3,2). Необходим принцип отбора. Он естественным образом вытекает из постановки задачи. В самом деле согласно определению нормального решения искомое ре­шение z° должно быть псевдорешением с минимальной нормой. Поэтому в качестве приближения к z° естествен­но брать вектор z из Q, минимизирующий функционал

    [ z ] = ||z||2 на множестве Q .

    Таким образом, задача сводится к минимизации функ­ционала [ z ] = ||z||2 на множестве Q векторов z, для которых выполняется условие || Аzu || <= +2.

    3.3.2. Пусть z — вектор из Q, на котором функционал ||z||2 достигает минимума на множестве Q. Его можно рассматривать как результат применения к правой части u уравнения (3; 3,2) некоторого оператора R1(u,), зависящего от параметра . Справедлива

    Теорема 1. Оператор R1(u,) обладает следующи­ми свойствами:

    1) он определен для всякого uRm и любого > 0;

    2) при 0 z== R1(u,) стремится к нормальному решению z° уравнения Аz=u, т. е. он является регуляризирующим для уравнения Аz=u .

    3.3.3. Пусть z — вектор, на котором функционал [ z ] = ||z||2 достигает минимума на множестве Q. Легко ви­деть из наглядных геометрических представлений, что вектор z лежит на границе множества Q, т.е. ||Az - u ||= +2=1.
    Это следует непосредственно также из того, что функционал [ z ] = ||z||2 является сстабилизирующим и квазимонотонным. Стабилизирующий функционал [ z ] называется квазимонотонным , если каков бы ни был элемент z из F1 , не принадлежащий множеству M0 , в любой его окрестности найдется элемент z1 из F1, для которого [ z1 ]<[ z ], т.е. если функционал не имеет локальных минимумов на множестве F1\ M0.
    Задачу нахождения вектора z можно поставить так: среди векторов z, удовлетворяющих условию ||Az – u ||= +2, найти вектор z с минимальной нормой, т. е. минимизирующий функционал [ z ]=||z||2.

    Последнюю задачу можно решать методом Лагранжа, т. е. в качестве z брать вектор z, минимизирующий функционал

    М [z, u] = ||Az - u ||2+||z||2, >0,

    с параметром , определяемым по невязке, т. е. из ус­ловия ||Аz— u||=1. При этом параметр  определяется однозначно .

    3.3.4. Поскольку М [z, u] квадратичный функционал, то для любых uRm и > 0 существует лишь один минимизирующий его вектор z. В самом деле, допустим,

    что существуют два вектора z и z, минимизирующие его. Рассмотрим векторы z, расположенные на прямой (пространства Rn), соединяющей z и z:

    z = z + (z - z).

    Функционал М [z, u] на элементах этой прямой есть неотрицательная квадратичная функция от . Следова­тельно, она не может достигать наименьшего значения при двух различных значениях :  = 0 (z = z) и =1 (z = z).

    Компоненты zj вектора z являются решением си­стемы линейных алгебраических уравнений



    получающихся из условий минимума функционала М [z, u]:



    Здесь


    Компоненты zj могут быть определены и с помощью какого-нибудь другого алгоритма минимизации функцио­нала М [z, u].

    Вектор z можно рассматривать как результат приме­нения к u некоторого оператора z=R(u, ), завися­щего от параметра .

    Покажем, что оператор R0(u, ) является регуляризирующим для системы (3;3,1), т. е. обладает свойствами 1) и 2) определения 2 (см. 3.1.2.). В п. 3.3.2. было сказано, что он определен для всяких uRm и  > О и, следовательно, обладает свойством 1). Теперь пока­жем справедливость свойства 2), т. е. существование таких функций = , что векторы z = R0(u, ) сходятся к нормальному решению z° системы (3; 3,1) при 0. Это непосредственно следует из приводимой ниже теоремы 2.

    Теорема 2( Тихонова). Пусть есть нормальное решение си­стемы Az= u и вместо вектора u мы имеем вектор u такой, что ||uu||<=. Пусть, далее,  и  — какие-либо непрерывные на [0, 2] и положительные на (02] функции, монотонно стремящиеся к нулю при 0 и такие, что



    Тогда для любой .положительной на (0, ] функции  , удовлетворяющей условиям



    векторы z = R0(u, ) сходятся к нормальному ре­шению z0 системы Az = u при 0, т. е.



    Примечание. Доказательства теорем в данном разделе опущены, т.к. основной теоретической частью работы является раздел «Метод Подбора. Квазирешения». Метод Тихонова описан из-за использования его в численном эксперименте.

    ЗАКЛЮЧЕНИЕ
    Для реализации численного примера был выбран метод Тихонова решения плохо обусловленных СЛАУ. В качестве исходной была взята СЛАУ Az=u, имеющая в матричной записи вид:



    Определитель матрицы коэффициентов этой системы близок к нулю – он равен 0.000125. Попробуем решить эту систему с помощью обратной матрицы:

    z=A-1u

    Получим z1=316

    z2=-990

    z3=832

    Теперь предположим, что правая часть нам известна приближенно, с погрешностью 0.1 Изменим, к примеру, третий элемент вектора-столбца с 1 на 1.1 :



    Попробуем решить новую систему также с помощью обратного оператора. Мы получаем другой результат:

    z1=348

    z2=-1090

    z3=916.

    Мы видим, что малому изменению правой части данной системы отвечают весьма значительные изменения решения. Очевидно, эта система – плохо обусловленная, и здесь не может идти речи о нахождении решения близкого к точному с помощью обратного оператора.

    Будем искать решение методом Тихонова. В теоретической части было показано, что целесообразно использовать регуляризирующий оператор следующего вида: (E + ATA)z=ATu , где E – единичная матрица, zприближенное нормальное решение, AT – транспонированная исходная матрица, параметр регуляризации,

    u -- правая часть, заданная неточно. Эту задачу можно решать стандартными методами, задав предварительно функцию удовлетворяющую условиям теоремы Тихонова. В моем примере это функция =/4Далее будем решать регуляризованную задачу с точностью .001 ,последовательно изменяя значения .

    В качестве контр-примера можно подставить в программу любую функцию  , не удовлетворяющую условиям теоремы Тихонова. Любая положительная функция монотонно возрастающая, не обладающая свойством 0 при 0, не будет минимизировать невязку.

    Текст программы приведен в приложении 1. Полная распечатка результатов приведена в приложении 2. Здесь же представлены окончательные значения на выходе из программы.
    Приближение к нормальному решению

    Z(1)= 3.47834819174013E+0002

    Z(2)=-1.08948394975175E+0003

    Z(3)= 9.15566443137791E+0002
    Значение правой части при подстановке прибл. решения

    U1(1)= 9.99997717012495E-0001

    U1(2)= 1.00000741970775E+0000

    U1(3)= 1.09948402394883E+0000
    Значение параметра регуляризации:

    2.61934474110603E-0010

    1   2   3   4


    написать администратору сайта