В. И. Арнольд. Обыкновенные дифференциальные уравнения. В. И. Арнольд Обыкновенные дифференциальные уравнения
Скачать 4.58 Mb.
|
§ . Свойства экспоненты Установим теперь ряд свойств оператора e A : R n → R n ; эти свойства позволят нам использовать для решения линейных дифференциальных уравнений. Групповое свойство. Пусть A : R n → R n –– линейный оператор. Тåîðåìà. Семейство линейных операторов e tA : R n →R n , t ∈R, является однопараметрической группой линейных преобразований R n . Дîêàçàòåëüñòâî. Поскольку мы уже знаем, что e tA –– линейный оператор, нужно только проверить, что e ( t+s)A = e tA e sA () и что дифференцируемо зависит от t. Мы докажем, что d dt e tA = Ae tA , () как и положено экспоненте. Чтобы доказать групповое свойство (), перемножим сначала формальные ряды по степеням A: E + tA + t 2 2 A 2 + … E + sA + s 2 2 A 2 + … = = E + (t + s)A + t 2 2 + ts + s 2 Коэффициент при в произведении будет равен (t + s) k /(k!), так как формула () верна в случае числовых рядов (A ∈ R). Остается обосновать законность почленного умножения. Это можно сделать также, как доказывается законность почленного умножения абсолютно сходящихся числовых рядов (ряды для и сходятся абсолютно, так как ряды e |t|a , e |s|a , где a = kAk, сходятся. Можно и прямо свести доказательство к числовому случаю. Лåììà. Пусть p ∈ R[z 1 , …, z n ] –– многочлен с неотрицательными коэффициентами от переменных z 1 , …, z n . Пусть A 1 , …, A n : R n → R n –– линейные операторы. Тогда, A n ) k ¶ p(kA 1 k, …, kA n k). Глава . Линейные системы Дîêàçàòåëüñòâî. Это вытекает из неравенств kA + Bk ¶ kAk + kBk, kABk ¶ kAk kBk, kλAk = |λ| Лемма доказана. Обозначим через S m ( A) частную сумму ряда для e A : S m ( A) = m P k=0 A k k! S m –– многочлен с неотрицательными коэффициентами относительно A. Мы должны доказать, что разность ∆ m = S m ( tA)S m ( sA) − S m (( t + s)A) стремится к 0 при m → Заметим, что ∆ m –– это многочлен с неотрицательными коэффициентами относительно sA и tA. Действительно, члены степени не выше по A в произведении рядов все получаются перемножением членов степени не выше m в рядах-сомножителях. Далее, S m (( s + t)A) –– частная сумма ряда-произведения. Поэтому ∆ m –– это сумма всех членов степени выше по A в произведении S m ( tA)S m ( sA). Но все коэффициенты произведения многочленов с неотрицательными коэффициентами неотрицательны. По лемме k∆ m ( tA, sA) k ¶ ∆ m ( ktAk, ksAk). Обозначим неотрицательные числа ktAk, ksAk через τ, σ. Тогда ∆ m ( τ, σ) = S m ( τ)S m ( σ) − S m ( τ + σ). Поскольку, правая часть стремится к 0 при m → ∞. Таким образом, sA) = 0 и соотношение () доказано. Для доказательства соотношения () продифференцируем ряд по t формально получим ряд из производных ∞ P k=0 d dt t k k! A k = A ∞ P k=0 t k k! A k Этот ряд сходится абсолютно и равномерно в любой области kAk ¶ a, |t| ¶ T, также как и исходный ряд. Поэтому производная суммы ряда существует и равна сумме ряда из производных. Теорема доказана. Зàäà÷à . Верно ли, что e A+B = e A e B ? Оòâåò. Нет. Зàäà÷à . Докажите, что det e A 6= УЗ . Докажите, что если оператор в евклидовом пространстве кососимметрический, то оператор e A –– ортогональный. Основная теорема теории линейных уравнений с постоянными коэффициентами. Из доказанной теоремы непосредственно вытекает формула для решения линейного уравнения = Ax, x ∈ R n () § . Свойства экспоненты Тåîðåìà. Решение уравнения () с начальным условием ϕ(0) = есть) = e tA x 0 , t ∈ R. () Дîêàçàòåëüñòâî. Согласно формуле дифференцирования (Итак, ϕ –– решение. Поскольку e 0 = E, ϕ(0) = x 0 . Теорема доказана, так как по теореме единственности всякое решение в своей области определения совпадает с решением (). . Общий вид однопараметрических групп линейных преобразований пространства R n . Тåîðåìà. Пусть {g t : R n → R n } –– однопараметрическая группа линейных преобразований. Тогда существует такой линейный оператор A : R n → R n , что g t = e At . Дîêàçàòåëüñòâî. Положим A = dg t dt t=0 = lim t →0 g t − Мы уже доказали, что движение) = g t x 0 –– это решение уравнения) с начальным условием ϕ(0) = x 0 . Согласно () что и требовалось. Оператор A называют производящим оператором группы З . Докажите, что производящий оператор определен группой однозначно. Зàìå÷àíèå. Таким образом, имеется взаимно однозначное соответствие между линейными дифференциальными уравнениями (и их фазовыми потоками {g t } ; при этом фазовый поток состоит из линейных диффеоморфизмов. . Второе определение экспоненты. Тåîðåìà. Пусть A : R n → R n –– линейный оператор. Тогда + A m m () Дîêàçàòåëüñòâî. Рассмотрим разность Ряд сходится, так как + A m m –– многочлена ряд e A сходится.) Заметим, что коэффициенты разности неотрицательны 1)…(m − k + 1) m · m · … · m 1 k! Глава . Линейные системы Поэтому, полагая kAk = a, находим + A m m ¶ ∞ P k=0 1 k! − C k m m k a k = e a − 1 +Последняя величина стремится к 0 при m → ∞, и теорема доказана. Пример формула Эйлера для e z . Пусть C –– комплексная прямая. Мы можем рассматривать ее как вещественную плоскость Рис. . Комплексное число +а умножение на комплексное число –– как линейный оператор A : R 2 → Оператор A есть поворот на угол arg с растяжением в раз. Зàäà÷à . Найти матрицу умножения на = u + iv в базисе e 1 = 1, e 2 = i. Оòâåò. u −v v u Найдем теперь e A . По формуле () надо вначале составить оператор E + A n . Это –– умножение на число + z n , те. поворот на угол arg 1 +с растяжением в + z n раз (рис. З. Докажите, что при n → ∞ arg 1 + z n = Im z n + o 1 n , 1 + z n = 1 + Оператор есть поворот на угол n arg 1 +с растяжением враз. Из формул () находим пределы угла поворота и коэффициента растяжения arg 1 + z n = Im z, lim n →∞ 1 +Тем самым доказана Тåîðåìà. Пусть z = u + iv –– комплексное число, A : R 2 → R 2 –– оператор умножения на z. Тогда есть оператор умножения на комплексное число e u (cos v + i sin v). Оïðåäåëåíèå. Комплексное число + i sin v) = lim n →∞ 1 + z n n § . Свойства экспоненты называется экспонентой комплексного числа z = u + iv и обозначается v). () Зàìå÷àíèå. Если не отличать комплексное число от оператора умножения на это число, то определение превращается в теорему, поскольку экспонента оператора уже определена. Зàäà÷à . Найти, З . Докажите, что C, z 2 ∈ C). Зàìå÷àíèå. Поскольку экспонента определяется также рядом, имеем e z = 1 + z + z 2 2! + …, z ∈ ряд сходится абсолютно и равномерно в каждом круге ¶ З . Сравнивая этот ряд с формулой Эйлера (), вывести ряды Тейлора для sin v, cos v. Зàìå÷àíèå. Обратно, зная ряды Тейлора sin v, cos v, e u , можно было бы доказать формулу (), приняв формулу () за определение Рис. . Ломаная Эйлера. Ломаные Эйлера. Соединяя формулы () и (), мы получаем метод приближенного решения дифференциального уравнения (), называемый методом ломаных Эйлера. Рассмотрим дифференциальное уравнение с линейным фазовым пространством, заданное векторным полем v. Чтобы найти решение уравнения ˙ x = v(x), x ∈ R n , с начальным условием x 0 , поступим следующим образом (рис. ). Скорость в точке нам известна это v(x 0 ). Будем двигаться с постоянной скоростью v(x 0 ) изв течение времени ∆t = t/N. Попадем в точку. В течение следующего отрезка времени ∆t будем двигаться со скоростью v(x 1 ), и т. д = 0, 1, …, N − Обозначим через X N ( t) последнюю точку, x N . Заметим, что график, изображающий движение с кусочно-постоянной скоростью, –– это Глава . Линейные системы ломаная линия из N звеньев в расширенном фазовом пространстве R n . Эта ломаная и называется ломаной Эйлера. Естественно ожидать, что при N → ∞ последовательность ломаных Эйлера сходится к интегральной кривой, так что последняя точка будет при больших N близка к значению решения ϕ с начальным условием) = в точке t. Тåîðåìà. Для линейного уравнения () lim N →∞ X N ( t) = ϕ(t). Дîêàçàòåëüñòâî. По определению ломаной Эйлера при v(x) = = Ax имеем X N = E + tA N N x 0 . Поэтому см. (Итак, lim N →∞ X N = ϕ(t) (см. (З . Докажите, что не только конец ломаной Эйлера стремится к ϕ(t), но и вся последовательность кусочно-линейных функций ϕ n : I → графиками которых служат ломаные Эйлера, равномерно сходится к решению на отрезке [0, t]. Зàìå÷àíèå. Ломаная Эйлера в общем случае (когда векторное поле v зависит от x нелинейно) также может быть записана в виде + tA N N x 0 , где A –– нелинейный оператор, переводящий точку в точку v(x). В дальнейшем мы увидим, что ив этом случае последовательность ломаных Эйлера сходится к решению, по крайней мере при достаточно малых (§ , п. ). Таким образом, выражение, в котором экспонента определена формулой (), дает решение вообще всех дифференциальных уравнений ∗) Эйлерова теория экспоненты, единообразная во всех своих вариантах от определения числа e, формулы Эйлера для e z , формулы Тейлора, формулы () для решения линейных уравнений и до метода ломаных Эйлера, имеет много других применений, выходящих за рамки нашего курса . Определитель экспоненты Если оператор A задан своей матрицей, вычисление матрицы оператора может требовать длинных выкладок. Однако опреде- ∗) Практически приближенно решать уравнение с помощью ломаных Эйлера неудобно, так как приходится брать очень малый шаг ∆t, чтобы получить заданную точность. Чаще пользуются различными усовершенствованиями этого метода, в которых интегральная кривая аппроксимируется не отрезком прямой, а отрезком параболы той или иной степени. Наиболее часто используются методы Адамса, Штермера и Рунге. Сними можно познакомиться по учебникам приближенных вычислений § . Определитель экспоненты литель матрицы можно, как мы сейчас увидим, вычислить очень легко. Определитель оператора. Пусть A : R n → R n –– линейный опе- ратор. Оïðåäåëåíèå. Определителем оператора A называется определитель матрицы оператора A в каком-нибудь базисе e 1 , …, e n ; обозначение Определитель матрицы оператора A не зависит от базиса. Действительно, если (A) –– матрица оператора A в базисе e 1 , …, e n , то матрицей оператора A в другом базисе будет (B)(A)(B −1 ), и det( B)(A)(B −1 ) = Определитель матрицы –– это ориентированный объем параллелепипеда, ребра которого задаются столбцами матрицы. Например, при n = 2 (рис. ) определитель есть площадь параллелограмма, натянутого на векторы ξ 1 , ξ 2 с компонентами) и ( x 2 , y 2 ), взятая со знаком плюс, если упорядоченная Рис. . Определитель матрицы равен ориентированной площади параллелограмма, натянутого на ее столбцы пара векторов ( ξ 1 , ξ 2 ) задает туже ориентацию R 2 , что и базисная пара векторов (e 1 , e 2 ), и со знаком минус в противном случае. Столбец с номером i в матрице оператора A в базисе e 1 , …, составлен из координат образа базисного вектора Ae i . Поэтому определитель оператора A –– это ориентированный объем образа единичного куба параллелепипеда с ребрами e 1 , …, e n ) при отображении З. Пусть Π –– параллелепипед с линейно независимыми ребрами. Докажите, что отношение (ориентированного) объема образа параллелепипеда AΠ к (ориентированному) объему Π не зависит от Π и равно det Параллелепипед с ребрами есть подмножество R n , состоящее из всех точек вида x 1 ξ 1 + … + x n ξ n , 0 ¶ x i ¶ 1. При = 2 параллелепипед называется параллелограммом. Если вы знакомы с каким-либо определением объема, то легко докажете выделенное утверждение. Если же нетто можете принять егоза определение объема параллелепипеда Глава . Линейные системы Зàìå÷àíèå. Читатель, знакомый с теорией измерения объемов в R n , может заменить Π любой фигурой, имеющей объем. Итак, определитель оператора A –– это коэффициент изменения ориентированного объема при применении A ориентированный объем любой фигуры меняется враз. Геометрически вовсе не очевидно, что растяжение объема для всех фигур одинаково (даже в случае плоскости, ведь форма фигуры при линейном преобразовании сильно меняется. След оператора. Следом матрицы A называется сумма ее диагональных элементов. След обозначается tr (от английского или Sp (от немецкого «Spur»): tr A След матрицы оператора A : R n → не зависит от базиса, но лишь от самого оператора З . Докажите, что след матрицы равен сумме всех ее собственных чисел, а определитель –– их произведению. Уêàçàíèå. Примените формулу Виета к многочлену det( A − λE) = (Собственные числа уже не зависят от базиса. Это позволяет дать следующее определение. Оïðåäåëåíèå. Следом оператора A называется след его матрицы в каком-нибудь (и тогда в любом) базисе. Связь определителя и следа. Пусть A : R n → R n –– линейный оператор ∈ R. Легко доказывается Тåîðåìà. При ǫ → 0 det(E + ǫA) = 1 + ǫ tr A + O(ǫ 2 ) . Дîêàçàòåëüñòâî. Определитель оператора E + ǫ A равен произведению собственных чисел. Собственные числа оператора E + ǫ с учетом кратностей) равны 1 + ǫλ i , где собственные числа Поэтому det(E + ǫ A) = n Q i=1 (1 + ǫλ i ) = 1 + ǫ n P i=1 λ i + O(ǫ 2 ), что и требовалось доказать. Вòîðîå äîêàçàòåëüñòâî. Ясно, что) = det(E + ǫ A) –– многочлен относительно, причем ϕ(0) = 1. Нужно доказать, что ϕ ′ (0) = tr A. Определитель матрицы (x ij ) обозначим через ∆({ x ij } ). По правилу дифференцирования сложной функции, j=1 ∂∆ ∂x ij E dx ij dǫ , где x ij ( ǫ) –– элементы матрицы A. Частная производная ∂∆ ∂x ij E равна по определению § . Определитель экспоненты где e ij –– матрица, единственный ненулевой элемент которой –– это 1 в й строке, м столбце. Но det(E + he ij ) = 1 при j и 1 + h, если i = j. Итак, если j, и 1, если i = j. Поэтому dϕ dǫ ǫ=0 = n P i=1 dx ii dǫ = n P i=1 a ii = tr A, Рис. . Приближенное определение площади параллелограмма, близкого к квадрату что и требовалось доказать. Между прочим, мы заново доказали независимость следа от базиса. Сëåäñòâèå. При малом изменении ребер параллелепипеда на изменение объема влияет лишь изменение каждого ребра в его собственном направлении изменение же в направлении других ребер дает в изменение объема лишь вклад второго порядка малости. Например, площадь параллелограмма, близкого к квадрату (рис. ), малыми второго порядка малости отличается от площади заштрихованного прямоугольника. Можно было бы доказать это следствие из элементарно-геомет- рических соображений это привело бык геометрическому доказательству предыдущей теоремы. Определитель оператора e A . Тåîðåìà. Для любого линейного оператора A : R n → R n det e A = e tr A Дîêàçàòåëüñòâî. Согласно второму определению экспоненты det e A = det lim m →∞ E + A m m = lim m →∞ det E ибо определитель матрицы –– многочлен (и следовательно, непрерывная функция) от элементов. Далее, по предыдущей теореме det E + A m m = det E + A m m = 1 + 1 m tr A + O 1 m 2 m , m → Остается заметить, что lim m →∞ 1 +для любого a ∈ в частности для a = tr С. Оператор e A невырожден. Сëåäñòâèå . Оператор сохраняет ориентацию пространства те Глава . Линейные системы Сëåäñòâèå (ôîðìóëà Л. Фазовый поток линейного уравнения = Ax, x ∈ за время t меняет объем любой фигуры враз, где a = tr Действительно, det g t = det e At = e tr At = e t tr В частности, отсюда вытекает Сëåäñòâèå . Если след A равен 0, то фазовый поток уравнения () сохраняет объемы те. переводит любой параллелепипед в параллелепипед того же объема). Действительно, П. Рассмотрим уравнение маятника с коэффициентом трения = −x + k эквивалентное системе ˙ x 1 = x 2 , ˙ x 2 = −x 1 + kx 2 с матрицей (рис. ) 0 1 −1 Рис. . Поведение площадей при преобразованиях фазового потока уравнения маятника След этой матрицы равен k. Итак, при k < 0 преобразование фазового потока g t (t > 0) переводит каждую область фазовой плоскости в область меньшей площади. В системе с отрицательным трением, наоборот, площадь области g t U , t > 0, больше площади. Наконец, когда трения нет (k = 0), фазовый поток сохраняет площади (неудивительно в этом случае, как мы уже знаем, есть поворот на угол З . Пусть вещественные части всех собственных чисел отрицательны. Докажите, что фазовый поток уравнения () уменьшает объемы > 0). § . Практическое вычисление матрицы экспоненты Зàäà÷à . Докажите, что собственные числа оператора e A равны e λ i , где собственные числа оператора A. Выведите отсюда доказанную выше теорему . Практическое вычисление матрицы экспоненты –– случай вещественных и различных собственных чисел При практическом решении дифференциальных уравнений оператор задан своей матрицей в некотором базисе и требуется явно вычислить матрицу оператора в том же базисе. Начнем с простейшего случая. Диагональный оператор. Рассмотрим линейное дифференциальное уравнение = Ax, x ∈ где A : R n → R n –– диагональный оператор. В базисе, в котором матрица оператора A диагональна, она имеет вид где собственные числа. Матрица оператора имеет диагональный вид Итак, решение ϕ с начальным условием ϕ 0 (0) = ( x 01 , …, x 0 n ) имеет в этом базисе вид. К этому базису и надо перейти, если матрица оператора A дана в другом базисе. Если все n собственных чисел оператора A вещественны и различны, то он диагонален (распадается впрямую сумму одномерных инвариантных относительно A подпространств). Поэтому решать уравнение () в случае, когда собственные числа оператора A вещественны и различны, нужно следующим образом) составить вековое, или характеристическое, уравнение det( A − λE) = 0; Глава . Линейные системы) найти его корни мы предполагаем, что они вещественны и различны) найти собственные векторы ξ 1 , …, из линейных уравнений, ξ k 6= 0; ) разложить начальное условие по собственным векторам) написать ответ ϕ(t) В частности, получаем Сëåäñòâèå. Пусть A –– диагональный оператор. Тогда элементы матрицы e At (t ∈ R) в любом базисе являются линейными комбинациями экспонент e λ k t , где λ k –– собственные числа матрицы A. . Пример. Рассмотрим маятник с трением Матрица оператора A имеет вид 1 −1 −k , tr A = −k, det A = Поэтому характеристическое уравнение имеет вид + 1 = корни вещественны и различны, когда дискриминант положителен, т. е. когда > 2. Итак, при достаточно большом (по абсолютной величине) коэффициенте трения k оператор A диагонален. Рассмотрим случай k > 2. В этом случае оба корня отрицательны. В собственном базисе уравнение запишется в виде 0, ˙ y 2 = λ 2 y 2 , λ 2 < Отсюда, как в § , получаем решение и картинку (узел, рис. ). При t → +∞ все решения стремятся к почти все интегральные кривые касаются оси y 1 , если больше (тогда стремится к 0 быстрее y 1 ). Картинка на плоскости) получается линейным преобразованием. Пусть, например, k = 3 1 3 , так что Собственный вектор находим из условия x 1 = −3x 2 ; получаем. Аналогично ξ 2 = e 1 − 3e 2 . Поскольку < |λ 2 |, фазовые кривые имеют вид, изображенный на рис. . Рассматривая § . Практическое вычисление матрицы экспоненты Рис. . Фазовые кривые маятника с сильным трением в собственном базисе Рис. . Фазовые кривые уравнения маятника с сильным трением в обычном базисе рис. , мы приходим к следующему удивительному выводу если коэффициент трения k достаточно велик (k > 2), то маятник не совершает затухающих колебаний, а сразу идет к положению равновесия его скорость меняет знак не более одного раза. Зàäà÷à . Каким движениям маятника соответствуют фазовые кривые, II, III на рис. ? Нарисовать примерный график З . Исследовать движение перевернутого маятника с трением = x − k ˙x. . Дискретный случай. Все сказанное о показательной функции непрерывного аргумента t относится и к показательной функции дискретного аргумента n. В частности, если A –– диагональный оператор, то для вычисления удобно перейти к диагональному базису. Пðèìåð. Последовательность Фибоначчи 0, 1, 1, 2, 3, 5, 8, 13, … определяется тем, что каждый следующий член равен сумме двух предыдущих, и двумя начальными членами, З . Найти формулу для. Показать, что растет как геометрическая прогрессия, и найти У. Заметим, что вектор) выражается линейно через, причем ξ 1 = (1, 0). Поэтому a n есть первая компонента вектора A n −1 ξ 1 Глава . Линейные системы Оòâåò. α = ln p 5 + 1 2 , a n = λ n 1 − λ n 2 p 5 , где, 2 = 1 ± p 5 2 –– собственные числа Такое же рассуждение сводит исследование любой рекуррентной последовательности порядка k, заданной правилом + c k a n −k , n = 1, 2, и k начальными членами, к изучению показательной функции A n , где : R k → R k –– линейный оператор. Поэтому, когда мы научимся вычислять матрицу экспоненты, мы одновременно изучим все рекуррентные последо- вательности. Возвращаясь к общей задаче о вычислении e At , заметим, что корни характеристического уравнения det(A − λE) = 0 могут быть комплексными. Чтобы изучить этот случай, мы вначале рассмотрим линейное уравнение с комплексным фазовым пространством C n |