Задача на условный экстремум 61 нелинейное программирование 72 метод Ньютона в нелинейном программировании 88 выпуклое программирование 96
Скачать 0.96 Mb.
|
(3) Функция ? H удовлетворяет условию ? H(x ? (t), ? ? (t)) ? const ? 0. (4) Функции x ? и ? ? удовлетворяют канонической си- стеме ?x i = ? ? H ?? i , ? ? i = ? ? ? H ?x i , i = 1, . . . , n. (5) Если точка x 1 лежит на гиперповерхности M, име- ющей в x 1 касательную гиперплоскость T x 1 M , то вектор ? ? (t 1 ) ортогонален к T x 1 M џ4. Две задачи о быстродействии 155 Замечание. Теорема 2 выгодно отличается от теоремы 1 в том смысле, что ее условия дают замкнутую систему отно- сительно неизвестных u ? , x ? , ? ? и t 1 Упражнения. (1) Дополните частные случаи B)E) принципа максимума Понтрягина. (2) Покажите, что замена ?x i+n = u, i = 1, . . . , m, формально приводит задачу (1), (2) к общей задаче вари- ационного исчисления. (3) Используя принцип максимума Понтрягина, решите за- дачу Дидоны и задачу о брахистохроне. џ4. Две простейшие задачи об оптимальном быстродействии Задача об оптимальном быстродействии является одной из немногих задач оптимального управления, в которой удается получить более или менее продвинутые результаты. Вместе с тем, эта задача позволяет выработать достаточно типиче- ские навыки решения задач со свободным временем перехода и имеет огромное самостоятельное практическое значение. В џ4 приведены два простейших частных случая задачи о быстро- действии, всегда входивших в джентльменский набор любо- го, изучающего оптимальное управление. Как будет показано, эти частные задачи, хотя и носят ярко выраженный учебный характер, вплотную подводят нас к решению уже реальных задач. Управление ускорением материальной точки. Рас- смотрим материальную точку, движущуюся вдоль оси Ox под действием управления u, удовлетворяющего ограничению |u| ? 1. (1) При этом начальное положение и скорость точки считаются заданными. Требуется найти управление, переодящее точку в начало координат плоскости R 2 с координатами (x, ?x) за наи- меньшее время. 156 Гл. 3. Основы оптимального упраления Начнем с самого простого случая, имеющего на первый взгляд исключительно учебный характер. Пример 9. Предположим, что уравнение движения мате- риальной точки имеет вид Ё x = u. (2) Положим x 1 = x (3) и x 2 = ?x, (4) что позволяет переписать уравнение (2) в виде системы Ѕ ?x 1 = x 2 , ?x 2 = u. (5) Заметим теперь, что управляемая функция Гамильтона ? H для системы (5) имеет вид ? H(x 1 , x 2 , ? 1 , ? 2 , u) = ? 1 x 2 + ? 2 u, где канонические переменные ? 1 и ? 2 удовлетворяют сопря- женной системе Ѕ ? ? 1 = 0, ? ? 2 = ?? 1 . (6) Поскольку ? H(x 1 , x 2 , ? 1 , ? 2 ) = max |u|?1 ? H(x 1 , x 2 , ? 1 , ? 2 , u), то в силу теоремы 2 видим, что в каждой точке t непрерывно- сти функции u ? u ? (t) = +1, (7) если ? 2 (t) > 0 , u ? (t) = ?1, (8) если ? 2 (t) < 0 , и u ? (t) не определено, если если ? 2 (t) = 0 Последнее будем записывать в виде u ? (t) = sign ? 2 (t), (9) используя для этого обозначение сигнум-функции. џ4. Две задачи о быстродействии 157 6 6 6 ? ? ? A) B) Рис. 4 Для отыскания управления u ? по формуле (9) заметим, что согласно системе (6) ? 2 (t) = C 1 + C 2 t, где C 1 и C 2 произвольные постоянные. Поэтому u ? (t) может переключать свое значение с +1 на ?1 или обратно не более одного раза. Рассмотрим два случая, в которых управление u ? (t) опре- делено u ? (t) A) Пусть u ? (t) определено по формуле (7). Тогда система (5) принимает вид Ѕ ?x 1 = x 2 , ?x 2 = +1. (10) Разделив формально первое из уравнений системы (10) на вто- рое, запишем dx 1 dx 2 = x 2 , откуда непосредственно следует, что x 1 = (x 2 ) 2 + C, где C произвольное постоянное. Таким образом, фазовые траектории системы (10) пред- ставляют собой параболы, изображенные на рис. 4, A), где стрелки показывают направление движения во времени t. 158 Гл. 3. Основы оптимального упраления B) Пусть теперь u ? (t) определено по формуле (8). Тогда система (5) принимает вид Ѕ ?x 1 = x 2 , ?x 2 = ?1. (11) Тогда, рассуждая как и ранее, имеем x 1 = ?(x 2 ) 2 + C, т.е. фазовые траектории системы (11) представляют собой па- раболы, изображенные на рис. 4, B). Заметим теперь, что из всего семейства парабол, изобра- женных на рис. 4, только две проходят через положение рав- новесия x 1 = 0, x 2 = 0 системы (5), причем только одна дуга каждой из них ведет к цели. На рис. 5 изображены дуга AO, соответствующая управ- лению (7), и дуга BO, соответствующая управлению (8), кото- рые ведут в начало координат без переключений управления. Другими словами, только с кривой AOB можно попасть в на- чало координат непосредственно. Во всех остальных случаях нужно сначала попасть на AOB и переключить при перехо- де на эту кривую управление. По этой причине кривую AOB называют линией перекличения. Заметим теперь, что (как было показано ранее) в систе- ме (5) при использовании оптимального по быстродействию управления может быть не более одного переключения. Тогда несложный анализ показывает, что выше кривой AOB следует использовать управление (8), а ниже управление (7). Замечание. Описанный метод решения задач о быстро- действии для систем второго порядка всегда дает оптимальное управление как функцию фазовых координат. Значение тако- го принципа построения управления, известного как принцип обратной связи, трудно переоценить. Управляемая остановка осцилятора. Действуя как и ранее, рассмотрим несколько более сложную задачу, связан- ную с управлением осцилятором. џ4. Две задачи о быстродействии 159 - 6 O B A x 2 x 1 u ? (t) = +1 u ? (t) = ?1 Рис. 5 Пример 10. Уравнение динамики управляемого осциля- тора имеет вид Ё x + x = u. (12) Если u(t) ? 0, то уравнению (12) сответствует уравнение неуправляемого осцилятора Ё x + x = 0. (13) На плоскости R 2 с координатами (x, ?x) система, описываемая уравнением (13), имеет единственное положение равновесия x = 0, ?x = 0. (14) Поскольку общее решение уравнения (13) имеет вид x(t) = C 1 sin t + C 2 cos t, при выводе внешней возмущающей силой системы из положе- ния равновесия (14) в ней возникают незатухающие периоди- ческие колебания, т.е. задача управления осцилятором заклю- чается быстрейшем гашении колебаний посредством перево- да материальной точки в положение равновесия (14). При этом на управление u по прежнему наложены ограничения (1). 160 Гл. 3. Основы оптимального упраления Используя замену (3), (4), перепишем уравнение (12) в ви- де системы Ѕ ?x 1 = x 2 , ?x 2 = ?x 1 + u. (15) Заметим теперь, что управляемая функция Гамильтона ? H для системы (5) имеет вид ? H(x 1 , x 2 , ? 1 , ? 2 , u) = ? 1 x 2 + ? 2 (?x 1 + u), где канонические переменные ? 1 и ? 2 удовлетворяют сопря- женной системе Ѕ ? ? 1 = ? 2 , ? ? 2 = ?? 1 . (16) Поскольку ? H(x 1 , x 2 , ? 1 , ? 2 ) = max |u|?1 ? H(x 1 , x 2 , ? 1 , ? 2 , u), то в силу теоремы 2 видим, что в каждой точке t непрерывно- сти функции u ? u ? (t) = sign ? 2 (t), (17) где обозначение сигнум-функции имеет тот-же смысл, что и в примере 9. Для отыскания управления u ? по формуле (17) введем в рассмотрение уравнение Ё ? + ? = 0. (18) Поскольку замена ? 1 = ?, ? 2 = ? ?, приводит уравнение (18) к системе (16), можем записать ? 2 (t) = S 1 sin t + S 2 cos t, где S 1 и S 2 произвольные постоянные. Следовательно, u ? (t) может переключать свое значение с +1 на ?1 или обратно ко- нечное число раз, зависящее от начального положения систе- мы (15). При этом, однако, если управление u ? (t) определено, то максимальное время его постоянства равно ?. Рассмотрим два случая, в которых управление u ? (t) опре- делено. џ4. Две задачи о быстродействии 161 A) Пусть u ? (t) = +1. (19) Тогда система (15) примет вид Ѕ ?x 1 = x 2 , ?x 2 = ?x 1 + 1. (20) Наряду с системой (20) введем в рассмотрение систему Ѕ ?x 1 = x 2 , ?x 2 = ?x 1 , (21) к которой замена (3), (4) приводит уравнение (13). Система (20) отличается от системы (21) тем, что положение равнове- сия системы (20) находится в точке x 1 = +1, x 2 = 0, (22) а положение равновесия системы (21) в точке x 1 = 0, x 2 = 0. (23) Если x 1 6= 0 , то разделив формально первое из уравнений системы (21) на второе, запишем dx 1 dx 2 = ? x 2 x 1 , откуда следует, что в этом случае (x 1 ) 2 + (x 2 ) 2 = (C) 2 , (24) где C любое действительное число. Аналогичным образом, если x 2 6= 0 , то разделив формально второе из уравнений си- стемы (21) на первое, запишем dx 2 dx 1 = ? x 1 x 2 , откуда следует, что в и этом случае справедливо равнество (24). Таком образом, на плоскости R 2 с координатами (x 1 , x 2 ) траектории системы (21), отличные от положеия равновесия (23), представляют собой окружности с центром в точке (23) и радиусом C. При этом, как легко видеть, направление движе- ния по этом окружностям совпадает с движением по часовой 162 Гл. 3. Основы оптимального упраления x 1 x 2 - 6 O A B &% '$ q &% '$ q - ѕ Рис. 6 стрелке. Поэтому уравнение траекторий системы (22) имеет вид (x 1 ? 1) 2 + (x 2 ) 2 = (C) 2 , (25) где направление движения при C 6= 0 совпадает с направле- нием движения по часовой стрелке. B) Пусть теперь u ? (t) = ?1. (26) Тогда система (15) примет вид Ѕ ?x 1 = x 2 , ?x 2 = ?x 1 ? 1. (27) Заметим теперь, что положение равновесия системы (27) находится в точке x 1 = ?1, x 2 = 0. (28) Поэтому действуя как и при выводе равенства (25), неслож- но показать, что уравнение траекторий системы (22) задается равенством (x 1 + 1) 2 + (x 2 ) 2 = (C) 2 , (29) в котором направление движения при C 6= 0 также совпадает с направлением движения по часовой стрелке. Из сказанного выше следует, что при использовании опти- мального управления (17) только две траектории могут про- ходит через точку (23) (см. рис. 6). Более того, поскольку џ4. Две задачи о быстродействии 163 x 1 x 2 - 6 - ѕ q q q PPP PPP P P O A A 1 B P Q Рис. 7 максимальное время постоянства управления u ? (t) (если u ? (t) определено) равно ?, то оптимальному управлению (19) со- ответствует дуга AO, а оптимальному управлению (26) дуга BO соотвествующих траекторий. Сказанное означает, что если только с кривой AOB можно попасть в положение равновесия непосредственно без переключений. Поэтому для получения общей картины нужно продолжить оптимальные траектории с этой кривой в направлении, обратном направлению движе- ния по траекториям. Пусть P произвольная точка дуги BO (см. рис. 7). Как уже отмечалось, использование в этой точке управления (26) приводит ситему в начало координат быстрейшим образом. Возьмем точку с координатами x 1 = +3, x 2 = 0, (30) и построим дугу AA 1 окружности с центром в точке (30) ра- диуса, равного единице. Через точку P и точку, соответству- ющую положению равновесия (22) проведем прямую до пере- сечения ее с точкой Q дуги AA 1 Заметим теперь, что время прохождения вдоль дуги P Q по замкнутой траектории из точки P в себя равно 2?. Посколь- ку максимальное время постоянства управления u ? (t) (если, конечно, u ? (t) определено) равно ?, а по построению дуга P Q 164 Гл. 3. Основы оптимального упраления x 1 x 2 - 6 - ѕ q q q q q - O A A 1 B B 1 B 2 P Q R Рис. 8 представляет собой ровно половину соответствующей окруж- ности, то для любой точки на этой дуге оптимальное управ- ление определено и удовлетворяет равенству (19). При этом продолжение оптимальной траектории в направлении, проти- воположном направлению движения, от точки Q требует пре- ключения управления с (19) на (26) при прохождении через Q . Но так как точка P на дуге выбиралась BO произвольным образом, из сказанного следует, что переключение оптималь- ного управления происходит при прохождении через дугу AA 1 каждой оптимальной траектории. Возьмем теперь точки с координатами x 1 = ?3, x 2 = 0, (31) и x 1 = ?5, x 2 = 0. (32) Построим дуги BB 1 и B 1 B 2 окружностей с центром в точке (31) и (32) соответственно; при этом радиус каждой из этих окружностей оставим равным, единице (см. рис. 8). Действуя как и при построении точки Q на рис. 7, на рис. (см. рис. 8) прямую, проходящую через точки (28) и Q; пересечение это прямой с дугой B 1 B 2 обозначим через R. џ4. Две задачи о быстродействии 165 Легко видеть, что время прохождения вдоль дуги RQ по замкнутой траектории из точки R в себя равно 2?. С другой стороны, так как по построению максимальное время посто- янства управления u ? (t) (если, как и ранее, u ? (t) определено) равно ?, а дуга по построению QR представляет собой ровно половину соответствующей окружности, то для любой точки на этой дуге оптимальное управление определено и задается формулой (26). Более того, продолжение оптимальной траек- тории в направлении, противоположном направлению движе- ния, от точки R требует преключения управления уже с (26) на (19) при прохождении через Q. Но так как выбор точки P , а, следовательно, и точек Q и R выше по существу не иг- рал никакой роли, то переключение оптимального управления происходит всякий раз, когда любая оптимальная траектория проходит через дугу B 1 B 2 Действуя аналогичным образом, построим дугу A 1 A 2 и продолжим кривую B 2 OA 2 на всю ось Ox 1 (см. рис. 9). По- строенное таким образом продолжение состоит из полуокруж- ностей единичного радиуса и разбивает плоскость R 2 на две полуплоскости, обладающими следующими свойствами. При движении по любой оптимальной траектории, находящейся в верхней полуплоскости, используется оптимальное управление (26), а при движении по любой оптимальной траектории, нахо- дящейся в верхней полуплоскости, оптимальное управление (19). Таким образом, линией переключения в рассматриваемой задаче является продолжение кривой B 2 OA 2 на ось Ox 1 . При этом время между переключениями не превосходит ?, а дви- жение по самой линии переключения происходит только по ду- гам AO и BO, ведущим непосредственно в начало координат. Оптимальное управление на дуге AO определяется по фор- муле (19), а по дуге BO по формуле (26). Общее же число переключений зависит от начального состояния системы. Замечание. Необходимо отметить, что здесь (как и в примере 9) оптимальное управление построено по принципу обратной связи. Упражнения. 166 Гл. 3. Основы оптимального упраления x 1 x 2 - 6 ѕ - q q q q q q O A A 1 A 2 u ? (t) = +1 B B 1 B 2 u ? (t) = ?1 Рис. 9 (1) Предположим, что в условиях примера 9 уравнение дви- жения системы имеет вид a 0 Ё x + a 1 ?x + a 2 x = u. (33) Решите задачу о быстродействии для системы (33) в пред- положении, что корни характеристического уравнения a 0 ? 2 + a 1 ? + a 2 = 0 действительны, различны и (a) отрицательны; (b) положительны. Указание: Используйте стандартные фазовые портреты системы (см., например, [17]). (2) Решите задачи примеров 9 и 10 в предположении, что си- стему следует перевести не в положение равновесия, а на окружность (x) 2 + ( ?x) 2 = C 2 извне. џ5. Линейные оптимальные быстродействия 167 џ5. Линейные оптимальные быстродействия Задача об оптимальном быстродействии, в которой управ- ляемая система линейна, имеет огромное историческое значе- ние, поскольку именно с нее фактически и начиналось опти- мальное управление (см. [18]). Более того, как уже отмеча- лось, эта задача во многом определяет методы решения за- дач со свободным временем перехода и, потому, имеет также огромное методическое значение. И, наконец, несмотря на ка- жущуюся внешнюю простоту данная задача и в наши дни про- должает иметь огромное практическое значение при констру- ировании систем управления. Так, задача о быстродействии возникает всякий раз, когда систему, подвергшуюся внешнему возмущению следует быстрейшим образом вернуть в некото- рое желаемое состояние. В качестве еще одного традиционного примера отметим также задачу о быстрейшем перехвате цели, движущейся по известной траектории. Предварительные сведения. Прежде всего, приведем некоторые сведения из геометрической теории обыкновенных дифференциальных уравнений, необходимые для дальнейшего изложения. Обозначим через A фиксированную (n Ч n)-матрицу, эле- ментами которой, вообще говоря, являются достаточное число раз дифференцируемые по времени t функции a i j . Далее, пусть A 0 матрица, транспонированная к A. Рассмотрим систему дифференциальных уравнений ? ? = A?, (1) ? ? = ?A 0 ?, (2) в которой считается, что решение ?(t) не равно нулю тожде- ственно. С решениями системы (1), (2) свяжем пространства ? и ?, которые определим следующим образом. Пространство ? является (n ? 1)-мерным подпростран- ством, зависящим от t и состоящим из векторов n-мерного пространства, ортогональных к ?(t). Непрерывно дифференци- руемым подпространством назовем собственное подпростран- ство n-мерного пространства, также зависящее от t и состоя- щее из точек, являющихся линейными комбинациями системы 168 Гл. 3. Основы оптимального упраления непрерывно дифференцируемых векторов. Если размерность последнего пространства равна n ? 1 для всех значений t, то будем обозначать его через ?. При этом будем писать v ? ? и говорить, что вектор v лежит в пространстве ?, если он лежит в ? при всех значениях t. Подпространство ? назовем ковариантным, если для каждого непрерывно дифференци- руемого вектора v ? ? ?v ? Av ? ?. Предложение 1. Подпространство ? ковариантно то- гда и только тогда, когда оно совпадает с некоторым подпро- странством ?. Оказывается, что это может быть тогда и только тогда, когда оно состоит из векторов вида v(t) = n?1 X k=1 ? k (t)? k (t), (3) где ? k скалярные функци, а ? 1 , . . . , ? n?1 система линейно независимых решений системы (1), ортогональных к ?(t) при некотором значении t = t 0 Доказательство. Прежде всего, заметим, что каждое подпространство ? ковариантно. В самом деле, для произ- вольного дифференцируемого вектора v ? ? справедлива це- почка равенств 0 = d dt hv, ?i = h ?v, ?i ? hv, A 0 ?i = h ?v ? Av, ?i. Поэтому ?v ? Av ? ?. Далее, для любой пары функций (?, ?), удовлетворяющей системе (1), (2) d dt h?, ?i = hA?, ?i ? h?, A 0 ?i = 0. Другими словами, если равенство h?(t), ?(t)i = 0 справедливо при некотором значении t = t 0 , то оно справед- ливо для всех значений t, для которых определено решение џ5. Линейные оптимальные быстродействия 169 системы (1), (2). Поэтому ? ? ? и, значит, каждое из n ? 1 ли- нейно независимых решений ? k (t) системы (1) (такие решения, как известно, всегда существуют) принадлежит ?. Сказанное, очевидно, означает, что подпространство ? должно состоять из векторов вида (3). Верно также и обратное: если вектора ? 1 (t), . . . ? n?1 (t) подобраны так, что они также ортогональны к ?(t) при некотором значении t = t 0 , они ортогональны к ?(t) при всех значениях t, для которых определено решение систе- мы (1), (2), т.е. система векторов (3) образует подпространство ? Предположим теперь, что подпространство ? ковариант- но. Обозначим через $ нормальный к нему единичный вектор. Тогда для любого дифференцируемого вектора v ? ? h ?v, $i + hv, ? $i = d dt hv, $i = 0 и, следовательно, 0 = h ?v ? Av, $i = ?hv, ? $i ? hAv, $i = ?hv, ? $ + A 0 $i. Другими словами, вектор h$ + A 0 $i ортогонален к каждому дифференцируемому вектору v ? ?. Поэтому этот вектор ор- тогонален к подпространству ? и, значит, отличается от нор- мального вектора $ только скалярным множителем q. Подберем скалярную функцию ? времени t так, чтобы вы- полнялись равенства d dt (?$) + A 0 ?$ = ( ?? + q?)$ = 0; это, очевидно, можно сделать всегда. Тогда вектор ?$ равен некотору вектору ?. Следовательно, подпространство ? сов- падает с соотвествующим ?. ¤ Если при некотором значении t = t 1 вектор v принажле- жит к подпространству ?, то будем говорить, что при t = t 1 вектор v пересекает ?, что обозначим через v ? (t 1 )?. В общем случае, если задано некоторое натуральное число k, то будем говорить, что при t = t 1 вектор v имеет пересесечение 170 Гл. 3. Основы оптимального упраления порядка k с подпространством ? или касание порядка (k ? 1) с этим подпространством, и писать v = k (t 1 )?, если при t = t 1 вектор v (k ? 1) раз дифференцируем по t и скалярное произведение hv, ?i равно нулю вместе со своими производными по t до порядка (k ? 1). При этом для опреде- ленности положим v ? k (T )?, где T множество тех значений t ? , для которых натуральные числа k ? удовлетворяют условиям v ? k ? (t ? )? и X ? k ? ? k. Будем говорить, что (n?1) раз дифференцируемый вектор v является вектором общего положения, если не существует такого значения t 0 времени t и такого подпространства ?, для которых v имеет пересечение порядка n с подпространством ? при t = t 0 Предложение 2. Для того, чтобы (n?1) раз дифферен- цируемый вектор v был вектором общего положения, необхо- димо и достаточно, чтобы для всех значений t 0 вектора µ d dt ? A ¶ k v, k = 0, . . . , n ? 1 (4) были линейно независимы при t = t 0 Доказательство. Прежде всего, заметим, что для каж- дого вектора ? имеет место равенство µ d dt ¶ k hv, ?i = *µ d dt ? A ¶ k v, ? + . (5) В самом деле, при k = 1 это очевидно. При любом же другом значении k справедливость равенства (5) проверяется џ5. Линейные оптимальные быстродействия 171 непосредственно по индукции. Поэтому справедливость пред- ложения 2 следует из того, что линейная независимость век- торов (4) при каком-либо значении t = t 0 эквивалентна тре- бованию их ортогональности к некоторому вектору ? при t = t 0 ¤ Значение вектора общего положения для задачи об оп- тимальном быстродействиии трудно переоценить, поскольку имеет место следующее Предложение 3. Если T ограниченное бесконечное множество значений времени t, то соотношение v ? ? (T )? не может выполняться для векторов общего положения. Доказательство. Предположим противное и приведем это предположение к противоречию. Пусть v произвольный вектор общего положения. Если утверждение теоремы 3 неверно, то из множества T можно выбрать последовательность значений t 1 , t 2 , . . . , t l , . . . , при l ? ? сходящуюся к некоторому действительному числу t ? . Вдоль этой последовательности по определению hv, ?i = 0. (6) Поэтому равенство (6) выполняется и при t = t ? Заметим теперь, что по построению между любыми двумя значениями t l и t l+1 находится нуль производной d dt hv, ?i. (7) Поэтому в силу непрерывности производной (7) последняя равна нулю и при t = t ? . Аналогичным образом, при t = t ? равны нулю также все производные порядков до n ? 1 вклю- чительно, т.е. вектор v не является вектором общего положе- ния. ¤ В частном случае предложение 3 принимает следующий гораздо более тонкий вид. 172 Гл. 3. Основы оптимального упраления Предложение 4. Пусть A постоянная матрица с действительными собственными числами и v постоянный вектор. Тогда соотношение v ? n (T )? не может выполняться ни для какого множества T , если не выполняется соотношение v ? ?. Доказательство. Прежде всего, заметим, что соотно- шение v ? ? эквивалентно равенству hv, ?i = 0. (8) Далее, матрицу A можно преобразовать в вырожденную, по- ложив ? A = A ? ?E, где ? любое собственное число матрицы A и E единичная матрица. Тогда, если принять ? ? = ?e ?t , то µ d dt + ? A 0 ¶ ? ? = e ?t µ d dt + A 0 ¶ ? = 0. Принимая во внимание сказанное для простоты предпо- ложим теперь, что матрица A вырождена. Тогда существует постоянный единичный вектор a, такой, что aA 0 = 0 и, следо- вательно, a ? ? = ?aA 0 ? ? = 0. Повернув, если это требуется, оси можно добиться того, что направление вектора a совпало с направлением оси x 1 . Обо- значим через v 1 и A 1 соответствено (n ? 1)-мерный вектор и (n ? 1) Ч (n ? 1) -матрицу, полученные вычеркиванием из v и A вычеркиванеим первой компоненты и первой строки и столб- ца. Тогда вектор ? окажется в (n?1)-мерном подпространстве, ортогональном к оси x 1 . Поэтому µ d dt + A 0 1 ¶ ? = 0 (9) и µ d dt + A 0 ¶ ? = 0. (10) џ5. Линейные оптимальные быстродействия 173 Поскольку d dt hv, ?i = hv, ? ?i, то условие (8) выполняется при n = 1. Тогда в силу равенств (9) и (10) справедливость утверждения предложения 4 непо- средственно проверяется по индукции. ¤ Задача о линейных оптимальных быстродействиях. Рассмотрим линейную систему ?x = Ax + Bu, (11) где A и B постоянные соответственно (n Ч n)- и (n Ч m)- матрицы. При этом считается, что допустимое множество U представляет собой выпуклый многограник, причем начало координат пространства R m является его внутренней точкой. Задача заключается в минимизации времени t 1 ? t 0 перехода системы (11) из заданной точки x(t 0 ) = x 0 (12) в начало координат пространства R n ; минимизация, как и ра- нее, осуществляется в множестве U(t 0 , t 1 ) кусочно-непрерыв- ных допустимых управлений. По вполне понятным причинам сформулированную выше задачу называют задачей о линейных оптимальных быстро- действиях. Физический смысл данной задачи также прозра- чен: систему (11) требуется быстрейшим образом перевести в положение равновесия невозмущенного движения ?x = Ax; (13) при этом оба уравнения (11) и (13) как правило являются урав- нениями в вариациях. Будем называть ребром многогранника U каждую из его 1 -мерных граней. Основное допущение, которое обычно при- нимают в задачах о линейных оптимальных быстродействиях, состоит в следующем. Каждый вектор v, определямый равен- ством v = Bw, (14) 174 Гл. 3. Основы оптимального упраления где w направление одного из ребер многогранника U, яв- ляется вектором общего положения. Это допущение, очевид- но, относится только к конечному числу векторов. И, хотя, на практике выполнения данного допущения всегда можно до- биться слегка повернув многогранник, последнее (как это ни печально) существенно ограничивает использование приведен- ных ниже результатов. Согласно предложению 2 несложно заметить, что (14) бу- дет вектором общего положения, если для каждого направле- ния w вектора Bw, ABw, . . . , A n?1 Bw (15) будут линейно независимы. Для чего нужна линейная незави- симость векторов (15), станет ясно чуть ниже. Пока перейдем к выясненю структуры оптимального управления. Для этого, прежде всего, заметим, что здесь сопряженная система имеет вид ? ? = ?A 0 ?, (16) а управляемая функция Гамильтона ? H(x, ?, u) = h?, Ax + Bui. Пусть u ? оптимальное управление в рассматриваемой за- даче и пусть x ? соответсвующая траектория. Тогда согласно теореме 2 найдется такая векторная функция ? ? (t) = (? ? 1 (t), . . . , ? ? n (t)), что: (1) Для всех значений t 0 ? t ? t 1 выполнено условие |? ? (t)| 6= 0. (2) Для всех значений t 0 ? t ? t 1 имеет место равенство h? ? (t), Ax ? (t) + Bu ? (t)i = ? H(x ? (t), ? ? (t)), где ? H(x, ?) = max u?U h?, Ax + Bui. |