Главная страница
Навигация по странице:

  • Заметим теперь, что управляемая функция Гамильтона

  • Задача на условный экстремум 61 нелинейное программирование 72 метод Ньютона в нелинейном программировании 88 выпуклое программирование 96


    Скачать 0.96 Mb.
    НазваниеЗадача на условный экстремум 61 нелинейное программирование 72 метод Ньютона в нелинейном программировании 88 выпуклое программирование 96
    Дата18.01.2022
    Размер0.96 Mb.
    Формат файлаpdf
    Имя файлаAfanasyev_A_P__Dzyuba_S_M_Elementarnoe_vvedenie_v_teoriyu_extrem.pdf
    ТипЗадача
    #335249
    страница12 из 13
    1   ...   5   6   7   8   9   10   11   12   13
    (3) Функция ?
    H
    удовлетворяет условию
    ?
    H(x
    ?
    (t), ?
    ?
    (t)) ? const ? 0.
    (4) Функции x
    ?
    и ?
    ?
    удовлетворяют канонической си- стеме
    ?x
    i
    =
    ? ?
    H
    ??
    i
    ,
    ?
    ?
    i
    = ?
    ? ?
    H
    ?x
    i
    ,
    i = 1, . . . , n.
    (5) Если точка x
    1
    лежит на гиперповерхности M, име- ющей в x
    1
    касательную гиперплоскость T
    x
    1
    M
    , то вектор ?
    ?
    (t
    1
    )
    ортогонален к T
    x
    1
    M

    џ4. Две задачи о быстродействии
    155
    Замечание. Теорема 2 выгодно отличается от теоремы 1
    в том смысле, что ее условия дают замкнутую систему отно- сительно неизвестных u
    ?
    , x
    ?
    , ?
    ?
    и t
    1
    Упражнения.
    (1) Дополните частные случаи B)E) принципа максимума
    Понтрягина.
    (2) Покажите, что замена
    ?x
    i+n
    = u,
    i = 1, . . . , m,
    формально приводит задачу (1), (2) к общей задаче вари- ационного исчисления.
    (3) Используя принцип максимума Понтрягина, решите за- дачу Дидоны и задачу о брахистохроне.
    џ4. Две простейшие задачи об оптимальном быстродействии
    Задача об оптимальном быстродействии является одной из немногих задач оптимального управления, в которой удается получить более или менее продвинутые результаты. Вместе с тем, эта задача позволяет выработать достаточно типиче- ские навыки решения задач со свободным временем перехода и имеет огромное самостоятельное практическое значение. В џ4
    приведены два простейших частных случая задачи о быстро- действии, всегда входивших в джентльменский набор любо- го, изучающего оптимальное управление. Как будет показано,
    эти частные задачи, хотя и носят ярко выраженный учебный характер, вплотную подводят нас к решению уже реальных задач.
    Управление ускорением материальной точки. Рас- смотрим материальную точку, движущуюся вдоль оси Ox под действием управления u, удовлетворяющего ограничению
    |u| ? 1.
    (1)
    При этом начальное положение и скорость точки считаются заданными. Требуется найти управление, переодящее точку в начало координат плоскости R
    2
    с координатами (x, ?x) за наи- меньшее время.

    156
    Гл. 3. Основы оптимального упраления
    Начнем с самого простого случая, имеющего на первый взгляд исключительно учебный характер.
    Пример 9. Предположим, что уравнение движения мате- риальной точки имеет вид
    Ё
    x = u.
    (2)
    Положим
    x
    1
    = x
    (3)
    и
    x
    2
    = ?x,
    (4)
    что позволяет переписать уравнение (2) в виде системы
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = u.
    (5)

    Заметим теперь, что управляемая функция Гамильтона ?
    H
    для системы (5) имеет вид
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    , u) = ?
    1
    x
    2
    + ?
    2
    u,
    где канонические переменные ?
    1
    и ?
    2
    удовлетворяют сопря- женной системе
    Ѕ
    ?
    ?
    1
    = 0,
    ?
    ?
    2
    = ??
    1
    .
    (6)
    Поскольку
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    ) = max
    |u|?1
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    , u),
    то в силу теоремы 2 видим, что в каждой точке t непрерывно- сти функции u
    ?
    u
    ?
    (t) = +1,
    (7)
    если ?
    2
    (t) > 0
    ,
    u
    ?
    (t) = ?1,
    (8)
    если ?
    2
    (t) < 0
    , и u
    ?
    (t)
    не определено, если если ?
    2
    (t) = 0
    Последнее будем записывать в виде
    u
    ?
    (t) = sign ?
    2
    (t),
    (9)
    используя для этого обозначение сигнум-функции.

    џ4. Две задачи о быстродействии
    157 6
    6 6
    ?
    ?
    ?
    A)
    B)
    Рис. 4
    Для отыскания управления u
    ?
    по формуле (9) заметим,
    что согласно системе (6)
    ?
    2
    (t) = C
    1
    + C
    2
    t,
    где C
    1
    и C
    2
     произвольные постоянные. Поэтому u
    ?
    (t)
    может переключать свое значение с +1 на ?1 или обратно не более одного раза.
    Рассмотрим два случая, в которых управление u
    ?
    (t)
    опре- делено u
    ?
    (t)
    A) Пусть u
    ?
    (t)
    определено по формуле (7). Тогда система
    (5) принимает вид
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = +1.
    (10)
    Разделив формально первое из уравнений системы (10) на вто- рое, запишем
    dx
    1
    dx
    2
    = x
    2
    ,
    откуда непосредственно следует, что
    x
    1
    = (x
    2
    )
    2
    + C,
    где C  произвольное постоянное.
    Таким образом, фазовые траектории системы (10) пред- ставляют собой параболы, изображенные на рис. 4, A), где стрелки показывают направление движения во времени t.

    158
    Гл. 3. Основы оптимального упраления
    B) Пусть теперь u
    ?
    (t)
    определено по формуле (8). Тогда система (5) принимает вид
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = ?1.
    (11)
    Тогда, рассуждая как и ранее, имеем
    x
    1
    = ?(x
    2
    )
    2
    + C,
    т.е. фазовые траектории системы (11) представляют собой па- раболы, изображенные на рис. 4, B).
    Заметим теперь, что из всего семейства парабол, изобра- женных на рис. 4, только две проходят через положение рав- новесия
    x
    1
    = 0,
    x
    2
    = 0
    системы (5), причем только одна дуга каждой из них ведет к цели. На рис. 5 изображены дуга AO, соответствующая управ- лению (7), и дуга BO, соответствующая управлению (8), кото- рые ведут в начало координат без переключений управления.
    Другими словами, только с кривой AOB можно попасть в на- чало координат непосредственно. Во всех остальных случаях нужно сначала попасть на AOB и переключить при перехо- де на эту кривую управление. По этой причине кривую AOB
    называют линией перекличения.
    Заметим теперь, что (как было показано ранее) в систе- ме (5) при использовании оптимального по быстродействию управления может быть не более одного переключения. Тогда несложный анализ показывает, что выше кривой AOB следует использовать управление (8), а ниже  управление (7).
    Замечание. Описанный метод решения задач о быстро- действии для систем второго порядка всегда дает оптимальное управление как функцию фазовых координат. Значение тако- го принципа построения управления, известного как принцип обратной связи, трудно переоценить.
    Управляемая остановка осцилятора. Действуя как и ранее, рассмотрим несколько более сложную задачу, связан- ную с управлением осцилятором.

    џ4. Две задачи о быстродействии
    159
    -
    6
    O
    B
    A
    x
    2
    x
    1
    u
    ?
    (t) = +1
    u
    ?
    (t) = ?1
    Рис. 5
    Пример 10. Уравнение динамики управляемого осциля- тора имеет вид
    Ё
    x + x = u.
    (12)
    Если u(t) ? 0, то уравнению (12) сответствует уравнение неуправляемого осцилятора
    Ё
    x + x = 0.
    (13)
    На плоскости R
    2
    с координатами (x, ?x) система, описываемая уравнением (13), имеет единственное положение равновесия
    x = 0,
    ?x = 0.
    (14)
    Поскольку общее решение уравнения (13) имеет вид
    x(t) = C
    1
    sin t + C
    2
    cos t,
    при выводе внешней возмущающей силой системы из положе- ния равновесия (14) в ней возникают незатухающие периоди- ческие колебания, т.е. задача управления осцилятором заклю- чается быстрейшем гашении колебаний посредством перево- да материальной точки в положение равновесия (14). При этом на управление u по прежнему наложены ограничения (1).

    160
    Гл. 3. Основы оптимального упраления
    Используя замену (3), (4), перепишем уравнение (12) в ви- де системы
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = ?x
    1
    + u.
    (15)

    Заметим теперь, что управляемая функция Гамильтона ?
    H
    для системы (5) имеет вид
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    , u) = ?
    1
    x
    2
    + ?
    2
    (?x
    1
    + u),
    где канонические переменные ?
    1
    и ?
    2
    удовлетворяют сопря- женной системе
    Ѕ
    ?
    ?
    1
    = ?
    2
    ,
    ?
    ?
    2
    = ??
    1
    .
    (16)
    Поскольку
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    ) = max
    |u|?1
    ?
    H(x
    1
    , x
    2
    , ?
    1
    , ?
    2
    , u),
    то в силу теоремы 2 видим, что в каждой точке t непрерывно- сти функции u
    ?
    u
    ?
    (t) = sign ?
    2
    (t),
    (17)
    где обозначение сигнум-функции имеет тот-же смысл, что и в примере 9.
    Для отыскания управления u
    ?
    по формуле (17) введем в рассмотрение уравнение
    Ё
    ? + ? = 0.
    (18)
    Поскольку замена
    ?
    1
    = ?,
    ?
    2
    = ?
    ?,
    приводит уравнение (18) к системе (16), можем записать
    ?
    2
    (t) = S
    1
    sin t + S
    2
    cos t,
    где S
    1
    и S
    2
     произвольные постоянные. Следовательно, u
    ?
    (t)
    может переключать свое значение с +1 на ?1 или обратно ко- нечное число раз, зависящее от начального положения систе- мы (15). При этом, однако, если управление u
    ?
    (t)
    определено,
    то максимальное время его постоянства равно ?.
    Рассмотрим два случая, в которых управление u
    ?
    (t)
    опре- делено.

    џ4. Две задачи о быстродействии
    161
    A) Пусть
    u
    ?
    (t) = +1.
    (19)
    Тогда система (15) примет вид
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = ?x
    1
    + 1.
    (20)
    Наряду с системой (20) введем в рассмотрение систему
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = ?x
    1
    ,
    (21)
    к которой замена (3), (4) приводит уравнение (13). Система
    (20) отличается от системы (21) тем, что положение равнове- сия системы (20) находится в точке
    x
    1
    = +1,
    x
    2
    = 0,
    (22)
    а положение равновесия системы (21)  в точке
    x
    1
    = 0,
    x
    2
    = 0.
    (23)
    Если x
    1
    6= 0
    , то разделив формально первое из уравнений системы (21) на второе, запишем
    dx
    1
    dx
    2
    = ?
    x
    2
    x
    1
    ,
    откуда следует, что в этом случае
    (x
    1
    )
    2
    + (x
    2
    )
    2
    = (C)
    2
    ,
    (24)
    где C  любое действительное число. Аналогичным образом,
    если x
    2
    6= 0
    , то разделив формально второе из уравнений си- стемы (21) на первое, запишем
    dx
    2
    dx
    1
    = ?
    x
    1
    x
    2
    ,
    откуда следует, что в и этом случае справедливо равнество
    (24).
    Таком образом, на плоскости R
    2
    с координатами (x
    1
    , x
    2
    )
    траектории системы (21), отличные от положеия равновесия
    (23), представляют собой окружности с центром в точке (23) и радиусом C. При этом, как легко видеть, направление движе- ния по этом окружностям совпадает с движением по часовой

    162
    Гл. 3. Основы оптимального упраления
    x
    1
    x
    2
    -
    6
    O
    A
    B
    &%
    '$
    q
    &%
    '$
    q
    -
    ѕ
    Рис. 6
    стрелке. Поэтому уравнение траекторий системы (22) имеет вид
    (x
    1
    ? 1)
    2
    + (x
    2
    )
    2
    = (C)
    2
    ,
    (25)
    где направление движения при C 6= 0 совпадает с направле- нием движения по часовой стрелке.
    B) Пусть теперь
    u
    ?
    (t) = ?1.
    (26)
    Тогда система (15) примет вид
    Ѕ
    ?x
    1
    = x
    2
    ,
    ?x
    2
    = ?x
    1
    ? 1.
    (27)
    Заметим теперь, что положение равновесия системы (27)
    находится в точке
    x
    1
    = ?1,
    x
    2
    = 0.
    (28)
    Поэтому действуя как и при выводе равенства (25), неслож- но показать, что уравнение траекторий системы (22) задается равенством
    (x
    1
    + 1)
    2
    + (x
    2
    )
    2
    = (C)
    2
    ,
    (29)
    в котором направление движения при C 6= 0 также совпадает с направлением движения по часовой стрелке.
    Из сказанного выше следует, что при использовании опти- мального управления (17) только две траектории могут про- ходит через точку (23) (см. рис. 6). Более того, поскольку

    џ4. Две задачи о быстродействии
    163
    x
    1
    x
    2
    -
    6
    -
    ѕ
    q q
    q
    PPP
    PPP
    P
    P
    O
    A
    A
    1
    B
    P
    Q
    Рис. 7
    максимальное время постоянства управления u
    ?
    (t)
    (если u
    ?
    (t)
    определено) равно ?, то оптимальному управлению (19) со- ответствует дуга AO, а оптимальному управлению (26)  дуга
    BO
    соотвествующих траекторий. Сказанное означает, что если только с кривой AOB можно попасть в положение равновесия непосредственно без переключений. Поэтому для получения общей картины нужно продолжить оптимальные траектории с этой кривой в направлении, обратном направлению движе- ния по траекториям.
    Пусть P  произвольная точка дуги BO (см. рис. 7). Как уже отмечалось, использование в этой точке управления (26)
    приводит ситему в начало координат быстрейшим образом.
    Возьмем точку с координатами
    x
    1
    = +3,
    x
    2
    = 0,
    (30)
    и построим дугу AA
    1
    окружности с центром в точке (30) ра- диуса, равного единице. Через точку P и точку, соответству- ющую положению равновесия (22) проведем прямую до пере- сечения ее с точкой Q дуги AA
    1
    Заметим теперь, что время прохождения вдоль дуги P Q по замкнутой траектории из точки P в себя равно 2?. Посколь- ку максимальное время постоянства управления u
    ?
    (t)
    (если,
    конечно, u
    ?
    (t)
    определено) равно ?, а по построению дуга P Q

    164
    Гл. 3. Основы оптимального упраления
    x
    1
    x
    2
    -
    6
    -
    ѕ
    q q
    q q
    q
    -
    O
    A
    A
    1
    B
    B
    1
    B
    2
    P
    Q
    R
    Рис. 8
    представляет собой ровно половину соответствующей окруж- ности, то для любой точки на этой дуге оптимальное управ- ление определено и удовлетворяет равенству (19). При этом продолжение оптимальной траектории в направлении, проти- воположном направлению движения, от точки Q требует пре- ключения управления с (19) на (26) при прохождении через
    Q
    . Но так как точка P на дуге выбиралась BO произвольным образом, из сказанного следует, что переключение оптималь- ного управления происходит при прохождении через дугу AA
    1
    каждой оптимальной траектории.
    Возьмем теперь точки с координатами
    x
    1
    = ?3,
    x
    2
    = 0,
    (31)
    и
    x
    1
    = ?5,
    x
    2
    = 0.
    (32)
    Построим дуги BB
    1
    и B
    1
    B
    2
    окружностей с центром в точке
    (31) и (32) соответственно; при этом радиус каждой из этих окружностей оставим равным, единице (см. рис. 8). Действуя как и при построении точки Q на рис. 7, на рис. (см. рис. 8)
    прямую, проходящую через точки (28) и Q; пересечение это прямой с дугой B
    1
    B
    2
    обозначим через R.

    џ4. Две задачи о быстродействии
    165
    Легко видеть, что время прохождения вдоль дуги RQ по замкнутой траектории из точки R в себя равно 2?. С другой стороны, так как по построению максимальное время посто- янства управления u
    ?
    (t)
    (если, как и ранее, u
    ?
    (t)
    определено)
    равно ?, а дуга по построению QR представляет собой ровно половину соответствующей окружности, то для любой точки на этой дуге оптимальное управление определено и задается формулой (26). Более того, продолжение оптимальной траек- тории в направлении, противоположном направлению движе- ния, от точки R требует преключения управления уже с (26)
    на (19) при прохождении через Q. Но так как выбор точки
    P
    , а, следовательно, и точек Q и R выше по существу не иг- рал никакой роли, то переключение оптимального управления происходит всякий раз, когда любая оптимальная траектория проходит через дугу B
    1
    B
    2
    Действуя аналогичным образом, построим дугу A
    1
    A
    2
    и продолжим кривую B
    2
    OA
    2
    на всю ось Ox
    1
    (см. рис. 9). По- строенное таким образом продолжение состоит из полуокруж- ностей единичного радиуса и разбивает плоскость R
    2
    на две полуплоскости, обладающими следующими свойствами. При движении по любой оптимальной траектории, находящейся в верхней полуплоскости, используется оптимальное управление
    (26), а при движении по любой оптимальной траектории, нахо- дящейся в верхней полуплоскости,  оптимальное управление
    (19).
    Таким образом, линией переключения в рассматриваемой задаче является продолжение кривой B
    2
    OA
    2
    на ось Ox
    1
    . При этом время между переключениями не превосходит ?, а дви- жение по самой линии переключения происходит только по ду- гам AO и BO, ведущим непосредственно в начало координат.
    Оптимальное управление на дуге AO определяется по фор- муле (19), а по дуге BO  по формуле (26). Общее же число переключений зависит от начального состояния системы.
    Замечание. Необходимо отметить, что здесь (как и в примере 9) оптимальное управление построено по принципу обратной связи.
    Упражнения.

    166
    Гл. 3. Основы оптимального упраления
    x
    1
    x
    2
    -
    6
    ѕ
    - q
    q q
    q q
    q
    O
    A
    A
    1
    A
    2
    u
    ?
    (t) = +1
    B
    B
    1
    B
    2
    u
    ?
    (t) = ?1
    Рис. 9
    (1) Предположим, что в условиях примера 9 уравнение дви- жения системы имеет вид
    a
    0
    Ё
    x + a
    1
    ?x + a
    2
    x = u.
    (33)
    Решите задачу о быстродействии для системы (33) в пред- положении, что корни характеристического уравнения
    a
    0
    ?
    2
    + a
    1
    ? + a
    2
    = 0
    действительны, различны и
    (a) отрицательны;
    (b) положительны.
    Указание: Используйте стандартные фазовые портреты системы (см., например, [17]).
    (2) Решите задачи примеров 9 и 10 в предположении, что си- стему следует перевести не в положение равновесия, а на окружность
    (x)
    2
    + ( ?x)
    2
    = C
    2
    извне.

    џ5. Линейные оптимальные быстродействия
    167
    џ5. Линейные оптимальные быстродействия
    Задача об оптимальном быстродействии, в которой управ- ляемая система линейна, имеет огромное историческое значе- ние, поскольку именно с нее фактически и начиналось опти- мальное управление (см. [18]). Более того, как уже отмеча- лось, эта задача во многом определяет методы решения за- дач со свободным временем перехода и, потому, имеет также огромное методическое значение. И, наконец, несмотря на ка- жущуюся внешнюю простоту данная задача и в наши дни про- должает иметь огромное практическое значение при констру- ировании систем управления. Так, задача о быстродействии возникает всякий раз, когда систему, подвергшуюся внешнему возмущению следует быстрейшим образом вернуть в некото- рое желаемое состояние. В качестве еще одного традиционного примера отметим также задачу о быстрейшем перехвате цели,
    движущейся по известной траектории.
    Предварительные сведения. Прежде всего, приведем некоторые сведения из геометрической теории обыкновенных дифференциальных уравнений, необходимые для дальнейшего изложения.
    Обозначим через A фиксированную (n Ч n)-матрицу, эле- ментами которой, вообще говоря, являются достаточное число раз дифференцируемые по времени t функции a
    i
    j
    . Далее, пусть
    A
    0
     матрица, транспонированная к A. Рассмотрим систему дифференциальных уравнений
    ?
    ? = A?,
    (1)
    ?
    ? = ?A
    0
    ?,
    (2)
    в которой считается, что решение ?(t) не равно нулю тожде- ственно. С решениями системы (1), (2) свяжем пространства
    ?
    и ?, которые определим следующим образом.
    Пространство ? является (n ? 1)-мерным подпростран- ством, зависящим от t и состоящим из векторов n-мерного пространства, ортогональных к ?(t). Непрерывно дифференци- руемым подпространством назовем собственное подпростран- ство n-мерного пространства, также зависящее от t и состоя- щее из точек, являющихся линейными комбинациями системы

    168
    Гл. 3. Основы оптимального упраления непрерывно дифференцируемых векторов. Если размерность последнего пространства равна n ? 1 для всех значений t, то будем обозначать его через ?. При этом будем писать v ? ?
    и говорить, что вектор v лежит в пространстве ?, если он лежит в ? при всех значениях t. Подпространство ? назовем ковариантным, если для каждого непрерывно дифференци- руемого вектора v ? ?
    ?v ? Av ? ?.
    Предложение 1. Подпространство ? ковариантно то- гда и только тогда, когда оно совпадает с некоторым подпро- странством ?. Оказывается, что это может быть тогда и только тогда, когда оно состоит из векторов вида
    v(t) =
    n?1
    X
    k=1
    ?
    k
    (t)?
    k
    (t),
    (3)
    где ?
    k
     скалярные функци, а ?
    1
    , . . . , ?
    n?1
     система линейно независимых решений системы (1), ортогональных к ?(t) при некотором значении t = t
    0
    Доказательство. Прежде всего, заметим, что каждое подпространство ? ковариантно. В самом деле, для произ- вольного дифференцируемого вектора v ? ? справедлива це- почка равенств
    0 =
    d
    dt
    hv, ?i = h ?v, ?i ? hv, A
    0
    ?i = h ?v ? Av, ?i.
    Поэтому
    ?v ? Av ? ?.
    Далее, для любой пары функций (?, ?), удовлетворяющей системе (1), (2)
    d
    dt
    h?, ?i = hA?, ?i ? h?, A
    0
    ?i = 0.
    Другими словами, если равенство
    h?(t), ?(t)i = 0
    справедливо при некотором значении t = t
    0
    , то оно справед- ливо для всех значений t, для которых определено решение

    џ5. Линейные оптимальные быстродействия
    169
    системы (1), (2). Поэтому ? ? ? и, значит, каждое из n ? 1 ли- нейно независимых решений ?
    k
    (t)
    системы (1) (такие решения,
    как известно, всегда существуют) принадлежит ?. Сказанное,
    очевидно, означает, что подпространство ? должно состоять из векторов вида (3). Верно также и обратное: если вектора
    ?
    1
    (t), . . . ?
    n?1
    (t)
    подобраны так, что они также ортогональны к ?(t) при некотором значении t = t
    0
    , они ортогональны к ?(t)
    при всех значениях t, для которых определено решение систе- мы (1), (2), т.е. система векторов (3) образует подпространство
    ?
    Предположим теперь, что подпространство ? ковариант- но. Обозначим через $ нормальный к нему единичный вектор.
    Тогда для любого дифференцируемого вектора v ? ?
    h ?v, $i + hv, ?
    $i =
    d
    dt
    hv, $i = 0
    и, следовательно,
    0 = h ?v ? Av, $i = ?hv, ?
    $i ? hAv, $i = ?hv, ?
    $ + A
    0
    $i.
    Другими словами, вектор h$ + A
    0
    $i
    ортогонален к каждому дифференцируемому вектору v ? ?. Поэтому этот вектор ор- тогонален к подпространству ? и, значит, отличается от нор- мального вектора $ только скалярным множителем q.
    Подберем скалярную функцию ? времени t так, чтобы вы- полнялись равенства
    d
    dt
    (?$) + A
    0
    ?$ = ( ?? + q?)$ = 0;
    это, очевидно, можно сделать всегда. Тогда вектор ?$ равен некотору вектору ?. Следовательно, подпространство ? сов- падает с соотвествующим ?.
    ¤
    Если при некотором значении t = t
    1
    вектор v принажле- жит к подпространству ?, то будем говорить, что при t = t
    1
    вектор v пересекает ?, что обозначим через
    v ? (t
    1
    )?.
    В общем случае, если задано некоторое натуральное число k,
    то будем говорить, что при t = t
    1
    вектор v имеет пересесечение

    170
    Гл. 3. Основы оптимального упраления порядка k с подпространством ? или касание порядка (k ? 1)
    с этим подпространством, и писать
    v =
    k
    (t
    1
    )?,
    если при t = t
    1
    вектор v (k ? 1) раз дифференцируем по t и скалярное произведение hv, ?i равно нулю вместе со своими производными по t до порядка (k ? 1). При этом для опреде- ленности положим
    v ?
    k
    (T )?,
    где T  множество тех значений t
    ?
    , для которых натуральные числа k
    ?
    удовлетворяют условиям
    v ?
    k
    ?
    (t
    ?
    )?
    и
    X
    ?
    k
    ?
    ? k.
    Будем говорить, что (n?1) раз дифференцируемый вектор
    v
    является вектором общего положения, если не существует такого значения t
    0
    времени t и такого подпространства ?, для которых v имеет пересечение порядка n с подпространством
    ?
    при t = t
    0
    Предложение 2. Для того, чтобы (n?1) раз дифферен- цируемый вектор v был вектором общего положения, необхо- димо и достаточно, чтобы для всех значений t
    0
    вектора
    µ
    d
    dt
    ? A

    k
    v,
    k = 0, . . . , n ? 1
    (4)
    были линейно независимы при t = t
    0
    Доказательство. Прежде всего, заметим, что для каж- дого вектора ? имеет место равенство
    µ
    d
    dt

    k
    hv, ?i =

    d
    dt
    ? A

    k
    v, ?
    +
    .
    (5)
    В самом деле, при k = 1 это очевидно. При любом же другом значении k справедливость равенства (5) проверяется

    џ5. Линейные оптимальные быстродействия
    171
    непосредственно по индукции. Поэтому справедливость пред- ложения 2 следует из того, что линейная независимость век- торов (4) при каком-либо значении t = t
    0
    эквивалентна тре- бованию их ортогональности к некоторому вектору ? при
    t = t
    0
    ¤
    Значение вектора общего положения для задачи об оп- тимальном быстродействиии трудно переоценить, поскольку имеет место следующее
    Предложение 3. Если T  ограниченное бесконечное множество значений времени t, то соотношение
    v ?
    ?
    (T )?
    не может выполняться для векторов общего положения.
    Доказательство. Предположим противное и приведем это предположение к противоречию.
    Пусть v  произвольный вектор общего положения. Если утверждение теоремы 3 неверно, то из множества T можно выбрать последовательность значений
    t
    1
    , t
    2
    , . . . , t
    l
    , . . . ,
    при l ? ? сходящуюся к некоторому действительному числу
    t
    ?
    . Вдоль этой последовательности по определению
    hv, ?i = 0.
    (6)
    Поэтому равенство (6) выполняется и при t = t
    ?
    Заметим теперь, что по построению между любыми двумя значениями t
    l
    и t
    l+1
    находится нуль производной
    d
    dt
    hv, ?i.
    (7)
    Поэтому в силу непрерывности производной (7) последняя равна нулю и при t = t
    ?
    . Аналогичным образом, при t = t
    ?
    равны нулю также все производные порядков до n ? 1 вклю- чительно, т.е. вектор v не является вектором общего положе- ния.
    ¤
    В частном случае предложение 3 принимает следующий гораздо более тонкий вид.

    172
    Гл. 3. Основы оптимального упраления
    Предложение 4. Пусть A  постоянная матрица с действительными собственными числами и v  постоянный вектор. Тогда соотношение
    v ?
    n
    (T )?
    не может выполняться ни для какого множества T , если не выполняется соотношение v ? ?.
    Доказательство. Прежде всего, заметим, что соотно- шение v ? ? эквивалентно равенству
    hv, ?i = 0.
    (8)
    Далее, матрицу A можно преобразовать в вырожденную, по- ложив
    ?
    A = A ? ?E,
    где ?  любое собственное число матрицы A и E  единичная матрица. Тогда, если принять
    ?
    ? = ?e
    ?t
    ,
    то
    µ
    d
    dt
    + ?
    A
    0

    ?
    ? = e
    ?t
    µ
    d
    dt
    + A
    0

    ? = 0.
    Принимая во внимание сказанное для простоты предпо- ложим теперь, что матрица A вырождена. Тогда существует постоянный единичный вектор a, такой, что aA
    0
    = 0
    и, следо- вательно,
    a ?
    ? = ?aA
    0
    ?
    ? = 0.
    Повернув, если это требуется, оси можно добиться того, что направление вектора a совпало с направлением оси x
    1
    . Обо- значим через v
    1
    и A
    1
    соответствено (n ? 1)-мерный вектор и
    (n ? 1) Ч (n ? 1)
    -матрицу, полученные вычеркиванием из v и A
    вычеркиванеим первой компоненты и первой строки и столб- ца. Тогда вектор ? окажется в (n?1)-мерном подпространстве,
    ортогональном к оси x
    1
    . Поэтому
    µ
    d
    dt
    + A
    0
    1

    ? = 0
    (9)
    и
    µ
    d
    dt
    + A
    0

    ? = 0.
    (10)

    џ5. Линейные оптимальные быстродействия
    173
    Поскольку
    d
    dt
    hv, ?i = hv, ?
    ?i,
    то условие (8) выполняется при n = 1. Тогда в силу равенств
    (9) и (10) справедливость утверждения предложения 4 непо- средственно проверяется по индукции.
    ¤
    Задача о линейных оптимальных быстродействиях.
    Рассмотрим линейную систему
    ?x = Ax + Bu,
    (11)
    где A и B  постоянные соответственно (n Ч n)- и (n Ч m)- матрицы. При этом считается, что допустимое множество U
    представляет собой выпуклый многограник, причем начало координат пространства R
    m
    является его внутренней точкой.
    Задача заключается в минимизации времени t
    1
    ? t
    0
    перехода системы (11) из заданной точки
    x(t
    0
    ) = x
    0
    (12)
    в начало координат пространства R
    n
    ; минимизация, как и ра- нее, осуществляется в множестве U(t
    0
    , t
    1
    )
    кусочно-непрерыв- ных допустимых управлений.
    По вполне понятным причинам сформулированную выше задачу называют задачей о линейных оптимальных быстро- действиях. Физический смысл данной задачи также прозра- чен: систему (11) требуется быстрейшим образом перевести в положение равновесия невозмущенного движения
    ?x = Ax;
    (13)
    при этом оба уравнения (11) и (13) как правило являются урав- нениями в вариациях.
    Будем называть ребром многогранника U каждую из его
    1
    -мерных граней. Основное допущение, которое обычно при- нимают в задачах о линейных оптимальных быстродействиях,
    состоит в следующем. Каждый вектор v, определямый равен- ством
    v = Bw,
    (14)

    174
    Гл. 3. Основы оптимального упраления где w  направление одного из ребер многогранника U, яв- ляется вектором общего положения. Это допущение, очевид- но, относится только к конечному числу векторов. И, хотя, на практике выполнения данного допущения всегда можно до- биться слегка повернув многогранник, последнее (как это ни печально) существенно ограничивает использование приведен- ных ниже результатов.
    Согласно предложению 2 несложно заметить, что (14) бу- дет вектором общего положения, если для каждого направле- ния w вектора
    Bw, ABw, . . . , A
    n?1
    Bw
    (15)
    будут линейно независимы. Для чего нужна линейная незави- симость векторов (15), станет ясно чуть ниже. Пока перейдем к выясненю структуры оптимального управления. Для этого,
    прежде всего, заметим, что здесь сопряженная система имеет вид
    ?
    ? = ?A
    0
    ?,
    (16)
    а управляемая функция Гамильтона 
    ?
    H(x, ?, u) = h?, Ax + Bui.
    Пусть u
    ?
     оптимальное управление в рассматриваемой за- даче и пусть x
    ?
     соответсвующая траектория. Тогда согласно теореме 2 найдется такая векторная функция
    ?
    ?
    (t) = (?
    ?
    1
    (t), . . . , ?
    ?
    n
    (t)),
    что:
    (1) Для всех значений t
    0
    ? t ? t
    1
    выполнено условие
    |?
    ?
    (t)| 6= 0.
    (2) Для всех значений t
    0
    ? t ? t
    1
    имеет место равенство
    h?
    ?
    (t), Ax
    ?
    (t) + Bu
    ?
    (t)i = ?
    H(x
    ?
    (t), ?
    ?
    (t)),
    где
    ?
    H(x, ?) = max
    u?U
    h?, Ax + Bui.

    1   ...   5   6   7   8   9   10   11   12   13


    написать администратору сайта