Главная страница
Навигация по странице:

  • Рис. 9. Поведение гамильтонианов j j j u u H Φ+α=)(1 и

  • в зависимости от j Φ

  • 6.2. Процедура нахождения особого управления

  • 6.4. Необходимые условия в точках сопряжения особого и регулярного управлений

  • Г л а в а 7 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ КООРДИНАТЫ x

  • 7.2. Необходимые условия оптимальности

  • Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


    Скачать 1.34 Mb.
    НазваниеСпециальные разделы теории управления. Оптимальное управление
    АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
    Дата12.01.2023
    Размер1.34 Mb.
    Формат файлаpdf
    Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
    ТипДокументы
    #883784
    страница10 из 15
    1   ...   7   8   9   10   11   12   13   14   15
    x
    x
    λ
    , (61) которое формально совпадает с условием


    =

    λ
    =


    n
    i
    ij
    i
    j
    t
    r
    u
    H
    0 0
    )
    ,
    (x
    (62) на отрезке
    [
    ]
    2 1
    ,
    τ
    τ
    Отрезок
    ]
    ,
    [
    2 1
    τ
    τ
    , на котором имеет место соотношение (61), называется участком особого управления для компоненты
    j
    u , а оптимальное управление
    )
    (
    *
    t
    u
    j
    на таком участке существует, называется особым оптимальным управлением. Такое название объясняется тем, что поскольку гамильтониан H от
    j
    u не зависит, оптимальное управление не может быть найдено непосредственно с помощью принципа максимума. Более того, в случае выполнения условия (61) ни необходимые условия классического вариационного исчисления, ни необходимые условия динамического программирования (см. п. 5.2) не могут служить для непосредственного вычисления компоненты
    *
    j
    u
    , хотя все эти условия формально не выполняются.
    Рис. 9. Поведение гамильтонианов
    j
    j
    j
    u
    u
    H
    Φ
    +
    α
    =
    )
    (
    1
    и
    α
    +
    +
    Φ
    =
    j
    j
    j
    j
    u
    u
    u
    H
    )
    (
    2
    в зависимости от
    j
    Φ :
    а, б, г, д – строгий минимум (регулярное управление);
    в, е – нестрогий минимум (особое управление)
    Так, например, если гамильтониан H от управления
    j
    u не зависит, то H достигает максимума при любом
    j
    u .
    Условия (61) не могут установить различие между управлениями
    j
    u
    , дающими минимум или максимум функционалу
    J[u]. На участке особого управления выполняется соотношение
    )
    ,
    1
    ,
    (
    0
    det
    2
    m
    j
    i
    u
    u
    H
    j
    i
    =

    



    






    на
    ]
    ,
    [
    2 1
    τ
    τ
    , (62) показывающее, что условие Гильберта невырожденности вариационной задачи нарушено. Задачи, для которых имеет место условие, в классическом вариационном исчислении называются вырожденными. Если множество
    m
    U
    – замкнуто и ограни- чено, то в вырожденных задачах может наблюдаться два режима оптимального управления: регулярный, когда u определяет- ся из принципа максимума [как, например, (60)], и особый, когда u не может быть найдено из принципа максимума [как, на- пример, при выполнении (61)] и когда требуется особая процедура для его отыскания.
    6.2. Процедура нахождения особого управления
    Общая теория вырожденных вариационных задач разработана недостаточно. Наиболее полно исследован случай особо- го управления по одной компоненте
    j
    u
    . В этом случае решение можно получить следующим образом.
    Условие (62) показывает, что режим особого управления на участке
    ]
    ,
    [
    2 1
    τ
    τ
    (участке особого управления) имеет место, если

    =

    λ
    =


    n
    i
    ij
    i
    j
    t
    r
    u
    H
    0 0
    )
    ,
    (
    x
    Последовательное дифференцирование этого соотношения по t приводит к соотношениям

    0











    j
    k
    k
    u
    H
    dt
    d
    на
    ]
    ,
    [
    2 1
    τ
    τ
    (k = 0, 1, 2, ...). (64)
    Можно показать, что первое ненулевое значение величины




















    j
    k
    k
    j
    u
    H
    dt
    d
    u
    возможно лишь при четном k. Обозначим его
    p
    k
    k
    2
    min
    =
    =
    . Число p называется порядком вырожденности (сингулярности) вариационной задачи (оптимального управления).
    При k = 2p управление
    j
    u войдет в










    j
    k
    u
    H
    dt
    d
    явным образом. Теперь величину особого оптимального управления
    *
    j
    u
    можно найти из условия
    0 2
    2
    =










    j
    p
    p
    u
    H
    dt
    d
    на
    ]
    ,
    [
    2 1
    τ
    τ
    , (65) которое линейно по
    j
    u (в силу линейности по u системы (56)). Уравнения сопряженной системы в данном случае имеют вид
    ∑ ∑

    =
    =
    =










    λ
    +

    ∂γ
    λ

    =
    λ
    m
    j
    j
    n
    i
    s
    ij
    i
    n
    i
    s
    i
    i
    s
    u
    x
    r
    x
    dt
    d
    1 0
    0
    . (66)
    Считая, что все остальные компоненты вектора u регулярны, т.е. определяются соотношениями типа (60), условие (65) можно записать в виде
    0
    )
    ,
    ,
    (
    )
    ,
    ,
    (
    2 1
    2 2
    =
    λ
    +
    λ
    =










    t
    M
    u
    t
    M
    u
    H
    dt
    d
    j
    j
    p
    p
    x
    x
    , (67) откуда и может быть найдено особое управление для компонент
    )
    ,
    ,
    (
    )
    ,
    ,
    (
    2 1
    t
    M
    t
    M
    u
    j
    λ
    λ

    =
    x
    x
    6.3. Необходимое условие оптимальности особого управления
    Для минимума критерия качества J[u] на особом управлении
    *
    j
    u
    в задаче (56)–(57) должно выполняться следующее не- обходимое условие:
    ,
    2
    ,
    1
    ,
    0
    ,
    0
    )
    1
    (
    2 2
    =






















    p
    u
    H
    dt
    d
    u
    j
    p
    p
    j
    p
    . (68)
    При максимизации критерия качества знак в неравенстве (68) следует заменить на обратный.
    Отметим, что при p = 0, т.е. для невырожденных задач, это условие переходит в условие
    0 2
    2



    j
    u
    H
    (при m = 1) и, та- ким образом, (68) является аналогом условия Лежандра–Клебша для особых (вырожденных) экстремалей (для одномерного управления
    j
    u ). При p = 1 условие (68) имеет вид
    0 2
    2





















    j
    j
    u
    H
    dt
    d
    u
    6.4. Необходимые условия в точках сопряжения
    особого и регулярного управлений
    Результаты, полученные в пп. 6.2 и 6.3, применимы, если значения оптимального особого управления
    )
    (
    *
    t
    u
    j
    являются внутренними точками множества
    m
    U
    на отрезке
    ]
    ,
    [
    2 1
    τ
    τ
    . Необходимые условия для перехода с регулярного оптимального управления на особое оптимальное в случае, когда
    m
    U
    m-мерный прямоугольник
    )
    (
    )
    (
    )
    (
    t
    b
    t
    u
    t
    a
    j
    j
    j


    , а
    1
    τ – момент вре- мени начала перехода, определяются следующими неравенствами:
    0
    )]
    ,
    ,
    (
    )
    (
    )
    ,
    ,
    (
    [
    1 2
    1
    <
    +
    τ
    t
    M
    t
    b
    t
    M
    j
    λ
    x
    λ
    x
    (69)

    (необходимое условие для возможности перехода регулярного управления с верхней границы
    )
    (
    )
    (
    t
    b
    t
    u
    j
    j
    =
    на особое опти- мальное управление) и
    0
    )]
    ,
    ,
    (
    )
    (
    )
    ,
    ,
    (
    [
    1 2
    1
    >
    +
    τ
    t
    M
    t
    a
    t
    M
    j
    λ
    x
    λ
    x
    (70)
    (необходимое условие для возможности перехода регулярного управления с верхней границы
    )
    (
    )
    (
    t
    b
    t
    u
    j
    j
    =
    на особое оптимальное управление).
    Требование совместного выполнения условий (69) и (70) может быть представлено в виде неравенства
    0 1
    2 2





















    τ
    j
    p
    p
    j
    u
    H
    dt
    d
    u
    . (71)
    Это условие является необходимым для возможности перехода с обеих границ регулярного управления на особое. Не- обходимое условие (71) легче проверить, так как оно не связано с вычислением
    )
    ,
    ,
    (
    1
    t
    M
    λ
    x
    . Однако следует иметь в виду, что оно является более слабым, чем условия (69) и (70), поскольку последние из него не вытекают.
    Контрольные вопросы
    1. Что такое особое управление, и когда оно возникает?
    2. Процедура нахождения особого управления.
    3. Необходимое условие оптимальности особого управления.
    4. Необходимые условия в точках сопряжения особого и регулярного управлений.
    Г л а в а 7
    НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
    УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА
    НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ
    КООРДИНАТЫ x
    В технических приложениях имеется ряд задач, когда при формировании оптимальной траектории необходимо учиты- вать ограничения на область допустимых значений фазовых координат. Например, при наборе самолетом высоты или при рассмотрении траекторий спуска зад
    2 2
    )
    (
    ))
    (
    (
    q
    t
    v
    t
    h
    q

    =
    ρ
    , т.е.
    0
    )
    ),
    (
    ),
    (
    (
    зад

    q
    t
    t
    v
    t
    h
    q
    При движении ЛА типичными также являются ограничения на допустимые значения высоты полета h и массы m ЛА:
    h(t)
    ≥ 0; m(t) ≥ m.
    В общем случае ограничения указанного типа можно записать в виде
    0
    )
    ,
    (

    x
    φ
    t
    , (72) где
    T
    n
    T
    x
    x
    x
    )
    ...,
    ,
    ,
    (
    ;
    )
    ...,
    ,
    ,
    (
    2 1
    2 1
    1
    =
    φ
    φ
    φ
    =
    µ
    x
    φ
    7.1. Краткая формулировка задачи
    Пусть эволюция рассматриваемой системы S описывается векторным дифференциальным уравнением
    )
    ,
    ,
    (
    u
    x
    f
    x
    t
    dt
    d =
    , (73) где
    ;
    )
    ...,
    ,
    ,
    (
    ;
    )
    ...,
    ,
    ,
    (
    ;
    )
    ...,
    ,
    ,
    (
    2 1
    2 1
    2 1
    T
    m
    T
    n
    T
    n
    u
    u
    u
    x
    x
    x
    x
    f
    f
    =
    =
    =
    u
    x
    f
    m
    U

    u
    ;
    m
    U
    – некоторая замкнутая и ограниченная область в пространстве
    m
    R
    З а д а н ы :
    • начальное значение
    0 0
    )
    (
    x
    x
    =
    t
    , (74)
    • интервал времени
    ]
    ,
    [
    1 0
    t
    t
    ,
    • критерий качества

    dt
    t
    f
    t
    t
    J
    t
    t

    +
    Φ
    =
    1 0
    )
    ,
    ,
    (
    ))
    (
    ,
    (
    ]
    [
    0 1
    1
    u
    x
    x
    u
    . (75)
    Необходимо найти такое кусочно-непрерывное управление
    m
    U
    t

    )
    (
    u
    , которое переводит начальное условие
    )
    ,
    (
    0 0
    x
    t
    в некоторую конечную точку
    ))
    (
    ,
    (
    1 1
    t
    t
    x
    , удовлетворяющую условиям
    ,
    )
    ...,
    ,
    ,
    (
    ,
    0
    ))
    (
    ,
    (
    2 1
    1 1
    T
    l
    q
    q
    q
    t
    t
    =
    =
    q
    x
    q
    (76)
    l < n + 1, и минимизирует функционал J[u] на траекториях, удовлетворяющих условиям
    )
    ...,
    ,
    ,
    (
    ,
    0
    )
    ,
    (
    1 2
    1
    T
    t
    µ
    φ
    φ
    φ
    =

    φ
    x
    φ
    (76')
    Здесь значения функции
    i
    φ не зависят явно от управления u. Предполагается, что
    φ
    ,
    ,
    0
    f
    t
    обладают непрерывными произ- водными до второго порядка.
    7.2. Необходимые условия оптимальности
    В постановке п. 7.1 вся оптимальная траектория полета в общем случае может состоять из двух типов участков: участ- ков, целиком лежащих внутри допустимой области, и участков, лежащих на границе допустимой области (рис. 10). Количе- ство таких участков и их чередование зависит от конкретной задачи и граничных условий. На участках, целиком располо- женных внутри допустимой области, условия (72) выполняются в виде строгих неравенств
    0
    )
    ,
    (
    >
    φ
    x
    t
    Для этих участков справедлив принцип максимума, сформулированный в п. 4.3.
    На участках, лежащих на границе допустимой области, одно или несколько условий типа (72) выполняются в виде ра- венств. Эти участки называются граничными, для них принцип максимума п. 4.3 уже не справедлив. Наличием этих участ- ков данная задача и отличается от задач п. 4.1.
    Известно несколько эквивалентных подходов к получению необходимых условий оптимальности для участков, распо- ложенных на границе
    0
    )
    ,
    (
    =
    φ
    x
    t
    . Будучи эквивалентными, эти подходы ведут к различным вычислительным процедурам получения решения.
    Рис. 10. Типы возможных оптимальных траекторий в задачах
    с ограничениями на фазовые координаты:
    аг – случаи, когда допустимые траектории располагаются внутри некоторой области (не обязательно замкнутой); а – траектория, цели- ком лежащая внутри допустимой области; б – траектория, имеющая с границей области одну общую точку (типа отражения от границы); в
    – траектория, целиком лежащая на
    границе; г – траектория, частично расположенная на границе;
    дз – случаи, когда допустимые траектории располагаются вне некоторой области; д – случай двух траекторий, доставляющих относи- тельный минимум в задаче о кратчайшем пути на плоскости; е – случай невыпуклой запрещенной области, траектории с несколькими уча- стками входа и схода; ж – 12 – траектория, не имеющая общих точек с границей; 13 – траектория, имеющая одну общую точку (касание) с границей; з – случай негладкой границы допустимой области; 1 – начальная точка траектории; 2 – конечная точка траектории; 1' – точка входа на границу; 2' – точка схода с границы
    Рассмотрим случай одного скалярного ограничения вида
    0
    )
    ,
    (

    φ
    x
    t
    i
    7.3. Первый тип необходимых условий оптимальности
    для граничных участков траектории
    Для простоты рассматривается случай, когда лишь одно из ограничений типа (72) выполняется в виде равенства (на- пример, ограничение
    1
    φ ). Пусть это ограничение
    0
    )
    ,
    (
    1
    =
    φ
    x
    t
    (77) таково, что полная производная по времени
    )
    ,
    ,
    (
    )
    ,
    (
    1 1
    1 1
    1
    u
    x
    f
    x
    x
    x
    x
    t
    t
    t
    dt
    t
    d







    ∂φ
    +

    ∂φ
    =

    ∂φ
    +

    ∂φ
    =
    φ
    &
    (78) содержит управление u явно.
    Необходимое и достаточное условие того, что (77) имеет место на некотором ненулевом отрезке
    ]
    ,
    [
    2 1
    t
    t


    , вводится в уравнение
    0
    )
    ,
    ,
    (
    )
    ,
    ,
    (
    )
    ,
    (
    1 1
    1 1
    1
    =
    φ
    =







    ∂φ
    +

    ∂φ
    =
    φ
    =
    φ
    u
    x
    u
    x
    f
    x
    x
    t
    t
    t
    dt
    t
    d
    &
    &
    (79)
    Составляется гамильтониан
    1
    H
    для граничных участков
    )
    ,
    ,
    (
    1 1
    u
    x
    t
    H
    H
    φ
    β
    +
    =
    &
    , (80) где

    =
    λ
    +
    λ
    =
    n
    i
    i
    i
    f
    f
    H
    1 0
    0
    ;
    0
    =
    β
    на участках, где
    ;
    0 1
    >
    φ
    0

    β
    на участках, где
    0 1
    =
    φ
    Теперь необходимые условия для граничного участка совпадают с необходимыми условиями п. 8.3 с заменой в услови- ях (95), (97), (101) функции

    на
    1
    φ&
    . Отличие этой задачи от задачи п. 8.2 заключается в условиях, накладываемых на пере- менные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные
    )
    (t
    i
    λ
    могут претер- певать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие
    0
    )
    ,
    (
    1
    =
    φ
    1   ...   7   8   9   10   11   12   13   14   15


    написать администратору сайта