Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
u u x u u x x x u l x l x x x l u T T T T T 3 T 2 T T Здесь T n T n f f x x x ) ..., , ( ; ) ..., , , ( 1 2 1 = = f x ; C, A(t) – матрицы размерности n × n; ) ( , ) ..., , ( 1 1 1 t u u T m x x u = = ; B(t), N(t) – мат- рицы размерности n × m; ) ( , 1 t Q R – положительно полуопределенные симметричные матрицы размерности n × n; P(t) – положительно определенная симметричная матрица размерности m × m; P(t) – известная функция времени; ) ( , 2 1 t l l , ) ( , 2 1 t l l – n-мерные векторы; ) ( 3 t l – m-мерный вектор. Напомним, что симметричная матрица Q называется положительно полуопределенной, если все ее собственные значе- ния неотрицательны или если соответствующая ей квадратичная форма неотрицательна, т.е. 0 ≥ x x Q T для всех 0 ) ..., , , ( 2 1 ≠ = T n x x x x . Для того чтобы матрица Q была положительно полуопределенной, необходимо и достаточно, чтобы все главные (а не только угловые!) миноры были неотрицательны: ) , 1 ; 1 ( 0 2 1 2 1 2 1 n p n i i i i i i i i i Q p p p = ≤ < < < ≤ ≥ Предполагается, что на значения управляющего вектора u не накладывается каких-либо ограничений, а матрицы Q(t), N(t), P(t) таковы, что выполняется условие 0 ) ( ) ( ) ( ) ( 1 ≥ − − t N t P t N t Q T (это условие гарантирует отсутствие сопряженных точек в данной задаче). Необходимо найти закон управления с обратной связью u * = v * (x, t), минимизирующий критерий J[u]. Заметим, что значения вектора фазовых координат x при 1 t t = не заданы (т.е. рассматри- ваемая задача относится к числу задач оптимального управления со свободным правым концом). Пусть V(t, x) – минимальное значение критерия качества J[u] при движении системы (I) из произвольной начальной точки (t, x) (нижний индекс «0» опущен) на отрезке времени 1 1 ], , [ t t t t ≤ : ] [ min ) , ( min * u x u J t V J J = = При решении задачи методом динамического программирования целесообразно руководствоваться последовательно- стью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с табл. 2 составляем функцию ) , , , ( u λ x t H (гамильтониан) для данной задачи ) ( ) ( 2 1 ) , , ( ) , , ( ) , , , ( 0 f u x λ u u x u u x x x l x l u x λ u x u λ x T 3 T 2 C B A P N N Q u t f t f t H T T T T T T T + + + + + + + + + = + = и заменяем сопряженный вектор T λ на градиент ) , ( x x t V (градиент ) , ( ) , ( x x x x t V t V = ∂ ∂ функции ) , ( x t V считается вектором- строкой) функции V(t, x) по x: ) ( ) 2 ( 2 1 ) , , , ( f u x u u u x x x u l x l u x x T 3 T 2 x C B A V P N Q V t H T T T + + + + + + + = Дифференциальное уравнение Гамильтона–Беллмана (45) в данном случае имеет вид 0 ) ( ) 2 ( 2 1 min = + + + + + + + + + ∂ ∂ f u x u u u x x x u l x l x T 3 T 2 u C B A V P N Q t V T T T , (IV) где функция V(t, x) удовлетворяет граничному условию (55"): x x x l x T 1 1 1 2 1 ) , ( R t V T + = . (V) Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум ) , , , ( u x x V t H достигается в стационарной точке, где 0 = ∂ ∂ u H ] [ ) , , , ( min arg 3 1 * T T T V B N P V t H x x u x l u x u + + − = = − . (VI) Подставляя теперь полученное выражение для u * в (VI), находим окончательный вид основного дифференциального уравнения динамического программирования (в данном случае это будет дифференциальное уравнение Гамильтона–Якоби, так как u * найдено из условия стационарности H): ) VII ( 0 2 1 2 1 2 1 2 1 2 1 2 1 1 1 3 1 3 3 1 3 2 1 1 3 1 = − + + − − − + + + − − − + ∂ ∂ − − − − − − − x x x x l x l l l x l f x l x x x x x x x T T T T T T T T T T T T N NP Q V B P N P P C V V B BP V N BP V BP V Ax V t V Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t), 1 R решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде ) ( ) ( ) ( 2 1 ) , ( t r t t R t V + + = x q x x x T T , (VIII) где R(t) – симметричная матрица размерности n × n; q(t) – n-мерный вектор; r(t) – скаляр. Частные производные функции V(t, x), записанной в форме (VIII), имеют вид ) ( ) ( ) ( 2 1 ) , ( t r t t R t t V T T & & & + + = ∂ ∂ x q x x x ; (IX) T T T T R t V t t R t V t V q x x x q x x x x x + = ∂ ∂ + = ∂ ∂ = ) , ( ); ( ) ( ) , ( ) , ( . (X) Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что: 1) при одновременном умножении произвольной матрицы М слева и справа на вектор x имеет место соотношение x x x x ) ( 2 1 T T T M M M + = (т.е. происходит выделение симметричной части ) ( 2 1 T M M + матрицы М); 2) скалярное произведение обладает свойством транспонируемости y b b y T T = , получим ) XI ( 0 2 1 2 1 ] ) ( ) ( [ ] ) ( ) ( [ 2 1 3 1 3 1 3 1 2 1 3 1 1 3 1 1 1 1 1 = − − + − − + + + − − − − − + + − − − + − + − + − − − − − − − − − − − l l f q q l q q x f l l q l q q x x P C B P B BP r R C N P R B BP R B P N BP A R B RBP N NP Q R N BP A N BP A R R T T T T T T T T T T T T T T T T T T T T T T T & & & Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при 1 t t = для любых значений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)] x R t r t t R T T T T 1 1 1 1 1 2 1 ) ( ) ( ) ( 2 1 l x x x q x x + = + + , то для определения матрицы R(t), вектора q(t) и скаляра r(t) получаем следующие уравнения и граничные условия: 1) ) XII ( ; 0 ) ( ) ( ) ( ) ( 1 1 1 1 1 = + + + − + + = − − + − − + − + − − − − − Q R B N P N RB R A RA R N NP Q R B RBP R N BP A N BP A R R T T T T T T T T & & ) ( 1 1 R t R = (XII') 2) ) XIII ( ; 0 ) ( ) ( 2 1 3 1 1 3 1 = + + − − − − − + − − − − R C N P R B BP R B P N BP A T T T T T T T T T T T f l l q l q q& T T t 1 1 ) ( l q = . (XIII') 3) 0 2 1 2 1 3 1 3 1 3 1 = − + − − − − − l l f q q l q q P C B P B BP r T T T T T T & ; (XIV) 0 ) ( 1 = t r . (XIV') Полученные уравнения следует интегрировать в обратном времени от 1 t t = к 0 t t = Оптимальный закон управления с обратной связью имеет вид )] ( ) ( ) ( )) ( ) ( ) ( )[ ( ) , ( 3 1 * t t t B t N t R t B t P t T T T l q x x u + + + − = − . (XV) Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества приведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимального закона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 – неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационар- ного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2 – для стационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченном интервале времени ( [ ] ∞ , 0 ), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа Nu x T ). В п. 5 приведено решение задачи, которая в оп- ределенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неодно- родной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являются частными случаями рассмотренной выше задачи. Контрольные вопросы 1. Принцип оптимальности динамического программирования. 2. Ослабленное необходимое условие. 3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций № строки Уравнение движения системы Начальные и конечные условия Критерий качества J[u] Оптимальный закон управле- ния (в смысле минимума J[u]) u * = v * (x, t) Оптимальное значение крите- рия качества 1 2 3 4 5 6 1 u x x ) ( ) ( t B t A + = & , T n x x ) ..., , ( 1 = x , T m u u ) ..., , ( 1 = u , A(t) – матрица раз- мерности n × n, B(t) – матрица размер- ности n × m 0 t – задано, 0 0 ) ( x x = t – задано, 1 0 t t t ≤ ≤ 1 t – задано, 1 1 ) ( x x = t – свободно dt t P t Q R J t t T T T ∫ + + + = 1 0 ] ) ( ) ( [ 2 1 2 1 ] [ 1 1 1 u u x x x x u ) ( , 1 t Q R – положительно полуопределенные сим- метричные матрицы размерности n × n; P(t) – положительно определенная симмет- x u ) ( ) ( ) ( 1 * t R t B t P T − − = , где R(t) – решение матрич- ного уравнения Риккати: 1 1 1 ) ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( R t R t R t B t P t B t R t Q t R t A t A t R t R T = + + − − − − = − & (интегрирование от 1 t до 0 t ) или ) ( ) ( ) ( 2 1 ) , ( 0 0 0 0 0 min * t t R t t V J J T |