Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
x x v ], , [ , ) , ( 1 0 ; 2) ) ( ) ), ( ( t t t u x v = , где x(t) – траектория системы S; u(t) – допустимое программное управление при законе управления v(x, t). Вектор а управляющих параметров называется допустимым, если его значение принадлежит заданному множеству r r R A ⊂ 2.8. Допустимые траектории и процессы Фазовая траектория x(t) системы S называется допустимой, если: а) она получена из решения системы ДУ при допустимом управлении u(t) или при допустимом законе управления v(x, t); б) значения x(t) принадлежат заданной области n X пространства состояний n X Управляемый процесс ( x, u) называется допустимым, если в нем под действием допустимого управления u(t) или до- пустимого закона управления v(x, t) реализуется допустимая траектория. 2.9. Граничные условия. Краевая задача Цель управляемого процесса ( x, u) состоит в переходе системы S из некоторого заданного при 0 t t = начального состоя- ния ) ( 0 0 t x x = в заданное конечное состояние ) ( 1 1 t x x = за время 0 1 t t T − = При этом все компоненты векторов 1 0 , x x и моменты времени 1 0 , t t обязательно должны быть фиксированными, неко- торые могут оставаться незаданными (свободными). В общем случае система S в начальный и конечный моменты времени может находиться в состояниях, описываемых уравнениями вида а) б) в) г) д) е) Рис. 4. Примеры граничных условий: a – левый и правый концы фазовой траектории закреплены; б – левый конец закреплен, правый – свободен; в – левый и правый концы подвижные; г – левый конец закреплен, правый – свободен, за исключением координаты x 1 ; д – общий случай подвижных граничных условий; е – граничные условия в задаче встречи движений; – оптимальная траектория; - - - - - - – произвольная траектория 0 ) ,..., , ( ) , , ( 1 2 1 0 0 = = T l h h h t a x h ; (6) 0 ) ,..., , ( ) , , ( 1 2 1 1 1 = = T l h h h t a x g (7) или более общими уравнениями вида 0 ) ..., , , ( ) , , , , ( 2 1 1 0 1 0 = = T l g g g t t a x x g , (8) где r n l r n l l + + ≤ + + ≤ + 2 2 ; 2 2 2 1 Уравнения (6) и (7) описывают (при фиксированном управляющем параметре а) обычно поверхность размерности ) 1 ( 2 l n − + и ) 1 ( 1 l n − + , и ) ( 2 l u − в пространстве (t, x) называются раздельными граничными условиями для концов фазовой траектории. Примеры граничных условий приведены на рис. 4. Уравнения (8) называются смешанными граничными усло- виями. Если значения фазовых координат в момент t 0 (или t 1 ) не фиксируются, то граничные условия для левого (или право- го) конца траектории называются свободными. Раздельные условия вида (6) и (7) часто называют подвижными граничными условиями. Определение уравнений u(t), при которых решение системы (1) удовлетворяет условиям (6) и (7), называется двухто- чечной краевой задачей. Перевод начального состояния x 0 в конечное состояние x 1 на заданном отрезке [t 0 , t 1 ] не всегда возможен. Однако, если найдется хотя бы одна пара векторов {u(t), a} или {v(x, t), a}, осуществляющая указанный переход, то обычно существуют и другие пары векторов, реализующие этот же самый переход. В этом случае каждой паре {u(t), a} соответствует определен- ное значение критерия качества J[u, a]. Можно ставить задачу об отыскании таких {u(t), a}, которые минимизируют или максимизируют этот критерий. Контрольные вопросы 1. Что такое фазовые координаты? 2. Расскажите об эволюции системы и ее описании при помощи дифференциальных уравнений движения. 3. Функционал. Критерий качества управления. 4. Какие системы называются автономными? 5. Расскажите о допустимых программных управлениях. 6. Расскажите о допустимом законе управления. 7. Допустимые траектории и процессы. Граничные условия. Краевая задача. Виды краевых условий. Г л а в а 3 ПОСТАНОВКА ОСНОВНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Основная задача оптимального программного управления в форме временной программы (2) для системы (1) с критери- ем (4) и краевыми условиями (8) формулируется следующим образом. Среди всех допустимых на отрезке ] , [ 1 0 t t программных управлений m U t ∈ = ) ( u u и управляющих параметров r A ∈ a , переводящих точку ) , ( 0 0 x t в точку ) , ( 1 1 x t , найти такие, для которых функционал (4) на решениях системы (1) примет наи- меньшее (наибольшее) значение с выполнением условий (8). Управление u(t), решающее эту задачу, называется оптимальным (программным) управлением, а вектор а – оптималь- ным параметром. Если пара {u * (t), a * } доставляет абсолютный минимум функционалу J[u(t), a] на решениях системы (1), то выполняется соотношение ] ), ( [ ] ), ( [ * * * min t t J t J J J u a u ≤ = = (9) для r m A U ∈ ∈ ∀ a u , , являющихся допустимыми и осуществляющих заданный переход с выполнением условия (8). Анало- гичное определение имеет место для абсолютного максимума (с заменой знака неравенства ≤ знаком ≥). Из определения абсолютного минимума (9) следует, что абсолютное минимальное значение функционала ] , [ * * * a u J J = является единственным, чего нельзя утверждать, вообще говоря об оптимальном управлении u * (t) и опти- мальном параметре a * 3.1. Основная задача оптимального координатного управления Основная задача оптимального координатного управления известна в теории оптимальных процессов как проблема синтеза оптимального закона управления, а в некоторых задачах – как задача об оптимальном законе поведения. Задача синтеза оптимального закона управления для системы (1) с критерием (4) и краевыми условиями (6) и (7), где для упрощения предполагается, что функции f 0 , f, h, g, Φ от вектора а не зависят, формулируется следующим образом. Среди всех допустимых законов управления v(x, t) найти такой, что для любых начальных условий (t 0 , x 0 ) из (6) при подстановке этого закона в (1) и в (4) осуществляется заданный переход (7) и критерий качества J[u] принимает наименьшее (наибольшее) решение. 3.2. Оптимальные траектории Траектория системы (1), соответствующая оптимальному управлению u * (t) или оптимальному закону v * (x, t), называет- ся оптимальной траекторией. Совокупность оптимальных траекторий x * (t) и оптимального управления u * (t) образует опти- мальный управляемый процесс {x * (t), u * (t)}. Установлено, что при отсутствии вектора а управляющих параметров в f 0 , f, h, g, Φ задача программного и координат- ного управления эквивалентны. Так как закон оптимального управления v * (x, t) имеет форму закона управления с обратной связью, то он остается оп- тимальным для любых значений начальных условий (x 0 , t 0 ) и любых координат x. В отличие от закона v * (x, t) программное оптимальное управление u * (t) является оптимальным лишь для тех начальных условий, для которых оно было вычислено. При изменении начальных условий будет меняться и функция u * (t). В этом со- стоит важное, с точки зрения практической реализации системы управления, отличие закона оптимального управления v * (x, t) от программного оптимального управления u * (t), поскольку выбор начальных условий на практике никогда не может быть сделан абсолютно точно. 3.3. Свойства оптимальных управлений и оптимальных траекторий 1. Всякая часть оптимальной траектории (оптимального управления) также, в свою очередь, является оптимальной траекторией (оптимальным управлением). Это свойство математически формулируется следующим образом. Пусть u * (t), t 0 ≤ t ≤ t 1 – оптимальное управление для выбранного функционала J[u], соответствующее переходу из со- стояния ) , ( 0 0 x t в состояние ) , ( 1 1 x t по оптимальной траектории x * (t). Числа 1 0 , t t и вектор 0 x – фиксированные, а вектор 1 x , вообще говоря, свободен. На оптимальной траектории x * (t) выбираются точки ) ( 0 * τ x и ) ( 1 * τ x , соответствующие мо- ментам времени 1 0 , τ = τ = t t , где 1 1 0 0 t t ≤ τ ≤ τ ≤ . Тогда управление u*(t) на отрезке ] , [ 1 0 τ τ является оптимальным, соответ- ствующим переходу из состояния ) ( 0 * τ x в состояние ) ( 1 * τ x , а дуга )] ( ), ( [ 1 * 0 * τ τ x x является оптимальной траекторией S. Таким образом, если начальное состояние системы есть ) ( 0 * τ x и начальный момент времени 0 τ = t , то независимо от того, каким образом пришла система к этому состоянию, ее оптимальным последующим движением будет дуга траектории x * (t), 1 0 τ ≤ ≤ τ t , являющейся частью оптимальной траектории между точками ) , ( 0 0 x t и ) , ( 1 1 x t . Это условие является необ- ходимым и достаточным свойством оптимальности процесса и служит основой динамического программирования. П р и м е ч а н и е . Приведенная краткая формулировка основного свойства оптимальных траекторий не должна толко- ваться слишком широко. Требование, чтобы начальная и конечная точки траекторий сравнения лежали на оптимальной тра- ектории в те же моменты времени 1 0 , τ τ , что и точки оптимальной траектории, или чтобы свободный правый конец 1 x′ тра- ектории сравнения оканчивался в тот же момент 1 t , что и конец оптимальной траектории, являются существенными. Без их выполнения это свойство, вообще говоря, не имеет места. Так, если заданы только начальная точка ) ( 0 0 t x x = и моменты времени 0 t и 0 τ , а ) ( 0 τ x свободен, то отрезок траектории x * (t), 0 0 τ ≤ ≤ t t может и не быть оптимальным. В этом случае оп- тимальным может быть, вообще говоря, другой отрезок ) (t x′ (рис. 5). Рис. 5. Основное свойство оптимальных траекторий: ) 3 , 2 , 1 ( , ; 1 1 2 2 = ′ > ′ i J J J J – значения функционала на участках оптимальной траектории и на траекториях сравнения, соответственно 2. Автономные системы инвариантны относительно сдвига вдоль оси t. Это означает, что если u * (t), 1 0 t t t ≤ ≤ соверша- ет переход 1 0 x x → и сообщает функционалу J[u] значение J * , то при любом действительном τ управление τ − ≤ ≤ τ − τ + 1 0 * ), ( t t t t u также совершает переход 1 0 x x → и придает функционалу J[u] значение J * 3.4. Геометрическая интерпретация основной задачи оптимального управления Основным задачам оптимального управления при закрепленных концах можно дать следующую эквивалентную гео- метрическую формулировку. Пусть при 0 t t = задано начальное состояние ) ( 0 0 t x x = , а при 1 t t = – конечное состояние ) ( 1 1 t x x = , где 1 0 1 0 , , , x x t t – фиксированные значения. Тогда в функционале J[u] (4) слагаемое ) , , , ( 1 0 1 0 x x t t Φ является известным числом 0 Φ Введем новую переменную x 0 , закон изменения которой имеет вид ) , , , ( 0 0 a u x t f dt dx = (10) с начальным условием 0 00 0 0 ) ( Φ = = x t x Присоединим эту переменную к системе (1). Тогда при 0 t t = система находится в точке T n t x t x t x )) ( ..., ), ( ), ( ( 0 0 1 0 0 , а при 1 t t = – в точке T n t x t x t x )) ( ..., ), ( ), ( ( 1 1 1 1 0 , где ] [ ) , , , ( ) ( 1 0 0 0 1 0 u a u x J dt t f t x t t = + Φ = ∫ Таким образом, если в (n + 1)-мерном пространстве точек ) , ( 0 x x провести через точку ) , 0 ( 1 x прямую П параллельно оси 0 0x , то решение системы (1), (10) проходит при 1 t t = через точку на прямой П с координатой J t x = ) ( 1 0 Теперь основная задача оптимального программного управления формулируется геометрически как на рис. 6. Рис. 6. Геометрическая формулировка основной задачи оптимального управления: 1 – оптимальная траектория; 1' – изменение критерия качества J вдоль оптимальной траектории; 2, 3 – неоптимальные траектории, проходящие через точки (x 0 , t 0 ), (x 1 , t 1 ); 2', 3' – изменение критерия качества J вдоль неоптимальных траекторий В (n + 1)-мерном фазовом пространстве T n x x x ) ..., , , ( 1 0 даны: 1) при 0 t t = точка ) , ( 0 0 x Φ ; 2) прямая П, параллельная оси 0 0x и проходящая через точку ) , 0 ( 1 x Среди всех допустимых программных управлений u = u(t), обладающих тем свойством, что соответствующее решение )) ( ), ( ( 0 t t x x системы (1), (10) с начальным условием T n t x t x )) ( ..., ), ( , ( 0 0 1 0 Φ пересекает при 1 t t = прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую (наибольшую) координату J t x = ) ( 1 0 Контрольные вопросы 1. Основная задача оптимального координатного управления. 2. Оптимальные траектории. 3. Основные свойства оптимальных управлений и оптимальных траекторий. 4. Геометрическая интерпретация основной задачи. Г л а в а 4 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ ПРОГРАММНОГО УПРАВЛЕНИЯ. ПРИНЦИП МАКСИМУМА |