Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
λ x x (33) и фиксированное значение управляющего параметра а, то система (23) может быть проинтегрирована. Однако начальный и конечный моменты времени t 0 , t 1 , начальное и конечное значения вектора фазовых координат ) ..., , ( ), ..., , ( 1 11 1 0 10 0 n n x x x x = = x x , начальное и конечное значения вектора сопряженных переменных ) ..., , , 1 ( 0 10 0 n λ λ = λ , ) ..., , , 1 ( 1 11 1 n λ λ = λ , постоянный вектор ) ..., , , ( 2 1 l µ µ µ = µ и вектор управляющих параметров ) ..., , , ( 2 1 r a a a = a для опти- мального решения заранее неизвестны. Они могут быть определены из условий трансверсальности (28) – (32) и граничных условий (12). В самом деле, для определения (2 + 4n + l + r) неизвестных a µ λ λ x x , , , , , , , 1 0 1 0 1 0 t t имеется два условия (28), (29), 2n условий (30), (31), r условий (32) и l условий (12); кроме того, 2n соотношений вида ) , , , ( ) ( 0 0 1 0 1 1 x λ x t t t ϕ = , ) , , , ( ) ( 0 0 1 0 2 1 x λ λ t t t ϕ = будут получены в результате интегрирования системы (23). Таким образом, для полученной крае- вой задачи имеется достаточное число соотношений, позволяющих считать ее, по крайней мере, теоретически разрешимой. Необходимо также отметить, что принцип максимума дает глобальный минимум. Численные методы решения краевых задач приведены в [20, 23]. 4.4. Некоторые следствия принципа максимума 1. Непосредственным следствием системы (23) и условия (24) является выполнение между точками разрыва функции u (t) соотношения t H dt dH ∂ ∂ = . (34) Это условие для автономных систем (т.е. систем, не зависящих явно от t) приводит к первому интегралу: H = const вдоль всей оптимальной траектории, хотя в общем случае условие (34) неверно, условия скачка обоснованы и получены. 2. В большинстве практических случаев 0 0 > λ (так называемый нормальный случай), и поэтому без нарушения общ- ности в силу однородности функции H по переменным λ i можно принять λ 0 = 1. П р и м е ч а н и е . Из-за однородности H по λ i управление u из (25) определяется не самими величинами λ i , а их отно- шениями к одной из них, например, к λ 0 . Это эквивалентно принятию λ 0 = 1. Случай λ 0 = 0 является особым (анормальным) и здесь не рассматривается. 3. Условия (24), (25) принципа максимума позволяют найти оптимальные значения всех m компонент вектора u. Если минимум H по u достигается во внутренней точке множества U m и функции i f дифференцируемы по u, то * j u опре- деляются из условия ) , 1 ( 0 * m j u H j = = ∂ ∂ =u u . (35) Это условие совместно с (23) образует условие Эйлера-Лагранжа классического вариационного исчисления для задачи (11) – (13) [24 – 27]. П р и м е ч а н и е . Минимум H по u далеко не всегда достигается во внутренней точке множества m U , а в тех случаях, когда он достигается во внутренней точке, последняя не обязательно является стационарной (рис. 7). Типы минимизирую- щих точек довольно разнообразны. Из них особо следует отметить случаи нестрогого минимума, так как принцип максиму- ма не позволяет для них однозначно определить u * . Этот случай в теории оптимального управления является особым. а – внутренний min H(u) в стационарной точке; б, в – граничный min H(u); г – граничный min H(u); u с1 , u с2 – стационарные точки локальных max и min; д – внутренний min H(u) в угловой точке; u с3 – точка перегиба; е – две изолированные минимизирующие точки 2 и 3; ж – нестрогий min H(u) на отрезке 4 – 5 и изолированный min H(u) в точке 6 Если функция H достигает минимального значения в точке на границе m U Г области m U , то условие (35) не является более необходимым в этой точке. При этом возможны три случая: а) множество m U описывается системой связей в виде равенств ) ..., , 2 , 1 ( 0 ) ..., , , ( 2 1 m s u u u m S < ν = = χ ; (36) тогда минимум H при условиях (36) находится методом неопределенных множителей Лагранжа; б) множество m U задано системой неравенств ...) , 3 , 2 , 1 ( 0 ) ..., , , ( 1 2 1 1 = ≤ ℵ s u u u m s ; (37) тогда задача сводится на каждом шаге интегрирования к проблеме нелинейного программирования; в) множество m U является ограниченной областью, не имеющей границ (например, замкнутой двумерной поверхно- стью типа сферы или эллипсоида в трехмерном пространстве). Для всякой непрерывной функции H(u), имеющей непрерыв- ные частные производные, заданной на замкнутой поверхности и выраженной через параметрические координаты этой по- верхности, точка максимума H по этим параметрическим координатам принадлежит к числу решений (35), где роль j u иг- рают параметрические координаты поверхности. П р и м е р . Пусть ) , , ( 3 2 1 u u u H задана на сфере. Тогда замена ϕ θ = cos sin 1 r u , ϕ θ = sin sin 2 r u , θ = cos 3 r u приводит к ) , , ( ) , , ( 3 2 1 r H u u u H ϕ θ = – периодической функции с периодом π 2 по θ и ϕ и в точке минимума H H = имеют место равенства 0 = ∂ϕ ∂ = ∂θ ∂ H H 4. Условия (35) определяют лишь внутреннюю стационарную точку функции H. Если u * = u удовлетворяет системе (35) и доставляет минимум функции H(u), то должны быть выполнены необходимые условия второго порядка: матрица ча- стных производных второго порядка функции H(u) ) , 1 , ( 2 m j i u u H H j i = ∂ ∂ ∂ = uu (38) должна быть неотрицательно определенной в точке u * минимума функции H(u). Положительная определенность матрицы Н uu при выполнении условий (35) в точке u * является достаточным условием для относительного (но не абсолютного!) минимума H(u) в этой точке. Условие (38) неотрицательной определенности мат- рицы Н uu представляет собой условия Лежандра-Клебша классического вариационного исчисления [25 – 27]. Проверка положительной определенности матрицы Н uu может проводиться по критерию Сильвестра: для положитель- ной определенности матрицы Н uu необходимо и достаточно, чтобы ее угловые миноры были положительными. В частности, для положительно определенной матрицы Н uu выполняется условие 0 det 2 > ∂ ∂ ∂ u* j i u u H , (39) являющееся аналогом условия Гильберта неособенности (невырожденности) вариационной задачи (см. п. 9.4). 5. Приведенная формулировка принципа максимума остается справедливой и для случая, когда область m U зависит явным образом от времени t: ) (t U U m m = З а м е ч а н и е . Принцип максимума является, вообще говоря, лишь необходимым условием. Любое допустимое опти- мальное управление, если оно существует, удовлетворяет принципу максимума. Однако не всякое допустимое управление, удовлетворяющее принципу максимума, является оптимальным. Поэтому после определения управления на основе необхо- димых условий следует убедиться в его оптимальности. Для этого служат достаточные условия оптимальности. В некоторых случаях принцип максимума является не только необходимым, но и достаточным условием оптимально- сти управления u(t). Пусть, например, найдено допустимое управление u * (t), которое переводит заданное начальное состоя- ние 0 0 ) ( x x = t линейной относительно фазовых координат системы m U t t A ∈ + = u u h x x ), , ( ) ( & , (40) где m U – замкнутое ограниченное множество; A(t), h(u, t) – непрерывные функции t, u; ) ,..., , ( 2 1 n x x x = x , ) ..., , , ( 2 1 m u u u = u в заданное конечное состояние 1 1 ) ( x x = t . Введем такую систему начальных значений сопряженных переменных 0 , ) ,..., , ( ) ( 00 0 10 00 0 > λ λ λ λ = T n t λ , что u * (t) минимизирует в каждый момент t функцию ) , ( ) ( ) , ( 0 00 t t t h H T u h λ u + λ = по всем m U ∈ u , где x x λ λ ∂ ∂ λ − − = ) ), ( ( ) ( ) ( ) ( * 0 00 t t f t t A t T T & Тогда управление u * (t) минимизирует на траекториях x * (t) системы (40), проходящих через 1 0 , x x , критерий качества ∫ + = 1 0 )] , ( ) , ( [ )] ( [ 0 0 t t dt t h t f t J u x u , если только ) , ( 0 t f x является однозначной выпуклой вниз функцией x для всех ] , [ 1 0 t t t ∈ З а м е ч а н и е . Функция ) , ( 0 t f x называется выпуклой вниз по x при ] , [ 1 0 t t t ∈ , если для всех n n R R ∈ ∈ x x , ) , ( ) , ( ) ( ) , ( 0 0 0 t f t f t f x x x x x x ≤ + − ∂ ∂ Контрольные вопросы 1. Приведите формулировку принципа максимума. 2. Расскажите о следствиях принципа максимума. 3. Каким условием является принцип максимума? Г л а в а 5 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 5.1. Задача синтеза оптимального закона управления Для синтеза оптимального закона управления систем с обратной связью, оптимальных замкнутых контуров управления, оптимальных законов наведения и т.д. более естественен другой подход, чем использованный при решении задач, описан- ных в гл. 4, 9. В отличие от уравнений Эйлера–Лагранжа и принципа максимума Понтрягина, использующих временное представле- ние оптимального управления [в форме u * = u(t)] для единичного объекта управления, этот подход рассматривает оптималь- ное управление в форме закона u * = v * (x, t) (координатное управление, управление в форме обратной связи) для множества однородных объектов, отличающихся различными начальными состояниями. С точки зрения механики, этот подход соответствует рассмотрению распространения «волн возбуждения» от некоторо- го источника в неоднородной среде. Общность обоих подходов устанавливает проективная геометрия, с точки зрения кото- рой траектория точки в фазовом пространстве может рассматриваться и как последовательность точек и как огибающая сво- их касательных. Последовательное применение описываемого подхода к задачам оптимального управления приводит для непрерывных процессов к дифференциальному уравнению (нелинейному) в частных производных первого порядка типа уравнения Га- мильтона–Якоби [25 – 27]. Один из возможных способов получения этого уравнения состоит в использовании принципа оптимальности динамиче- ского программирования. Динамическое программирование является довольно общим методом, разработанным для решения общих задач многоэтапного выбора (т.е. задач, в которых результаты предыдущих операций можно использовать для управ- ления ходом будущих операций). 5.2. Принцип оптимальности динамического программирования Принцип оптимальности . В основе динамического программирования лежит сформулированный Р. Беллманом прин- цип оптимальности: «Оптимальная политика обладает тем свойством, что каковы бы ни были начальное состояние и перво- начально принятое решение, последующие решения должны составлять оптимальную политику относительно состояния, получившегося в результате первоначально принятого решения» [19, 28]. Или, оптимальное управление не зависит от того, каким образом пришла система к данному состоянию при t t ′ = (т.е. не зависит от «предыстории» движения) и для будущих моментов времени полностью определяется лишь состоянием системы в рассматриваемый момент времени. Как частный случай в динамическом программировании рассматриваются задачи управления непрерывными процесса- ми (основная задача оптимального координатного управления). Краткая формулировка задачи. Пусть дана система уравнений движения ) , , ( u x f x t dt d = , (41) где m T m U u u u ∈ = ) ..., , , ( 2 1 u ; n T n X x x x ∈ = ) ..., , , ( 2 1 x ; T n t f t f t f )) , , ( ..., ), , , ( ), , , ( ( 2 1 u x u x u x f = , и граничные условия 1 1 0 0 ) ( ; ) ( x x x x = = t t . (42) Требуется синтезировать закон оптимального управления u * = v * (x, t), минимизирующий значение функционала dt t f t J t t ∫ = 1 0 ) , , ( ] , , [ 0 0 0 u x u x . (43) Необходимые условия . Пусть в (n + 1)-мерном пространстве ) , ( T X n имеется некоторая область G(x, t) начальных значений )) , ( ) , (( , 0 0 0 0 t G t t x x x ∈ , для каждой точки которой существует оптимальное (в смысле минимума ] , , [ 0 0 u x t J управление u * (t), переводящее эти начальные точки в некоторую фиксированную точку ) , ) ( ( 1 1 1 t t x x = ; 1 1 , t x – заданы. На таких оптимальных управлениях минимальное значение критерия качества (43) будет зависеть лишь от начальных значений 0 0 , t x . Таким образом, ) , ( 0 0 * min x t V J J = = , где ) , ( 0 0 x t V – некоторая функция (n + 1) переменного 0 10 0 ..., , , n x x t Имея в виду произвольную точку области G(x, t), в дальнейшем, в целях упрощения записи, нижний индекс «0» будем опускать. Таким образом, функция V(t, |