Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
x x λ , (61) которое формально совпадает с условием ∑ = ≡ λ = ∂ ∂ n i ij i j t r u H 0 0 ) , (x (62) на отрезке [ ] 2 1 , τ τ Отрезок ] , [ 2 1 τ τ , на котором имеет место соотношение (61), называется участком особого управления для компоненты j u , а оптимальное управление ) ( * t u j на таком участке существует, называется особым оптимальным управлением. Такое название объясняется тем, что поскольку гамильтониан H от j u не зависит, оптимальное управление не может быть найдено непосредственно с помощью принципа максимума. Более того, в случае выполнения условия (61) ни необходимые условия классического вариационного исчисления, ни необходимые условия динамического программирования (см. п. 5.2) не могут служить для непосредственного вычисления компоненты * j u , хотя все эти условия формально не выполняются. Рис. 9. Поведение гамильтонианов j j j u u H Φ + α = ) ( 1 и α + + Φ = j j j j u u u H ) ( 2 в зависимости от j Φ : а, б, г, д – строгий минимум (регулярное управление); в, е – нестрогий минимум (особое управление) Так, например, если гамильтониан H от управления j u не зависит, то H достигает максимума при любом j u . Условия (61) не могут установить различие между управлениями j u , дающими минимум или максимум функционалу J[u]. На участке особого управления выполняется соотношение ) , 1 , ( 0 det 2 m j i u u H j i = ≡ ∂ ∂ ∂ на ] , [ 2 1 τ τ , (62) показывающее, что условие Гильберта невырожденности вариационной задачи нарушено. Задачи, для которых имеет место условие, в классическом вариационном исчислении называются вырожденными. Если множество m U – замкнуто и ограни- чено, то в вырожденных задачах может наблюдаться два режима оптимального управления: регулярный, когда u определяет- ся из принципа максимума [как, например, (60)], и особый, когда u не может быть найдено из принципа максимума [как, на- пример, при выполнении (61)] и когда требуется особая процедура для его отыскания. 6.2. Процедура нахождения особого управления Общая теория вырожденных вариационных задач разработана недостаточно. Наиболее полно исследован случай особо- го управления по одной компоненте j u . В этом случае решение можно получить следующим образом. Условие (62) показывает, что режим особого управления на участке ] , [ 2 1 τ τ (участке особого управления) имеет место, если ∑ = ≡ λ = ∂ ∂ n i ij i j t r u H 0 0 ) , ( x Последовательное дифференцирование этого соотношения по t приводит к соотношениям 0 ≡ ∂ ∂ j k k u H dt d на ] , [ 2 1 τ τ (k = 0, 1, 2, ...). (64) Можно показать, что первое ненулевое значение величины ∂ ∂ ∂ ∂ j k k j u H dt d u возможно лишь при четном k. Обозначим его p k k 2 min = = . Число p называется порядком вырожденности (сингулярности) вариационной задачи (оптимального управления). При k = 2p управление j u войдет в ∂ ∂ j k u H dt d явным образом. Теперь величину особого оптимального управления * j u можно найти из условия 0 2 2 = ∂ ∂ j p p u H dt d на ] , [ 2 1 τ τ , (65) которое линейно по j u (в силу линейности по u системы (56)). Уравнения сопряженной системы в данном случае имеют вид ∑ ∑ ∑ = = = ∂ ∂ λ + ∂ ∂γ λ − = λ m j j n i s ij i n i s i i s u x r x dt d 1 0 0 . (66) Считая, что все остальные компоненты вектора u регулярны, т.е. определяются соотношениями типа (60), условие (65) можно записать в виде 0 ) , , ( ) , , ( 2 1 2 2 = λ + λ = ∂ ∂ t M u t M u H dt d j j p p x x , (67) откуда и может быть найдено особое управление для компонент ) , , ( ) , , ( 2 1 t M t M u j λ λ − = x x 6.3. Необходимое условие оптимальности особого управления Для минимума критерия качества J[u] на особом управлении * j u в задаче (56)–(57) должно выполняться следующее не- обходимое условие: , 2 , 1 , 0 , 0 ) 1 ( 2 2 = ≥ ∂ ∂ ∂ ∂ − p u H dt d u j p p j p . (68) При максимизации критерия качества знак в неравенстве (68) следует заменить на обратный. Отметим, что при p = 0, т.е. для невырожденных задач, это условие переходит в условие 0 2 2 ≥ ∂ ∂ j u H (при m = 1) и, та- ким образом, (68) является аналогом условия Лежандра–Клебша для особых (вырожденных) экстремалей (для одномерного управления j u ). При p = 1 условие (68) имеет вид 0 2 2 ≤ ∂ ∂ ∂ ∂ j j u H dt d u 6.4. Необходимые условия в точках сопряжения особого и регулярного управлений Результаты, полученные в пп. 6.2 и 6.3, применимы, если значения оптимального особого управления ) ( * t u j являются внутренними точками множества m U на отрезке ] , [ 2 1 τ τ . Необходимые условия для перехода с регулярного оптимального управления на особое оптимальное в случае, когда m U – m-мерный прямоугольник ) ( ) ( ) ( t b t u t a j j j ≤ ≤ , а 1 τ – момент вре- мени начала перехода, определяются следующими неравенствами: 0 )] , , ( ) ( ) , , ( [ 1 2 1 < + τ t M t b t M j λ x λ x (69) (необходимое условие для возможности перехода регулярного управления с верхней границы ) ( ) ( t b t u j j = на особое опти- мальное управление) и 0 )] , , ( ) ( ) , , ( [ 1 2 1 > + τ t M t a t M j λ x λ x (70) (необходимое условие для возможности перехода регулярного управления с верхней границы ) ( ) ( t b t u j j = на особое оптимальное управление). Требование совместного выполнения условий (69) и (70) может быть представлено в виде неравенства 0 1 2 2 ≤ ∂ ∂ ∂ ∂ τ j p p j u H dt d u . (71) Это условие является необходимым для возможности перехода с обеих границ регулярного управления на особое. Не- обходимое условие (71) легче проверить, так как оно не связано с вычислением ) , , ( 1 t M λ x . Однако следует иметь в виду, что оно является более слабым, чем условия (69) и (70), поскольку последние из него не вытекают. Контрольные вопросы 1. Что такое особое управление, и когда оно возникает? 2. Процедура нахождения особого управления. 3. Необходимое условие оптимальности особого управления. 4. Необходимые условия в точках сопряжения особого и регулярного управлений. Г л а в а 7 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ КООРДИНАТЫ x В технических приложениях имеется ряд задач, когда при формировании оптимальной траектории необходимо учиты- вать ограничения на область допустимых значений фазовых координат. Например, при наборе самолетом высоты или при рассмотрении траекторий спуска зад 2 2 ) ( )) ( ( q t v t h q ≤ = ρ , т.е. 0 ) ), ( ), ( ( зад ≤ − q t t v t h q При движении ЛА типичными также являются ограничения на допустимые значения высоты полета h и массы m ЛА: h(t) ≥ 0; m(t) ≥ m. В общем случае ограничения указанного типа можно записать в виде 0 ) , ( ≥ x φ t , (72) где T n T x x x ) ..., , , ( ; ) ..., , , ( 2 1 2 1 1 = φ φ φ = µ x φ 7.1. Краткая формулировка задачи Пусть эволюция рассматриваемой системы S описывается векторным дифференциальным уравнением ) , , ( u x f x t dt d = , (73) где ; ) ..., , , ( ; ) ..., , , ( ; ) ..., , , ( 2 1 2 1 2 1 T m T n T n u u u x x x x f f = = = u x f m U ∈ u ; m U – некоторая замкнутая и ограниченная область в пространстве m R З а д а н ы : • начальное значение 0 0 ) ( x x = t , (74) • интервал времени ] , [ 1 0 t t , • критерий качества dt t f t t J t t ∫ + Φ = 1 0 ) , , ( )) ( , ( ] [ 0 1 1 u x x u . (75) Необходимо найти такое кусочно-непрерывное управление m U t ∈ ) ( u , которое переводит начальное условие ) , ( 0 0 x t в некоторую конечную точку )) ( , ( 1 1 t t x , удовлетворяющую условиям , ) ..., , , ( , 0 )) ( , ( 2 1 1 1 T l q q q t t = = q x q (76) l < n + 1, и минимизирует функционал J[u] на траекториях, удовлетворяющих условиям ) ..., , , ( , 0 ) , ( 1 2 1 T t µ φ φ φ = ≥ φ x φ (76') Здесь значения функции i φ не зависят явно от управления u. Предполагается, что φ , , 0 f t обладают непрерывными произ- водными до второго порядка. 7.2. Необходимые условия оптимальности В постановке п. 7.1 вся оптимальная траектория полета в общем случае может состоять из двух типов участков: участ- ков, целиком лежащих внутри допустимой области, и участков, лежащих на границе допустимой области (рис. 10). Количе- ство таких участков и их чередование зависит от конкретной задачи и граничных условий. На участках, целиком располо- женных внутри допустимой области, условия (72) выполняются в виде строгих неравенств 0 ) , ( > φ x t Для этих участков справедлив принцип максимума, сформулированный в п. 4.3. На участках, лежащих на границе допустимой области, одно или несколько условий типа (72) выполняются в виде ра- венств. Эти участки называются граничными, для них принцип максимума п. 4.3 уже не справедлив. Наличием этих участ- ков данная задача и отличается от задач п. 4.1. Известно несколько эквивалентных подходов к получению необходимых условий оптимальности для участков, распо- ложенных на границе 0 ) , ( = φ x t . Будучи эквивалентными, эти подходы ведут к различным вычислительным процедурам получения решения. Рис. 10. Типы возможных оптимальных траекторий в задачах с ограничениями на фазовые координаты: а – г – случаи, когда допустимые траектории располагаются внутри некоторой области (не обязательно замкнутой); а – траектория, цели- ком лежащая внутри допустимой области; б – траектория, имеющая с границей области одну общую точку (типа отражения от границы); в – траектория, целиком лежащая на границе; г – траектория, частично расположенная на границе; д – з – случаи, когда допустимые траектории располагаются вне некоторой области; д – случай двух траекторий, доставляющих относи- тельный минимум в задаче о кратчайшем пути на плоскости; е – случай невыпуклой запрещенной области, траектории с несколькими уча- стками входа и схода; ж – 1–2 – траектория, не имеющая общих точек с границей; 1–3 – траектория, имеющая одну общую точку (касание) с границей; з – случай негладкой границы допустимой области; 1 – начальная точка траектории; 2 – конечная точка траектории; 1' – точка входа на границу; 2' – точка схода с границы Рассмотрим случай одного скалярного ограничения вида 0 ) , ( ≥ φ x t i 7.3. Первый тип необходимых условий оптимальности для граничных участков траектории Для простоты рассматривается случай, когда лишь одно из ограничений типа (72) выполняется в виде равенства (на- пример, ограничение 1 φ ). Пусть это ограничение 0 ) , ( 1 = φ x t (77) таково, что полная производная по времени ) , , ( ) , ( 1 1 1 1 1 u x f x x x x t t t dt t d ∂ ∂φ + ∂ ∂φ = ∂ ∂φ + ∂ ∂φ = φ & (78) содержит управление u явно. Необходимое и достаточное условие того, что (77) имеет место на некотором ненулевом отрезке ] , [ 2 1 t t ′ ′ , вводится в уравнение 0 ) , , ( ) , , ( ) , ( 1 1 1 1 1 = φ = ∂ ∂φ + ∂ ∂φ = φ = φ u x u x f x x t t t dt t d & & (79) Составляется гамильтониан 1 H для граничных участков ) , , ( 1 1 u x t H H φ β + = & , (80) где ∑ = λ + λ = n i i i f f H 1 0 0 ; 0 = β на участках, где ; 0 1 > φ 0 ≠ β на участках, где 0 1 = φ Теперь необходимые условия для граничного участка совпадают с необходимыми условиями п. 8.3 с заменой в услови- ях (95), (97), (101) функции ℵ на 1 φ& . Отличие этой задачи от задачи п. 8.2 заключается в условиях, накладываемых на пере- менные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные ) (t i λ могут претер- певать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие 0 ) , ( 1 = φ |