Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
x t может толковаться либо как связь, наложенная на начальные значения ) , ( 0 0 x t , либо как связь, наложенная на конечные значения ) , ( 1 1 x t , в зависимости от порядка следования участков с 0 1 > φ и 0 1 = φ При трех участках, если сначала идет граничный участок, затем участок с 0 1 > φ и далее снова граничный участок, множители тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних боль- ше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях ) (t i λ можно осуществить на любом конце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени 2 t′ , то условия скачка имеют вид x λ λ ∂ φ ∂ − = − + ) ( ) ( ) ( 2 1 2 2 t C t t ; (81) t t C t H t H ∂ ′ ∂φ + ′ = ′ − + ) ( ) ( ) ( 2 1 2 1 2 ; (82) 0 ) ( 2 1 = ′ φ − t , (83) где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно. Если условия (81) подставить в (82), то коэффициент при С будет 1 φ& и, таким образом, условие (82) не зависит от С, а содержит только значения ) ( 2 t′ λ − . После указанной подстановки уравнение (82) может быть использовано в качестве экви- валентного необходимого условия. В данной задаче решение ) ( ), ( t t λ x не зависит от 0 i λ , С как от параметров ) , , ( ); , , ( 0 0 C t C t i i λ = λ = λ λ x x В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом пара- метров, что существенно усложняет ее практическое решение даже с помощью ЭВМ. П р и м е р 3. Пусть имеются три участка оптимальной траектории, следующие в таком порядке: 1 участок – траектория в открытой области, 0 1 > φ ; 2 участок – граничная траектория, 0 1 = φ ; 3 участок – снова траектория в открытой области, 0 1 > φ Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных C t i , , 1 0 λ . Условия (82), (83) и 0 ) 0 ( 2 = + ′ β t (84) определяют точку 2 t′ и дают дополнительное уравнение относительно неизвестных C t i , , 1 0 λ . Задача, таким образом, све- лась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными. Если участков больше, чем три, задача сводится к многоточечной краевой проблеме. 7.4. Второй тип необходимых условий для оптимальности управления на граничных участках Пусть вх t – момент входа траектории на границу допустимой области, сх t – момент схода с этой границы. Гамильтони- ан 2 H для граничных участков может быть представлен в следующем виде: 1 2 1 1 1 1 2 1 1 0 0 2 φ β + φ β + = φ β + φ β + λ + λ = ∑ = & & H f f H n i i i , где , 0 2 1 = β = β если 0 1 > φ ; 0 , 0 2 1 ≠ β ≠ β , если 0 1 = φ , а 1 φ& определяется правой частью соотношения (78). На граничном участке (т.е. при сх вх t t t ≤ ≤ ) вдоль оптимальной траектории выполняются условия 0 , 0 , , 1 1 2 2 = φ = φ ∂ ∂ − = ∂ ∂ = & & & T t H H x λ λ x . (85) Оптимальное управление на граничном участке определяется из условия минимума H по ) , ( 1 x u t U m ∈ , где ) , ( 1 x t U m – та часть значений u из области m U , которая удовлетворяет условию 0 ) , , ( 1 = φ u x t Если минимум H по u в области ) , ( 1 x t U m достигается в ее внутренней точке, то 0 ) , , ( , 0 ) , ( , 0 )) , , ( ( 1 1 2 2 = φ = φ = φ ∂ ∂ β + ∂ ∂ = ∂ ∂ u x x u x u u u t t t H H & & Значения вектора λ и гамильтониана 2 H непрерывны в точке входа на границу допустимой области: ) 0 ( ) 0 ( ); 0 ( ) 0 ( вх 2 вх 2 вх вх − = + − = + t H t H t t λ λ Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см. п. 4.3). В частности, из этих условий следует, что при 1 t t = )) ( , ( )) ( , ( ; ) ( 1 1 1 1 1 1 t t t t L L t T t t T x q µ x x λ + Φ = ∂ ∂ = = ; 0 ) ( 1 2 1 = + ∂ ∂ t H t L (если 1 t – не задано). Кроме того, к этим условиям надо добавить заданное граничное условие (76): 0 )) ( , ( 1 1 = t t x q Контрольные вопросы 1. Необходимые условия оптимальности. 2. Первый тип необходимых условий оптимальности для граничных участков траектории. 3. Второй тип необходимых условий для оптимальности управления на граничных участках. Г л а в а 8 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО ФАЗОВЫЕ КООРДИНАТЫ x И УПРАВЛЕНИЕ u При рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функ- ций не должны превосходить пределов, зависящих от текущего состояния системы. Ограничения рассматриваемого типа можно записать в виде 0 ) , , ( ≤ u x t ℵ , (86) где ℵ явным образом зависит от состояния x и управления u. Принцип максимума, сформулированный в п. 4.3, справедлив лишь для неравенств типа 0 ) , ( ≤ u t i ℵ , (87) т.е. не содержащих фазовых координат x явно. Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86). 8.1. Краткая формулировка задачи Пусть эволюция системы S описывается векторным дифференциальным уравнением ) , ( u x, f x t dt d = , (88) где T n x x x ) ..., , , ( 2 1 = x – n-мерный вектор состояния; T m u u u ) ..., , , ( 2 1 = u – m-мерный вектор управления. На значения управляющего вектора u наложены ограничения 0 ) , , ( ≥ u x t ℵ , (89) где T v ) ..., , , ( 1 2 1 ℵ ℵ ℵ = ℵ – 1 v -мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m. Область m U допустимых значений u зависит от t, x: ) , ( x t U U m m = и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89). В начальный момент времени 0 t t = задано состояние системы 0 0 ) ( x x = t . (90) Необходимо перевести систему S из состояния 0 x в некоторое конечное состояние, определяемое соотношениями 0 )) ( , ( 1 1 = t t x q , (91) где 1 ), ..., , , ( 2 2 1 2 + ≤ = n l q q q l q Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал ∫ + Φ = 1 0 ) , , ( )) ( , ( ] [ 0 1 1 t t dt t f t t J u x x u (92) принимает минимальное значение на решениях системы (88). Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки α t , где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точ- ками. Точки s t , в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называют- ся точками соединения. 8.2. Типы граничных условий Задача, в которой 0 )) ( , ( 1 1 ≡ Φ t t x , а граничные условия (97) имеют вид ) , 1 ( 0 ) ( 2 1 1 n l i x t x i i ≤ = = − (93) или ) 1 , 1 ( 0 ) ( 2 1 1 n l i x t x i i ≤ − = = − , (94) 0 зад 1 = − t t , где зад 1 , t x i – заданные числа, называется иногда простейшей. При n l = 2 условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При n l < 2 условия (93) приводят к задаче с частично свободным правым концом и свободным временем 1 t . Условия типа (94) относятся к зада- че с закрепленным временем зад 1 t t = и частично свободным правым концом траектории. 8.3. Необходимые условия оптимальности Если ) , ( ) ( * t U t m x u ∈ [ m U определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа T l ) ..., , ( , 1 2 1 0 µ µ = = λ µ , не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы T n t t t )) ( ..., ), ( ) ( 1 λ λ = λ (непрерывный на ] , [ 1 0 t t ) и T v t t t )) ( ..., ), ( ( ) ( 1 1 β β = β (непрерывный на ] , [ 1 0 t t всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на ] , [ 1 0 t t имеют место соотношения T T T H H dt d ∂ ∂ − = ∂ ∂ − ∂ ∂ − = x β x x λ 1 ℵ ; (95) T T H H dt d ∂ ∂ = ∂ ∂ = λ λ x 1 ; (96) ) , 1 ( 0 1 v j j j = = ℵ β , (97) где 0 ≤ β . (98) Для всех фиксированных ) , , ( λ x t и u, удовлетворяющих (89), выполняется принцип максимума (см. п. 4.3) ) , , , ( ) , , , ( * u λ x u λ x t H t H ≤ , (99) т.е. ) , , , ( ) , , , ( min * u λ x u λ x t H t H m U u = ∈ , где гамильтониан H определяется, как и в п. 4.2, выражением f λ T f H + λ = 0 0 , (100) а ℵ T H H β + = 1 . (101) Если минимум H достигается во внутренней точке области m U , то β u u u T H H ∂ ∂ + ∂ ∂ = ∂ ∂ ℵ 1 . (102) В угловых точках α t выполняются следующие условия: а) сопряженный вектор ) (t λ непрерывен, т.е. ) 0 ( ) 0 ( − = + α α t t λ λ ; (103) б) функция H непрерывна, т.е. )) 0 ( ), ( ), ( , ( )) 0 ( ), ( ), ( , ( * * − = + α α α α α α α α t t t t H t t t t H u λ x u λ x (104) (условие (99) соблюдается со знаком равенства); в) уравнения (97) и (102) сохраняются. Условия a) – в) являются аналогом условий Вейерштрасса–Эрдмана. В конечной точке ( ) 1 1 , x t для любых значений ) ( , 1 1 t d dt x выполняются условия трансверсальности 0 ) ( 1 1 1 1 0 1 1 = − ∂ ∂ + ∂ Φ ∂ + ∂ ∂ + ∂ Φ ∂ + + = = t d dt t t f T t t T T t t T T x λ µ x q x q µ f λ ; (105) 0 )) ( , ( 1 1 = t t x q Из (105) следует, что 1 1 1 1 0 1 ) ( ) ( t T t T t t f t H ∂ ∂ + ∂ Φ ∂ − = + = q µ f λ ; (106) 1 ) ( 1 t T T t ∂ ∂ + ∂ Φ ∂ = µ x q x λ . (107) Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид + = = λ = µ = λ = ). , 1 ( 0 ) ( ); , 1 ( ) ( ; 0 ) ( 2 1 2 1 1 n l i t l i t t H i i i (108) 8.4. Аналог необходимого условия Клебша Обозначим через ℵ те компоненты вектора ограничений ℵ , которые в каждой точке минимизирующей кривой x * (t), u * (t) удовлетворяются в виде равенств. Пусть β – соответствующий им вектор множителей. Тогда ℵ T H H β + = 1 (109) и для внутренних точек области m U на минимизирующем управлении u * (t) имеет место неравенство 0 2 1 2 ≥ ∂ ∂ η u η H T (110) для всех 0 ) ..., , , ( 2 1 ≠ η η η = T m η , удовлетворяющих условию 0 = ∂ ∂ |