4.1. Краткая формулировка задачи Пусть даны: • система дифференциальных уравнений движения ) , , , ( a u x f x t dt d = , (11) где ) , , , ( a u x f t определены для всех ,
) ..., , , ( 2 1 n n T n R X x x x ⊂ ∈ = x r m A U t t t ∈ ∈ ≤ ≤ a u , , 1 0 , непрерывны по совокупности переменных (t, x, u, a) и непрерывно дифференцируемы по (x, a); • соотношения, которым удовлетворяют начальные ) , ( 0 0 x t и конечные ) , ( 1 1 x t фазы движения системы (11): ) 2 2 ..., , 2 , 1 ( 0 ) , , , , ( 1 0 1 0 r n l j t t g j + + < = = a x x , (12) где функции j g непрерывно дифференцируемы по всем своим аргументам; • критерий качества управления (функционал) ∫ + Φ = 2 1 ) , , , ( ) , , , , ( ] ), ( [ 0 1 0 1 0 t t dt t f t t t J a u x a x x a u , (13) где 0 , f Φ обладают всеми необходимыми производными. Множество m U представляет собой замкнутую и ограниченную область евклидова m-мерного пространства m R . Функ-
ция u(t) считается допустимой, если она кусочно-непрерывна и ее значения принадлежат множеству m m U t U ∈ ) ( : u , т.е. та- кие управления u i (t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u i (t) может терпеть разрывы первого рода. Во избежание недоразумений отметим, что, по определению разрывов первого рода, в точке разрыва τ предполагается существование конечных пределов: ) ( lim ) 0 ( ), ( lim ) 0 ( t u u t u u t t t t τ > τ → τ < τ → = + τ = − τ 4.2. Некоторые вспомогательные построения и терминология Вводятся: • зависящий от времени вектор сопряженных координат (вектор-функция множителей Лагранжа) T n t t t t )) ( ..., ), ( ), ( ( ) ( 1 0 λ λ λ = λ ; (14) • постоянный вектор µ : T l ) ..., , , ( 2 1 µ µ µ = µ ; (15) • вспомогательные функции (гамильтониан задачи оптимизации и функция Лагранжа) ) , , , ( ) , , , ( ) , , , , ( 0 0 1 a u x a u x a λ u x t f t f t H n i i i λ + λ = ∑ = (16) и ∑ = Φ λ + µ = l j j j t t t t g t t L 1 1 0 1 0 0 1 0 1 0 1 0 1 0 ) , , , , ( ) , , , , ( ) , , , , , ( a x x a x x µ a x x ; (17) • система дифференциальных уравнений, сопряженная к (11) (13) и определяющая изменение вектора ) (t λ , ) , 0 ( ) , , , ( 0 n i x t f x H dt d i k n k k i i = ∂ ∂ λ − = ∂ ∂ − = λ ∑ = a u x . (18) З а м е ч а н и е . Система линейных дифференциальных уравнений y y ) (t B = & называется сопряженной для системы x& = A(t)x + f(t), если ) ( ) ( t A t B T − = и размерность векторов x и y (а также матриц B(t) и A(t)) одинаковы. Таким образом, система (18) является фактически сопряженной к линеаризованной системе (11), (20): ) ( ) ( ), ( ) ( ), (( t t u t x t u t x u u f x x f x δ ∂ ∂ + δ ∂ ∂ = δ ) ) ) ) & , где ) ( ˆ ), ( ˆ t t u x – некоторая опорная траектория и опорное управление, соответственно. С помощью функции H исходная система уравнений (1) записывается в виде ) , 0 ( ) , , , ( n i t f H dt dx i i i = = ∂λ ∂ = a u x . (19) Индексу i = 0 соответствует новая переменная ) ( 0 t x , определяемая скалярным уравнением ) , , , ( 0 0 a u x t f dt dx = , (20) с начальным условием ) , , , , ( ) ( 1 0 1 0 00 0 0 a x x t t x t x Φ = = . (21) Система уравнений ∂ ∂ − = ∂ ∂ − = = ∂ ∂ = ,
;
λ x f x λ f λ x T T T H H & & (22) где x f f λ ∂ ∂ =
,
T H – матрица Якоби, ) ..., , , (
1 0 n x x x = x , ) ..., , , (
1 0 n f f f = f ; 1
+ ∈ n X x , называется канонической системой дифференциальных уравнений, связанной с основной задачей. 4.3. Принцип максимума Л.С. Понтрягина Пусть ] , [ , )) ( ..., ), ( ( ) ( 1 0 * * 1 * t t t t u t u t T m ∈ = u – такое допустимое управление, а T r a a a ) ..., , , ( * * 2 * 1 * = a – такое допустимое значение вектора параметров, что соответствующая им траектория x * (t) системы (11) удовлетворяет условиям (12) для кон- цов. Для оптимальности (в смысле минимума) критерия качества (13) управления u * (t), траектории x * (t) и вектора управ-
ляющих параметров а * необходимо существование такого ненулевого переменного вектора 0 const ) ( , )) ( ..., ), ( ), ( ( ) ( 0 1 0 ≥ = λ λ λ λ = t t t t t T n λ (обычно можно принимать 1 0 = λ , см. следствие 2, п. 4.4) и такого постоян- ного вектора T l ) ..., , , ( 2 1 µ µ µ = µ , что выполняются следующие условия. 1. Вектор-функции x * (t), u * (t), ) ( t λ и вектор a * удовлетворяют системе = ∂ ∂ − = λ λ ∂ ∂ = ) , 0 ( ) ), ( ), ( ), ( , ( ; ) ), ( ), ( ), ( , ( * * * * * * * 1 n i x t t t t H dt d t t t t H dt dx i i i a λ u x a λ u x (23) 2. Функция ) ), ( , ), ( , ( * * a λ x t u t t H переменного m U ∈ u при каждом ] , [ 1 0 t t t ∈ , т.е. при фиксированных x * и λ и при фиксированном векторе а * достигает при u = u * (t) минимума): ) ), ( , ), ( , ( min ) ), ( ), ( , ( ) ), ( ), ( ), ( , ( * * * * * * * * a λ u x a λ x a λ u x u t t t H t t t H t t t t H m U ∈ = = = (24) Случай максимума функционала J[u, a] сводится к задаче в данной постановке путем рассмотрения функционала ] , [ ] , [ 1 a u a u J J − = З а м е ч а н и е . В отличие от классической формулировки принципа максимума Л.С. Понтрягина в данном случае опе- рация max в (24) заменена на min. В соответствии с такой заменой необходимое условие (24) можно было бы назвать прин- ципом минимума. Следует обратить внимание, что в данном случае 0 0 ≥ λ , тогда как в классической формулировке 0 0 ≤ λ Таким образом, оптимальное управление определяется как ) ), ( , ), ( , ( min arg ) ), ( ), ( , ( ) ( * * * * * * a λ u x a λ x u u u t t t H t t t t m U ∈ = = . (25) Принцип максимума, следовательно, утверждает, что оптимальное управление u * (t) в каждый момент времени t мини- мизирует проекцию фазовой скорости ) , , (
u x f x t = & управляемого процесса (т.е. проекцию скорости изображающей точки 1
+ ∈ n X x ) на направление, задаваемое вектором ) (t λ ; напомним, что ) , , , (
0 a u x f λ x λ t f H T n i T i i = = λ = ∑ = & – скалярное произведение векторов ) (t λ и x& 3. Сопряженные переменные ) (t i λ и функция ) ), ( ), ( ), ( , ( * * * a λ u x t t t t H непрерывны вдоль оптимальной траектории (аналог условия Эрдмана-Вейерштрасса классического вариационного исчисления). 4. Условия трансверсальности. Для концевых точек ) , ( 0 0 x t , ) , ( 1 1 x t и вектора параметров а * при произвольных вариа- циях концевых точек и параметров выполняются обобщенные условия трансверсальности 0 1 0 1 0 1 0 = δ ∂ ∂ + + δ λ − δ ρ = ρ ρ = ∑ ∫ ∑ dt a a H dL x t H r t t t t n i i i . (26) Здесь dL – полная вариация функции ) , , , , , ( 1 0 1 0 a µ x x t t L , определяемой уравнением (17): ) 27 ( , ) ( ) ( ) ( ) ( 1 1 0 1 0 0 0 1 1 0 0 ρ = ρ ρ = = δ ∂ ∂ + δ ∂ ∂ + + δ ∂ ∂ + δ ∂ ∂ + δ ∂ ∂ = ∑ ∑ ∑ a a L t x t x L t x t x L t t L t t L dL r i n i i i n i i
где ρ δ δ δ δ δ atxtxttii), ( ), ( , , 1 0 1 0 – произвольные вариации концевых точек и параметров. Обобщенные условия трансверсальности (26) с учетом выражения (27) приводят в силу независимости δ t0 , δ t1 , δ ti( t0 ), δ ti( t1 ), δ aρ к следующим 2 n + 2 + r соотношениям: 0 0 0 0 = δ ∂ ∂ + − ttLHt; (28) 0 1 1 1 = δ ∂ ∂ + ttLHt; (29) ) , 1 ( 0 ) ( 0 0 nitxxLitii= = δ ∂ ∂ + λ ; (30) ) , 1 ( 0 ) ( 1 1 nitxxLitii= = δ ∂ ∂ + λ − ; (31) ) , 1 ( 0 1 0 radtaHaLtt= ρ = δ ∂ ∂ + ∂ ∂ ρ ρ ρ ∫ . (32) Если какое-либо конечное условие ) ( ), ( 1 0 txtxii или параметр ρ a закреплены (не варьируются), то соответствующая вариация равна нулю: ) ), ( ), ( , , ( 0 1 0 1 0 ρ = = δ atxtxttzzii. Если какое-либо конечное условие ) ( 0 txi, ) ( 1 txi или управляющий параметр ρ a свободны, то равен нулю коэффициент при свободной вариации zδ в (30) – (32). Таким образом, совокупность условий, выражающих принцип максимума (23), (25), условий трансверсальности (26), дают необходимые условия оптимальности программного управления. Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из ) , ( 0 0 xt в ) , ( 1 1 xt, выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оп- тимальными. В формулировке принципа максимума участвует 2 n + 2 + m + 1 неизвестных функций ) ( ..., ), ( ), ( : ) ( ..., ), ( ), ( 1 0 1 0 ttttxtxtxnnλ λ λ ; ) ( ..., ), ( 1 tutum, для определения которых имеется ( n + 1) дифференциальных уравнений физической системы (11), (20), ( n + 1) дифференциальных уравнений сопряженной системы (18) и m конечных соотношений для ju, вытекающих из (24). Следовательно, для (2 n + 2 + m) неизвестных функций имеется (2 n + 2 + m) соотношений. Если известны все начальные условия λ λ λ λ = = Φ = = TnTnttttttxtxtxt)) ( ..., ), ( ), ( ), ( ( ) ( ; )) ( ..., ), ( ), ( , ( ) ( 0 0 2 0 1 0 0 0 0 0 0 2 0 1 0 0 |