Главная страница

Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


Скачать 1.34 Mb.
НазваниеСпециальные разделы теории управления. Оптимальное управление
АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
Дата12.01.2023
Размер1.34 Mb.
Формат файлаpdf
Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
ТипДокументы
#883784
страница5 из 15
1   2   3   4   5   6   7   8   9   ...   15

4.1. Краткая формулировка задачи
Пусть даны:
• система дифференциальных уравнений движения
)
,
,
,
(
a
u
x
f
x
t
dt
d =
, (11) где
)
,
,
,
(
a
u
x
f t
определены для всех
,


)
...,
,
,
(
2 1
n
n
T
n
R
X
x
x
x


=
x
r
m
A
U
t
t
t




a
u
,
,
1 0
, непрерывны по совокупности переменных
(t, x, u, a) и непрерывно дифференцируемы по (x, a);
• соотношения, которым удовлетворяют начальные
)
,
(
0 0
x
t
и конечные
)
,
(
1 1
x
t
фазы движения системы (11):
)
2 2
...,
,
2
,
1
(
0
)
,
,
,
,
(
1 0
1 0
r
n
l
j
t
t
g
j
+
+
<
=
=
a
x
x
, (12) где функции
j
g
непрерывно дифференцируемы по всем своим аргументам;
• критерий качества управления (функционал)

+
Φ
=
2 1
)
,
,
,
(
)
,
,
,
,
(
]
),
(
[
0 1
0 1
0
t
t
dt
t
f
t
t
t
J
a
u
x
a
x
x
a
u
, (13) где
0
, f
Φ
обладают всеми необходимыми производными.
Множество
m
U
представляет собой замкнутую и ограниченную область евклидова m-мерного пространства
m
R
. Функ-
ция u(t) считается допустимой, если она кусочно-непрерывна и ее значения принадлежат множеству
m
m
U
t
U

)
(
: u
, т.е. та- кие управления u
i
(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u
i
(t) может терпеть разрывы первого рода. Во избежание недоразумений отметим, что, по определению разрывов первого рода, в точке разрыва
τ предполагается существование конечных пределов:
)
(
lim
)
0
(
),
(
lim
)
0
(
t
u
u
t
u
u
t
t
t
t
τ
>
τ

τ
<
τ

=
+
τ
=

τ
4.2. Некоторые вспомогательные построения и терминология
Вводятся:
• зависящий от времени вектор сопряженных координат (вектор-функция множителей Лагранжа)
T
n
t
t
t
t
))
(
...,
),
(
),
(
(
)
(
1 0
λ
λ
λ
=
λ
; (14)
• постоянный вектор
µ
:
T
l
)
...,
,
,
(
2 1
µ
µ
µ
=
µ
; (15)
• вспомогательные функции (гамильтониан задачи оптимизации и функция Лагранжа)
)
,
,
,
(
)
,
,
,
(
)
,
,
,
,
(
0 0
1
a
u
x
a
u
x
a
λ
u
x
t
f
t
f
t
H
n
i
i
i
λ
+
λ
=

=
(16) и

=
Φ
λ
+
µ
=
l
j
j
j
t
t
t
t
g
t
t
L
1 1
0 1
0 0
1 0
1 0
1 0
1 0
)
,
,
,
,
(
)
,
,
,
,
(
)
,
,
,
,
,
(
a
x
x
a
x
x
µ
a
x
x
; (17)
• система дифференциальных уравнений, сопряженная к (11) (13) и определяющая изменение вектора
)
(t
λ
,
)
,
0
(
)
,
,
,
(
0
n
i
x
t
f
x
H
dt
d
i
k
n
k
k
i
i
=


λ

=



=
λ

=
a
u
x
. (18)
З а м е ч а н и е . Система линейных дифференциальных уравнений
y
y
)
(t
B
=
&
называется сопряженной для системы
x&
=
A(t)x + f(t), если
)
(
)
(
t
A
t
B
T

=
и размерность векторов x и y (а также матриц B(t) и A(t)) одинаковы. Таким образом, система
(18) является фактически сопряженной к линеаризованной системе (11), (20):
)
(
)
(
),
(
)
(
),
((
t
t
u
t
x
t
u
t
x
u
u
f
x
x
f
x
δ


+
δ


=
δ
)
)
)
)
&
, где
)
(
ˆ
),
(
ˆ
t
t u
x
– некоторая опорная траектория и опорное управление, соответственно.
С помощью функции H исходная система уравнений (1) записывается в виде
)
,
0
(
)
,
,
,
(
n
i
t
f
H
dt
dx
i
i
i
=
=
∂λ

=
a
u
x
. (19)
Индексу i = 0 соответствует новая переменная
)
(
0
t
x
, определяемая скалярным уравнением
)
,
,
,
(
0 0
a
u
x
t
f
dt
dx =
, (20) с начальным условием
)
,
,
,
,
(
)
(
1 0
1 0
00 0
0
a
x
x
t
t
x
t
x
Φ
=
=
. (21)
Система уравнений


















=









=
=








=
,



;

λ
x
f
x
λ
f
λ
x
T
T
T
H
H
&
&
(22) где
x
f
f
λ


=

,

T
H
– матрица Якоби,
)
...,
,
,
(

1 0
n
x
x
x
=
x
,
)
...,
,
,
(

1 0
n
f
f
f
=
f
;
1

+

n
X
x
, называется канонической системой дифференциальных уравнений, связанной с основной задачей.
4.3. Принцип максимума Л.С. Понтрягина
Пусть
]
,
[
,
))
(
...,
),
(
(
)
(
1 0
*
*
1
*
t
t
t
t
u
t
u
t
T
m

=
u
– такое допустимое управление, а
T
r
a
a
a
)
...,
,
,
(
*
*
2
*
1
*
=
a
– такое допустимое значение вектора параметров, что соответствующая им траектория x
*
(t) системы (11) удовлетворяет условиям (12) для кон- цов.
Для оптимальности (в смысле минимума) критерия качества (13) управления u
*
(t), траектории x
*
(t) и вектора управ-
ляющих параметров
а
*
необходимо существование такого ненулевого переменного вектора
0
const
)
(
,
))
(
...,
),
(
),
(
(
)
(
0 1
0

=
λ
λ
λ
λ
=
t
t
t
t
t
T
n
λ
(обычно можно принимать
1 0
=
λ
, см. следствие 2, п. 4.4) и такого постоян- ного вектора
T
l
)
...,
,
,
(
2 1
µ
µ
µ
=
µ
, что выполняются следующие условия.
1. Вектор-функции x
*
(t), u
*
(t),
)
(
t
λ
и вектор a
*
удовлетворяют системе










=



=
λ
λ


=
)
,
0
(
)
),
(
),
(
),
(
,
(
;
)
),
(
),
(
),
(
,
(
*
*
*
*
*
*
*
1
n
i
x
t
t
t
t
H
dt
d
t
t
t
t
H
dt
dx
i
i
i
a
λ
u
x
a
λ
u
x
(23)
2. Функция
)
),
(
,
),
(
,
(
*
*
a
λ
x
t
u
t
t
H
переменного
m
U

u
при каждом
]
,
[
1 0
t
t
t

, т.е. при фиксированных x
*
и
λ
и при фиксированном векторе а
*
достигает при u = u
*
(t) минимума):
)
),
(
,
),
(
,
(
min
)
),
(
),
(
,
(
)
),
(
),
(
),
(
,
(
*
*
*
*
*
*
*
*
a
λ
u
x
a
λ
x
a
λ
u
x
u
t
t
t
H
t
t
t
H
t
t
t
t
H
m
U

=
=
=
(24)
Случай максимума функционала J[u, a] сводится к задаче в данной постановке путем рассмотрения функционала
]
,
[
]
,
[
1
a
u
a
u
J
J

=
З а м е ч а н и е . В отличие от классической формулировки принципа максимума Л.С. Понтрягина в данном случае опе- рация max в (24) заменена на min. В соответствии с такой заменой необходимое условие (24) можно было бы назвать прин- ципом минимума. Следует обратить внимание, что в данном случае
0 0

λ
, тогда как в классической формулировке
0 0

λ
Таким образом, оптимальное управление определяется как
)
),
(
,
),
(
,
(
min arg
)
),
(
),
(
,
(
)
(
*
*
*
*
*
*
a
λ
u
x
a
λ
x
u
u
u
t
t
t
H
t
t
t
t
m
U

=
=
. (25)
Принцип максимума, следовательно, утверждает, что оптимальное управление u
*
(t) в каждый момент времени t мини- мизирует проекцию фазовой скорости
)
,
,
(


u
x
f
x
t
=
&
управляемого процесса (т.е. проекцию скорости изображающей точки
1


+

n
X
x
) на направление, задаваемое вектором
)
(t
λ
; напомним, что
)
,
,
,
(


0
a
u
x
f
λ
x
λ
t
f
H
T
n
i
T
i
i
=
=
λ
=

=
&
– скалярное произведение векторов
)
(t
λ
и
x&
3. Сопряженные переменные
)
(t
i
λ
и функция
)
),
(
),
(
),
(
,
(
*
*
*
a
λ
u
x
t
t
t
t
H
непрерывны вдоль оптимальной траектории
(аналог условия Эрдмана-Вейерштрасса классического вариационного исчисления).
4. Условия трансверсальности. Для концевых точек
)
,
(
0 0
x
t
,
)
,
(
1 1
x
t
и вектора параметров а
*
при произвольных вариа- циях концевых точек и параметров выполняются обобщенные условия трансверсальности
0 1
0 1
0 1
0
=
δ


+
+








δ
λ

δ
ρ
=
ρ
ρ
=
∑ ∫

dt
a
a
H
dL
x
t
H
r t
t
t
t
n
i
i
i
. (26)
Здесь dL – полная вариация функции
)
,
,
,
,
,
(
1 0
1 0
a
µ
x
x
t
t
L
, определяемой уравнением (17):
)
27
(
,
)
(
)
(
)
(
)
(
1 1
0 1
0 0
0 1
1 0
0
ρ
=
ρ
ρ
=
=
δ


+
δ


+
+
δ


+
δ


+
δ


=



a
a
L
t
x
t
x
L
t
x
t
x
L
t
t
L
t
t
L
dL
r
i
n
i
i
i
n
i
i
где
ρ
δ
δ
δ
δ
δ
a
t
x
t
x
t
t
i
i
),
(
),
(
,
,
1 0
1 0
– произвольные вариации концевых точек и параметров.
Обобщенные условия трансверсальности (26) с учетом выражения (27) приводят в силу независимости
δt
0
,
δt
1
,
δt
i
(t
0
),
δt
i
(t
1
),
δa
ρ
к следующим 2n + 2 + r соотношениям:
0 0
0 0
=
δ








+

t
t
L
H
t
; (28)
0 1
1 1
=
δ








+
t
t
L
H
t
; (29)
)
,
1
(
0
)
(
0 0
n
i
t
x
x
L
i
t
i
i
=
=
δ








+
λ
; (30)
)
,
1
(
0
)
(
1 1
n
i
t
x
x
L
i
t
i
i
=
=
δ








+
λ

; (31)
)
,
1
(
0 1
0
r
a
dt
a
H
a
L
t
t
=
ρ
=
δ










+


ρ
ρ
ρ

. (32)
Если какое-либо конечное условие
)
(
),
(
1 0
t
x
t
x
i
i
или параметр
ρ
a
закреплены (не варьируются), то соответствующая вариация равна нулю:
)
),
(
),
(
,
,
(
0 1
0 1
0
ρ
=
=
δ
a
t
x
t
x
t
t
z
z
i
i
. Если какое-либо конечное условие
)
(
0
t
x
i
,
)
(
1
t
x
i
или управляющий параметр
ρ
a
свободны, то равен нулю коэффициент при свободной вариации z
δ в (30) – (32).
Таким образом, совокупность условий, выражающих принцип максимума (23), (25), условий трансверсальности (26), дают необходимые условия оптимальности программного управления.
Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из
)
,
(
0 0
x
t
в
)
,
(
1 1
x
t
, выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оп- тимальными.
В формулировке принципа максимума участвует
2n + 2 + m + 1 неизвестных функций
)
(
...,
),
(
),
(
:
)
(
...,
),
(
),
(
1 0
1 0
t
t
t
t
x
t
x
t
x
n
n
λ
λ
λ
;
)
(
...,
),
(
1
t
u
t
u
m
, для определения которых имеется (n + 1) дифференциальных уравнений физической системы (11), (20), (n + 1) дифференциальных уравнений сопряженной системы (18) и m конечных соотношений для
j
u
, вытекающих из (24).
Следовательно, для (2n + 2 + m) неизвестных функций имеется (2n + 2 + m) соотношений. Если известны все начальные условия




λ
λ
λ
λ
=
=
Φ
=
=
T
n
T
n
t
t
t
t
t
t
x
t
x
t
x
t
))
(
...,
),
(
),
(
),
(
(
)
(
;
))
(
...,
),
(
),
(
,
(
)
(


0 0
2 0
1 0
0 0
0 0
0 2
0 1
0 0
1   2   3   4   5   6   7   8   9   ...   15


написать администратору сайта