Главная страница

Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


Скачать 1.34 Mb.
НазваниеСпециальные разделы теории управления. Оптимальное управление
АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
Дата12.01.2023
Размер1.34 Mb.
Формат файлаpdf
Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
ТипДокументы
#883784
страница8 из 15
1   ...   4   5   6   7   8   9   10   11   ...   15
u
u
x
u
u
x
x
x
u
l
x
l
x
x
x
l
u
T
T
T
T
T
3
T
2
T
T
Здесь
T
n
T
n
f
f
x
x
x
)
...,
,
(
;
)
...,
,
,
(
1 2
1
=
=
f
x
; C, A(t) – матрицы размерности n
× n;
)
(
,
)
...,
,
(
1 1
1
t
u
u
T
m
x
x
u
=
=
; B(t), N(t) – мат- рицы размерности n
× m;
)
(
,
1
t
Q
R
– положительно полуопределенные симметричные матрицы размерности n
× n; P(t) – положительно определенная симметричная матрица размерности m
× m; P(t) – известная функция времени;
)
(
,
2 1
t
l
l
,
)
(
,
2 1
t
l
l
n-мерные векторы;
)
(
3
t
l
m-мерный вектор.
Напомним, что симметричная матрица Q называется положительно полуопределенной, если все ее собственные значе- ния неотрицательны или если соответствующая ей квадратичная форма неотрицательна, т.е.
0

x
x Q
T
для всех
0
)
...,
,
,
(
2 1

=
T
n
x
x
x
x
. Для того чтобы матрица Q была положительно полуопределенной, необходимо и достаточно, чтобы все главные (а не только угловые!) миноры были неотрицательны:
)
,
1
;
1
(
0 2
1 2
1 2
1
n
p
n
i
i
i
i
i
i
i
i
i
Q
p
p
p
=

<
<
<








Предполагается, что на значения управляющего вектора u не накладывается каких-либо ограничений, а матрицы Q(t),
N(t), P(t) таковы, что выполняется условие
0
)
(
)
(
)
(
)
(
1



t
N
t
P
t
N
t
Q
T
(это условие гарантирует отсутствие сопряженных точек в данной задаче).
Необходимо найти закон управления с обратной связью
u
*
= v
*
(x, t), минимизирующий критерий J[u]. Заметим, что значения вектора фазовых координат x при
1
t
t
=
не заданы (т.е. рассматри- ваемая задача относится к числу задач оптимального управления со свободным правым концом).
Пусть V(t, x) – минимальное значение критерия качества J[u] при движении системы (I) из произвольной начальной точки (t, x) (нижний индекс «0» опущен) на отрезке времени
1 1
],
,
[
t
t
t
t

:
]
[
min
)
,
(
min
*
u
x
u
J
t
V
J
J
=
=
При решении задачи методом динамического программирования целесообразно руководствоваться последовательно- стью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с табл. 2 составляем функцию
)
,
,
,
(
u
λ
x
t
H
(гамильтониан) для данной задачи
)
(
)
(
2 1
)
,
,
(
)
,
,
(
)
,
,
,
(
0
f
u
x
λ
u
u
x
u
u
x
x
x
l
x
l
u
x
λ
u
x
u
λ
x
T
3
T
2
C
B
A
P
N
N
Q
u
t
f
t
f
t
H
T
T
T
T
T
T
T
+
+
+
+
+
+
+
+
+
=
+
=
и заменяем сопряженный вектор
T
λ
на градиент
)
,
( x
x
t
V
(градиент
)
,
(
)
,
(
x
x
x
x
t
V
t
V
=


функции
)
,
( x
t
V
считается вектором-
строкой) функции V(t, x) по x:
)
(
)
2
(
2 1
)
,
,
,
(
f
u
x
u
u
u
x
x
x
u
l
x
l
u
x
x
T
3
T
2
x
C
B
A
V
P
N
Q
V
t
H
T
T
T
+
+
+
+
+
+
+
=
Дифференциальное уравнение Гамильтона–Беллмана (45) в данном случае имеет вид
0
)
(
)
2
(
2 1
min
=








+
+
+
+
+
+
+
+
+


f
u
x
u
u
u
x
x
x
u
l
x
l
x
T
3
T
2
u
C
B
A
V
P
N
Q
t
V
T
T
T
, (IV) где функция V(t, x) удовлетворяет граничному условию (55"):
x
x
x
l
x
T
1
1 1
2 1
)
,
(
R
t
V
T
+
=
. (V)
Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум
)
,
,
,
(
u
x
x
V
t
H
достигается в стационарной точке, где
0
=


u
H
]
[
)
,
,
,
(
min arg
3 1
*
T
T
T
V
B
N
P
V
t
H
x
x
u
x
l
u
x
u
+
+

=
=

. (VI)
Подставляя теперь полученное выражение для u
*
в (VI), находим окончательный вид основного дифференциального уравнения динамического программирования (в данном случае это будет дифференциальное уравнение Гамильтона–Якоби, так как u
*
найдено из условия стационарности H):
)
VII
(
0 2
1 2
1 2
1 2
1 2
1 2
1 1
1 3
1 3
3 1
3 2
1 1
3 1
=

+
+



+
+
+



+









x
x
x
x
l
x
l
l
l
x
l
f
x
l
x
x
x
x
x
x
x
T
T
T
T
T
T
T
T
T
T
T
T
N
NP
Q
V
B
P
N
P
P
C
V
V
B
BP
V
N
BP
V
BP
V
Ax
V
t
V
Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t),
1
R
решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
V
+
+
=
x
q
x
x
x
T
T
, (VIII) где R(t) – симметричная матрица размерности n
× n; q(t) – n-мерный вектор; r(t) – скаляр.
Частные производные функции V(t, x), записанной в форме (VIII), имеют вид
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
t
V
T
T
&
&
&
+
+
=


x
q
x
x
x
; (IX)
T
T
T
T
R
t
V
t
t
R
t
V
t
V
q
x
x
x
q
x
x
x
x
x
+
=


+
=








=
)
,
(
);
(
)
(
)
,
(
)
,
(
. (X)
Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что:
1) при одновременном умножении произвольной матрицы М слева и справа на вектор x имеет место соотношение
x
x
x
x
)
(
2 1
T
T
T
M
M
M
+
=
(т.е. происходит выделение симметричной части
)
(
2 1
T
M
M
+
матрицы М);
2) скалярное произведение обладает свойством транспонируемости
y
b
b
y
T
T
=
, получим
)
XI
(
0 2
1 2
1
]
)
(
)
(
[
]
)
(
)
(
[
2 1
3 1
3 1
3 1
2 1
3 1
1 3
1 1
1 1
1
=


+


+
+
+





+
+



+

+

+











l
l
f
q
q
l
q
q
x
f
l
l
q
l
q
q
x
x
P
C
B
P
B
BP
r
R
C
N
P
R
B
BP
R
B
P
N
BP
A
R
B
RBP
N
NP
Q
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
&
&
&
Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при
1
t
t
=
для любых значений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)]
x
R
t
r
t
t
R
T
T
T
T
1 1
1 1
1 2
1
)
(
)
(
)
(
2 1
l
x
x
x
q
x
x
+
=
+
+
,
то для определения матрицы R(t), вектора q(t) и скаляра r(t) получаем следующие уравнения и граничные условия:
1)
)
XII
(
;
0
)
(
)
(
)
(
)
(
1 1
1 1
1
=
+
+
+

+
+
=


+


+

+





Q
R
B
N
P
N
RB
R
A
RA
R
N
NP
Q
R
B
RBP
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
&
&
)
(
1 1
R
t
R
=
(XII')
2)
)
XIII
(
;
0
)
(
)
(
2 1
3 1
1 3
1
=
+
+





+




R
C
N
P
R
B
BP
R
B
P
N
BP
A
T
T
T
T
T
T
T
T
T
T
T
f
l
l
q
l
q
q&
T
T
t
1 1
)
(
l
q
=
. (XIII')
3)
0 2
1 2
1 3
1 3
1 3
1
=

+





l
l
f
q
q
l
q
q
P
C
B
P
B
BP
r
T
T
T
T
T
T
&
; (XIV)
0
)
(
1
=
t
r
. (XIV')
Полученные уравнения следует интегрировать в обратном времени от
1
t
t
=
к
0
t
t
=
Оптимальный закон управления с обратной связью имеет вид
)]
(
)
(
)
(
))
(
)
(
)
(
)[
(
)
,
(
3 1
*
t
t
t
B
t
N
t
R
t
B
t
P
t
T
T
T
l
q
x
x
u
+
+
+

=

. (XV)
Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества приведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимального закона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 – неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационар- ного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2 – для стационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченном интервале времени (
[ ]

,
0
), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа
Nu
x
T
). В п. 5 приведено решение задачи, которая в оп- ределенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неодно- родной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являются частными случаями рассмотренной выше задачи.
Контрольные вопросы
1. Принцип оптимальности динамического программирования.
2. Ослабленное необходимое условие.
3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций

строки
Уравнение движения системы
Начальные и конечные условия
Критерий качества J[u]
Оптимальный закон управле- ния
(в смысле минимума J[u])
u
*
= v
*
(x, t)
Оптимальное значение крите- рия качества
1 2 3
4 5
6 1
u
x
x
)
(
)
(
t
B
t
A
+
=
&
,
T
n
x
x
)
...,
,
(
1
=
x
,
T
m
u
u
)
...,
,
(
1
=
u
,
A(t) – матрица раз- мерности n
× n, B(t)
– матрица размер- ности n
× m
0
t
– задано,
0 0
)
(
x
x
=
t

задано,
1 0
t
t
t


1
t
– задано,
1 1
)
(
x
x
=
t

свободно
dt
t
P
t
Q
R
J
t
t
T
T
T

+
+
+
=
1 0
]
)
(
)
(
[
2 1
2 1
]
[
1 1
1
u
u
x
x
x
x
u
)
(
,
1
t
Q
R
– положительно полуопределенные сим- метричные матрицы размерности n
× n;
P(t) – положительно определенная симмет-
x
u
)
(
)
(
)
(
1
*
t
R
t
B
t
P
T


=
, где R(t) – решение матрич- ного уравнения Риккати:
1 1
1
)
(
),
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
R
t
R
t
R
t
B
t
P
t
B
t
R
t
Q
t
R
t
A
t
A
t
R
t
R
T
=
+
+




=

&
(интегрирование от
1
t
до
0
t
) или
)
(
)
(
)
(
2 1
)
,
(
0 0
0 0
0
min
*
t
t
R
t
t
V
J
J
T
1   ...   4   5   6   7   8   9   10   11   ...   15


написать администратору сайта