Главная страница

Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


Скачать 1.34 Mb.
НазваниеСпециальные разделы теории управления. Оптимальное управление
АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
Дата12.01.2023
Размер1.34 Mb.
Формат файлаpdf
Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
ТипДокументы
#883784
страница6 из 15
1   2   3   4   5   6   7   8   9   ...   15

λ
λ
x
x
(33) и фиксированное значение управляющего параметра а, то система (23) может быть проинтегрирована. Однако начальный и конечный моменты времени
t
0
,
t
1
, начальное и конечное значения вектора фазовых координат
)
...,
,
(
),
...,
,
(
1 11 1
0 10 0
n
n
x
x
x
x
=
=
x
x
, начальное и конечное значения вектора сопряженных переменных
)
...,
,
,
1
(
0 10 0
n
λ
λ
=
λ
,
)
...,
,
,
1
(
1 11 1
n
λ
λ
=
λ
, постоянный вектор
)
...,
,
,
(
2 1
l
µ
µ
µ
=
µ
и вектор управляющих параметров
)
...,
,
,
(
2 1
r
a
a
a
=
a
для опти- мального решения заранее неизвестны. Они могут быть определены из условий трансверсальности (28) – (32) и граничных условий (12). В самом деле, для определения (2 + 4n + l + r) неизвестных
a
µ
λ
λ
x
x
,
,
,
,
,
,
,
1 0
1 0
1 0
t
t
имеется два условия (28),
(29), 2n условий (30), (31), r условий (32) и l условий (12); кроме того, 2n соотношений вида
)
,
,
,
(
)
(
0 0
1 0
1 1
x
λ
x
t
t
t
ϕ
=
,
)
,
,
,
(
)
(
0 0
1 0
2 1
x
λ
λ
t
t
t
ϕ
=
будут получены в результате интегрирования системы (23). Таким образом, для полученной крае- вой задачи имеется достаточное число соотношений, позволяющих считать ее, по крайней мере, теоретически разрешимой.
Необходимо также отметить, что принцип максимума дает глобальный минимум. Численные методы решения краевых задач приведены в [20, 23].
4.4. Некоторые следствия принципа максимума
1. Непосредственным следствием системы (23) и условия (24) является выполнение между точками разрыва функции
u
(t) соотношения
t
H
dt
dH


=
. (34)
Это условие для автономных систем (т.е. систем, не зависящих явно от t) приводит к первому интегралу: H = const вдоль всей оптимальной траектории, хотя в общем случае условие (34) неверно, условия скачка обоснованы и получены.

2. В большинстве практических случаев
0 0
>
λ
(так называемый нормальный случай), и поэтому без нарушения общ- ности в силу однородности функции H по переменным
λ
i
можно принять
λ
0
= 1.
П р и м е ч а н и е . Из-за однородности H по
λ
i
управление u из (25) определяется не самими величинами
λ
i
, а их отно- шениями к одной из них, например, к
λ
0
. Это эквивалентно принятию
λ
0
= 1. Случай
λ
0
= 0 является особым (анормальным) и здесь не рассматривается.
3. Условия (24), (25) принципа максимума позволяют найти оптимальные значения всех m компонент вектора u.
Если минимум H по u достигается во внутренней точке множества U
m
и функции
i
f
дифференцируемы по u, то
*
j
u
опре- деляются из условия
)
,
1
(
0
*
m
j
u
H
j
=
=


=u
u
. (35)
Это условие совместно с (23) образует условие Эйлера-Лагранжа классического вариационного исчисления для задачи (11) –
(13)
[24 – 27].
П р и м е ч а н и е . Минимум H по u далеко не всегда достигается во внутренней точке множества
m
U
, а в тех случаях, когда он достигается во внутренней точке, последняя не обязательно является стационарной (рис. 7). Типы минимизирую- щих точек довольно разнообразны. Из них особо следует отметить случаи нестрогого минимума, так как принцип максиму- ма не позволяет для них однозначно определить u
*
. Этот случай в теории оптимального управления является особым.
а – внутренний min H(u) в стационарной точке; б, в – граничный min H(u);
г – граничный min H(u); u
с1
, u
с2
– стационарные точки локальных max и min;
д – внутренний min H(u) в угловой точке; u
с3
– точка перегиба;
е – две изолированные минимизирующие точки 2 и 3; ж – нестрогий min H(u) на отрезке 45 и изолированный min H(u) в точке 6
Если функция H достигает минимального значения в точке на границе
m
U
Г
области
m
U
, то условие (35) не является
более необходимым в этой точке. При этом возможны три случая: а) множество
m
U
описывается системой связей в виде равенств
)
...,
,
2
,
1
(
0
)
...,
,
,
(
2 1
m
s
u
u
u
m
S
<
ν
=
=
χ
; (36) тогда минимум H при условиях (36) находится методом неопределенных множителей Лагранжа; б) множество
m
U
задано системой неравенств
...)
,
3
,
2
,
1
(
0
)
...,
,
,
(
1 2
1 1
=


s
u
u
u
m
s
; (37) тогда задача сводится на каждом шаге интегрирования к проблеме нелинейного программирования; в) множество
m
U
является ограниченной областью, не имеющей границ (например, замкнутой двумерной поверхно- стью типа сферы или эллипсоида в трехмерном пространстве). Для всякой непрерывной функции H(u), имеющей непрерыв- ные частные производные, заданной на замкнутой поверхности и выраженной через параметрические координаты этой по- верхности, точка максимума H по этим параметрическим координатам принадлежит к числу решений (35), где роль
j
u иг- рают параметрические координаты поверхности.
П р и м е р . Пусть
)
,
,
(
3 2
1
u
u
u
H
задана на сфере. Тогда замена
ϕ
θ
=
cos sin
1
r
u
,
ϕ
θ
=
sin sin
2
r
u
,
θ
= cos
3
r
u
приводит к
)
,
,
(


)
,
,
(
3 2
1
r
H
u
u
u
H
ϕ
θ
=
– периодической функции с периодом
π
2
по
θ и ϕ и в точке минимума
H
H
=

имеют место равенства
0


=
∂ϕ

=
∂θ

H
H
4. Условия (35) определяют лишь внутреннюю стационарную точку функции H. Если u
*
= u удовлетворяет системе
(35) и доставляет минимум функции H(u), то должны быть выполнены необходимые условия второго порядка: матрица ча- стных производных второго порядка функции H(u)
)
,
1
,
(
2
m
j
i
u
u
H
H
j
i
=











=
uu
(38) должна быть неотрицательно определенной в точке u
*
минимума функции H(u).
Положительная определенность матрицы Н
uu
при выполнении условий (35) в точке u
*
является достаточным условием для относительного (но не абсолютного!) минимума H(u) в этой точке. Условие (38) неотрицательной определенности мат- рицы Н
uu
представляет собой условия Лежандра-Клебша классического вариационного исчисления [25 – 27].
Проверка положительной определенности матрицы Н
uu
может проводиться по критерию Сильвестра: для положитель- ной определенности матрицы Н
uu
необходимо и достаточно, чтобы ее угловые миноры были положительными. В частности, для положительно определенной матрицы Н
uu
выполняется условие
0
det
2
>











u*
j
i
u
u
H
, (39) являющееся аналогом условия Гильберта неособенности (невырожденности) вариационной задачи (см. п. 9.4).
5. Приведенная формулировка принципа максимума остается справедливой и для случая, когда область
m
U
зависит явным образом от времени t:
)
(t
U
U
m
m
=
З а м е ч а н и е . Принцип максимума является, вообще говоря, лишь необходимым условием. Любое допустимое опти- мальное управление, если оно существует, удовлетворяет принципу максимума. Однако не всякое допустимое управление, удовлетворяющее принципу максимума, является оптимальным. Поэтому после определения управления на основе необхо- димых условий следует убедиться в его оптимальности. Для этого служат достаточные условия оптимальности.
В некоторых случаях принцип максимума является не только необходимым, но и достаточным условием оптимально- сти управления u(t). Пусть, например, найдено допустимое управление u
*
(t), которое переводит заданное начальное состоя- ние
0 0
)
(
x
x
=
t
линейной относительно фазовых координат системы
m
U
t
t
A

+
=
u
u
h
x
x
),
,
(
)
(
&
, (40) где
m
U
– замкнутое ограниченное множество; A(t), h(u, t) – непрерывные функции t, u;
)
,...,
,
(
2 1
n
x
x
x
=
x
,
)
...,
,
,
(
2 1
m
u
u
u
=
u
в заданное конечное состояние
1 1
)
(
x
x
=
t
. Введем такую систему начальных значений сопряженных переменных

0
,
)
,...,
,
(
)
(
00 0
10 00 0
>
λ
λ
λ
λ
=
T
n
t
λ
, что u
*
(t) минимизирует в каждый момент t функцию
)
,
(
)
(
)
,
(
0 00
t
t
t
h
H
T
u
h
λ
u
+
λ
=
по всем
m
U

u
, где
x
x
λ
λ


λ


=
)
),
(
(
)
(
)
(
)
(
*
0 00
t
t
f
t
t
A
t
T
T
&
Тогда управление u
*
(t) минимизирует на траекториях x
*
(t) системы (40), проходящих через
1 0
,
x
x
, критерий качества

+
=
1 0
)]
,
(
)
,
(
[
)]
(
[
0 0
t
t
dt
t
h
t
f
t
J
u
x
u
, если только
)
,
(
0
t
f
x
является однозначной выпуклой вниз функцией x для всех
]
,
[
1 0
t
t
t

З а м е ч а н и е . Функция
)
,
(
0
t
f
x
называется выпуклой вниз по x при
]
,
[
1 0
t
t
t

, если для всех
n
n
R
R


x
x
,
)
,
(
)
,
(
)
(
)
,
(
0 0
0
t
f
t
f
t
f
x
x
x
x
x
x

+



Контрольные вопросы
1. Приведите формулировку принципа максимума.
2. Расскажите о следствиях принципа максимума.
3. Каким условием является принцип максимума?
Г л а в а 5
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ.
МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
5.1. Задача синтеза оптимального закона управления
Для синтеза оптимального закона управления систем с обратной связью, оптимальных замкнутых контуров управления, оптимальных законов наведения и т.д. более естественен другой подход, чем использованный при решении задач, описан- ных в гл. 4, 9.
В отличие от уравнений Эйлера–Лагранжа и принципа максимума Понтрягина, использующих временное представле- ние оптимального управления [в форме u
*
= u(t)] для единичного объекта управления, этот подход рассматривает оптималь- ное управление в форме закона u
*
= v
*
(x, t) (координатное управление, управление в форме обратной связи) для множества однородных объектов, отличающихся различными начальными состояниями.
С точки зрения механики, этот подход соответствует рассмотрению распространения «волн возбуждения» от некоторо- го источника в неоднородной среде. Общность обоих подходов устанавливает проективная геометрия, с точки зрения кото- рой траектория точки в фазовом пространстве может рассматриваться и как последовательность точек и как огибающая сво- их касательных.
Последовательное применение описываемого подхода к задачам оптимального управления приводит для непрерывных процессов к дифференциальному уравнению (нелинейному) в частных производных первого порядка типа уравнения Га- мильтона–Якоби [25 – 27].
Один из возможных способов получения этого уравнения состоит в использовании принципа оптимальности динамиче- ского программирования. Динамическое программирование является довольно общим методом, разработанным для решения общих задач многоэтапного выбора (т.е. задач, в которых результаты предыдущих операций можно использовать для управ- ления ходом будущих операций).
5.2. Принцип оптимальности динамического программирования
Принцип оптимальности
. В основе динамического программирования лежит сформулированный Р. Беллманом прин- цип оптимальности: «Оптимальная политика обладает тем свойством, что каковы бы ни были начальное состояние и перво- начально принятое решение, последующие решения должны составлять оптимальную политику относительно состояния, получившегося в результате первоначально принятого решения» [19, 28]. Или, оптимальное управление не зависит от того,
каким образом пришла система к данному состоянию при
t
t

= (т.е. не зависит от «предыстории» движения) и для будущих моментов времени полностью определяется лишь состоянием системы в рассматриваемый момент времени.
Как частный случай в динамическом программировании рассматриваются задачи управления непрерывными процесса- ми (основная задача оптимального координатного управления).
Краткая формулировка задачи. Пусть дана система уравнений движения
)
,
,
(
u
x
f
x
t
dt
d =
, (41) где
m
T
m
U
u
u
u

=
)
...,
,
,
(
2 1
u
;
n
T
n
X
x
x
x

=
)
...,
,
,
(
2 1
x
;
T
n
t
f
t
f
t
f
))
,
,
(
...,
),
,
,
(
),
,
,
(
(
2 1
u
x
u
x
u
x
f
=
, и граничные условия
1 1
0 0
)
(
;
)
(
x
x
x
x
=
=
t
t
. (42)
Требуется синтезировать закон оптимального управления u
*
= v
*
(x, t), минимизирующий значение функционала
dt
t
f
t
J
t
t

=
1 0
)
,
,
(
]
,
,
[
0 0
0
u
x
u
x
. (43)
Необходимые условия
.
Пусть в (n + 1)-мерном пространстве
)
,
(
T
X
n
имеется некоторая область G(x, t) начальных значений
))
,
(
)
,
((
,
0 0
0 0
t
G
t
t
x
x
x

, для каждой точки которой существует оптимальное (в смысле минимума
]
,
,
[
0 0
u
x
t
J
управление u
*
(t), переводящее эти начальные точки в некоторую фиксированную точку
)
,
)
(
(
1 1
1
t
t
x
x
=
;
1 1
, t
x
– заданы. На таких оптимальных управлениях минимальное значение критерия качества (43) будет зависеть лишь от начальных значений
0 0
, t
x
. Таким образом,
)
,
(
0 0
*
min
x
t
V
J
J
=
=
, где
)
,
(
0 0
x
t
V
– некоторая функция (n + 1) переменного
0 10 0
...,
,
,
n
x
x
t
Имея в виду произвольную точку области G(x, t), в дальнейшем, в целях упрощения записи, нижний индекс «0» будем опускать.
Таким образом, функция V(t,
1   2   3   4   5   6   7   8   9   ...   15


написать администратору сайта