Главная страница

Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


Скачать 1.34 Mb.
НазваниеСпециальные разделы теории управления. Оптимальное управление
АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
Дата12.01.2023
Размер1.34 Mb.
Формат файлаpdf
Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
ТипДокументы
#883784
страница4 из 15
1   2   3   4   5   6   7   8   9   ...   15
x
x
v
],
,
[
,
)
,
(
1 0
;
2)
)
(
)
),
(
(
t
t
t
u
x
v
=
,
где
x(t) – траектория системы S; u(t) – допустимое программное управление при законе управления v(x, t).
Вектор
а управляющих параметров называется допустимым, если его значение принадлежит заданному множеству
r
r
R
A

2.8. Допустимые траектории и процессы
Фазовая траектория
x(t) системы S называется допустимой, если: а) она получена из решения системы ДУ при допустимом управлении
u(t) или при допустимом законе управления v(x,
t); б) значения
x(t) принадлежат заданной области
n
X
пространства состояний
n
X
Управляемый процесс (
x, u) называется допустимым, если в нем под действием допустимого управления u(t) или до- пустимого закона управления
v(x, t) реализуется допустимая траектория.
2.9. Граничные условия. Краевая задача
Цель управляемого процесса (
x, u) состоит в переходе системы S из некоторого заданного при
0
t
t
=
начального состоя- ния
)
(
0 0
t
x
x
=
в заданное конечное состояние
)
(
1 1
t
x
x
=
за время
0 1
t
t
T

=
При этом все компоненты векторов
1 0
,
x
x
и моменты времени
1 0
, t
t
обязательно должны быть фиксированными, неко- торые могут оставаться незаданными (свободными). В общем случае система S в начальный и конечный моменты времени может находиться в состояниях, описываемых уравнениями вида
а) б)
в) г)

д) е)
Рис. 4. Примеры граничных условий:
a – левый и правый концы фазовой траектории закреплены;
б – левый конец закреплен, правый – свободен; в – левый и правый концы подвижные; г – левый конец закреплен, правый – свободен, за исключением координаты x
1
; д – общий случай подвижных граничных условий;
е – граничные условия в задаче встречи движений;
– оптимальная траектория; - - - - - - – произвольная траектория
0
)
,...,
,
(
)
,
,
(
1 2
1 0
0
=
=
T
l
h
h
h
t
a
x
h
; (6)
0
)
,...,
,
(
)
,
,
(
1 2
1 1
1
=
=
T
l
h
h
h
t
a
x
g
(7) или более общими уравнениями вида
0
)
...,
,
,
(
)
,
,
,
,
(
2 1
1 0
1 0
=
=
T
l
g
g
g
t
t
a
x
x
g
, (8) где
r
n
l
r
n
l
l
+
+

+
+

+
2 2
;
2 2
2 1
Уравнения (6) и (7) описывают (при фиксированном управляющем параметре а) обычно поверхность размерности
)
1
(
2
l
n

+
и
)
1
(
1
l
n

+
, и
)
(
2
l
u

в пространстве (t, x) называются раздельными граничными условиями для концов фазовой траектории. Примеры граничных условий приведены на рис. 4. Уравнения (8) называются смешанными граничными усло-
виями. Если значения фазовых координат в момент t
0
(или t
1
) не фиксируются, то граничные условия для левого (или право- го) конца траектории называются свободными. Раздельные условия вида (6) и (7) часто называют подвижными граничными условиями.
Определение уравнений u(t), при которых решение системы (1) удовлетворяет условиям (6) и (7), называется двухто-
чечной краевой задачей.
Перевод начального состояния x
0
в конечное состояние x
1
на заданном отрезке [t
0
, t
1
] не всегда возможен. Однако, если найдется хотя бы одна пара векторов {u(t), a} или {v(x, t), a}, осуществляющая указанный переход, то обычно существуют и другие пары векторов, реализующие этот же самый переход. В этом случае каждой паре {u(t), a} соответствует определен- ное значение критерия качества J[u, a]. Можно ставить задачу об отыскании таких {u(t), a}, которые минимизируют или максимизируют этот критерий.
Контрольные вопросы
1. Что такое фазовые координаты?
2. Расскажите об эволюции системы и ее описании при помощи дифференциальных уравнений движения.
3. Функционал. Критерий качества управления.
4. Какие системы называются автономными?
5. Расскажите о допустимых программных управлениях.
6. Расскажите о допустимом законе управления.
7. Допустимые траектории и процессы. Граничные условия. Краевая задача. Виды краевых условий.
Г л а в а 3
ПОСТАНОВКА ОСНОВНЫХ ЗАДАЧ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Основная задача оптимального программного управления в форме временной программы (2) для системы (1) с критери- ем (4) и краевыми условиями (8) формулируется следующим образом.
Среди всех допустимых на отрезке
]
,
[
1 0
t
t
программных управлений
m
U
t

=
)
(
u
u
и управляющих параметров
r
A

a
, переводящих точку
)
,
(
0 0
x
t
в точку
)
,
(
1 1
x
t
, найти такие, для которых функционал (4) на решениях системы (1) примет наи- меньшее (наибольшее) значение с выполнением условий (8).
Управление u(t), решающее эту задачу, называется оптимальным (программным) управлением, а вектор а – оптималь- ным параметром.
Если пара {u
*
(t), a
*
} доставляет абсолютный минимум функционалу J[u(t), a] на решениях системы (1), то выполняется
соотношение
]
),
(
[
]
),
(
[
*
*
*
min
t
t
J
t
J
J
J
u
a
u

=
=
(9) для
r
m
A
U



a
u
,
, являющихся допустимыми и осуществляющих заданный переход с выполнением условия (8). Анало- гичное определение имеет место для абсолютного максимума (с заменой знака неравенства
≤ знаком ≥).
Из определения абсолютного минимума (9) следует, что абсолютное минимальное значение функционала
]
,
[
*
*
*
a
u
J
J
=
является единственным, чего нельзя утверждать, вообще говоря об оптимальном управлении u
*
(t) и опти- мальном параметре a
*
3.1. Основная задача оптимального координатного управления
Основная задача оптимального координатного управления известна в теории оптимальных процессов как проблема
синтеза оптимального закона управления, а в некоторых задачах – как задача об оптимальном законе поведения.
Задача синтеза оптимального закона управления для системы (1) с критерием (4) и краевыми условиями (6) и (7), где для упрощения предполагается, что функции f
0
, f, h, g,
Φ от вектора а не зависят, формулируется следующим образом.
Среди всех допустимых законов управления v(x, t) найти такой, что для любых начальных условий (t
0
, x
0
) из (6) при подстановке этого закона в (1) и в (4) осуществляется заданный переход (7) и критерий качества J[u] принимает наименьшее
(наибольшее) решение.
3.2. Оптимальные траектории
Траектория системы (1), соответствующая оптимальному управлению u
*
(t) или оптимальному закону v
*
(x, t), называет- ся оптимальной траекторией. Совокупность оптимальных траекторий x
*
(t) и оптимального управления u
*
(t) образует опти- мальный управляемый процесс {x
*
(t), u
*
(t)}.
Установлено, что при отсутствии вектора а управляющих параметров в f
0
, f, h, g,
Φ задача программного и координат- ного управления эквивалентны.
Так как закон оптимального управления v
*
(x, t) имеет форму закона управления с обратной связью, то он остается оп- тимальным для любых значений начальных условий (x
0
, t
0
) и любых координат x.
В отличие от закона v
*
(x, t) программное оптимальное управление u
*
(t) является оптимальным лишь для тех начальных условий, для которых оно было вычислено. При изменении начальных условий будет меняться и функция u
*
(t). В этом со- стоит важное, с точки зрения практической реализации системы управления, отличие закона оптимального управления v
*
(x,
t) от программного оптимального управления u
*
(t), поскольку выбор начальных условий на практике никогда не может быть сделан абсолютно точно.
3.3. Свойства оптимальных управлений
и оптимальных траекторий
1. Всякая часть оптимальной траектории (оптимального управления) также, в свою очередь, является оптимальной траекторией (оптимальным управлением). Это свойство математически формулируется следующим образом.
Пусть u
*
(t), t
0
tt
1
– оптимальное управление для выбранного функционала J[u], соответствующее переходу из со- стояния
)
,
(
0 0
x
t
в состояние
)
,
(
1 1
x
t
по оптимальной траектории x
*
(t). Числа
1 0
, t
t
и вектор
0
x
– фиксированные, а вектор
1
x
, вообще говоря, свободен. На оптимальной траектории x
*
(t) выбираются точки
)
(
0
*
τ
x
и
)
(
1
*
τ
x
, соответствующие мо- ментам времени
1 0
,
τ
=
τ
=
t
t
, где
1 1
0 0
t
t

τ

τ

. Тогда управление u*(t) на отрезке
]
,
[
1 0
τ
τ
является оптимальным, соответ- ствующим переходу из состояния
)
(
0
*
τ
x
в состояние
)
(
1
*
τ
x
, а дуга
)]
(
),
(
[
1
*
0
*
τ
τ
x
x
является оптимальной траекторией S.
Таким образом, если начальное состояние системы есть
)
(
0
*
τ
x
и начальный момент времени
0
τ
=
t
, то независимо от того, каким образом пришла система к этому состоянию, ее оптимальным последующим движением будет дуга траектории
x
*
(t),
1 0
τ


τ
t
, являющейся частью оптимальной траектории между точками
)
,
(
0 0
x
t
и
)
,
(
1 1
x
t
. Это условие является необ- ходимым и достаточным свойством оптимальности процесса и служит основой динамического программирования.
П р и м е ч а н и е . Приведенная краткая формулировка основного свойства оптимальных траекторий не должна толко- ваться слишком широко. Требование, чтобы начальная и конечная точки траекторий сравнения лежали на оптимальной тра- ектории в те же моменты времени
1 0
,
τ
τ
, что и точки оптимальной траектории, или чтобы свободный правый конец
1
x
тра- ектории сравнения оканчивался в тот же момент
1
t
, что и конец оптимальной траектории, являются существенными. Без их выполнения это свойство, вообще говоря, не имеет места. Так, если заданы только начальная точка
)
(
0 0
t
x
x
=
и моменты времени
0
t
и
0
τ
, а
)
(
0
τ
x
свободен, то отрезок траектории x
*
(t),
0 0
τ

t
t
может и не быть оптимальным. В этом случае оп- тимальным может быть, вообще говоря, другой отрезок
)
(t
x
(рис. 5).

Рис. 5. Основное свойство оптимальных траекторий:
)
3
,
2
,
1
(
,
;
1 1
2 2
=

>

i
J
J
J
J
– значения функционала на участках оптимальной траектории и на траекториях сравнения, соответственно
2. Автономные системы инвариантны относительно сдвига вдоль оси t. Это означает, что если u
*
(t),
1 0
t
t
t


соверша- ет переход
1 0
x
x

и сообщает функционалу J[u] значение J
*
, то при любом действительном
τ управление
τ



τ

τ
+
1 0
*
),
(
t
t
t
t
u
также совершает переход
1 0
x
x

и придает функционалу J[u] значение J
*
3.4. Геометрическая интерпретация основной задачи
оптимального управления
Основным задачам оптимального управления при закрепленных концах можно дать следующую эквивалентную гео- метрическую формулировку.
Пусть при
0
t
t
=
задано начальное состояние
)
(
0 0
t
x
x
=
, а при
1
t
t
=
– конечное состояние
)
(
1 1
t
x
x
=
, где
1 0
1 0
,
,
,
x
x
t
t
– фиксированные значения. Тогда в функционале J[u] (4) слагаемое
)
,
,
,
(
1 0
1 0
x
x
t
t
Φ
является известным числом
0
Φ
Введем новую переменную x
0
, закон изменения которой имеет вид
)
,
,
,
(
0 0
a
u
x
t
f
dt
dx =
(10) с начальным условием
0 00 0
0
)
(
Φ
=
= x
t
x
Присоединим эту переменную к системе (1). Тогда при
0
t
t
=
система находится в точке
T
n
t
x
t
x
t
x
))
(
...,
),
(
),
(
(
0 0
1 0
0
, а при
1
t
t
=
– в точке
T
n
t
x
t
x
t
x
))
(
...,
),
(
),
(
(
1 1
1 1
0
, где
]
[
)
,
,
,
(
)
(
1 0
0 0
1 0
u
a
u
x
J
dt
t
f
t
x
t
t
=
+
Φ
=

Таким образом, если в (n + 1)-мерном пространстве точек
)
,
(
0
x
x
провести через точку
)
,
0
(
1
x
прямую П параллельно оси
0 0x
, то решение системы (1), (10) проходит при
1
t
t
=
через точку на прямой П с координатой
J
t
x
=
)
(
1 0
Теперь основная задача оптимального программного управления формулируется геометрически как на рис. 6.

Рис. 6. Геометрическая формулировка основной задачи
оптимального управления:
1 – оптимальная траектория; 1' – изменение критерия качества J вдоль оптимальной траектории; 2, 3 – неоптимальные траектории, проходящие через точки (x
0
, t
0
), (x
1
, t
1
); 2', 3' – изменение критерия качества J вдоль неоптимальных траекторий
В (n + 1)-мерном фазовом пространстве
T
n
x
x
x
)
...,
,
,
(
1 0
даны:
1) при
0
t
t
=
точка
)
,
(
0 0
x
Φ
;
2) прямая П, параллельная оси
0 0x
и проходящая через точку
)
,
0
(
1
x
Среди всех допустимых программных управлений u = u(t), обладающих тем свойством, что соответствующее решение
))
(
),
(
(
0
t
t
x
x
системы (1), (10) с начальным условием
T
n
t
x
t
x
))
(
...,
),
(
,
(
0 0
1 0
Φ
пересекает при
1
t
t
=
прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую (наибольшую) координату
J
t
x
=
)
(
1 0
Контрольные вопросы
1. Основная задача оптимального координатного управления.
2. Оптимальные траектории.
3. Основные свойства оптимальных управлений и оптимальных траекторий.
4. Геометрическая интерпретация основной задачи.
Г л а в а 4
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
ДЛЯ ОСНОВНОЙ ЗАДАЧИ ПРОГРАММНОГО УПРАВЛЕНИЯ.
ПРИНЦИП МАКСИМУМА
1   2   3   4   5   6   7   8   9   ...   15


написать администратору сайта