Главная страница

Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление


Скачать 1.34 Mb.
НазваниеСпециальные разделы теории управления. Оптимальное управление
АнкорГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
Дата12.01.2023
Размер1.34 Mb.
Формат файлаpdf
Имя файлаГромов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ.pdf
ТипДокументы
#883784
страница3 из 15
1   2   3   4   5   6   7   8   9   ...   15
a
x
g(
a
x
h
a
x
x
Формируются также свободные граничные условия
Выбор показателя оценки качества управления, на- правленного на достижение поставленной цели.
Различного
рода
функционалы
]
,
[ a
u
J
, определение на решениях
системы:
Выбор вычислительного опе- ратора (max, min, max min, min max, …), применение которого к показателю каче- ства является математиче- ским выражением техниче- ского понимания оптималь- ности системы. Фиксация аргументов этого оператора
(u, a, t и т.д.). Формулировка задач оптимизации
]
,
[
max min
];
[
max min
];
[
min
];
[
max
,
,
w
u
u
u
u
w
u
u
u
u
J
J
J
J
W
U
T
t
U
U
U






III Корректировка технической постановки задачи.
Число переменных, вид уравнений,
критерий, граничные условия и т.д.
Аналитические трудности, изуче- ние сформулированной модели мо- гут заставить пойти на дальнейшие упрощения.
Эквивалент преобразования
ММ для удобства изменения аналитических численных методов решения задач оп- тимизации.
Переход к новым фазовым и (или)
управляющим переменным, гранич-
ным условиям и т.д.
В частности, использование мето- дов штрафных функций, редукции к более простым задачам и т.д.
Изменение ММ для удобства вычислений. Формулировка понятий «практически опти- мальной системы», «практи- ческой точности получения результата» в конкретной задаче
Производится на базе содержатель- ной (этап I) и математической
(этап II) формулировок задач
Вектор
T
t)
,
(x
z
=
, т.е. состояние в момент
t, называется событием (фазой). Множество всех возможных событий
z
обра- зует пространство
1 1
+
+

n
n
R
Z
событий. Точка
1
+

n
Z
z
является изображающей точкой пространства событий.

2.2. Управление
Система
S называется управляемой на отрезке (одно из определений управляемости)
]
,
[
1 0
t
t
, если ее поведение при
0
t
t
>
зависит только от начального состояния
))
(
,
(
0 0
0
t
t
t
x
x
=
=
, будущего поведения некоторого переменного вектора u
(входа системы)
1
,
)
,
,
(
1

=
m
u
u
T
m
K
u
, называемого
управляющим вектором (или просто управлением) u, и постоянного вектора
a :
0
,
)
,
,
(
1

=
r
a
a
T
r
K
a
, называемого
вектором управляющих (проектных) параметров.
Вектор u принимает значение из некоторого множества
m
U
m-мерного пространства
m
R
с координатами
m
u
u
u
...,
,
,
2 1
Это множество может быть всем пространством
m
R
или его частью
m
m
R
U

m
U
– чаще всего компактное множество пространства
m
R
Множество
m
U
называется
множеством допустимых значений управления. Некоторые виды множества
m
U
приведе- ны на рис. 2. Постоянный вектор a обычно принадлежит некоторому замкнутому множеству
r
r
R
A

2.3. Эволюция состояния системы.
Дифференциальные уравнения движения
Изменение состояния (эволюция) системы
S на временном интервале
}
,
{
1 0
t
t
t
t
T


=
часто с хорошей степенью при- ближения описывается системой обыкновенных дифференциальных уравнений первого порядка:
)
,
,
,
(
a
u
x
f
x
t
dt
d =
, (1) где
T
n
x
x
x
)
...,
,
,
(
2 1
=
x
– вектор состояния;
T
m
u
u
u
)
...,
,
,
(
2 1
=
u
– управляющий вектор;
T
r
a
a
a
)
...,
,
,
(
2 1
=
a
– вектор проектных параметров.
а)










M
m
M
m
u
u
u
u
u
u
U
2 2
2 1
1 1
2
;
:
б)
}
{
:
2 2
2 2
1 2
R
u
u
u
U

+
в)
}
{
:
2 1
2
M
u
u
u
U

+
г)
}
0
)
,
(
{
:
2 1
2

u
u
f
U
д)








=
+
=
+
R
R
u
u
u
u
u
u
U
2 1
2 2
2 2
1 2
;
:
е)






)
,
(
),
,
(
);
,
(
),
,
(
:
2 1
2 1
2 1
2 1
2
m
M
m
M
M
m
M
M
u
u
u
u
u
u
u
u
U
Рис. 2. Виды множества U
2
допустимых управлений:
ав – замкнутые ограничения выпуклые области, содержащие начало координат; г – невыпуклая область, не содержащая начало коорди- нат; д – невыпуклые одномерные области
2 2
2 1
, U
U
; е – дискретное множество допустимых значений (14 изолированные точки)
1
4
3
2
2
u
M
u
2 1
u
M
u
1
M
u
2
M
u
1 0
2
u
1
u
R
u
R
u
2 1
u
2 2
u
1
u
0 2
u
2
u
m
u
2
m
u
1
M
u
1
M
u
2
M
u
1
u
2
u
2
u
M
u
1
u
2
u
R
u
2
u
0 2
u
1
u
2
u
0

Система (1) образует существенную часть математической модели динамической системы S. В ММ, описываемой сис- темой ДУ, формальным признаком переменной состояния
x является наличие ее производной
dt
dx
в левой части системы (1).
Управляющая переменная
u входит только в правую часть системы (1) и не встречается под знаком производной (это фор- мальный признак управляющей переменной).
Предполагается, что вектор-функция
f(t, x, u, a) определена для любых значений
T
t
A
U
X
r
m
n




,
,
,
a
u
x
, непре- рывна по совокупности переменных t,
x, u, a и непрерывно дифференцируема по x, a. Хотя гладкость является достаточно жестким требованием и может быть заменена требованием измеримости и ограниченности. Так как поведение вектора
u мо- жет быть произвольным (за исключением условия
m
U

u
) и, кроме того, можно произвольно выбрать постоянный вектор
r
A

a
, то система уравнений (1) определяет управляемый процесс. Ход управляемого процесса будет определен на некото- ром интервале
1 0
t
t
t


, если на этом интервале вектор
u задан в одной из двух форм:
T
m
t
u
t
u
t
u
t
))
(
...,
),
(
),
(
(
)
(
2 1
=
= u
u
; (2)
T
m
t
t
t
t
))
,
(
v
...,
),
,
(
v
),
,
(
v
(
)
,
(
2 1
x
x
x
x
v
u
=
=
. (3)
Вектор-функцию
u(t) называют программным (временным) управлением, а вектор-функцию v(x, t) – координатным
управлением или законом управления. Закон управления (3) физически выражает известный принцип обратной связи, соглас- но которому величина управляющего воздействия определяется на основании измерения текущего состояния системы
x и, быть может, момента времени t.
Каждому выбору векторов управляющих параметров
a и управления u (вида (2), (3)) и каждому начальному состоянию
)
,
(
0 0
x
t
соответствует по (1) временная последовательность состояний
)
,
,
(
0 0
t
t x
x
, которая называется фазовой траектори-
ей (поведением, эволюцией, движением) системы S. Пара вектор-функций {
u(t), x(t)} или {v(x, t), x(t)} называется про-
цессом управления или режимом.
2.4. Функционал. Критерий качества управления
Величина
)]
(
[ t
u
J
называется функционалом функции u(t) на отрезке
1 0
t
t
t


, если каждой функции u(t),
]
,
[
1 0
t
t
t

, принадлежащей некоторому классу функций, поставлено в соответствие определенное число
(
)
(
max
,
)
(
),
(
),
(
0 0
t
f
dt
t
f
x
f
a
f
t
t
t
t




и т.д.) из R.
Таким образом, функционал J[u(t)] – это отображение, в котором роль независимого переменного (функционального ар- гумента) играет функция u(t). При этом J[u(t)] зависит от совокупности всех значений, принимаемых функцией u(t) на отрез- ке
]
,
[
1 0
t
t
, и может рассматриваться как функция бесконечного числа независимых переменных.
Для каждого фиксированного конечного момента времени
1 1
t
t

=
состояние
)
(
1
t
x
системы S, движущейся из начального состояния
)
,
(
0 0
x
t
в соответствии с уравнением (1), является одновременно векторным функционалом (т.е. вектором, ком- понентами которого являются функционалы) от управления
u(t) и вектор-функцией от вектора a и вектора начальных усло- вий
)
(
0 0
t
x
. Критерии качества процессов управления являются функционалами.
Достаточно общая форма критерия качества в ТОП имеет вид

+
Φ
=
1 0
)
),
(
),
(
,
(
)
,
,
,
,
(
]
),
(
[
0 1
0 1
0
t
t
dt
t
t
t
f
t
t
t
J
a
u
x
a
x
x
a
u
, (4) где
x(t) удовлетворяет системе (1); u(t) – некоторое выбранное управление; а – управляющий параметр.
В частности, каждую из координат
)
(t
x
i
системы (1) можно записать в форме
n
i
t
x
a
t
u
t
x
t
f
t
x
t
t
i
i
i
i
,
1
,
)
(
)
),
(
),
(
,
(
)
(
1 0
0
=
+
=

2.5. Автономные системы
Если правые части (1) и функции
Φ и f
0
в (4) от времени явно не зависят, то соответствующая задача называется авто-
номной:
)
,
,
(
a
u
x
x
f
dt
d =
;
dt
f
t
J
t
t

+
Φ
=
1 0
)
,
,
(
)
,
,
(
]
),
(
[
0 1
0
a
u
x
a
x
x
a
u
Автономные системы инвариантны относительно сдвига вдоль оси t, поэтому для автономных систем важна только длительность процесса
0 1
t
t

и можно положить
0 0
=
t

2.6. Допустимое программное управление
Вектор-функция
u(t) называется допустимым программным управлением в задаче, если: а)
u(t) принадлежит к выбранному классу в большинстве практических приложений кусочно-непрерывных по t на ин- тервале
]
,
[
1 0
t
t
функций, т.е. может иметь лишь конечное число точек разрыва первого рода; б) значения
u(t) принадлежат заданному множеству
m
U
для всех
]
,
[
1 0
t
t
t

Кусочно-непрерывные управления соответствуют предположению о «безынерционности».
Если желательно учесть «инерцию», то следует искать управление в классе непрерывных кусочно-гладких функций
u(t). Такой класс допустимых управлений иногда сводится к предыдущему путем введения нового безынерционного управ- ления
)
(t
u
, связанного со «старым» управлением
u(t) соотношением
m
U
dt
d

=
u
u
u
,
, где
T
m
u
u
u
)
,...,
,
(
2 1
=
u
;
T
m
u
u
u
)
,...,
,
(
2 1
=
u
. (5)
Если
m
U
замкнутая и ограниченная область, то это означает, что введены ограничения на значения первых производ- ных от вектор-функции
u(t).
Кусочно-непрерывным функциям
)
(t
u
отвечают кусочно-гладкие функции
u(t) в силу (5). Таким образом, в новой задаче
u(t) становится переменной состояния, управляемой посредством
)
(t
u
через систему (5).
Если условие
m
U

u
в новой задаче можно снять, то задача сводится к предыдущей для кусочно-непрерывного управ- ления
m
U

u
. В противном случае следует обратиться к задаче оптимизации с ограничениями на фазовые координаты. На рис. 3 приведены примеры управлений, принадлежащих как к классу кусочно-непрерывных функций, так и к другим клас- сам.
Рассмотрение допустимых управлений в классе кусочно-непрерывных функций объясняется тем, что для оптимизации функционалов на этом классе функций разработан соответствующий математический аппарат – принцип максимума.
Рис. 3. Примеры управлений u
j
(t), принадлежащих различным классам функций:
а – гладкое управление; б – кусочно-гладкое непрерывное управление; в – непрерывное управление (в окрестности u
j
(t), t недифферен- цируема); г – кусочно-непрерывное управление; д – управление, не являющееся кусочно-непрерывным (u'
j
содержит бесконечное число переключений в окрестности t
1
;
)
(
2
t
u
j
– элемент последовательности, сходящейся к функции, разрывной в каждой точке [t
0
, t
1
]); е – управ- ление, содержащее
δ-функции Дирака;
2 1
0
,
,
u
u
u
– константы

Для каждого допустимого управления
u(t) в силу сделанных предположений относительно f(t, x, u) существует единст- венное абсолютно-непрерывное решение системы
)
,
,
(
)
(
0 0
t
t
t
x
x
x
=
, которое удовлетворяет системе (1) почти всюду на
]
,
[
1 0
t
t
[т.е. за исключением конечного числа или счетного множества точек разрыва функции
u(t)] и при
0
t
t
=
принимает заданное значение
)
(
0 0
t
x
x
=
2.7. Допустимый закон управления
Закон управления
v(x, t) является допустимым на
n
X

x
,
]
,
[
1 0
t
t
t

, если
1)
n
m
X
t
t
T
t
U
t

=



1   2   3   4   5   6   7   8   9   ...   15


написать администратору сайта