5.3. Оптимальное управление в замкнутых системах
Расчет оптимального регулятора для замкнутых систем (систем управления с обратной связью) выполняется почти так же, как и синтез оптимальных фильтров. Однако нужно учиты- вать две особенности:
1) регулятор должен обеспечивать устойчивость замкнутой системы (в задаче фильтрации обычно требуется устойчивость самого фильтра);
2) уменьшение дисперсии ошибки, как правило, достигается за счет увеличения мощности управления, которая ограничена в реальных задачах; например, угол перекладки руля судна не может быть больше 30-35
°.
Рассмотрим систему стабилизации судна на курсе в условиях морского волнения.
Модель судна (обведена штриховой линией) состоит из двух блоков с передаточными функ- циями
)
(
1
s
P
и
s
s
P
/
1
)
(
2
=
(интегрирующее звено). Истинный курс
ϕ
измеряется датчиком с пе- редаточной функцией
)
(s
G
. Для компенсации измеренной ошибки
ϕ
ϕ
ˆ
0
−
=
y
регулятор
)
(s
C
выдает на привод (с передаточной функцией
)
(s
H
) управляющий сигнал
u
, который преобра- зуется в угол поворота руля
δ
. Заметим, что сама ошибка не измеряется, вместо нее регулятор получает сигнал y , который можно назвать оценкой ошибки.
На систему действуют два случайных сигнала: возмущение
w
, вызванное морским волне- нием и имеющее спектральную плотность
)
(
ω
w
S
, и шум измерений
m
. Для моделирования возмущения используется формирующий фильтр
)
(s
F
w
(такой, что
)
(
)
(
)
(
s
F
s
F
S
w
w
w
−
=
ω
), на вход которого поступает единичный белый шум
ξ
. Далее мы будем считать, что
0 0
=
ϕ
и все случайные сигналы – центрированные.
w
δ
z
ω
)
(
1
s
P
s
1
u
+
–
y
0
ϕ
заданный курс
)
(s
F
w
ξ
)
(s
H
)
(s
G
)
(s
C
регулятор привод датчик
ϕ
m
ϕ
ˆ
©
К.Ю. Поляков, 2009 45
Какова же цель управления? Очевидно, что нужно сделать минимальной дисперсию
ε
Dошибки
ϕ
ϕ
ϕ
ε
=
−
=
0
(при
0 0
=
ϕ
). Это может быть обеспечено только с помощью управления, то есть, за счет увеличения активности руля. В то же время, постоянные «дергания»
руля край- не нежелательны, поэтому нужно ограничить дисперсию
uD (мощность) сигнала управления
uОбычно в таких случаях для решения задачи оптимизации составляют единый критерий min
2
→
+
=
uuDkDIε
. (21) где
2
uk – неотрицательный весовой коэффициент. Задача состоит в том, чтобы выбрать переда- точную функцию регулятора
)
(
sC, обеспечивающую минимум критерия (21).
Величина
2
uk позволяет ограничить сигнал управления. Если этого не делать, то есть при- нять
0 2
=
uk, мощность управления в оптимальной системе практически всегда будет неограни- ченно расти, что неприемлемо.
Вычисление дисперсий ошибки и управления выполним через их спектральные плотно- сти. Чтобы упростить выводы, пока не будем учитывать шум измерений. Тогда
(
)
∫
∞
∞
−
+
=
jjuuudsWWkWWjI*
2
*
2 1
ϕ
ϕ
π
, где
)
(
sWϕ
и
)
(
sWu – передаточные функции от входа
ξ
(белого шума) к углу рыскания
ϕ
и сигналу управления
u. Используя правила преобразования структурных схем, находим
wwFPHGPCHPGCFPsW2 2
1
)
(
+
−
=
ϕ
,
wuFGPCHPGCsW2 1
)
(
+
−
=
где
)
(
)
(
)
(
2 1
sPsPsP=
. Здесь от выбора регулятора
)
(
sC зависит только функция
CHPGCsC+
=
1
)
(
, (22) поэтому спектральные плотности угла рыскания и управления можно вычислить как
(
)(
)
*
*
2 2
*
*
*
*
1
1
)
(
wwFFPPCGHPCPHGsS−
−
=
ϕ
,
*
*
2 2
*
*
)
(
wwuFFPPGGCCsS=
После простых преобразований, критерий качества (21) можно записать в виде (19), где
ECBCBCCAsX+
−
−
=
*
*
*
)
(
. (23)
Это значит, что подынтегральное выражение имеет вид (18), где вместо
)
(
sC фигурирует
)
(
sC, а функции
)
(
sA,
)
(
sB и
)
(
sE известны (конечно, они отличаются от тех, что были в задаче фильтрации). При этом сразу возникает вопрос: нельзя ли
использовать здесь тот же способ оп- тимизации, который применяется для построения фильтра Винера?
Несложно показать, что
)
(
sC – это в самом деле передаточная функция замкнутой систе- мы от
y к
u, то есть, для устойчивости системы она должна быть устойчива, как и фильтр Ви- нера. Тогда можно было бы сначала найти оптимальную устойчивую функцию
)
(
sC как опти- мальный фильтр Винера, а затем выразить передаточную функцию регулятора
)
(
sC из (22).
Однако такой метод «проходит» только тогда, когда сам объект устойчив. В общем случае (ес- ли объект может быть неустойчивым) приходится использовать различные «хитрости», чтобы свести задачу оптимизации замкнутой системы к задаче Винера и при этом гарантировать ус- тойчивость системы. По существу, сначала строится вспомогательный регулятор, который ста- билизирует объект, а затем используется методика синтеза оптимального фильтра Винера.
©
К.Ю. Поляков, 2009 46
Современный подход к решению этой задачи основан на использовании
параметризации всех стабилизирующих регуляторов. Так называется выражение для передаточной функции ре- гулятора, которое зависит от неизвестной устойчивой функции. Изменяя эту функции произ- вольным образом (но сохраняя ее устойчивость), мы можем получить любой регулятор, кото- рый стабилизирует систему. С другой стороны, в такой форме можно представить любой регу- лятор, который стабилизирует систему.
Для построения параметризации передаточную функцию
разомкнутого контура (без ре- гулятора) представляют в виде отношения полиномов,
)
(
sn и
)
(
sd:
)
(
)
(
)
(
)
(
)
(
sdsnsHsGsP=
. (24)
Если полиномы
)
(
sn и
)
(
sd не имеют общих корней, то существуют полиномы
)
(
0
sa и
)
(
0
sb, удовлетворяющие уравнению
1
)
(
)
(
)
(
)
(
0 0
=
+
sdsbsnsa. (25)
Это
полиномиальное уравнение, то
есть уравнение, в котором неизвестными являются полино- мы (многочлены). Степени полиномов
)
(
0
sa и
)
(
0
sb на единицу меньше, чем степени
)
(
sd и
)
(
sn соответственно. Приравнивая коэффициенты при одинаковых степенях
s в левой и пра- вой частях уравнения, получаем линейную систему уравнений, которая легко решается совре- менными программными средствами.
Параметризация всех стабилизирующих регуляторов имеет вид
Φ
−
Φ
+
=
nbdasC0 0
)
(
, (26) где
)
(
sΦ
произвольная устойчивая дробно-рациональная функция (то есть, все корни ее знаме- нателя имеют отрицательные вещественные части). Любой регулятор, построенный по этой формуле – стабилизирующий, в то же время любой стабилизирующий регулятор может быть представлен в таком виде для некоторой функции
)
(
sΦ
Подставляя выражение (26) для
)
(
sC в (22), находим, учитывая (24) и (25):
)
(
)
(
0
Φ
+
=
dadsCВ свою очередь, подставляя это выражение в (23), получаем
EBBAsX)
(
*
*
*
+
Φ
−
Φ
−
ΦΦ
=
, где
)
(
sA, )
(
sB и
)
(
sE – известные функции. Поскольку любая устойчивая функция
)
(
sΦ
дает стабилизирующий регулятор (26), мы свели исходную задачу к задаче Винера, которую можно решать известными средствами (применяя факторизацию и сепарацию).
5.4. Стандартная система Чтобы не «привязываться» к конкретной структурной схеме, программы для проектиро- вания оптимальных регуляторов обычно используют так называемую стандартную систему, где выделяют 4 типа сигналов и связанных с ними передаточных функций:
ε
– сигнал ошибки, его нужно сделать «минимальным» в некотором смысле;
y – измеренный сигнал обратной связи, поступающий на вход регулятора;
w – внешнее возмущение;
u – управляющий сигнал на выходе регулятора.
Уравнения системы (в изображениях по Лапласу) можно записать так:
©
К.Ю. Поляков, 2009 47
usGwsGyusGwsG)
(
)
(
)
(
)
(
22 21 12 11
+
=
+
=
ε
Справа показано общепринятое обозначение стандартной системы. Обратите внимание, что в ней (формально) используется положительная обратная связь. При построении передаточных функций
)
2
,
1
,
(
)
(
=
jisGij предполагается, что регулятора в контуре нет (цепь разорвана).
Каждый из
четырех сигналов может быть векторным, то есть, содержать несколько ком- понент. Например, в рассмотренной выше задаче стабилизации судна на курсе требовалось ог- раничить сумму дисперсий
uuDkD2
+
ϕ
. Ее можно представить как дисперсию векторного сигна- ла
⎥
⎦
⎤
⎢
⎣
⎡
=
ukuϕ
ε
, которая по определению равна:
[
]
uuuuuTDkDukEukukEED2 2
2 2
}
{
}
{
+
=
+
=
⎭
⎬
⎫
⎩
⎨
⎧
⎥
⎦
⎤
⎢
⎣
⎡
=
=
ϕ
ε
ϕ
ϕ
ϕ
ε
ε
Здесь
}
{
⋅
E обозначает математическое ожидание выражения в фигурных скобках, верхний ин- декс
T – операцию транспонирования. Также учитывается, что сигналы центрированные, по- этому математическое ожидание квадрата сигнала равно его дисперсии.
Построим стандартную систему для задачи оптимальной стабилизации судна на курсе, ко- торая рассматривалась выше. Здесь добавлен фильтр
)
(
sFm, который формирует спектр помехи измерений. Его входной сигнал
µ
описывается как единичный белый шум, независимый от
ξ
Вектор внешних воздействий в задаче оптимизации при случайных возмущениях должен опи- сываться моделью единичного белого шума. В данном случае он состоит из двух компонент, независимых сигналов
ξ
и
µ
. Уравнения системы выглядят так:
GPHuFFGPyukPHuFPmwuw−
−
−
=
=
+
=
=
µ
ξ
ε
ξ
ϕ
ε
2 2
2 1
Поэтому
⎥
⎦
⎤
⎢
⎣
⎡
=
0 0
0
)
(
2 11
wFPsG,
⎥
⎦
⎤
⎢
⎣
⎡
=
ukPHsG)
(
12
,
[
]
mwFFGPsG−
−
=
2 21
)
(
,
GPHsG−
=
)
(
22
δ
zω
)
(
1
sPs1
u+
–
y 0
ϕ
заданный курс
)
(
sFwξ
)
(
sH)
(
sG)
(
sCрегулятор привод датчик
ϕ
mϕ
ˆ
)
(
sFmµ
ε
uwy)
(
)
(
)
(
)
(
22 21 12 11
sGsGsGsG)
(
sC
© К.Ю. Поляков, 2009
48
Обратите внимание, что отрицательная обратная связь здесь выражается в том, что в записи
)
(
22
s
G
появляется знак «минус». Можно показать, что
)
(
22
s
G
– это передаточная функция ра- зомкнутого контура (без регулятора).
5.5. Особенности задачи оптимизации
5.5.1. Идеальные датчики
Что будет, если в задаче оптимизации предположить, что датчик идеально измеряет сиг- нал (то есть, принять
0
)
(
=
s
F
m
)? Если выполнить синтез, передаточная функция оптимального регулятора может получиться, например, такая:
4
,
0 1
,
0 5
,
0
)
(
2
+
+
+
=
s
s
s
s
C
В ней степень числителя выше, чем степень знаменателя. Разделив числитель на знамена- тель, можно выделить дифференцирующее звено с передаточной функцией
s
5
,
0
. Вроде бы здесь нет ничего плохого. Однако при построении частотной характеристики такого регулятора
(см. ЛАФЧХ на рисунке справа, красная линия) становится видно, что он усиливает высокочастотные сигналы. Во- первых, это приводит к тому, что сигнал управления будет очень большим и в реальной системе будет превышено его максимально допустимое значение. Во-вторых, любой высо- кочастотный шум измерения (который всегда присутствует) будет усиливаться регулятором, который начнет «раскачи- вать» систему. Таким образом, с точки зрения практического использования получилось плохое решение, хотя и «оптимальное».
Чтобы избежать подобных проблем и сделать регулятор нечувствительным к высокочас- тотным помехам измерительной системы, в задаче оптимизации учитывают сигнал помехи типа
«белого шума». Если принять
1
,
0
)
(
=
s
F
m
при тех же условиях мы получаем регулятор
40 100 14 10 100 50
)
(
2 3
2
+
+
+
+
+
=
s
s
s
s
s
s
C
Поскольку эта функция строго правильная (степень ее числителя меньше степени знаменателя), амплитудная частотная характеристика (синяя линия на рисунке) «скатывается» вниз на высо- ких частотах. Поэтому регулятор будет нечувствителен к помехам измерений. Для обеспечения
«ската» частотной характеристики регулятора на высоких частотах (англ. roll-off), передаточная функция фильтра
)
(s
F
m
должна иметь равные степени числителя и знаменателя, то есть, модель помехи должна содержать составляющую типа «белого шума». Если в системе несколько изме- ряемых сигналов, это относится к каждому из них.
5.5.2. Фиксированные полюса
Анализ оптимальных систем показывает, что все устойчивые полюса
)
(s
H
, )
(s
G
и
)
(
1
s
P
автоматически становятся корнями характеристического уравнения оптимальной замкнутой системы. Это – так называемые фиксированные полюса, они определяются особенностями структуры системы. Если эти передаточные функции имеют неустойчивые полюса (с положи- тельной вещественной частью), корнями характеристического уравнения становятся их (устой-
)
(
ω
m
L
ω
1
,
0
)
(
0
)
(
=
=
s
F
s
F
m
m
©
К.Ю. Поляков, 2009 49
чивые)
отражения от мнимой оси. Если же в
)
(
sH, )
(
sG или
)
(
1
sP есть интегрирующее звено, задача не имеет практически ценного решения – характеристическое уравнение «оптимальной» системы будет иметь нулевой корень, система находится на границе области устойчивости.
Полюса функций
)
(
2
sP, )
(
sFw и
)
(
sFm в явном виде не входят в характеристическое урав- нение. Это объясняется (на интуитивном уровне) тем, что блоки с передаточными функциями находятся
)
(
sFw и
)
(
sFm вне контура управления. Особенность блока
)
(
2
sP состоит в том, что входной сигнал
ξ
проходит
через него на выход
ϕ
. Путем достаточно сложных выкладок мож- но доказать, что при этом его полюса не будут корнями характеристического уравнения. Из этого правила есть одно исключение: формирующий фильтр возмущения не
должен содержать дифференцирующее звено, то есть передаточная функция
)
(
sFw не должна иметь сомножителя
s в числителе.
Вспомним, что для моделирования воздействия морского волнения чаще всего использу- ют формирующий фильтр с передаточной функцией
0 0
2 2
)
(
ω
λω
+
+
=
sssKsFww, где
0
ω
– доминирующая частота волн,
λ
– коэффициент демпфирования (
1 0
<
<
λ
),
wwKσ
λω
0 2
=
и
wσ
– коэффициент, определяющий интенсивность волнения. При этом
0 0
2 0
0 2
2 2
1 2
)
(
)
(
ω
λω
ω
λω
+
+
=
⋅
+
+
=
ssKssssKsPsFwww, то есть, полюс
)
(
2
sP в точке
0
=
s сократился нулем передаточной функции
)
(
sFw. Это значит, что входной сигнал
ξ
уже
не действует на интегратор, и полюс в точке
0
=
s в модели судна должен быть (с формально-математической точки зрения) отнесен к блоку
)
(
1
sP. Так как все полюса
)
(
1
sP (в исходном или «отраженном» виде) становятся корнями характеристического уравнения, в этом случае оптимального стабилизирующего регулятора не существует.
5.5.3. Регуляризация Что же делать? Нужно построить «квазиоптимальный» (лат.
как бы оптимальный, похо-жий на оптимальный) регулятор, который будет стабилизировать систему, хотя и будет не- сколько хуже, чем «оптимальный» (но нестабилизирующий!) по выбранному критерию качест- ва. Для этого обычно выполняют
регуляризацию задачи, то есть, немного меняют условие так, чтобы она стала решаемой. В данном случае возможно два приема:
1) вместо
)
(
sFw использовать измененную передаточную функцию фильтра
0 0
2 2
)
(
ω
λω
θ
+
+
+
=
sssKsFww, которая не имеет нуля в точке
0
=
s при любом малом
θ
;
2) воспользоваться другой моделью спектра морского волнения, которая дает ненулевое зна- чение на частоте
0
=
ω
, например, дробно-рациональными спектрами типов 1 и 2, которым соответствуют формирующие фильтры
0 1
2 0
)
(
δ
δ
γ
+
+
=
sssFw и
0 1
2 0
1
)
(
δ
δ
γ
γ
+
+
+
=
ssssFw ©
К.Ю. Поляков, 2009 50
5.5.4. Все не может быть оптимальным Отметим еще одну особенность рассматриваемой задачи. Мы стремились к тому, чтобы система была устойчива и обеспечивался минимум функции потерь
uuDkDI2
+
=
ε
. Одновре- менно все остальные требования к системе, например, скорость и качество переходных процес- сов, не учитывались. Поэтому «оптимальный» регулятор может приводить к затянутому или колебательному переходному процессу.