ОТУ_Поляков_Часть2_2009. Теория автоматического управления для чайников Часть ii. Управление при случайных
Скачать 1.41 Mb.
|
5.6. Кривая качества Важно понимать, что в любой задаче есть принципиальные (фундаментальные) ограниче- ния, которые определяются особенностями структуры системы и не могут быть преодолены никаким регулятором. Например, ясно, что задачу «обеспечить рыскание судна не более 1 ° при волнении 8 баллов» в реальной ситуации решить нельзя. Пусть известны все характеристики системы и возмущений. За счет чего можно умень- шить ошибку стабилизации? Как правило, только за счет увеличения мощности управления, которая ограничена 14 . Поэтому для уменьшения ошибки нужно увеличивать управляющий сиг- нал. С другой стороны, активность руля тоже нужно всячески уменьшать, потому что механи- ческие части быстро изнашиваются и приходят в негодность. Кроме того, на управление затра- чивается дополнительная энергия. Таким образом, мы пришли к задаче многоцелевой оптимизации – хочется одновременно обеспечить минимум ошибки и минимум мощности управления. Как мы видели, эти две цели противоречивы. В таком случае чаще всего составляется единый критерий качества, который включает все величины, которые нужно минимизировать, с различными весовыми коэффици- ентами. Например, в задаче стабилизации судна при случайных возмущениях он выглядит так: u u D k D I 2 + = ε . (27) Здесь ε D и u D – дисперсии ошибки и сигнала управления, а 2 u k – неотрицательный весовой ко- эффициент. Предположим, что мы нашли оптимальный регулятор ) (s C opt , который минимизирует этот критерий при некотором фиксированном коэффициенте 2 u k . Можно ли выбором какого-то другого регулятора ) ( ˆ s C одновременно уменьшить и дисперсию ошибки ε D , и дисперсию управления u D ? Если предположить, что можно, получается, что регулятор ) ( ˆ s C дает меньшее значение критерия качества (при том же 2 u k ), чем ) (s C opt , то есть, ) (s C opt – это не оптимальный регулятор и мы пришли к противоречию. Таким образом, для полученной оптимальной систе- мы нельзя одновременно уменьшить и дисперсию ошибки ε D , и дисперсию управления u D . Та- кие регуляторы называются Парето-оптимальными. Для каждого коэффициента 2 u k будут свои значения ε D и u D , так что можно построить график зависимости u D от ε D в оптимальных системах. Отметим, что чаще всего удобнее вме- 14 Например, угол перекладки руля судна чаще всего не может быть более 30-35 ° (при больших углах руль стано- вится неэффективен). © К.Ю. Поляков, 2009 51 u σ ε σ сто дисперсий использовать соответствующие среднеквадратические отклонения – ε ε σ D = и u u D = σ , которые измеряются в тех же единицах, что и исходные величины. Этот график по- казывает, какая мощность управления требуется, чтобы обеспечить заданную точность стаби- лизации. Наоборот, по графику можно определить, какую точ- ность можно обеспечить, имея заданную мощность управления. В этом смысле можно называть эту кривую кривой качества системы. Каждая точка этой кривой соответствует какому-то Паре- то-оптимальному регулятору. Поскольку для таких регуляторов нельзя одновременно уменьшить оба показателя качества, вы- пуклость кривой всегда направлена в сторону начала коорди- нат. Серая область недостижима, то есть, ни один регулятор в такой системе не может обеспечить соответствующее качество. © К.Ю. Поляков, 2009 52 6. Оптимальные следящие системы 6.1. Постановка задачи Задача следящей системы – отслеживать на выходе z сигнал r , подаваемый на вход. На- пример, систему автоматического управления курсом корабля (автопилот) можно рассматри- вать как следящую систему ( r – заданный курс, z – фактический курс). Точность следящей системы определяется свойствами сигнала ошибки z r − = ε : Если эталонный (задающий) сигнал r – случайный процесс с известной спектральной плотностью, мы получаем задачу оптимизации при случайных возмущениях, варианты которой были рассмотрены ранее. Здесь мы остановимся на задаче оптимизации при детерминированных (известных, опре- деленных, неслучайных) возмущениях. Это означает, что мы знаем входной сигнал r (напри- мер, его изображение по Лапласу ) (s R ). При этом требуется обеспечить «малость» ошибки ε в некотором смысле. В идеальном случае ошибка равна нулю для любого момента времени. В реальных системах этот результат чаще всего недостижим, поскольку требует бесконечно боль- шого управления. Предположим, что входной сигнал имеет ступенчатый вид, причем можно считать, что его изменение происходит достаточно редко, так что при очередном скачке переходный про- цесс, вызванный предыдущим изменением, уже закончился. В этом случае имеет смысл строить систему, оптимальную для единичного скачка на входе. Так как система линейная, при любом изменении величины скачка она останется оптимальной (изменится только величина сигналов). В идеале мы хотим, чтобы изменение входного сигнала мгновенно привело к такому же изменению на выходе. Можно догадаться, что для мгновенного перевода инерционной системы (а не просто усилителя) в новое состояние требуется бесконечное управление. Этот вариант не- приемлем с практической точки зрения и нереализуем, поскольку управляющий сигнал всегда ограничен. Таким образом, реальный переходный процесс будет отличаться от идеального. Как же измерить эту ошибку, оценив ее одним числом? Казалось бы, можно взять интеграл от сигнала ошибки z r − = ε на интервале от 0 до бесконеч- ности 15 ∫ ∞ = 0 1 ) ( dt t I ε , 15 Чтобы такой интеграл сходился, необходимо, чтобы ошибка ) (t ε стремилась к нулю при ∞ → t 0 t ) ( t r 0 < ε 0 > ε ) (t z 0 t ) (t r ) ( t z 0 > ε z следящая система r ε © К.Ю. Поляков, 2009 53 однако он может служить для оценки ошибки только при монотонном переходном процессе, когда ошибка всегда остается положительной (см. рисунок слева). Если процесс колебательный, на разных интервалах ошибка может принимать как положительные, так и отрицательные зна- чения, поэтому использовать этот интеграл для оценки ошибки нельзя (см. рисунок справа). Мы можем справиться с этой проблемой, если интегрировать модуль ошибки: ∫ ∞ = 0 2 ) ( dt t I ε Такую оценку иногда используют при численной оптимизации. К сожалению, получить опти- мальную передаточную функцию регулятора аналитически (по формулам) в этом случае не удается. Удобнее всего минимизировать интеграл от квадрата ошибки (его также называют инте- гральной квадратической ошибкой ): ∫ ∞ = 0 2 ) ( dt t I ε . (28) Далее мы увидим, что задачу оптимизации по такому критерию удается свести к задаче фильт- рации Винера. 6.2. Теорема Парсеваля Для большинства задач в теории управления существует два типа решений – временное (когда рассматривается изменение сигналов во времени) и частотный (работа с передаточны- ми функциями и частотными характеристиками). Эти подходы не исключают, а взаимно дополняют друг друга, позволяя увидеть разные стороны одной задачи. Для построения оптимального фильтра Винера мы использовали опера- ции с передаточными функциями (частотный метод Боде и Шеннона), хотя сам Винер впервые предложил решение этой задачи с помощью временного метода (на основе корреляционных функций). Для того, чтобы использовать уже рассмотренные алгоритмы, нужно «перевести» задачу с критерием (28) в частотную область, то есть, выразить критерий через изображения сигналов по Лапласу и передаточные функции. Это позволяет сделать теорема Парсеваля, которая утвер- ждает, что интеграл от квадрата функции ) ( t ε , которая равна нулю при 0 < t и стремится к ну- лю при ∞ → t , равен интегралу от «квадрата» ее преобразования Лапласа ) ( s E : ∫ ∫ ∞ ∞ − ∞ − = = j j ds s s j dt t I ) ( ) ( 2 1 ) ( 0 2 E E π ε . (29) Выражение ) ( ) ( s s − E E можно назвать «квадратом» потому что оно на мнимой оси (где берется интеграл), при подстановке ω j s = , действительно является квадратом частотной характери- стики ) ( ω j E : 2 ) ( ) ( ) ( ω ω ω j j j E E E = − Заметим, что функционал (29) в нашей задаче (при известном входном сигнале) совпадает по форме (при ) ( ) ( ) ( s s s X − = E E ) с функционалом (19), который получен в задаче фильтрации при случайных возмущениях. Поэтому для решения задачи можно использовать алгоритм, применявшийся при расчете фильтра Винера. 6.3. Эквивалентность двух задач Теорема Парсеваля позволяет обнаружить связь между задачами анализа и синтеза при случайных (или стохастических) и детерминированных возмущениях. Поскольку ошибка ) (t ε стремится к нулю при ∞ → t , ее преобразование Лапласа ) (s E – устойчивая функция (все ее полюса имеют отрицательные вещественные части). Если рассмат- © К.Ю. Поляков, 2009 54 ривать ) ( s E как передаточную функцию формирующего фильтра, то можно построить соответ- ствующую спектральную плотность ) ( ) ( ) ( ω ω ω ε j j S − = E E , так что ∫ ∫ ∫ ∞ ∞ ∞ − ∞ = = 0 0 2 ) ( 1 ) ( 2 1 ) ( ω ω π ω ω π ε ω ω d S d S dt t Таким образом, интеграл от квадрата функции ) (t ε , стремящейся к нулю при ∞ → t , равен среднему квадрату случайного процесса, имеющего спектральную плотность ) ( ω ε S Пусть существует некоторая система с передаточной функцией ) (s W . Обозначим ее вход- ной сигнал через ) (t w , а выходной – через ) (t ε Если w – единичный центрированный белый шум, то спектральная плотность выхода ε равна ) ( ) ( ) ( s W s W s S − = ε , а дисперсия выхода (средний квадрат) – интегралу от спектральной плотности по мнимой оси. В то же время, если w – единичный импульс (дельта-функция), изображение выхода по Лапласу равно ) ( ) ( s W s = E , а интегральная квадратическая ошибка равна тому же самому инте- гралу от ) ( ) ( s W s W − . Таким образом, вместо вычисления дисперсии выхода при белом шуме на входе можно вычислить интеграл от квадрата выходного сигнала при импульсном входе, и наоборот. Квадратный корень из этой величины называется 2 H -нормой передаточной функции ) ( s W : ∫ ∞ ∞ − − = j j ds s W s W j s W ) ( ) ( 2 1 ) ( 2 π и вычисляется с помощью функции norm среды M ATLAB С другой стороны, пусть передаточная функция ) (s W зависит определенным образом от выбора регулятора ) (s C . Тогда, как следует из сказанного, две следующие задачи оптимизации эквивалентны: 1) найти регулятор ) (s C , минимизирующий дисперсию ошибки при единичном белом шуме на входе; 2) найти регулятор ) (s C , минимизирующий интегральную квадратическую ошибку при по- ступлении на вход единичного импульса (дельта-функции). Вторая задача в теории управления называется задачей 2 H -оптимизации или просто 2 H - задачей (поскольку требуется обеспечить минимум 2 H -нормы передаточной функции замкну- той системы), а о первой говорят как о стохастическом варианте 2 H -задачи. 6.4. Разомкнутые системы Чтобы понять особенности задачи, сначала мы рассмотрим простейшую разомкнутую систему, состоящую только из регулятора ) ( s C и объекта ) ( s F : Входной сигнал r задан в виде преобразования Лапласа ) (s R , так что его можно представить как результат прохождения единичного импульса (дельта-функции ) (t δ ) через звено с переда- z ) ( s P r ε u ) ( s C ) ( s R ) ( t w δ = ) (s W ε w © К.Ю. Поляков, 2009 55 точной функцией ) ( s R . Такой способ общепринят при моделировании входных сигналов и по- зволяет представить систему в стандартном виде: на входе – дельта-функция, на выходе – ошибка. Передаточная функция системы от входа w к выходу ε равна R CP s W ) 1 ( ) ( − = Предполагается, что все звенья устойчивы. Это значит, что все полюса функций ) (s P и ) (s R имеют отрицательные вещественные части и регулятор ) (s C , который требуется найти, также должен обладать этим свойством. Кроме того, регулятор должен обеспечить минимум инте- гральной квадратической ошибки ∫ ∫ ∞ ∞ − ∞ = = j j ds s X j dt t I ) ( 2 1 ) ( 0 2 π ε , где * * * * * * * * * ) ( RR C RR P C PRR CC RR PP W W s X + − − = = . Подынтегральное выражение имеет форму (18), как для задачи Винера, поэтому можно применить уже известный алгоритм поиска оптимальной устойчивой передаточной функции ) (s C Попытаемся понять, какие результаты мы можем получить в результате оптимизации. Прежде всего, выбор регулятора из условия 1 = CP сразу дает 0 ) ( = s W , то есть, ошибка будет нулевой не только при ступенчатом, но и при любом другом входе. Это так называемое условие инвариантности, при котором обеспечивается идеальное слежение за эталонным сигналом. Именно такой регулятор будет получен в результате оптимизации «в лоб», если все нули пере- даточной функции ) (s P находятся в левой полуплоскости. К сожалению, все не так просто. Как правило, передаточные функции реальных объектов – строго правильные, то есть, степень их числителя меньше, чем степень знаменателя. Тогда передаточная функция регулятора ) ( / 1 ) ( s P s C = будет неправильной (степень числителя больше степени знаменателя). Как было показано при анализе задачи оптимизации при случайных воз- мущениях, такой регулятор неприменим в практических задачах по двум причинам: 1) регулятор содержит дифференцирующее звено, поэтому при скачкообразном изменении входного сигнала сигнал управления должен теоретически стать бесконечным; 2) регулятор усиливает высокочастотные помехи измерений вместо того, чтобы подавлять их; это делает систему неработоспособной. В задаче оптимизации при случайных возмущениях мы добивались «ската» частотной ха- рактеристики регулятора на высоких частотах с помощью ограничения на сигнал управления: в критерий качества вводилась дисперсия управления с некоторым весовым коэффициентом, ко- торый подстраивался методом проб и ошибок. Если формально составить критерий [ ] ∫ ∞ + = 0 2 2 2 ) ( ) ( dt t u k t I u ε , добавив интеграл от квадрата сигнала управления ) ( t u с весовым коэффициентом 2 u k , то ничего хорошего не получится, по- скольку установившееся значение ) (t u при ∞ → t не равно нулю. Следовательно, интеграл расходится и теорема Парсеваля неприменима. Оптимизация в частотной области не имеет смысла: если формально применить алгоритм синтеза, получится регулятор, для которого ошибка в установившемся режиме (при ∞ → t ) не равна нулю. Чтобы грамотно ограничить управляющий сигнал, нужно ввести ошибку управления ) (t u ε , то есть отклонение фактического сигнала управления ) (t u от некоторого эталонного сигнала ) ( 0 t u , который должен быть выбран так, чтобы ошибка управления ) ( ) ( ) ( 0 t u t u t u − = ε стреми- лась к нулю при ∞ → t . Тогда можно искать минимум критерия [ ] ∫ ∞ + = 0 2 2 2 ) ( ) ( dt t k t I u u ε ε , © К.Ю. Поляков, 2009 56 это позволит ограничить мощность управления и при этом минимизировать ошибку слежения. Изменяя коэффициент u k , мы получим семейство Парето-оптимальных регуляторов, как и в за- даче оптимизации при случайных возмущениях. Как же выбрать сигнал ) ( 0 t u ? Для простоты рассмотрим только случай ступенчатого входного сигнала. Поскольку передаточная функция ) ( s C устойчива, установившееся значение ∞ u сигнала ) (t u при ∞ → t – постоянная величина, ее можно рассчитать следующим образом. Если вход w – это единичный импульс, то установившееся значение эталонного сигнала ) ( t r можно определить по теореме о конечном значении для преобразования Лапласа ) ( lim ) ( lim 0 s R s t r r s t → ∞ → ∞ = = Например, если ) ( t r – единичный ступенчатый сигнал, для которого s s R / 1 ) ( = , то 1 = ∞ r . С другой стороны, для того, чтобы установившаяся ошибка была равна нулю, необходимо, чтобы предельное значение сигнала ) (t z тоже было равно ∞ r . Учитывая, что ) (s P – устойчивая пере- даточная функция, имеем ∞ ∞ ⋅ = u k r P , где ∞ u – нужное нам установившееся значение сигнала управления, а P k – статический коэф- фициент усиления объекта, который вычисляется по формуле ) ( lim 0 s P k s P → = (в среде M ATLAB это делает функция |