Громов - СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. Специальные разделы теории управления. Оптимальное управление
Скачать 1.34 Mb.
|
a x g( a x h a x x Формируются также свободные граничные условия Выбор показателя оценки качества управления, на- правленного на достижение поставленной цели. Различного рода функционалы ] , [ a u J , определение на решениях системы: Выбор вычислительного опе- ратора (max, min, max min, min max, …), применение которого к показателю каче- ства является математиче- ским выражением техниче- ского понимания оптималь- ности системы. Фиксация аргументов этого оператора (u, a, t и т.д.). Формулировка задач оптимизации ] , [ max min ]; [ max min ]; [ min ]; [ max , , w u u u u w u u u u J J J J W U T t U U U ∈ ∈ ∈ ∈ ∈ ∈ III Корректировка технической постановки задачи. Число переменных, вид уравнений, критерий, граничные условия и т.д. Аналитические трудности, изуче- ние сформулированной модели мо- гут заставить пойти на дальнейшие упрощения. Эквивалент преобразования ММ для удобства изменения аналитических численных методов решения задач оп- тимизации. Переход к новым фазовым и (или) управляющим переменным, гранич- ным условиям и т.д. В частности, использование мето- дов штрафных функций, редукции к более простым задачам и т.д. Изменение ММ для удобства вычислений. Формулировка понятий «практически опти- мальной системы», «практи- ческой точности получения результата» в конкретной задаче Производится на базе содержатель- ной (этап I) и математической (этап II) формулировок задач Вектор T t) , (x z = , т.е. состояние в момент t, называется событием (фазой). Множество всех возможных событий z обра- зует пространство 1 1 + + ⊂ n n R Z событий. Точка 1 + ∈ n Z z является изображающей точкой пространства событий. 2.2. Управление Система S называется управляемой на отрезке (одно из определений управляемости) ] , [ 1 0 t t , если ее поведение при 0 t t > зависит только от начального состояния )) ( , ( 0 0 0 t t t x x = = , будущего поведения некоторого переменного вектора u (входа системы) 1 , ) , , ( 1 ≥ = m u u T m K u , называемого управляющим вектором (или просто управлением) u, и постоянного вектора a : 0 , ) , , ( 1 ≥ = r a a T r K a , называемого вектором управляющих (проектных) параметров. Вектор u принимает значение из некоторого множества m U m-мерного пространства m R с координатами m u u u ..., , , 2 1 Это множество может быть всем пространством m R или его частью m m R U ⊂ m U – чаще всего компактное множество пространства m R Множество m U называется множеством допустимых значений управления. Некоторые виды множества m U приведе- ны на рис. 2. Постоянный вектор a обычно принадлежит некоторому замкнутому множеству r r R A ⊂ 2.3. Эволюция состояния системы. Дифференциальные уравнения движения Изменение состояния (эволюция) системы S на временном интервале } , { 1 0 t t t t T ≤ ≤ = часто с хорошей степенью при- ближения описывается системой обыкновенных дифференциальных уравнений первого порядка: ) , , , ( a u x f x t dt d = , (1) где T n x x x ) ..., , , ( 2 1 = x – вектор состояния; T m u u u ) ..., , , ( 2 1 = u – управляющий вектор; T r a a a ) ..., , , ( 2 1 = a – вектор проектных параметров. а) ≤ ≤ ≤ ≤ M m M m u u u u u u U 2 2 2 1 1 1 2 ; : б) } { : 2 2 2 2 1 2 R u u u U ≤ + в) } { : 2 1 2 M u u u U ≤ + г) } 0 ) , ( { : 2 1 2 ≤ u u f U д) = + = + R R u u u u u u U 2 1 2 2 2 2 1 2 ; : е) ) , ( ), , ( ); , ( ), , ( : 2 1 2 1 2 1 2 1 2 m M m M M m M M u u u u u u u u U Рис. 2. Виды множества U 2 допустимых управлений: а – в – замкнутые ограничения выпуклые области, содержащие начало координат; г – невыпуклая область, не содержащая начало коорди- нат; д – невыпуклые одномерные области 2 2 2 1 , U U ; е – дискретное множество допустимых значений (1 – 4 изолированные точки) 1 4 3 2 2 u M u 2 1 u M u 1 M u 2 M u 1 0 2 u 1 u R u R u 2 1 u 2 2 u 1 u 0 2 u 2 u m u 2 m u 1 M u 1 M u 2 M u 1 u 2 u 2 u M u 1 u 2 u R u 2 u 0 2 u 1 u 2 u 0 Система (1) образует существенную часть математической модели динамической системы S. В ММ, описываемой сис- темой ДУ, формальным признаком переменной состояния x является наличие ее производной dt dx в левой части системы (1). Управляющая переменная u входит только в правую часть системы (1) и не встречается под знаком производной (это фор- мальный признак управляющей переменной). Предполагается, что вектор-функция f(t, x, u, a) определена для любых значений T t A U X r m n ∈ ∈ ∈ ∈ , , , a u x , непре- рывна по совокупности переменных t, x, u, a и непрерывно дифференцируема по x, a. Хотя гладкость является достаточно жестким требованием и может быть заменена требованием измеримости и ограниченности. Так как поведение вектора u мо- жет быть произвольным (за исключением условия m U ∈ u ) и, кроме того, можно произвольно выбрать постоянный вектор r A ∈ a , то система уравнений (1) определяет управляемый процесс. Ход управляемого процесса будет определен на некото- ром интервале 1 0 t t t ≤ ≤ , если на этом интервале вектор u задан в одной из двух форм: T m t u t u t u t )) ( ..., ), ( ), ( ( ) ( 2 1 = = u u ; (2) T m t t t t )) , ( v ..., ), , ( v ), , ( v ( ) , ( 2 1 x x x x v u = = . (3) Вектор-функцию u(t) называют программным (временным) управлением, а вектор-функцию v(x, t) – координатным управлением или законом управления. Закон управления (3) физически выражает известный принцип обратной связи, соглас- но которому величина управляющего воздействия определяется на основании измерения текущего состояния системы x и, быть может, момента времени t. Каждому выбору векторов управляющих параметров a и управления u (вида (2), (3)) и каждому начальному состоянию ) , ( 0 0 x t соответствует по (1) временная последовательность состояний ) , , ( 0 0 t t x x , которая называется фазовой траектори- ей (поведением, эволюцией, движением) системы S. Пара вектор-функций { u(t), x(t)} или {v(x, t), x(t)} называется про- цессом управления или режимом. 2.4. Функционал. Критерий качества управления Величина )] ( [ t u J называется функционалом функции u(t) на отрезке 1 0 t t t ≤ ≤ , если каждой функции u(t), ] , [ 1 0 t t t ∈ , принадлежащей некоторому классу функций, поставлено в соответствие определенное число ( ) ( max , ) ( ), ( ), ( 0 0 t f dt t f x f a f t t t t ∫ ≤ ≤ ′ и т.д.) из R. Таким образом, функционал J[u(t)] – это отображение, в котором роль независимого переменного (функционального ар- гумента) играет функция u(t). При этом J[u(t)] зависит от совокупности всех значений, принимаемых функцией u(t) на отрез- ке ] , [ 1 0 t t , и может рассматриваться как функция бесконечного числа независимых переменных. Для каждого фиксированного конечного момента времени 1 1 t t ′ = состояние ) ( 1 t′ x системы S, движущейся из начального состояния ) , ( 0 0 x t в соответствии с уравнением (1), является одновременно векторным функционалом (т.е. вектором, ком- понентами которого являются функционалы) от управления u(t) и вектор-функцией от вектора a и вектора начальных усло- вий ) ( 0 0 t x . Критерии качества процессов управления являются функционалами. Достаточно общая форма критерия качества в ТОП имеет вид ∫ + Φ = 1 0 ) ), ( ), ( , ( ) , , , , ( ] ), ( [ 0 1 0 1 0 t t dt t t t f t t t J a u x a x x a u , (4) где x(t) удовлетворяет системе (1); u(t) – некоторое выбранное управление; а – управляющий параметр. В частности, каждую из координат ) (t x i системы (1) можно записать в форме n i t x a t u t x t f t x t t i i i i , 1 , ) ( ) ), ( ), ( , ( ) ( 1 0 0 = + = ∫ 2.5. Автономные системы Если правые части (1) и функции Φ и f 0 в (4) от времени явно не зависят, то соответствующая задача называется авто- номной: ) , , ( a u x x f dt d = ; dt f t J t t ∫ + Φ = 1 0 ) , , ( ) , , ( ] ), ( [ 0 1 0 a u x a x x a u Автономные системы инвариантны относительно сдвига вдоль оси t, поэтому для автономных систем важна только длительность процесса 0 1 t t − и можно положить 0 0 = t 2.6. Допустимое программное управление Вектор-функция u(t) называется допустимым программным управлением в задаче, если: а) u(t) принадлежит к выбранному классу в большинстве практических приложений кусочно-непрерывных по t на ин- тервале ] , [ 1 0 t t функций, т.е. может иметь лишь конечное число точек разрыва первого рода; б) значения u(t) принадлежат заданному множеству m U для всех ] , [ 1 0 t t t ∈ Кусочно-непрерывные управления соответствуют предположению о «безынерционности». Если желательно учесть «инерцию», то следует искать управление в классе непрерывных кусочно-гладких функций u(t). Такой класс допустимых управлений иногда сводится к предыдущему путем введения нового безынерционного управ- ления ) (t u , связанного со «старым» управлением u(t) соотношением m U dt d ∈ = u u u , , где T m u u u ) ,..., , ( 2 1 = u ; T m u u u ) ,..., , ( 2 1 = u . (5) Если m U – замкнутая и ограниченная область, то это означает, что введены ограничения на значения первых производ- ных от вектор-функции u(t). Кусочно-непрерывным функциям ) (t u отвечают кусочно-гладкие функции u(t) в силу (5). Таким образом, в новой задаче u(t) становится переменной состояния, управляемой посредством ) (t u через систему (5). Если условие m U ∈ u в новой задаче можно снять, то задача сводится к предыдущей для кусочно-непрерывного управ- ления m U ∈ u . В противном случае следует обратиться к задаче оптимизации с ограничениями на фазовые координаты. На рис. 3 приведены примеры управлений, принадлежащих как к классу кусочно-непрерывных функций, так и к другим клас- сам. Рассмотрение допустимых управлений в классе кусочно-непрерывных функций объясняется тем, что для оптимизации функционалов на этом классе функций разработан соответствующий математический аппарат – принцип максимума. Рис. 3. Примеры управлений u j (t), принадлежащих различным классам функций: а – гладкое управление; б – кусочно-гладкое непрерывное управление; в – непрерывное управление (в окрестности u j (t), t недифферен- цируема); г – кусочно-непрерывное управление; д – управление, не являющееся кусочно-непрерывным (u' j содержит бесконечное число переключений в окрестности t 1 ; ) ( 2 t u j – элемент последовательности, сходящейся к функции, разрывной в каждой точке [t 0 , t 1 ]); е – управ- ление, содержащее δ-функции Дирака; 2 1 0 , , u u u – константы Для каждого допустимого управления u(t) в силу сделанных предположений относительно f(t, x, u) существует единст- венное абсолютно-непрерывное решение системы ) , , ( ) ( 0 0 t t t x x x = , которое удовлетворяет системе (1) почти всюду на ] , [ 1 0 t t [т.е. за исключением конечного числа или счетного множества точек разрыва функции u(t)] и при 0 t t = принимает заданное значение ) ( 0 0 t x x = 2.7. Допустимый закон управления Закон управления v(x, t) является допустимым на n X ∈ x , ] , [ 1 0 t t t ∈ , если 1) n m X t t T t U t ∈ = ∈ ∀ ∈ |