ОАС 2 часть. Общая характеристика адаптивных систем. Их классификация
Скачать 6.79 Mb.
|
Глава 2. Общая характеристика адаптивных систем. Их классификация. В общем случае задача синтеза СУ предполагает в качестве исходной информации данные о структуре и параметрах объекта, и о критерии управления. Если априорная информация достаточна я и точная, то с использованием методов теории оптимальных систем выполняется синтез управляющий частью системы, таким образом, чтобы обеспечить экстремальные значения критерия качества при заданной структуре и параметрах объекта. На практике в большинстве случаев имеет место неполнота априорной информации об объекте. Отсюда адаптивные системы в процессе функционирования решают задачу доопределения недостающей информации объекта и соответствующей корректировке функции управления с учетом части СУ. При рассмотрении адаптивных систем как правило предполагают выполненными 2 следующих допущения: Адаптивное управление осуществляется в замкнутом пространстве в состоянии управляемого объекта и коэффициентов в уравнении этой СУ. Вопросы выведения объекта на расчетный режим не рассматриваются на этом этапе, и предполагается это рассмотрение при изучении теории оптимального управления. Нестационарный объект заменяется на квазистационарный на вполне ограниченном интервале времени. Этот период времени так же называется квазистационарным. Предполагается, что периоды квазистационарности достаточны для завершения процесса адаптивной настройки системы. Другими словами процессы настройки в системе протекают быстрее, чем процессы изменения параметров объекта. При проектировании адаптивных систем необходима такая информация: Характеристика структуры связей управляемой частью системы объекта. При этом возможны случаи: Структура связей полностью известна. Структура связей известна частично. Структура связей не известна. Характеристика параметров модели объекта. Здесь возможны такие случаи: Известны номинальные значения параметров и диапазоны их отклонения от номинальных. Информация о параметрах модели полностью отсутствует. Оценка влияния и характеристика возмущений на объект: Возмущения доступны прямому измерению с помощью датчиков. Известны законы распределения вероятностей возмущающих величин. Информация, т.е. сведенья о возмущениях полностью отсутствуют. Характеристика возможностей прямых измерений физических параметров управляемого процесса. В том числе: Непрерывные измерения. Циклические Одноразовые, эпизодические. В зависимости от количества указанной информации применяется тот или иной подход или метод к построению адаптивной системы. При этом в любом случае необходимость построения адаптивной системы обусловлена априорной неопределенностью объекта, т.е. недостаточностью информации. Определим понятие априорной неопределенности. Н а рисунке приведено изображение обычного контура управления объектом при использовании регулятора P с определенным запасом регулирования в виде априорной неопределенности. Для задач адаптивного управления наиболее интересны случаи, когда входные воздействия (y0, f) для системы изменяются во времени, т.е. система является не стационарной (квазистационарной). В зависимости от характера и объема недостающей информации об объекте и наличии внешних воздействий (неконтролируемых) различают: Адаптацию, обусловленную неопределенностью знаний (отсутствие измерения) (y0, f). Адаптацию, вызванную неопределенностью информации об объекте. Адаптацию, вызванную одновременно неопределенностью по пунктам 1 и 2. Имеется классификация адаптивных систем по функциональному признаку в следующем: Если в процессе работы системы целенаправленно изменяются параметры управляющей части (регулятора), то такая нотация или адаптивная система называется самонастраивающейся. Если в процессе работы системы целенаправленно изменяется структура управляющей части, то такая отдельная система называется самоорганизующейся и при этом могут изменяться параметры. Если адаптивная система изменяет свои параметры, структуру и алгоритм функционирования управления, то она называется самообучающейся. Рассмотрим классификацию адаптивных систем по двум признакам: По сложности ОУ и количеству априорной информации о нем. Классификацию изложим в виде таблицы.
1.1, 1.2, 2.1, 2.2 – решение ищется в классе СНС (самонастраивающиеся системы). 1.3, 2.3 – системы экстремального регулирования (СЭР). 3.1, 3.2 – самоорганизующиеся системы (СОС). 2.3, 3.2, 3.3 – системы с обучением. Типы самонастраивающихся систем (СНС). При синтезе СНС предполагается что: Структура ОУ известна, а параметры могут изменяться непредсказуемым образом в определенном рабочем диапазоне. Выполняется гипотеза квазистационарности, т.е. процессы настройки системы протекают гораздо быстрее, чем процессы изменения параметров объекта. Различают СНС с эталонной и настраиваемой моделью. Структурная схема СНС с настраиваемой моделью имеет вид: Б НМ – блок настройки модели. МО – модель объекта. ВУ – вычислительное устройство. ИО – исполнительный орган. Структура ОУ и модели является известной и неизвестной. Параметры объекта сi могут меняться, причем эти изменения существенно влияют на качество работы основного контура. По сигналу рассогласования εм производится настройка параметров модели сi*, а в контуре самонастройки (КС) рассчитываются оптимальные параметры регулятора. Таким образом в этой системе решаются 3 оптимальные задачи: Оптимизация управления в основном контуре. Оптимизация процесса настройки модели. Оптимизация в контуре самонастройки. С труктурная схема СНС с эталонной моделью. Структура и параметры эталонной модели соответствуют желаемым, а значит процесс на ее выходе тоже. Настройка параметров регулятора {bj} производится по сигналу рассогласования εм между выходом эталонной модели и основного контура. Метод вспомогательных операторов синтеза СНС с эталонной моделью. Пусть основной контур по каналу имеет передаточную функцию Ф(p,t). Полагаем, что выполняется гипотеза квазистационарности, для периода настройки системы справедливо: Процесс настройки параметров регулятора выполняется по закону: – коэффициент, определяющий скорость настройки. Q – критерий эффективности управления. Обычно Q зависит от : Передаточная функция эталонной модели и не зависит от , поэтому: - алгоритм настройки параметров регулятора. – есть функция чувствительности передаточной функции основного контура параметров регулятора. зависит от неизвестных параметров модели с. Вместо них, при вычислении, в подставляются параметры эталонной модели – это есть суть метода вспомогательных операторов. 2.3 Аналитические СНС с моделью вариации уравнения объекта. В инвариантных СНС образуется дополнительный канал обратной связи, который компенсирует движения на выходе объекта, вызванные отклонением его параметров от номинальных. Предполагается, что в СНС выполняется гипотеза квазистационарности. Пусть задана структура линейного объекта: - полиномы, соответствуют полиномиальным значениям параметров. – непредсказуемые отклонения параметров от номинальных. С оставляющую называют возмущенным движением, вызванным не стационарностью параметров объекта. Уравнения (2) соответствуют следующей структурной схеме: П еренесем узел суммирования за звено. Входной сигнал заменим суммой: некоторое управляющее воздействие. сигнал компенсации: Е сли условие (4) выполняется, то выход объекта: . То есть выход объекта становится инвариантен изменению параметров объекта. Указанные построения соответствую структурной схеме: ОНО – обобщенный настраиваемый объект, который после настройки имеет передаточную функцию . Если настройка ОНО закончена и , а , то ОНО имеет передаточную функцию . Параметры и структура регулятора являются оптимальными с точки зрения назначенного критерия и рассчитываются известными методами. Параметры регулятора остаются постоянными, а основная задача состоит в определении вариаций параметра объекта, т.е. . 2.4 Аналитические СНС с настройкой по импульсной переходной функции (ИПФ) разомкнутого основного контура. ИПФ называется реакция системы на импульс единичной площади и бесконечно малой длительности. Данный подход применяется тогда, когда в системе действует возмущение и все процессы являются случайными процессами. Разомкнутый основной контур имеет вид: Н астройка параметров регулятора осуществляется с помощью уравнения Винера-Хопера: – желаемая ИПФ разомкнутой системы. - ИПФ объекта. - ИПФ регулятора. автокорреляционная функция x(t). – взаимокорреляционная функция процессов x(t), y(t). На очередном текущем интервале выполняются следующие действия: Вычисляется и . Определяется ИПФ ОУ путем решения уравнения (2). Определяется оптимальное ИПФ регулятора путем решения уравнения (1). 2.5 Проектирование СНС с моделью на основе прямого метода Ляпунова. Система является устойчивой, если функция от ее координат является знакоопределенной положительной, а производная этой функции знакоопределенная отрицательная. В данном методе такая функция Ляпунова подбирается от и ее производной - разность выходов эталонной модели и основного контура. Выполнение условий устойчивости определяют структуру контура самонастройки. 2.6. Аналитические СНС с настройкой по внешним воздействиям Такие системы применяются для поддержания оптимального режима работы в условиях изменения свойств внешних воздействий. Структурная схема такой системы имеет вид: АС – анализатор сигнала ВУ – вычислительное устройство На некотором периоде квазистационарности в анализаторе сигналов оцениваются характеристики задания и возмущений и , информация передается в вычислительное устройство, где определяется оптимальное значение параметров регулятора. Критерий оптимальности в таких сиситемах обычно отражает точность ее работы и имеет вид: (1) - динамическая ошибка, отражающая неточность воспроизведения выхода заданием - случайная составляющая, вызванная действием помех и . - весовой коэффициент. Предполагается что на периоде квазистационарности представляет собой полином степени . и есть случайные стационарные процессы с определенными характеристиками. Параметры регулятора должны настраиватся так, чтобы обеспечить минимум критерию 1. Пусть А – вектор настраивающихся параметров регулятора. Если определить аналитическое задание , то путем решение системы уравнений (2), можно найти оптимальное значение А. Если полином степени , то динамическая ошибка имеет вид: (3) Коэффициент определяется по формулам: ; ; ; (4) - передаточная функция основного контура по каналу . Случайная составляющая определяется по формуле: - частотная характеристика основного контура по каналу (получается из передаточной функции заменой ). - спектральная плотность помех. зависит от параметров регулятора А, таким образом определяется функция . Системы экстремального регулирования С ЭР – поисковые системы, работают в условиях малого количества априорной информации об объекте. Зато имеется возможность непосредственного измерения текущего значения критерия эффективности. Процесс поиска состоит в периодической подаче пробных воздействий на объект и анализ их результатов. 2.7. Понятие об экстремальном управлении. Классификация СЭР Р ассмотри объект содержащий n управляемых входов: . - имеет экстремальный характер. Задача состоит в поиске и поддержании таких значений входов ( ) при которых критерий имеет экстремальное значение. Задача усложняется тем, что на объект действуют возмущения вызывающие дрейф характеристики. Для одномерного случая дрейф характеристики иллюстрируется рисунком: Классификация СЭР: 1. По количеству управляющих переменных: - одномерные - многомерные 2. По количеству экстремумов: - одноэкстремальные - многоэкстремальные 3. По динамическим свойствам объекта управления: - статические - динамические 4. По количеству априорной информации об объекте(виды информации): - о виде экстремальных характеристик. - о динамических свойствах объекта. - о характеристиках помех. 5. По способу организации поиска экстремума. 2.8. Методы нахождения экстремума однопараметрических объектов 1 . Метод измерения производной:. Основан на том факте что в районе экстремума . В процессе движения системы измеряют и и находят / =k – const 2. Метод запоминания экстремума. Ц ентральной процедурой этого метода при поиске max (для определенности), является запоминание max значения I в запоминающем устройстве. , если - ЗУ. Запоминающее устройство запоминает текущее значение I если I(t) увеличивается. R=-R, если - ПЭ. - зона нечувствительности. - ИМ. Такая система находится в постоянном движении, то есть постоянно изменяется со скоростью |R|=1 3. Метод периодического поискового сигнала. Основан на подаче входного периодического сигнала малой амплитуды: Слева от экстремума фазы входа и выхода совпадают, справа – различаются на . В районе экстремума сигнал I(t) непериодический. 4. Коммутатор поверочных реверсов. Если объект работает в условиях интенсивных помех, вызывающих дрейф характеристики ложные срабатывания. В этих случаях через определенное время система безусловно реверсирует (поверочный реверс). 2.9. Поисковые шаговые алгоритмы экстремального управления одномерными и многомерными объектами Вначале рассмотрим объект с 1 входом . - некоторый параметр характеристики. Приближенно (1) Значения и доступны непосредственному измерению. Поэтому оценивается по выражению 1. В основе поискового алгоритма обычно используется метод градиента (2) а – некоторый параметр. - в зависимости от вида экстремума. Поскольку подача пробных воздействий требует времени Т, управление осуществляется по шагам k=0,1,2 … . Тогда выражение 2 в дискретном виде следующее: (3) - параметр шага. Если мал система долго выходит в район экстремума, если велик, совершает колебания с большой амплитудой при удержании экстремум. Обычно адаптивно настраивается: Рассмотрим многомерный объект с характеристикой Методы поиска экстремума делятся на 2 группы – градиентные и неградиентные. Среди неградиентных методов на практике распространен метод спуска по координатам. Движение начинается из некоторой начальной точки с известными координатами 1. по , - результат. по , - результат. по , - результат. 2. по , - результат. по , - результат. и т.д. Таким образом метод состоит в последовательном повторении одномерного поиска по всем n координатам. 2.10. Градиентные методы поиска экстремума В этих методах направление движения совпадает с вектором градиентом при поиске макс и противоположно ему при поиске мин. Градиент функции в точке есть вектор, поправленный в сторону наискорейшего ее возрастания g rad J ={ … } Все градиентные методы различаются способом выбора длины шага , однако шаг всегда выполняется в направлении вектора grad Что бы выдержать это поправление шаг по каждой координате должен быть пропорционален соотв. составляющей вектора grad ,i= Для реализации этого алгоритма на каждой итерац. требуется оценивать сост. вектора grad. Это можно делать пробными воздействиями по каждой коорд. Рассмотрим след метод оценки сост. градиент. На входы подаются воздействия вида: В конкретный момент времени в последнем выр. все слагаемые кроме одного равны 0. Например на интервале 2.11. Экстремальное управление в условиях помех. На практике имеют место случаи, когда выход объекта управления зашумлен. Предполагается, что U(t) центрированный ССП с огранич. дисперсией и неизвестными характеристиками. Задача экстримального упр в условиях измерения выхода с помехой сост. в след: (1) Для решения этой задачи может применятся рассмотренный ранее метод: Этот метод обеспечит решение задачи (1), если величина и удовл условиям: (2) Выполнение условия (2) сост суть метода стохастич аппроксимации. На практике используются соотнош., обеспечивающее выполнение условий (2). 2.12. Идентификационные алгоритмы экстремального управления Процесс поиска ускорится если структура мат модели объекта известна с точностью до параметров. Пусть имеется одномерный объект с экстремальной характеристикой , – неизвестный параметр. Структура функции – известна. Если бы было известно значение , то задача (1) сводилась бы к решению уравнения: (2) Таким образом любой идентификац. алгоритм сост из 3х этапов: 1 По результатам измерений пар определяются параметры 2 Решается задача (2) 3 Найденное оптимальное U выдается на объект. Пример: рассмотрим процедуру вычисления экстремума ф-и вида кривой Гаусса по 3 замерам. U*=М - оптимальное значение М. Для определения U*=М разделим первое ур на второе , а второе на третье: Прологарифмируем уравнение: Из последнего уравнения выражаем параметр М U*= 2.13. Динамические режимы работы систем экстремального регулирования. Показатели качества экстр систем В определенных случаях инерцией ОУ пребречь нельзя, при этом уравн. описывающие обьект является не алгебраическим а дифференциальным. Инерциональные экстремальные объекты могут иметь 1 из след структур : f(x)- безинерционное нелинейное звено с экстремальной характеристикой. Инерционность на входе w1 обусловлена в основном инерционностью исполнительного механизма. А инерциональность выхода w2 определяется непосредственно динамикой обьекта и средств сбора инф. Рассмотрим систему экстремального управления объектом типа НЛ. В УУ реализуется процесс экстрем. поиска с запоминанием экстремума. ИМ перемещ. с постоянной скоростью . В прямом поправлении, когда R=+1 или в обратном R=-1 Управление ОУ имеет вид : (1) (2) k- скорость изменения исполнительного механизма. Из уравнений (1,2) исключим dt, и получим ур-ния фазов. траекторий (3) Фазовая траектория М0-М1 не совпадает со статистической характеристикой f(u), и в соотв с уравнением (3) тем ниже, чем больше k и Т. В точке М1 =j В системе управления произойдет реверс при выполнении условия: если (4) Рассмотрим временные диаграммы работы системы с запоминанием экстремума: Ч ерез некоторое время после выхода системы в экстремум в ней наблюдаются колебания в районе экстремума. Процесс движения системы опред путем решения СУ: Обычно более наглядно процесс движения к экстремуму изображ. На фазовой плоскости В. т. М2, М4, М6, М8 происходит реверс, т.е. переключение. Уравнение фазовых траекторий получается путем решения ДУ: если После выхода системы к экстремуму устанавливается автоколебание. М1,М2 – точки переключения Показатели работы системы экстремального регулирования: Время выхода системы в область экстремума - время движения системы от края рабочего диапазона до установ. автоколебаний . Потери на поиск – разность между Jmax и средним значением критерия в уст режиме. Амплитуда уст колебаний Для определения оптимальных значений параметров управляющей части системы необходимо выполнить расчет переходных процессов в системе экстремального регулирования. Н аиболее общим методом расчета процессов в системе являются численные методы Задав начальные условия на инерционных элементах ( ) с использованием разностных уравнений рассчитывается процесс в системе для k=1,2… По нему определяются показатели качества . 2.14. Методы улучшения качества работы СЭР Основными причинами ухудшающими работу СЭР явл: Инерционность ОУ. Высокочастотные помехи, которые накладываются на выходной сигнал j Низкочастотные помехи, вызывающие дрейф статической характеристики . Методы, улучшающие качество работы СЭР делятся на 2 группы: Выбор (расчет) оптимальных значений параметров управляющей части Алгоритмические методы улучшения качества. Рассмотрим некоторые из них : 1.* Камутатор поверочных реверсов – после переключения через заданное время выполняется безусловный реверс системы. Если интервалов между переключениями , поверочных реверсов не происходит . 2.* Измерение произв. Статической характерист. В таких системах скорость изменения u не является постоянной : она пропорциональна производной статической характеристики. D- делитель 3 .* Метод динамич. оптимизации. Применяется в тех случаях , когда объект имеет структуру НЛ, а его инерционная часть есть апереодич. звено 1го порядка. ОУ описывается уравнением: Из последнего уравнения видно, что при большом D на определенном интервале времени f(u)определяется первым слагаемым, значит в процессе движения max произв равен max характеристики: max J max f(u) Поэтому на этапе выхода в экстремум управление производится по производной. В этой системе на этапе движения к экстремуму (J – велико) работает блок F1, в режиме удержания блок F2 4 .* Метод непрерывной динамической коррекции . В устройстве управления использ. доп. звено с передаточной ф-цией , обратной инерционной части обьекта , при этом происходит компенсация инерционности объекта , а движение происходит по статической характеристике |