Адаптивные системы. Классификация адаптивных систем управления
Скачать 1.92 Mb.
|
Содержание Введение . Адаптивные системы . Классификация адаптивных систем управления . Самонастраивающиеся системы .1 Принципы построения поисковых самонастраивающихся систем .2 Принципы построения беспоисковых самонастраивающихся систем . Системы с адаптацией в особых фазовых состояниях .1 Релейные автоколебательные системы управления .2 Адаптивные системы с переменной структурой . Обучающиеся системы Заключение Введение Разработка адаптивных систем автоматического управления привлекала исследователей задолго до создания предпосылок для их широкого внедрения. Различные структуры и алгоритмы СНС предлагались в общих чертах без конкретизации принципов действия отдельных блоков. При классификации СНС в разной литературе приоритет отдавался разным критериям, что привело к их существенному несовпадению. Современный уровень техники позволяет реализовать сколь угодно сложные алгоритмы управления почти без удорожания системы в целом за счет применения цифровых регуляторов на основе микропроцессоров. Это требует разработки последовательной классификации различных видов СНС, наполненной конкретными схемами их реализации с наиболее полной детализацией основных блоков и разъяснением их принципов действия. Для различных вариаций применений необходим анализ их относительных преимуществ и недостатков. 1. Адаптивные системы Адаптация - свойства организма приспосабливаться к изменяющимся условиям окружающей среды. Необходимость в использовании адаптивных систем возникает в связи с усложнением решаемых задач, отсутствием практической возможности подробного изучения процессов в управляемых объектах. Примерами таких объектов могут быть: многокомпонентные технологические процессы химической продукции; высокоскоростные летательные аппараты (ракеты); и т.д., - т.е. это те объекты, где априорные данные о характеристиках или уравнениях, описывающих все реакции, получить не возможно, слишком широкий разброс параметров. Неадаптивные методы управления предусматривают наличие достаточного объёма априорных сведений о внутренних и внешних условиях работы на предварительной стадии. Чем полнее априорная информация о характеристиках, тем выше качество неадаптивного управления. Создание адаптивных систем осуществляется в принципиально иных условиях, т.е. адаптивные методы должны способствовать высокому качеству управления при отсутствии априорной информации о характеристиках управления объекта, либо в условиях неопределённости. Эффект приспосабливаемости к изменениям условий внешней среды в адаптивных системах достигается за счёт того, что часть функций по получению, обработке и анализу недостающей информации об управляющем процессе осуществляется не на предварительной стадии, а самой системой в процессе работы. Это способствует более полному использованию рабочей информации. 2. Классификация адаптивных систем управления Поскольку адаптивные системы широко используют рабочую информацию для анализа динамического состояния системы управления и организации контролируемых изменений свойств, параметров, управляющих воздействий и структуры системы управления, то в зависимости от способов реализации контролируемых изменений в процессе нормальной эксплуатации системы можно привести следующую классификацию адаптивных систем: самонастраивающиеся системы, системы с адаптацией в особых фазовых состояниях и обучающиеся системы (см. рис.). Самонастраивающиеся системы (СНС) характеризуются наличием специальных контуров самонастройки, с помощью которых оцениваются динамические и статические свойства системы и формируются такие контролируемые воздействия, что система самопроизвольно приближается к определённому эталону, часто задаваемому математически в виде критерия качества функционирования. При этом контур самонастройки служит для изменения параметров или структуры основного контура с целью обеспечения заданного критерия качества управления. Обычно критерий качества управления выражается в виде функционала или функции от параметров и измеряемых координат системы. В процессе работы системы значение функционала качества изменяется и задача контура самонастройки сводится к обеспечению экстремального (минимального или максимального) значения критерия. Нахождение и поддержание экстремального значения критерия качества управления может производиться или с помощью пробных отклонения системы, или путём аналитического определения условий экстремума. В зависимости от указанных способов нахождения экстремума самонастраивающиеся системы подразделяются на поисковые и беспоисковые. В свою очередь поисковые самонастраивающиеся системы в зависимости от применяемых методов поиска делятся на системы со случайным поиском, с поиском по методу Гаусса-Зейделя, с поиском по методу градиента, с поиском по методу наискорейшего спуска. В классе беспоисковых СНС можно выделить самонастраивающиеся системы, использующие информацию о частотных характеристиках, СНС с контролем временных характеристик и границ устойчивости, СНС с эталонными моделями, градиентные СНС. Системы с адаптацией в особых фазовых состояниях используют особые режимы или свойства нелинейных систем, например режимы автоколебаний, скользящие режимы для организации контролируемых изменений динамических свойств системы управления. Специально организованные особые режимы в таких системах либо служат дополнительным источником рабочей информации об изменяющихся условиях функционирования системы, либо наделяют систему управления новыми свойствами, за счёт которых динамические характеристики управляемого процесса поддерживаются в желаемых пределах не зависимо от характера возникающих при функционировании изменений. Эти системы можно подразделить на релейные автоколебательные системы и адаптивные системы с переменной структурой. Обучающиеся системы управления характеризуются наличием специальных процессов обучения, которые заключатся в постепенном накапливании, запоминании и анализе информации о поведении системы и изменении законов функционирования в зависимости от приобретаемого опыта. К процессу обучения приходиться прибегать тогда, когда не только мал объём априорных сведений об объекте, но и отсутствует возможность установления детальных причинно-следственных связей в структуре самой системы из-за её сложности. Накопление и обобщение информации в процессе обучения можно осуществлять за счёт внесения “эталонного опыта” в систему из вне, либо путем формирования такого опыта внутри системы. Например, в первом случае обучаемой системе предъявляют последовательность ситуаций, образов или режимов, которые имеют заранее известные характеристики или различаются по принадлежности определённым классам. Поведение системы в ответ на такую обучающую последовательность ситуаций формируют на основе принципа “поощрение-наказание”, т.е. правильная реакция системы на предъявлённую ситуацию запоминается и используется для организации контролируемых изменений динамических свойств системы управления. В зависимости от способов накопления опыта указанные системы разделяют на обучающиеся с поощрением и обучающиеся без поощрения (самообучающиеся) системы. 3. Самонастраивающиеся системыСтруктурная схема самонастраивающейся системы управления представлена на рис. 1. К основному контуру управления, состоящему из регулятора Р и объекта О, добавлен контур самонастройки КС, с помощью которого осуществляется коррекция параметров и алгоритма управления регулятора. Основная задача самонастраивающейся системы заключается в поддержании заданной в виде функционала меры качества системы вблизи экстремального значения при изменениях в процессе функционирования системы входных управляющих воздействий x(t), возмущающих воздействий f(t), а также динамических характеристик объекта. Рис. 1 Так как значение функционала качества J изменяется при действии указанных возмущений, то для выполнения основной задачи возникает необходимость в определении. Если время, требующееся для определения условий экстремума, не является критическим фактором, например в случае сравнительно медленного изменения значений функционала качества J в процессе управления, тогда целесообразно применять для определения условий экстремума поисковые методы. Беспоисковые методы определения условий экстремума не требуют специальных затрат времени на поисковые движения и используют, как правило, аналитические методы определения указанных условий. Сравнивая поисковые и беспоисковые самонастраивающиеся системы, можно сказать, что для определения условий экстремума поисковые системы нуждаются в меньшей информации, но обладают небольшим быстродействием при наличии процесса поиска, а беспоисковые системы при прочих равных условиях обладают более высоким быстродействием, но требуют более полной информации об управляемом процессе. 3.1 Принципы построения поисковых самонастраивающихся систем Задача поисковой самонастройки формулируется следующим образом. Предполагается, что имеется множество состояний системы (х1, х2,..., хп)=Х, которое является областью определения целевой функции или функционала качества системы . (1) Из множества состояний Х необходимо выбрать определённые состояния , (2) где j = 1, 2, …, m, при которых обеспечивается экстремальное значение функционала качества . (3) Связь между экстремальным значением функционала качества и предпочтительными состояниями системы из множества Х не задана в явном виде, и требуемый выбор обеспечивается путем последовательного приближения к решению в результате опробования различных состояний системы. Таким образом, существенной чертой самонастраивающихся систем данного класса является наличие процесса поиска как последовательной, итеративной процедуры выбора одного из множества возможных путей для достижения поставленной цели. Поиск экстремума может осуществляться различными способами, начиная от простого просмотра всех имеющихся в наличии состояний системы и кончая сложными вероятностными процедурами сравнения вариантов выбираемых путей. На сложность процедуры поиска влияют многие факторы: а) общее число состояний или параметров системы в области поиска (с увеличением множества состояний приходится принимать специальные меры для ускорения процедуры поиска экстремума); б) вид целевой функции, которая может быть унимодальной или обладать многими экстремумами (в случае многоэкстремальных функций процедуры поиска не должны заканчиваться в окрестности локальных экстремумов); в) дрейф экстремума, приводящий к ошибкам и нарушениям в поиске; г) ограничения области поиска, длительности поиска и точности используемой информации; д) непрерывность или дискретность поиска и т. д. Все методы поиска подразделяются на регулярные и случайные. В регулярных методах поиска выбор направления поискового движения осуществляется по заранее заданному закону, а в случайных методах направление к экстремуму «нащупывается» случайным образом. .2 Принципы построения беспоисковых самонастраивающихся систем Такие самонастраивающиеся системы обладают существенным преимуществом по сравнению с поисковыми системами в отношении быстродействия, поскольку в них отсутствуют процессы поиска, замедляющие работу системы. Кроме того, поисковые движения, как правило, создают заметные возмущения для работы основного контура. Часто такие возмущения становятся недопустимыми по конструктивным соображениям, например поисковые колебательные возмущения могут преждевременно выводить из строя исполнительные механизмы системы управления. Однако беспоисковые самонастраивающиеся системы, так же как и поисковые, решают аналогичную задачу адаптации динамических характеристик системы в условиях изменения меры качества под воздействием управляющих, параметрических и внешних возмущений. Беспоисковое определение условий экстремума функционала качества позволяет получить темп процесса адаптации, соизмеримый с темпом переходных процессов в системе. В беспоисковых системах используют несколько различных принципов аналитического определения условий экстремума, которые базируются на компенсационных подходах, например принцип инвариантности или сравнения с эталоном-моделью, либо на идентификационных подходах, позволяющих определять связанные с функционалом качества параметры или характеристики управляемого процесса. 4. Системы с адаптацией в особых фазовых состоянияхРассмотренные в предыдущем параграфе адаптивные системы с контурами самонастройки обладают весьма существенным недостатком, вызванным наличием в них сложно реализуемых вычислительных блоков для поискового или аналитического определения условий экстремума заданного функционала качества. Часто реализация контура самонастройки приводит к усложнению конструкции системы управления и к снижению надежности ее функционирования. В отдельных случаях удается решить задачу адаптации более простыми средствами, используя, например, особенности нелинейных систем. В нелинейных системах могут возникать при определенных условиях особые режимы - автоколебательные или скользящие. Иногда такие режимы бывают вредными или недопустимыми с точки зрения функционирования объекта управления, тогда приходится принимать специальные меры для ослабления действия этих режимов. Однако в адаптивных системах факт возникновения особого режима может быть использован для получения дополнительной информации об управляемом процессе либо особый режим преднамеренно организуется в системе, придавая ей новые свойства, в частности свойство адаптации к параметрическим или внешним возмущениям. Рассмотрим два класса систем с адаптацией за счет особых режимов: релейные автоколебательные системы и адаптивные системы с переменной структурой. 4.1 Релейные автоколебательные системы управленияВ нелинейной системе, состоящей из релейного элемента и линейной части с передаточной функцией (рис.2), используя метод гармонической линеаризации, можно определить зависимость параметров автоколебаний от параметров линейной части. Рис. 2 Предположим, что передаточная функция линейной части , (4) где - const; - переменный коэффициент усиления. Уравнение релейного элемента (5) При g(t)=0 можно записать общее уравнение для оператора нелинейной системы: (6) Гармоническая линеаризация релейного элемента дает следующую зависимость: . (7) Поэтому (6) можно записать так: . (8) Находя периодическое решение уравнения (8) при условии p = jω, находим амплитуду и частоту автоколебаний: . (9) Отсюда видно, что при параметрическом возмущении в виде изменения коэффициента усиления объекта амплитуда автоколебаний также будет изменяться. Поддерживая амплитуду автоколебаний на заданном первоначальном уровне, можно создать систему, адаптирующуюся к указанному параметрическому возмущению. Таким образом, параметры особого режима в нелинейной системе могут быть использованы в качестве дополнительной рабочей информации для обеспечения стабильной работы системы вблизи экстремального режима. На рис. 3 приведена структурная схема адаптивной автоколебательной системы с регулируемым уровнем ограничения релейного элемента. Рис. 3 На основании (9) амплитуда автоколебаний может поддерживаться на постоянном уровне при изменениях за счет изменения уровня ограничения реле . Уравнения системы записываются следующим образом: уравнение релейного элемента ; (10) уравнение фильтра, настроенного на частоту автоколебаний , ; (11) уравнение двухполупериодного выпрямителя сигнала автоколебаний ; (12) уравнение исполнительного устройства для перестройки уровня ограничения релейного элемента , (13) где ; уравнение основного контура . (14) После гармонической линеаризации (14) получим , (15) параметры автоколебаний ; (16) . Пусть экстремальный режим определяется следующими значениями: , (17) тогда можно определить значение опорного напряжения : . (18) Линеаризация (18) по постоянной составляющей дает . (19) Учитывая (16) и (17), получим . (20) Таким образом, при изменении коэффициента будут изменяться амплитуда автоколебаний и среднее выпрямленное значение напряжения za. Появляющееся рассогласование будет воздействовать на изменение уровня ограничения релейного элемента таким образом, чтобы уменьшалась до нуля величина . В случае необходимости регулирования нескольких параметров автоколебательная система может содержать большее число нелинейных взаимосвязанных контуров что позволяет организовать многочастотные автоколебательные режимы. 4.2 Адаптивные системы с переменной структурой адаптивный автоматический управление релейный В системах с переменной структурой за счет нелинейного сочетания различных линейных структур удается организовать специфическое вырожденное движение - скользящий режим, или режим перехода от движения, соответствующего одной линейной структуре, к движению, соответствующему другой линейной структуре, с помощью логического переключения связей в системе в зависимости от ее фазового состояния. Такой переход осуществляется с высокой частотой, в пределе стремящейся к бесконечности. После возникновения скользящего режима движение системы происходит вдоль границы переключения и становится независимым от параметров управляемого объекта. Если параметры объекта изменяются в процессе функционирования системы, то такие изменения не оказывают влияния на динамические свойства системы с переменной структурой, находящейся в скользящем режиме. Следовательно, организуя в системе с переменной структурой скользящий режим, удается добиться независимости ее движения от параметрических возмущений. Пусть система с переменной структурой описывается дифференциальными уравнениями (21) где хi - фазовые координаты; аi(t) - переменные параметры системы; и - управление. Обычно диапазоны изменения параметров аi(t) бывают известны: (22) Управление выбирают в следующем виде: , (23) где коэффициенты являются разрывными функциями фазового состояния системы (24) Гиперплоскость g = 0 является поверхностью разрыва коэффициентов , т. е. вдоль этой поверхности происходит движение в скользящем режиме. Так как уравнение движения по поверхности g = 0 зависит только от постоянных коэффициентов ci, выбираемых из условия обеспечения требуемого качества переходных процессов, то движение в скользящем режиме не зависит от переменных параметров аi(t). Для обеспечения существования скользящего режима необходимо выбирать значения постоянных коэффициентов αi и βi в соответствии с условием или неравенствами (25) Очевидно, при постоянных значениях αi и βi условия (25) накладывают ограничения на выбор коэффициентов поверхности скольжения сi из допустимой области при изменениях параметров ai(t) в заданном диапазоне . На рис. 4 для двумерного случая штриховкой показана допустимая область изменения коэффициентов поверхности скольжения ci, полученная из условий обеспечения скользящего режима. Фазовой траектории, охватывающей наибольшую площадь, соответствует наиболее быстрый переходный процесс, поэтому cmax выбрано из условия (25), а cmin - из условия максимальной заданной длительности переходного процесса tmax. Если в экстремальном режиме функционирования системы необходимо поддерживать максимальное быстродействие в переходных процессах, то в процессе изменения параметров объекта ai(t) необходимо определять значение cmax перестраивать коэффициенты поверхности скольжения при их несоответствии этому значению. Такая задача может быть решена адаптивной системой с переменной структурой, использующей информацию о наличии скользящего режима в системе. Рис. 4 Принцип действия адаптивной системы с переменной структурой заключается в следующем. В начале переходного процесса в регуляторе формируется функция переключения , (26) где сmin - определяется либо по максимальной заданной длительности переходного процесса, либо из условия (25) при минимальных значениях ai(t) из диапазона . На поверхности g0 (в данном случае прямая) возникает скользящий режим при любых значениях аiиз заданного диапазона. Факт возникновения скользящего режима регистрируется индикатором скользящего режима, выходной сигнал которого скачкообразно изменяется при уменьшении относительной длительности пребывания системы в состоянии одной из имеющихся структур, т. е. при повторных изменениях знака функции g0. По сигналу индикатора скользящего режима функция переключения перестраивается с g0 на g1 . (27) В системе вновь возникает скользящий режим, но уже на линии переключения g1=0. С помощью индикатора скользящего режима происходит дальнейшее перестроение функции переключения (28) до тех пор, пока значение коэффициента не превысит значение cmax, после чего скользящий режим по условию (25) возникнуть не сможет и перестроение функции переключения закончится. Движение фазовой точки после того момента будет происходить по близкой к границе фазовой траектории одной из структур без скользящего режима (рис. 5). Рис. 5 На этом же рисунке видно, что шаг приращения должен выбираться в зависимости от допустимого значения перерегулирования η в переходном процессе. Таким образом, за счет поиска предельного по условию (25) режима работы поддерживается максимальное быстродействие системы управления при изменениях параметров объекта. 5. Обучающиеся системы Обучающиеся системы являются наиболее сложным и пока мало изученным классом адаптивных систем. Такие системы создаются на основе принципа обучения, заключающегося в постепенном накоплении опыта формирования поведения системы при высокой степени неопределенности ее исходных состояний, по результатам которого происходит улучшение функционирования системы. Характер накопления опыта при обучении весьма многообразен, например опыт может быть накоплен положительный или отрицательный, систематизированный или случайный, собственный или привнесённый, имитационный (искусственный) или естественный и т.д. Однако у всех способов накопления опыта есть достаточно общая черта - постепенное выделение “области знаний” из всей совокупности “незнания”. Поэтому в теории обучающихся систем эта особенность нашла отражение в достаточно быстро развивающемся направлении, связанном с созданием автоматических систем классификации или распознаванием образов. Под классификацией или распознаванием образов здесь понимается установление по результатам накопленного опыта границ между определёнными классами сложных ситуаций. Задачи распознавания и классификации встречаются часто не только в технических приложениях, но и в таких областях, как медицинская диагностика, геологическая разведка месторождений прогнозирование погоды и т.д. Задача автоматического обучения классификации формулируется следующим образом. Каждой возможной ситуации из множества рассматриваемых ставится в соответствие точка некоторого пространства x. Заранее известно, что в пространстве х необходимо выделить две или большее число областей или классов ситуаций. Расположение границ между областями неизвестно и нет определенных правил, по которым можно определить принадлежность той или иной точки любой из заданных областей. Цель обучения заключается в построении поверхности, разделяющей предъявляемые точки из указанного множества на заданное число классов. Принципиально существует два подхода к обучению такому разделению. В первом случае, при обучении с поощрением, классифицирующему автомату предъявляют ряд случайных точек из множества в пространстве х и сообщают информацию о принадлежности этих точек определенным классам. После определенного цикла обучения на таких примерах автомат строит разделяющую поверхность и может в дальнейшем отличать принадлежность разным классам не только предъявленных ему точек-примеров, но и любых других точек в пространстве х. В случае обучения без поощрения информация р принадлежности точек разделяемым классам отсутствует. Здесь автомат по наблюдению предъявляемых точек определят факт компактного расположения нескольких из них и затем строит разделяющие поверхности на основе выбранной меры близости компактных групп точек к разделяющей поверхности. Объективная сложность обучения как с поощрением, так и без поощрения заключается в том, что не всегда классы из близко расположенных друг к другу точек строго отделимы, т.е. возможны пересечения классов, когда одни и те же точки принадлежат разным классам. Для хорошо разделимых классов используют достаточно простые алгоритмы автоматической классификации, основанные на аппроксимации разделяющих поверхностей отдельными участками гиперплоскостей. Для менее разделимых классов приходиться использовать вероятностные методы, основанные на определении вероятностных характеристик принадлежности точек пересекающимся классам. Персептронная модель автоматической классификации Впервые принципы автоматической классификации были реализованы американским ученым Ф. Розенблатом в автомате, названном им “персептроном” (от слова “perception” - восприятие). Рассмотрим принцип действия автомата на примере персептрона МАРК-1 (рис. 6). Рис. 6 В качестве воспринимающего устройства в персептроне использовано поле рецепторов в виде фотоэлектрического устройства, состоящего из нескольких сотен фотоэлементов. Каждый фотоэлемент может находиться в одном из двух состояний: 0 и 1. Выходные сигналы фотоэлементов поступают на входы “ассоциативных элементов” А, число которых сравнимо с числом фотоэлементов. Каждый А-элемент имеет несколько входов и один выход. Входы А-элементов соединяются с выходами фотоэлементов случайным образом и со случайными знаками. В процессе обучения случайные связи сохраняются неизменными. А-элементы осуществляют алгебраическое суммирование поданных на их входы сигналов с фотоэлементов и сравнивают получаемую сумму с постоянным числом Q в соответствии с алгоритмом (29) где Выходные сигналы А-элементов после перемножения на независимые переменные коэффициенты складываются (рис. 7) (30) и поступают на вход реагирующего элемента R, который может находиться в одном из двух состояний: или 0, или 1 в зависимости от положительности суммы (30), т.е. (31) Рис. 7 В процессе обучения персептрон должен выдавать выходной сигнал 0 при предъявлении объектов класса А и выдавать сигнал 1 при предъявлении объектов класса В. Обучение заключается в том, что коэффициенты при каждом показе объектов класса А и получении на выходе А-элементов сигналов 1 увеличиваются на некоторую величину, а при отказе объектов класса В уменьшаются на эту величину. Постепенно правильность ответов на предъявляемые объекты увеличивается, т.к. повышается сумма (21.10) при правильной классификации. По окончании обучения на последовательности объектов конечной длины автомат распознает с определенной точностью объекты А и В, если они и не предъявлялись ему на этапе обучения. Схема обучения представлена на рис. 7. Решающее правило выглядит следующим образом: (32) Значения коэффициентов изменяется в соответствии с правилом обучения: (33) Заключение В результате рассмотрения множества примеров СНС на основе анализа наиболее существенных признаков можно предложить следующую классификацию самонастраивающихся систем. . Системы с адаптацией по помехе (или иным сигналам, косвенно или прямо описывающим изменение параметров объекта или условий его действий). .1. С эталонной моделью замкнутой системы. .2. С программным изменением параметров регулятора. . СНС со стабилизацией свойств основного контура без идентификации объекта. .1. С настройкой на экстремум свойств: а) с пробной девиацией в виде сигнала, вносимого в контур; б) с пробной девиацией параметров регулятора; в) без девиации. .2. С поддержанием заданных свойств контура: а) с доведением до автоколебаний; б) с введением пробных колебаний; в) без колебаний. . С эталонной моделью объекта (неуточняемой). . С идентификатором объекта или с уточняемой его моделью. . С блоком прогноза выхода объекта. . Системы с адаптацией по ошибке управления. . Экстремальные системы, переводящие систему в состояние вблизи экстремума. Наибольший практический интерес вследствие наибольшей универсальности и наилучшего эффекта представляют, по-видимому, системы со стабилизацией основного контура и системы с идентификатором или с уточняемой моделью объекта. |