Интеллектуальный анализ данных
Скачать 7.76 Mb.
|
{S} на основе природы элементов A a , то все системы можно разделить на физиче- ские, технические, социальные, воен- ные и т.п. 1. Постановка задачи синтеза системы. Определение (выбор) объекта исследования и наиболее существенных показателей его качества 2. Выбор критерия оценивания качества системы 3. Построение модели системы, коррекция модели 4. Изучение модели системы и определение значений абсолютных показателей ее свойств 5. Анализ результатов моделирования и принятие решения о качестве синтезируемой системы 6. Формирование требований к структуре и параметрам синтезируемой системы, обеспечивающих заданное ее качество Рис.3. Обратная задача: синтез системы NB! 1. Постановка задачи анализа качества. Определение (выбор) объекта исследования и абсолютных показателей его свойств 2. Выбор критерия качества системы и критерия ее оценивания 3. Построение модели системы 4. Испытание модели системы и оценивание ее качества 5. Анализ результатов моделирования и принятие решения о качестве системы Рис. 2. Прямая задача: анализ качества сис- 43 Классификация по свойствам отношений R r приводит к разделению мно- жества {S} на системы с постоянной const) = (R и переменной R(t)) = R var, = (R структурой. Классификация, основанная на свойствах входа-выхода системы, позволя- ет разделить множество {S} по взаимодействию со средой на открытые ) Y (U и закрытые системы ) = Y = (U , на активные ) (Y и пассивные ) = (Y , а также по числу входов-выходов (например, система с m входами и n вы- ходами). Классификация по свойствам множества Х разделяет множество систем в зависимости: - от характера возможных состояний - на дискретные и непрерывные, - от изменения состояния во времени - на статистические const) = (Х и ди- намические Х(t)) = (Х , - в зависимости от степени учета случайных факторов - на детерминиро- ванные и стохастические. И, наконец, классификация на основе отношения эмерджентности G позво- ляет разделить все системы на регулярные и нерегулярные в зависимости от од- нозначности отображения множества элементов А на множество возможных со- стояний Х Заметим, что при решении прикладных задач часто используются некоторые установившиеся, общепринятые разбиения систем на составные части. Так, система управления разбивается на управляющую и управляемую подсистемы, а управляющая система - на подсистему наблюдения и собственно управления. И в заключение этого раздела приведем диалог Конфуция с учеником, от- ражающий отношение великого мудреца к системному анализу. "-Ты считаешь меня многоученым? - спросил Конфуций ученика. - А разве нет? - ответил тот. - Нет, - сказал Конфуций, - я лишь связываю все воедино". 2. Сложные системы: Проклятие размерности, декомпозиция Классической проблемой почти всех прикладных наук является проблема сложных систем. Как правило, это понятие в каждом конкретном случае уточняется в зави- симости от контекста решаемой проблемы. В общем случае под сложной системой понимают многофунк- циональную систему с многомерной, многосвязной, неоднородной структурой, нестационарно изменяющейся во времени и содержащей существенные неопределенности в описании. Иногда, "для букета", добавляют некорректность задания, недифференцируемость протекающих в ней процессов, ограниченную наблюдаемость, слабую управляемость и т.п. Можно предложить альтернативное определение: сложная система — это система, не допускающая красивого математического описания. Вывод из представленного выше определения достаточно очевиден - необ- ходимо по возможности упростить и модель исследуемой системы, и саму ре- шаемую задачу. Соответствующие математические технологии описаны, напри- NB! 44 мер, в [Егор, Месар, Моисеев, Перегуд]. Проблема состоит в том, чтобы сделать это корректно! NB! Введение корректных ограничений и упрощений, строгое применение техники декомпозиции - задачи, требующие особого внимания и предельной акку- ратности. Именно здесь возникают серьезные вопросы, а иногда и проблемы при защите полученных результатов. Идея декомпозиции достаточно очевидна - разделить изучаемую систему на подсистемы, а решаемую задачу - на подзадачи, каждая из которых допускает более или менее самостоятельное исследование. Если вычлененная подсистема слишком сложна, то продолжают процесс разбиения до тех пор, пока не получат подсистему, допускающую определенное решение. По существу, реализуется иерархическая, или многоуровневая структури- зация исходной задачи (системы). Для формализованного решения задачи деком- позиции удобно использовать математический аппарат теории графов и техноло- гию структурного программирования. Как правило, сложная система допускает несколько вариантов декомпозиции, что связано с наличием различных подходов к задаче анализа ее функционирования. В результате возникают неоднозначность, субъек- тивизм выбора, многокритериальность и другие неприятности, существенно за- трудняющие получение строгого решения. При этом не последнюю роль приобре- тают интуиция и опыт исследователя. По данным психологов, человек может мысленно охватить структуру деком- позированной системы, если на каждом уровне возникает не более 52 подзадач [ЕгорФрадк]. Научная методология постановки и решения задач исследования сложных систем получила наименование "системный анализ". По своей природе сис- темный анализ представляет собой некоторое обобщение различных методиче- ских приемов, возникающих при решении конкретных естественно-научных, соци- альных, военных, технических и других задач. Несмотря на содержательную раз- нородность таких задач, системный анализ позволяет существенно унифициро- вать технологию их решения. В частности, в работе [Егор] представлен вариант общей схемы алгоритма решения задачи исследования системы (рис. 1). Следует заметить, что одной из типичных проблем, возникающих при ис- следовании сложных систем, является так называемое "проклятие размерности" [Ли]. В соответствии с законами Мэрфи, "задача, имеющая размерность меньше трех, тривиальна, а имеющая размерность больше восьми - не имеет реше- ния". Очевидной неприятностью, вытекающей из высокой размерности решаемой задачи, является нелинейный рост требований к вычислительным ресурсам ис- пользуемой ЭВМ. Так, например, объем вычислений, необходимых для реализа- ции алгоритма следящего наблюдателя, растет пропорционально третьей степени от размерности вектора состояния контролируемого объекта. К сожалению, возникающие в результате роста размерности задачи про- блемы не исчерпываются чисто техническими аспектами; в задачах с высокой размерностью возникают многочисленные "таинственные" явления, объяснение NB! 45 которых представляет собой самостоятельную, отнюдь не тривиальную задачу. Как замечено в мэрфологическом принципе Шательера, сложные системы име- ют тенденцию противопоставлять себя своим же функциям. В качестве примера приведем задачи теории наблюдения динамических систем, в которых рост числа контролируемых параметров увеличивает вероят- ность появления таких переменных, которые слабо зависят от изменений входных переменных (измерений). В результате соответствующая градиентная матрица оказывается вырожденной или плохо обусловлен- ной, что приводит к полной или час- тичной потере наблюдаемости. Аналогичные проблемы возни- кают в задачах управления больше- размерными системами, в задачах прогнозирования, идентификации и т.п. Мэрфологический принцип не- определенности утверждает, что системы имеют тенденцию расти и, по мере роста, взаимораство- ряться. Другие формулировки звучат не менее пессимистично: "Сложные системы приводят к неожиданным последствиям" или "Совокупное по- ведение больших систем предска- зать нельзя". Для борьбы с "проклятьем раз- мерности" используется разнообраз- ный математический аппарат, охва- тывающий широкий спектр вычислительных технологий от методов агрегирования сложных систем (задача, обратная декомпозиции) [Бусленко, Цурков] до алгорит- мов тихоновской или иной регуляризации [Тихон]. Выбор наиболее подходящей технологии в каждом конкретном случае индивидуален и лежит в области систе- мотехнического искусства, приобретаемого долгим и нелегким опытом. Остается надеяться, что если не рядовой разработчик, то хотя бы руково- дитель проекта таким опытом обладает. 3. Методы решения задач системного анализа Для решения хорошо структурированных количественно выражаемых про- блем используется известная методология исследования операций, которая со- стоит в построении адекватной математической модели (например, зада- чи линейного, нелинейного, динамического программирования, задачи теории массового обслуживания, теории игр и др.) и применении методов для отыскания оптимальной стратегии управления целенаправленными действиями. Системный анализ предоставляет к использованию в различных науках, системах следующие системные методы и процедуры: абстрагирование и конкретизация анализ и синтез, индукция и дедукция Рис. 4. Общая схема алгоритма решения задачи исследования системы 1. Определение системы (выделение из среды) 2. Определение входов и выходов системы 3. Определение цели 4. Построение математической модели (выбор структуры), оценка параметров, проверка адекватности 5. Анализ модели системы 6. Формализация цели 7. Формализация ограничений 8. Выбор решения (алгоритмизация, программирование, счет) 9. Анализ решения 10. При необходимости - декомпозиция системы 46 формализация и конкретизация композиция и декомпозиция линеаризация и выделение нелинейных составляющих структурирование и реструктурирование макетирование реинжиниринг алгоритмизация моделирование и эксперимент программное управление и регулирование распознавание и идентификация кластеризация и классификация экспертное оценивание и тестирование верификация и другие методы и процедуры. Вопросы для самопроверки: 1. Приведите различные определения системного анализа. 2. Назовите цель системного анализа. 3. Дайте классификацию СА в зависимости от уровня структуризации дан- ных. 4. Приведите основной постулат СА. 5. Назовите основные свойства системы. 6. Приведите формализованное описание системы; 7. Какая система называется функциональной? неопределенной? 8. Что называется отношением эмерджентности? 9. Опишите взаимосвязь основных понятий системного анализа. 10. Опишите две основные задачи теории систем: прямую и обратную. ЛИТЕРАТУРА: 1. Айвaзян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы мо- делирования и первичная обработка данных / Под ред. С.А. Айвазяна.- М.: Финансы и статистика, 1993.- 471с. 2. Директор С., Рорер Р. Введение в теорию систем/Пер. с англ. под ред. Н.П. Бус- ленко. - М.: Мир, 1974. - 464с. 3. Калинин В.Н., Резников Б.А., Варакин Е.И. Теория систем и оптимального управления. - Л.: ВИКИ им. А.Ф. Можайского, 1979. - 319с. 4. Бусленко Н.П. Моделирование сложных систем. - М.: Наука, 1978. - 399с. 5. Егоренков Д.Л., Фрадков А.Л., Харламов В.Ю. Основы математического модели- рования с примерами на языке MATLAB. - СПб БГТУ, 1996. - 192с. 6. Ли Р. Оптимальные оценки, определение характеристик и управление/Пер. с англ. под ред. Я.З. Цыпкина. - М.: Наука, 1966.-176с. 7. Математическое моделирование/Под ред. Д.Эндрюса, Р.Маклоуна. Пер. с англ. - М.: Мир, 1979. - 277с. 8. Месарович Д., Такахара Я. Общая теория систем: математические основы/Пер. с англ. под ред. С.В. Емельянова. - М.: Мир, 1978. - 312с. 9. Моисеев Н.Н. Математические задачи системного анализа. - М.: Наука, 1981. - 488с. 10. Морозов Л.М., Петухов Г.Б., Сидоров В.Н. Методологические основы теории эффективности: Учебное пособие. - Л.: ВИКИ им. А.Ф.Можайского, 1982. - 236с. 11. Николис Г., Пригожин И. Самоорганизация в неравновесных структурах / Пер. с англ. - М.: Мир, 1979. - 327с. 47 12. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. - М.: Высшая школа, 1989. - 367с. 13. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. - М.: Наука, 1979. - 244с. 14. Цурков В.Н. Агрегирование данных при решении динамических задач большой размерности. - М.: Наука, 1987. - 484с. 15. Штейнгауз Г. Математический калейдоскоп/Пер. с польск. - М.: ГИТТЛ, 1949. – 143с. 48 ЛЕКЦИЯ 5 ЭЛЕМЕНТЫ ТЕОРИИ ДИНАМИЧЕСКИХ СИСТЕМ 1. Динамическая система и ее математическая модель Определение. Под ДС понимают любой объект или процесс, для ко- торого однозначно определено понятие состояния как совокупности неко- торых величин в данный момент времени и задан закон, который описывает из- менение (эволюцию) начального состояния с течением времени. Закон эволюции позволяет по начальному состоянию прогнозировать буду- щее состояние ДС системы. ДС – это механические, физические, химические и биологические объекты, состояние которых изменяется во времени в соответствии с конкретными алго- ритмами. Описания ДС для задания закона эволюции также разнообразны: с по- мощью дифференциальных уравнений, дискретных отображений, теории графов, теории марковских цепей и т.д. Выбор одного из способов описания задает кон- кретный вид математической модели соответствующей ДС. Математическая модель ДС считается заданной, если введены парамет- ры (координаты) системы, определяющие однозначно ее состояние, и указан за- кон эволюции. В зависимости от степени приближения одной и той же системе мо- гут быть поставлены в соответствие различные математические модели. Исследование реальных систем сводится к изучению математических мо- делей, совершенствование и развитие которых определяются анализом экспери- ментальных и теоретических результатов при их сопоставлении. В связи с этим изучение ДС всегда ассоциировано с исследованием ее математической модели. Исследуя одну и ту же ДС (к примеру, движение маятника), в зависимости от степени учета различных факторов мы получим различные математические модели. В качестве примера рассмотрим модель нелинейного консервативного осциллятора: 2 2 sin sin 0 d x x x x dt Функция sin x аналитическая, и ее можно разложить в ряд Тейлора: 3 5 4 1 4 1 1 1 sin 3! 5! ( ) (4 1)! (4 1)! n n n n x x x x x x n n При малых 1 sin x x x . В этом случае получаем самую простую мо- дель математического маятника 0 x x С увеличением x требуется учет второго, третьего и т.д. членов ряда, чтобы с заданной точностью аппроксимировать sin x. Следующим приближением будет модель нелинейного маятника: NB! 49 3 0 6 x x x и т.д. Для каждого конкретного значения n будем получать новую ДС, в заданном приближении описывающую процесс колебаний физического маятника 2. Кинематическая интерпретация Рассмотрим ДС, моделируемые конечным числом обыкновенных диффе- ренциальных уравнений. В рассматриваемом случае для определения ДС необ- ходимо указать объект, допускающий описание состояния заданием величин x 1 , x 2 , …, x N в некоторый момент времени t = t 0 Величины x i могут принимать произвольные значения, причем двум различ- ным наборам величин x i отвечают два разных состояния. Закон эволюции ДС во времени записывается системой обыкновенных дифференциальных уравнений 1 ( ,..., ), 1,2,..., i i i n dx x f x x i N dt (1) Если рассматривать величины x 1 , x 2 , …, x N как координаты точки x в N- мерном пространстве, то получается наглядное геометрическое представление состояния ДС в виде этой точки, которую называют изображающей или фазовой точкой. Множество фазовых точек с введенной над ним метрикой называется пространством состояний или фазовым пространством ДС. Изменению со- стояния системы во времени отвечает движение фазовой точки вдоль некоторой линии, называемой фазовой траекторией. В фазовом пространстве системы уравнениями (1) определяется векторное поле скоростей, сопоставляющее каж- дой точке x выходящий из нее вектор скорости F(x), компоненты которого даются правыми частями уравнений (1). При этом ДС (1) может быть записана в вектор- ной форме: ( ) X F X (2) где F(x) – вектор-функция размерности N. Необходимо уточнить взаимосвязь по- нятий числа степеней свободы и размерности фазового пространства ДС. Под числом степеней свободы понимается наименьшее число независи- мых координат, необходимых для однозначного определения состояния системы. Под координатами первоначально понимались именно пространственные переменные, характеризующие взаимное расположение тел и объектов. В то же время для однозначного решения соответствующих уравнений дви- жения необходимо помимо координат задать соответствующие начальные значе- ния импульсов или скоростей. В связи с этим система с n степенями свободы ха- рактеризуется фазовым пространством в два раза большей размерности (N = 2n). |