Интеллектуальный анализ данных
Скачать 7.76 Mb.
|
Пример 2. Модель Мальтуса. Скорость роста пропорциональна текущему размеру популяции. Она описывается дифференциальным уравнением x x , 35 где — некоторый параметр, определяемый разностью между рождаемостью и смертностью. Решением этого уравнения является экспоненциальная функция t e x ) t ( x 0 Если рождаемость превосходит смертность ( 0 ), размер популяции не- ограниченно и очень быстро возрастает. Понятно, что в действительности этого не может происходить из-за ограни- ченности ресурсов. При достижении некоторого критического объёма популяции модель перестает быть адекватной, поскольку не учитывает ограниченность ре- сурсов. Уточнением модели Мальтуса может служить логистическая модель, кото- рая описывается дифференциальным уравнением Ферхюльста , x ) x x ( x s 1 где s x — «равновесный» размер популяции, при котором рождаемость в точности компенсируется смертностью. Размер популяции в такой модели стремится к рав- новесному значению s x , причем такое поведение структурно устойчиво. Пример 3. Система хищник-жертва. Допустим, что на некоторой терри- тории обитают два вида животных:кролики (питающиеся растениями) и лисы (пи- тающиеся кроликами). Пусть число кроликов , число лис . Используя модель Мальтуса с необходимыми поправками, учитывающими поедание кроликов лиса- ми, приходим к следующей системе, носящей имя модели Лотки — Вольтерра: . y ) dx ( y ; x ) cy ( x Эта система имеет равновесное состояние, когда число кроликов и лис по- стоянно. Отклонение от этого состояния приводит к колебаниям численности кро- ликов и лис, аналогичным колебаниям гармонического осциллятора. Как и в слу- чае гармонического осциллятора, это поведение не является структурно устойчи- вым: малое изменение модели (например, учитывающее ограниченность ресур- сов, необходимых кроликам) может привести к качественному изменению поведе- ния. Например, равновесное состояние может стать устойчивым, и колебания численности будут затухать. Возможна и противоположная ситуация, когда любое малое отклонение от положения равновесия приведет к катастрофическим по- следствиям, вплоть до полного вымирания одного из видов. На вопрос о том, ка- кой из этих сценариев реализуется, модель Вольтерра — Лотки ответа не дает: здесь требуются дополнительные исследования. Томас Роберт Мальтус (Thomas Robert Malthus, своё среднее имя он обычно опускал; 1766—1834) — английский священник и учёный, демограф и экономист, автор теории, согласно кото- рой неконтролируемый рост народонаселения должен привес- ти к голоду на Земле. 36 Разработка модели. Разработка математической модели, как правило, включает в себя три основных этапа - выбор структуры, - определение параметров - проверку подобия. В общем случае моделирование осуществляется итерационно. Это связано с тем, что практически невозможно оценить качество выбранной непараметриче- ской структуры модели без оценки ее параметров. Осуществив априорный выбор структуры, разработчик модели переходит к определению ее параметров. В случае, когда имеется набор численных данных, полученных в результате наблюдения за функционированием реальной системы- прототипа или ее экспериментального аналога, искомые параметры находятся пу- тем применения алгоритмов обработки указанной информации. В частности, ши- роко используется математический аппарат статистического оценивания. Последний этап создания модели связан с проверкой ее адекватности, или подобия моделируемой системе. При этом адекватность понимается в крайне уз- ком смысле этого слова, а именно в контексте близости изучаемых свойств сис- темы и аналогичных характеристик модели. Например, при исследовании выход- ных характеристик системы формируется мера близости между конкретными вы- ходными показателями реальной системы и ее модели. Очевидно, что данная мера представляет собой реализацию некоторой случайной величины. Определив функцию распределения этой величины, можно найти по соответствующим таблицам математической статистики критические значения выбранной меры, отвечающие a'priori выбранному уровню доверия раз- работчика модели своему детищу. Если уровень доверия оказывается ниже кри- тического, необходимо перейти либо к первому этапу и скорректировать структуру модели, либо ко второму этапу сбора и обработки экспериментальных данных. И все начинается сначала... NB!: "Цифры не управляют миром, но они показывают, как управляется мир". И. В. Гете Вопросы для самопроверки: 1. Что называется моделью? 2. Перечислите основные виды моделирования. 3. Что такое ментальное моделирование? 4. Назовите виды моделей по способу отображения реальности. 5. Что представляют собой эвристические модели? 6. Чем отличаются натурные модели от реальных объектов? 7. Что такое математическое моделирование? 8. Назовите основные этапы моделирования. 9. Приведите классификацию математических моделей. 10. Что такое структурны и функциональные модели? ЛИТЕРАТУРА: 1. Айвaзян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы мо- делирования и первичная обработка данных / Под ред. С.А.Айвазяна.- М.: Финансы и ста- тистика, 1993.- 471с. 37 2. Директор С., Рорер Р. Введение в теорию систем/Пер. с англ. под ред. Н.П. Бус- ленко. - М.: Мир, 1974. - 464с. 3. Калинин В.Н., Резников Б.А., Варакин Е.И. Теория систем и оптимального управления. - Л.: ВИКИ им. А.Ф. Можайского, 1979. - 319с. 4. Бусленко Н.П. Моделирование сложных систем. - М.: Наука, 1978. - 399с. 5. Егоренков Д.Л., Фрадков А.Л., Харламов В.Ю. Основы математического модели- рования с примерами на языке MATLAB. - СПб БГТУ, 1996. - 192с. 6. Ли Р. Оптимальные оценки, определение характеристик и управление/Пер. с англ. под ред. Я.З. Цыпкина. - М.: Наука, 1966.-176с. 7. Математическое моделирование/Под ред. Д.Эндрюса, Р.Маклоуна. Пер. с англ. - М.: Мир, 1979. - 277с. 8. Месарович Д., Такахара Я. Общая теория систем: математические основы/Пер. с англ. под ред. С.В. Емельянова. - М.: Мир, 1978. - 312с. 9. Моисеев Н.Н. Математические задачи системного анализа. - М.: Наука, 1981. - 488с. 10. Морозов Л.М., Петухов Г.Б., Сидоров В.Н. Методологические основы теории эффективности: Учебное пособие. - Л.: ВИКИ им. А.Ф.Можайского, 1982. - 236с. 11. Николис Г., Пригожин И. Самоорганизация в неравновесных структурах/Пер. с англ. - М.: Мир, 1979. - 327с. 12. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. - М.: Высшая школа, 1989. - 367с. 13. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. - М.: Наука, 1979. - 244с. 14. Цурков В.Н. Агрегирование данных при решении динамических задач большой размерности. - М.: Наука, 1987. - 484с. 15. Штейнгауз Г. Математический калейдоскоп/Пер. с польск. - М.: ГИТТЛ, 1949. - 143с. 16. Самарский А.А., Михайлов А.П. Математическое моделирование: Идеи. Мето- ды. Примеры. — М: Наука, 1997. — 320 с. 38 ЛЕКЦИЯ 4 СИСТЕМНЫЙ АНАЛИЗ ДАННЫХ 1. Введение. Системный подход: взаимосвязь всего со всем Определение. Системный анализ — научный метод познания, представляющий собой последовательность действий по установлению структурных связей между переменными или постоянными элементами исследуемой системы. Опирается на комплекс общенаучных, экспериментальных, естественнонаучных, статистических, математических методов. Системный анализ (СА) является компонентом Computer Science, он воз- ник в эпоху разработки компьютерной техники и напрямую связан с уровнем раз- вития информационных технологий. Н. Н. Моисеев приводит, по его выражению, довольно узкое определение системного анализа: «Системный анализ — это совокупность методов, основан- ных на использовании ЭВМ и ориентированных на исследование сложных сис- тем — технических, экономических, экологических и т.д.» [Моисеев]. Результатом системных исследований является, как правило, выбор вполне определенной альтернативы: плана развития региона, параметров конструкции и т. д. Поэтому истоки системного анализа, его методические концепции лежат в тех дисциплинах, которые занимаются проблемами принятия реше- ний: исследование операций и общая теория управления. Ценность системного подхода состоит в том, что рассмотрение категорий системного анализа создает основу для логического и последовательного подхо- да к проблеме принятия решений. Эффективность решения проблем с помощью системного анализа определяется структурой решаемых проблем. В зависимости от качества структуризации данных, проблемы СА можно разделить на три класса: хорошо структурированные (well-structured), или количественно сформу- лированные проблемы, в которых существенные зависимости выяснены очень хорошо; слабо структурированные (ill-structured), или смешанные проблемы, кото- рые содержат как качественные элементы, так и малоизвестные, неопределенные стороны, которые имеют тенденцию доминировать; неструктурированные (unstructured), или качественно выраженные про- блемы, содержащие лишь описание важнейших ресурсов, признаков и характери- стик, количественные зависимости между которыми совершенно неизвестны. Системность – это важнейший атрибут научного мышления, проявляющая- ся в способности видеть взаимосвязанное единство в совокупности разрозненных фактов, событий, элементов. Примечание. В соответствии с законами "мэрфологии" основные постулаты развитой теории систем имеют следую- щий вид: 1. Все - система. 2. Все - часть еще большей системы. 3. Вселенная бесконечно систематизирована как снизу вверх (все более крупные системы), так и сверху вниз (меньшие системы). NB! 39 4. Все системы бесконечно сложны. (Иллюзия простоты возникает из-за сосредоточения внимания на одной или нескольких переменных.) Основным постулатом системного анализа является необходи- мость исследования не только тех или иных явлений, но и совокупности всевозможных сопутствующих им взаимосвязей, без которых получен- ные решения не будут ни достаточно полными, ни достаточно корректными с точ- ки зрения понимания изучаемого вопроса. Именно взаимосвязанность составных частей является основной характеристикой одного из важнейших объектов науч- ных исследований - системы. Понятие "система" представляет собой базовую научную категорию в са- мых разнообразных областях знаний. Существует множество определений этого понятия, различающихся между собой той или иной степенью неудачности. Само слово "система" произошло от греческого - целое, состав- ленное из частей. Наиболее общее, философское определение утверждает: система — это множество элементов, находящихся в отношениях и связях друг с другом, которое образует определенную целостность, единство. Характерными свойствами системы являются: - целостность, - структурированность, - целенаправленность (для большинства искусственных систем). Свойство целостности говорит о том, что система может быть выделена из окружающей ее внешней среды, хотя и находится во взаимодействии с нею. Структурированность означает, что система может быть разделена на подсистемы или составные элементы, связанные и взаимодействующие друг с другом. Свойство целенаправленности предполагает задание некоторой цели, достижение которой определяет предназначение системы. Формализация понятия "система" приводит к более конкретным, хотя и более узким определениям. В частности, в кибернетике система задается в виде математиче- ских моделей Y} {U, = S или Y} X, {U, = S , где U - множество входов, X - множество состояний, Y - множество выходов. Таким образом, систему можно трактовать, как некоторый "черный ящик", преобразующий входные сигналы (данные) в выходные в интересах некоторой априори заданной цели. NB! NB! Норберт Винер (26 ноября 1894, Колумбия, штат Миссури, США — 18 марта 1964, Стокгольм, Швеция) — американский учёный, выдающийся математик и философ, основополож- ник кибернетики и теории искусственного интеллекта. NB! 40 В случае, когда функционирование системы изучается с точки зрения изме- нений ее состояния во времени, T} t {X(t), : S , где T - интервал времени, систе- ма называется динамической. Если каждой входной функции u(t) соответствует единственная выходная функция y(t) , то такая система называется функциональной. Иными словами, если (t) u = (t) u 2 1 при t , то соответствующие им выход- ные сигналы будут удовлетворять требованию ) ( y = ) ( y 2 1 . В противном случае ее относят к категории неопределенных. Важнейшим свойством, присущим реальным системам, является причин- ность их эволюции. Это означает, что настоящее состояние системы определя- ется ее прошлыми состояниями и не зависит от будущего. Представленная формализация понятия системы носит явно выраженный функциональный характер и не затрагивает ее структуру. В то же время в задачах синтеза важнейшую роль играет именно структура системы, которую и требуется определить. В связи с этим обобщенная модель системы еще более усложняется и при- обретает вид G}, Y, X, U, R, {A, = S (1) где А - множество элементов системы; R - матрица отношений между элементами системы, заданными на А; ) X , A ( G G - матрица отношений между множествами A и Х (отношения эмерджентности). Составляющая часть системы R} {A, назы- вается ее структурой, а } Y, X, {U, - ее программой функционирования. Таким об- разом, система представляет собой объединение этих двух составляющих, а ее единство определяется отношением эмерджентности G. Заметим, что понятие элемента системы является первичным и как всякое первичное представление очень сложно формализуется, но достаточно очевидно на уровне "здравого смысла": элемент — это составляющая часть системы на по- следней ступени ее детализации. Декомпозицию можно проводить до атомарного уровня и ниже; здесь, как и вообще в жизни, следует вовремя остановиться, не утратив функциональной осмысленности. Следует заметить, что категория "система", несмотря на кажущуюся про- стоту, достаточно загадочна и малообъяснима с позиций материализма. Так, на- пример, расширение системы вполне может привести к диалектическому скачку, описанному Георгом Вильгельмом Фридрихом Гегелем в XIX веке, в результате которого образуется новое качество. При этом новое качество может быть совсем не присущим ни одному элементу, образующему эту систему. Примером этого таинства может служить, например, книга - последователь- ность знаков (букв, пробелов, символов) в совокупности составляет носитель но- вой (как надеются ее авторы) информации. NB! 41 Еще один удивительный пример - синергетические системы [Николис, Ха- кен]. Здесь вопреки "великому и ужасному» второму закону термодинамики моде- лировались и наблюдались спонтанные процессы самоорганизации! Возвращаясь к обсуждению свойств систем, отметим, что важнейшее из них (с точки зрения практического человека) - целенаправленность - наиболее харак- терно для homo sapiens и связанных с его деятельностью искусственных структур. В отношении природных систем сказать что-либо однозначное об их целе- направленности достаточно сложно - есть ли цель у неба? у моря? у погоды (кро- ме как испортить в Санкт-Петербурге выходной день)? Сам факт наличия законо- мерностей в природе (законы той же диалектики, законы физики и т.п.) указывает на то, что в принципе какая-то цель (или какие-то цели) вполне может существо- вать. Эту цель материалисты называют развитием, совмещая результат с процес- сом его достижения, идеалисты - Божественным промыслом, самопознанием Идеи и т.п. Однако назвать что-либо еще не означает это понять. В искусственных системах все гораздо понятнее: цель - это результат. Ес- ли получен результат, то цель достигнута. Достижение цели, в свою очередь, со- стоит из решения поставленной задачи (или совокупности задач, образующих проблему). Результат не возникает из ничего, для его достижения всегда необхо- димо наличие определенных ресурсов. Преобразование ресурса в результат, обеспечивающий достижение цели, осуществляется упорядоченной совокупностью взаимосвязанных действий, обра- зующих операцию. Наличие последнего понятия позволило получить еще одно, впол- не прагматическое определение системы [ Морозов ]: система - это множе- ство взаимосвязанных материальных объектов, непосредственно участ- вующих в процессе выполнения операции. Взаимосвязи приведенных понятий можно представить в виде структурной схемы [10], показанной на рис. 1. NB! Ресурс Операция Результат Среда Система Рис. 1. Взаимосвязь основных понятий системного анализа 42 В большинстве исследованиях, как правило, приходится иметь дело с так называемыми "сложными", или "большими" системами, рассмотрению которых посвящен следующий раздел лекции. В таких системах особенно подчеркнуто их важнейшее свойство - взаимосвязанность элементов. В дальнейшем будем различать две ос- новные задачи тео- рии систем: прямую и об- ратную [9]. Структурные схе- мы решений указанных задач приведены на рис. 2 и 3. Пря- мая задача, или задача ана- лиза, состоит в изучении результатов функционирования системы и определе- нии условий ее применения. Обратная задача, или задача синтеза, связана с определением структуры, параметров и свойств системы в заданном диапазоне возможных условий. При этом предполагается, что в результате синтеза в конечном итоге будет получена система, отвечающая выбранным кри- териям качества. Основополагающим этапом по- нимания любого предмета является классификация. Однако задача клас- сификации систем достаточно сложна в силу крайне высокого уровня общности самого этого понятия. Тем не менее, эту работу надо делать: проведение классификации позволяет исследова- телю сузить область анализа и подоб- рать наиболее подходящую для данной задачи математическую модель. В качестве первичных классифи- кационных признаков будем использо- вать, следуя [10], элементы модели (1). В частности, если осуществлять клас- сификацию множества систем |