Реферат по курсу Теоретические основы испр
![]()
|
^И\(и.^, ц"2) Уй1, так как из него следует<и°<(и<_4)) <Ц;+ иМИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ Донецкий государственный институт искусственного интеллекта ИГРОВЫЕ МОДЕЛИ ВЗАИМОДЕЙСТВИЯ СИСТЕМ Реферат по курсу: «Теоретические основы ИСПР» Подготовил: ст. гр. ИС-99 А.В. Любичев 2003 1. Моделирование взаимодействия систем В настоящее время вопросы, связанные с взаимодействием и конфликтами между системами разного уровня и вида, являются предметом разнообразных научных исследований. Если говорить о математическом моделировании конфликтных ситуаций, то здесь развит специальный раздел – теория игр. Естественно, игровые модели широко используются для анализа процессов переговоров, торговли, эксплуатации общих природных ресурсов и т.д. Однако этот подход упирается в принципиальную проблему теории игр – отсутствие единого принципа оптимального поведения. Это значит, что разумные соглашения с точки зрения одного принципа оптимальности не являются таковыми с точки зрения другого принципа. В результате в исследование реальных конфликтов вносится элемент субъективизма, связанный с выбором понятия решения игры, что подрывает ценность математического подхода. Имеется по крайней мере два пути для выхода из этой ситуации:
Далее рассматриваются обе эти возможности. Как показывают исследования, конфликты и их игровые модели имеют хорошую структуру, характеризующуюся наличием устойчивых и взаимовыгодных соглашений, если каждый участник имеет несколько критериев эффективности, связанных с различными сферами интересов, причем среди этих критериев имеются индивидуальные, общие и противоположные цели. Первый класс таких моделей предложен Ю. Б. Гермейером. Он служит для описания конфликтов, участники которых наряду со своими противоречивыми целями имеют общую цель. При некоторых условиях монотонности целевых функций для таких конфликтов существуют компромиссы (решения), которые удовлетворяют сразу ряду принципов оптимального поведения (в первую очередь являются равновесными и паретооптимальными). Возник вопрос, насколько важным является наличие общей цели у участников конфликта. Возможны ли взаимовыгодные и устойчивые соглашения в ситуациях, когда таких общих целей нет? Был построен новый класс игровых моделей, исследование которого позволило дать положительный ответ на данный вопрос. В данном реферате будут изложены некоторые результаты, являющиеся развитием этого исследования. При описании функционирования и взаимодействия систем будем предполагать, что можно выделить внутреннюю для каждой из них сферу деятельности, в которой она полностью независима от других, и общую для всех сферу деятельности, в которой происходит столкновение интересов (можно рассматривать и несколько сфер столкновения интересов). Управлениями участников являются выборы пропорций распределения ресурсов или продуктов, вкладываемых во внутреннюю и во внешнюю сферы (точнее, далее под управлением понимается выбор доли вклада во внутреннюю сферу). Достижения каждого участника во внутренней сфере описываются критерием, который зависит только от управления данного участника. Достижения каждого участника во внешней сфере оцениваются своим критерием, который зависит от управлений всех участников. Обозначим эти критерии соответственно ![]() ![]() ![]() ![]() ![]() ![]() Для описания индивидуальных принципов поведения задания этих критериев недостаточно. Необходимо либо ввести общий критерий, либо определить понятие оптимума в терминах векторного критерия. Как уже говорилось, существует такой общий критерий, который тесно связан с одним из основных понятий оптимума для векторного критерия – паретооптимальностью. Этот критерий в данном случае имеет вид ![]() где ![]() ![]() ![]() ![]() ![]() ![]() В качестве основного принципа коллективного поведения будет принято равновесие по Нэшу. Однако при этом окажется, что для исследуемого класса игр равновесные решения удовлетворяют и ряду других принципов оптимальности. Рассматривается два вида моделей: статические и динамические. Для (первого вида критерии задаются как явные функции управления, для второго – критерии как функции управления находятся в силу системы дифференциальных уравнений, описывающей динамический процесс. Для описания динамики систем будет использоваться агрегированная модель с однородным ресурсом (продуктом). Процесс для всех систем рассматривается на едином непрерывном промежутке планирования [0, Т]. Фазовыми переменными для i-й системы являются размеры фондов во внутренней и внешней сферах; соответственно ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Здесь все переменные являются скалярными величинами, все коэффициенты и начальные условия – положительные числа, ![]() ![]() ![]() ![]() Модели такого типа, несмотря на их простоту, могут быть интерпретированы в достаточно разнообразных содержательных терминах и относиться к вопросам экономического соперничества на внутренних и внешних рынках борьбы за политическое влияние в различных регионах, распределения ресурсов между мирным и военным секторами и переговоров по сокращению вооружений и т. д. 2. Вопросы существования устойчивых и взаимовыгодных компромиссов В статическом случае задача сводится к анализу игры n лиц с критериями вида (1) на n-мерном единичном кубе. Относительно функций ![]() ![]() ![]() ![]() ![]() Функции ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Игру в нормальной форме на <-мерном единичном кубе с критериями вида (4.1) (А,*=1) при сделанных предположениях относительно функций Ф{(и{), Ч^ы) назовем игрой Я<4 Ситуация равновесия в игре Я(л) есть точка ц*=(<*ь .... ы*"), для которой щ, 1, ..., и*п) (4.3) Если неравенства (4.3) строгие Уи^<*<, 1=1, п, то ситуация равновесия называется строгой. Лемма 4.1. В игре Я<п) существует по крайней мере одна ситуация равновесия, причем все ситуации равновесия являются строгими, принадлежат Я и удовлетворяют следующим условиям: [Ф*(и'4)-VI (о*) ](<%-<-<) (<*(-<+{) =0, 1=1, п. (4.4) Доказательство. Реализация максимума Я,- по << при фиксированных и], /=5*1, есть однозначная непрерывная функция ы0с(н(_{)), где ц(_() = (и1, ..., и(_1, ц.ч.1, ..., ы"), причем в силу свойств Ф,-(и{), Ф((и°( (<,_<,) )=Ч>,()- "< + 1..... <п). , .-Отображение (и\, ,.., ип)-*'(и01(и(_1)), ..., и0п("(-п))) п-мерного единичного куба в Я является однозначным и непрерывным, поэтому по теореме Брауэра 100 оно имеет неподвижную точку, которая я является точкой равновесия. Остальные утверждения леммы вытекают из определения равновесия и свойств функций И°<(<(-<)). Замечание. Из леммы 4.1 (с учетом доказательства) вытекает, что можно ограничиться без потери общности результатов рассмотрением игры Я<п) на Я, где Ф<("() монотонно возрастают, Ч1',-(и) монотонно убывают по щ и монотонно возрастают по и;-, /э6>', /=1, п (далее это предполагается без дополнительных оговорок). Исследуем свойства равновесия, начав с игры двух лиц. Наряду с игрой Я<2> будем рассматривать две игры Гь Г2 с критериями Я1(ыь иг), Я2(<1, <2), в которых соответственно первый или второй игрок делает свой ход первым (является лидером), а затем, зная этот ход, делает свой ход другой игрок (ведомый). Наилучший результат лидера в игре А (первый игрок) есть I, ( тах а в игре Гг (второй игрок) есть Я2 (и? ("2), и,), (4-6) где и°{ (и]) = Аг§ тах Яг (и1( ы2) -однозначные функции наилучшего и^^и ^"7" отклика. Оптимальные управления лидеров, реализующие максимумы в '(4.5), (4.6), обозначим и°\, ы°2, а ответы ведомых й2 = = И°2(Н01)( й,=И0,|(<0,). Напомним, что множество Парето Р для игры Я<2) состоит из таких точек (<:, ы2)еЯ, что если ЯДм'ь и'-^^Н^щ, <2), (и'\, и'г)^П, 1=1,2, то Я^(ы'ьЫ/2)=Я,1(иь н2), 1 = 1,2, а у-ядро Су есть подмножество Р, для точек которого Я,-.(ы1, и^^^г, 1=1, 2. Лемма 4.2. Если в игре Я<2) существует несколько ситуаций равновесия, то среди них имеется наилучшая для обоих участников, а в играх Гь Г2 оба участника получают выигрыш, не меньший, чем в лучшей ситуации равновесия. Доказательство. Пусть имеются две'-точ<и равновесия (и(*, и2*), ("1**, и2**). Функции и°|(и2), и°2(ы!) являются неубывающими на Я. Действительно, пусть и'г^и."г- Тогда в силу свойства монотонности функции Ч^ имеем Т^м^и'г)^ <ь и" г) У^, откуда ,, н"2). Я! (<1 <г) = ^ ( <[, <г)- 101 Пусть Тах т е. и'1 = ив1(и'2), и",=*и01(и"2). Предположим, что и'1<.и"\, тогда и"1>ис |