Реферат по курсу Теоретические основы испр

Название	Реферат по курсу Теоретические основы испр
Дата	01.05.2018
Размер	213.5 Kb.
Формат файла
Имя файла	ref-2.doc
Тип	Реферат #42573
страница	1 из 3

1 2 3

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

Донецкий государственный институт искусственного интеллекта

ИГРОВЫЕ МОДЕЛИ ВЗАИМОДЕЙСТВИЯ СИСТЕМ

Реферат

по курсу: «Теоретические основы ИСПР»

Подготовил: ст. гр. ИС-99

А.В. Любичев

2003

1. Моделирование взаимодействия систем
В настоящее время вопросы, связанные с взаимодействием и конфликтами между системами разного уровня и вида, являются предметом разнообразных научных исследований. Если говорить о математическом моделировании конфликтных ситуаций, то здесь развит специальный раздел – теория игр. Естественно, игровые модели широко используются для анализа процессов переговоров, торговли, эксплуатации общих природных ресурсов и т.д. Однако этот подход упирается в принципиальную проблему теории игр – отсутствие единого принципа оптимального поведения. Это значит, что разумные соглашения с точки зрения одного принципа оптимальности не являются таковыми с точки зрения другого принципа. В результате в исследование реальных конфликтов вносится элемент субъективизма, связанный с выбором понятия решения игры, что подрывает ценность математического подхода.

Имеется по крайней мере два пути для выхода из этой ситуации:

найти такие классы игровых моделей, описывающих достаточно реальные конфликты, для которых различные принципы оптимальности дают одни и те же решения;

на основе начальной игры, являющейся моделью реального конфликта, сконструировать новую динамическую многошаговую игру, которая описывает процесс переговоров, предназначенный для выбора одного из видов решений, предлагаемых различными принципами оптимальности.

Далее рассматриваются обе эти возможности.

Как показывают исследования, конфликты и их игровые модели имеют хорошую структуру, характеризующуюся наличием устойчивых и взаимовыгодных соглашений, если каждый участник имеет несколько критериев эффективности, связанных с различными сферами интересов, причем среди этих критериев имеются индивидуальные, общие и противоположные цели. Первый класс таких моделей предложен Ю. Б. Гермейером. Он служит для описания конфликтов, участники которых наряду со своими противоречивыми целями имеют общую цель. При некоторых условиях монотонности целевых функций для таких конфликтов существуют компромиссы (решения), которые удовлетворяют сразу ряду принципов оптимального поведения (в первую очередь являются равновесными и паретооптимальными).

Возник вопрос, насколько важным является наличие общей цели у участников конфликта. Возможны ли взаимовыгодные и устойчивые соглашения в ситуациях, когда таких общих целей нет? Был построен новый класс игровых моделей, исследование которого позволило дать положительный ответ на данный вопрос. В данном реферате будут изложены некоторые результаты, являющиеся развитием этого исследования.

При описании функционирования и взаимодействия систем будем предполагать, что можно выделить внутреннюю для каждой из них сферу деятельности, в которой она полностью независима от других, и общую для всех сферу деятельности, в которой происходит столкновение интересов (можно рассматривать и несколько сфер столкновения интересов). Управлениями участников являются выборы пропорций распределения ресурсов или продуктов, вкладываемых во внутреннюю и во внешнюю сферы (точнее, далее под управлением понимается выбор доли вклада во внутреннюю сферу).

Достижения каждого участника во внутренней сфере описываются критерием, который зависит только от управления данного участника. Достижения каждого участника во внешней сфере оцениваются своим критерием, который зависит от управлений всех участников. Обозначим эти критерии соответственно и , , где ; – управление i-го участника; n – число участников, .

Для описания индивидуальных принципов поведения задания этих критериев недостаточно. Необходимо либо ввести общий критерий, либо определить понятие оптимума в терминах векторного критерия. Как уже говорилось, существует такой общий критерий, который тесно связан с одним из основных понятий оптимума для векторного критерия – паретооптимальностью. Этот критерий в данном случае имеет вид
, (1)
где – весовой коэффициент. Фиксация соответствует выделению некоторого решения из множества Парето. Далее будет предполагаться, что предпочтения участников описываются критериями вида (1) и участники стремятся их максимизировать. Содержательно это означает, что участники соизмеряют свои достижения во внутренней и внешней сферах и оценивают ситуацию по худшему результату (“узкому месту”), причем в силу разнородности сфер результаты в них не являются взаимозамещающими. Весовой коэффициент может быть размерным, так как достижения во внутренней и внешней сферах могут измеряться в различных единицах. Далее, поскольку функции имеют в основном произвольный вид, без ограничения общности иногда будем считать , .

В качестве основного принципа коллективного поведения будет принято равновесие по Нэшу. Однако при этом окажется, что для исследуемого класса игр равновесные решения удовлетворяют и ряду других принципов оптимальности.

Рассматривается два вида моделей: статические и динамические. Для (первого вида критерии задаются как явные функции управления, для второго – критерии как функции управления находятся в силу системы дифференциальных уравнений, описывающей динамический процесс.

Для описания динамики систем будет использоваться агрегированная модель с однородным ресурсом (продуктом). Процесс для всех систем рассматривается на едином непрерывном промежутке планирования [0, Т]. Фазовыми переменными для i-й системы являются размеры фондов во внутренней и внешней сферах; соответственно и . Производственная функция предполагается линейной, а ее единственным аргументом является объем производственных фондов. Выпускаемый во внутренней сфере в каждый момент времени t однородный продукт в количестве где – темп роста основных фондов, распределяется между внутренней и внешней сферами в пропорции и , где управление в каждый момент удовлетворяет ограничениям . Заданы начальные условия , и коэффициенты амортизации производственных и непроизводственных фондов (соответственно и ). Таким образом, имеем системы
(2)
Здесь все переменные являются скалярными величинами, все коэффициенты и начальные условия – положительные числа, , , , .

Модели такого типа, несмотря на их простоту, могут быть интерпретированы в достаточно разнообразных содержательных терминах и относиться к вопросам экономического соперничества на внутренних и внешних рынках борьбы за политическое влияние в различных регионах, распределения ресурсов между мирным и военным секторами и переговоров по сокращению вооружений и т. д.
2. Вопросы существования устойчивых и взаимовыгодных компромиссов
В статическом случае задача сводится к анализу игры n лиц с критериями вида (1) на n-мерном единичном кубе. Относительно функций и , кроме непрерывности примем следующие предположения, согласующиеся с содержательным смыслом этих функций. Функции вообще говоря, естественно считать монотонно возрастающими, однако, как показывают исследования, для некоторых типов экономических систем при определенных значениях параметров возможны стимулирующие влияния внешней сферы на внутреннюю (например, непроизводственные расходы в умеренных размерах повышают эффективность производства). Поэтому будем считать унимодальными функциями с точками максимума .

Функции , вообще говоря, должны убывать по “своей” переменной , так как ее увеличение означает уменьшение доли вклада во внешнюю сферу. Однако если ресурс производится во внутренней (производственной) сфере, то при определенной длительности планового периода абсолютное значение вклада во внешнюю сферу может расти вместе с ростом (при небольших значениях ). Поэтому при фиксированных остальных аргументах будем считать как функции унимодальными с точками максимума ( не зависят от значений , ). По остальным (“чужим”) аргументам (при фиксированном ) считаются монотонно возрастающими при , , что означает противоположность интересов во внешней сфере (уменьшение вкладов других сторон во внешнюю сферу выгодно данной стороне, так как увеличивает ее конкурентоспособность или относительное влияние). Кроме того, предположим, что (вообще говоря, близки к единице, а – к нулю), а n-мерный параллелепипед обозначим через П.

Игру в нормальной форме на <-мерном единичном кубе с критериями вида (4.1) (А,=1) при сделанных предположениях относительно функций Ф{(и{), Ч^ы) назовем игрой Я<4 Ситуация равновесия в игре Я(л) есть точка ц=(<ь .... ы"), для которой

щ,

1, ..., ип)

(4.3)

Если неравенства (4.3) строгие Уи^<<, 1=1, п, то ситуация равновесия называется строгой.

Лемма 4.1. В игре Я<п) существует по крайней мере одна ситуация равновесия, причем все ситуации равновесия являются строгими, принадлежат Я и удовлетворяют следующим условиям:

[Ф(и'4)-VI (о) ](<%-<-<) (<(-<+{) =0, 1=1, п. (4.4)

Доказательство. Реализация максимума Я,- по << при фиксированных и],

/=51, есть однозначная непрерывная функция ы0с(н(_{)), где ц(_() = (и1, ..., и(_1,

ц.ч.1, ..., ы"), причем в силу свойств Ф,-(и{),

*У{(и) УИ(_,-) справедливо либо

и°<(Ы(_1-))=а,--) либо и°{(и(_,-)) =<(+, либо и,-<и°<(и<_4)) <Ц;+ и

Ф((и°( (<,_<,) )=Ч>,()- "< + 1..... <п).

, .-Отображение (и\, ,.., ип)-*'(и01(и(_1)), ..., и0п("(-п))) п-мерного единичного куба в Я является однозначным и непрерывным, поэтому по теореме Брауэра

100

оно имеет неподвижную точку, которая я является точкой равновесия. Остальные утверждения леммы вытекают из определения равновесия и свойств функций И°<(<(-<)).

Замечание. Из леммы 4.1 (с учетом доказательства) вытекает, что можно ограничиться без потери общности результатов рассмотрением игры Я<п) на Я, где Ф<("() монотонно возрастают, Ч1',-(и) монотонно убывают по щ и монотонно возрастают по и;-, /э6>', /=1, п (далее это предполагается без дополнительных оговорок).

Исследуем свойства равновесия, начав с игры двух лиц. Наряду с игрой Я<2> будем рассматривать две игры Гь Г2 с критериями Я1(ыь иг), Я2(<1, <2), в которых соответственно первый или второй игрок делает свой ход первым (является лидером), а затем, зная этот ход, делает свой ход другой игрок (ведомый). Наилучший результат лидера в игре А (первый игрок) есть

I, (

тах

а в игре Гг (второй игрок) есть Я2 (и? ("2), и,),

(4-6)

где и°{ (и]) = Аг§ тах Яг (и1( ы2) -однозначные функции наилучшего

и^^и ^"7"

отклика. Оптимальные управления лидеров, реализующие максимумы в '(4.5), (4.6), обозначим и°\, ы°2, а ответы ведомых й2 =

= И°2(Н01)( й,=И0,|(<0,).

Напомним, что множество Парето Р для игры Я<2) состоит из таких точек (<:, ы2)еЯ, что если ЯДм'ь и'-^^Н^щ, <2), (и'\, и'г)^П, 1=1,2, то Я^(ы'ьЫ/2)=Я,1(иь н2), 1 = 1,2, а у-ядро Су есть подмножество Р, для точек которого Я,-.(ы1, и^^^г, 1=1, 2.

Лемма 4.2. Если в игре Я<2) существует несколько ситуаций равновесия, то среди них имеется наилучшая для обоих участников, а в играх Гь Г2 оба участника получают выигрыш, не меньший, чем в лучшей ситуации равновесия.

Доказательство. Пусть имеются две'-точ<и равновесия (и(*, и2*), ("1**, и2**). Функции и°|(и2), и°2(ы!) являются неубывающими на Я. Действительно, пусть и'г^и."г- Тогда в силу свойства монотонности функции Ч^ имеем Т^м^и'г)^ <ь и" г) У^, откуда

,, н"2).

Я! (<1 <г) = ^ ( <[, <г)-

101

Пусть

Тах
т е. и'1 = ив1(и'2), и",=*и01(и"2). Предположим, что и'1<.и"\, тогда и"1>ис и имеем соотношения

Я||(И'1. <'2ХФ1(М'1)<Ф1(Ы",)=Я,(И"1, и"2),

т. е. пришли к противоречию с неравенством Н\(и1, м'2) ^И\(и.^, ц"2) Уй1, так как из него следует

так Я1(<1. "2)=^ тах #1 ("1. иг)-

о- <и,^и+ ц- ^ы,<и+

Значит, функция и0! ("2) монотонно не убывает (аналогично и функция и°2 (<])). Поэтому с учетом однозначности этих функций имеем и1*<и|**<=^и2*<<2**, а вследствие свойств монотонности критериев Ф<, Ч"1; - Я;(<1**, и2**) >Н{(и\*, иг"), (=1,2. Существование наилучшего для обоих игроков равновесия (и!н, иг") (с максимальными координатами) следует из непрерывности критериев. В играх Г|, Г 2 результат лидера всегда не меньше, чем в любой строгой ситуации равновесия, значит, и в наилучшей. В данном случае и^^^и^, /=1,2, так как, предположив противное и0,-<К(н, имеем и^>иг и у<^Н{(и1я, и2я)=Ф{(и{п)> >Ф,-(и°() ^у,-, т. е. приходим к противоречию. В связи с тем, что Я; не убывает по и,-, \Ф(, то и ведомый в игре Г,- получает не меньше Я((<1Н, и2п).

Теорема 4.1. Если функция ^(<ь и?) =ЧГ1:(<1, <2) +Чг2!(мь <2) не возрастает по иь <2 на Я, в частности Ч^Ыь н2)=соп5{, то в игре Я<2) существует единственная ситуация равновесия, а именно (ы°1, ы02), причем (ы°1, <°2)еС\,еР и является единственным решением игр Гь Г2, а если дополнительно Чг(ыь ы2) монотонно убывает хотя <бы по одному аргументу, то С7={(и°ь и°2)}.

Доказательство. Предположим, что существуют две точки равновесия (<1*, ы2*) и (<1**, <2**), причем и;*<<<**, /=1,2. Тогда ы4*<и<+ и Н^(и^*, <2*) = =ЧМИ1*,<2*Ь /=1,2. Поэтому ^(и,*,и2*)=Я1(ы,*, <2*)+Я2(и1*, ы2*)<Я,(ы,**, ы2**)+Я2(и,**, м^Ч^ЧМ"!**. и2**) +4^(1*1**, и2**)=Ч'(ы,**, и2*<), и пришли к противоречию. Значит, равновесие единственно: (и^, и2р).

Покажем, что (и^, ц2Р)еР. Пусть для произвольной точки (и\, <2)еЯ выполняется Н^(и^, <2)>

1 2 3