Главная страница

games бак Мэ 12. 4 бескоалиционные(некооперативные) игры


Скачать 238 Kb.
Название4 бескоалиционные(некооперативные) игры
Дата29.04.2019
Размер238 Kb.
Формат файлаdoc
Имя файлаgames бак Мэ 12.doc
ТипДокументы
#75640
страница2 из 4
1   2   3   4

Хэл Вэриан Микроэкономика. Промежуточный уровень. Гл..27 Теория игр




Yale, 2007 ECON 159:Game Theory Class Sessions


Prof. Ben Polak (видео, аудио и пр)

http://oyc.yale.edu/economics/game-theory/
MIT Game Theory for Managers

http://ocw.mit.edu/courses/sloan-school-of-management/15-040-game-theory-for-managers-spring-2004/

The Centipede Game

http://www.youtube.com/user/JimBobJenkins#p/c/102B69CCA6049B6C/16/NZxOO-y4I0s

Problems with Backward Induction


http://www.youtube.com/watch?v=cW-JTaJD4Ek&feature=rec-LGOUT-exp_stronger_r2-2r-14-HM
William Spaniel (короткие видео по отд темам)

http://www.youtube.com/user/JimBobJenkins#g/c/102B69CCA6049B6C
2.1. ДИНАМИЧЕСКИЕ ИГРЫ С ПОЛНОЙ(COMPLETE) И СОВЕРШЕННОЙ(PERFECT) ИНФОРМАЦИЕЙ.

В играх с совершенной информацией ранее сделанные ходы обозримы для всех игроков (как в дуополистических моделях Штакельберга и ценового лидерства). В играх, рассматриваемых в экономической литературе, как правило предполагается наличиеperfectrecall, т.е. игроки не забывают сделанные ими ходы, и, вообще, всю информацию, однажды ставшую им известной.

Вернемся к рассмотрению игры MatchingPennies, полагая что игроки не одновременно, а последовательно выбирают ту или иную сторону монеты орел или решку, сообщая о своем выборе противнику.



Различие между ходом и стратегией в динамической игре.

Для одношаговых игр это различие несущественно(чистые стратегии совпадают с возможными ходами). Но его следует отчетливо осознавать, рассматривая динамические(многошаговые)игры.

Ход (action): выбор орла(О) или решки(Р)

Cтратегия - полный перечень действий игрока, которые следует предпринять при различных ситуациях , в которых игрок может оказаться

Стратегии второго игрока:

s1:

если игрок 1 сыграл О,играть О ;

если игрок 1 сыграл Р, играть О,

всегда играть О

(always O - AO)

s2:

если игрок 1 сыграл О,играть Р;

если игрок 1 сыграл Р, играть Р,

всегда играть Р

(always P - AP)

s3:

если игрок 1 сыграл О, играть О; если игрок 1 сыграл Р, играть Р,

повторение хода 1- го

игрока (F - follow)

s4:

если игрок 1 сыграл О, играть Р ;

если игрок 1 сыграл Р, играть О,

играть наоборот

(VV)

У первого игрока в данном случае только две стратегии(О и Р).

Если бы игру начинал второй игрок - все было бы наоборот.

Нормальная форма представления этой


второй игрок

последовательной игры:

s1

АО

s2

АР

s3

F

s4

VV




орел

-1,+1

+1,-1

-1,+1

+1,-1

первый игрок

решка

+1,-1

-1,+1

-1,+1

+1,-1

Стратегия s3 для игрока 2- доминирующая
МЕТОД ОБРАТНОЙ ИНДУКЦИИ(BACKWARDSINDUCTION) МОДЕЛЬ ТОРГА(BARGAINING GAME)

РУБИНШТЕЙНА - СТИГЛИЦА(RUBINSTEIN-STIGLITZ)

Рассмотрим последовательную игру



Начнем анализ в рассмотрения последней стадии, в ходе которой(разумеется, если игра не будет окончена ранее, первый игрок выберет Т(3 > 0). Осознавая это, второй игрок ходом ранее несомненно выберет Т. Его выигрыш составит 1 , что предпочтительнее получения 0 на следующей стадии. Однако понимание того, каким будет предстояший выбор игрока 2, вынуждает игрока 1 закончить игру уже на первой стадии, что позволяет ему получить 2 вместо 1 .

Решая подобные задачи методом обратной индукции, удобно рассматривать следующую последовательность ходов, постепенно отсекая последние этапы игры и перенося выигрыши, которые сулит игрокам их поведение на последующих этапах :



Критика. Впрочем, предсказание исхода игры методом обратной индукции предполагает, как уже отмечалось, не просто рациональность игроков и не просто их осведомленность о рациональности партнера, а неч то большее- "commonknowledge" : " я знаю, что ты рационален; ты знаешь, что я знаю, что ты рационален; ты знаешь, что я знаю, что ты знаешь и т.д. и т.д.". При этом, чем более продолжительной является игра, чем более длинной становится приводимая "цепочка" рассуждений, тем менее убедительно они начинают выглядеть. Более того, заведомая выгодность продолжения игры для обоих партнеров, как в приведенной ниже сentipedegame (Rosenthal,1981) вызывает всё большие сомнения в исходе, предписываемом анализом игры методом обратной индукции, т.е. в выборе D на первом же этапе. При этом возникает естественное стремление оценить вероятность с которой игроки, осознавая свои выгоды от продолжения игры(чем дольше она длится, тем выше выигрыши), возможно будут выбирать А .

сentipede game



Вариант сentipede game (Tirole/ Fudenberg,pp.).

1 А1 2 А2 1 А3 2 А4 1 А5



D1
(1,0)


D2
(0,1)


D3
(3,0)


D4
(2,4)


D5
(6,3)

(5,5)

Следуя логике обратной индукции первому игроку следует выбрать D1, застраховав себя от возможных потерь. Но в конечном итоге оба игрока могут существенно выиграть, продолжив игру, и все зависит от оценки поведения партнера: если игрок 2 полагает, что существует не менее чем 25 % шанс, что игрок 1 выберет А3, то он сыграет А2 , что делает осмысленным и ход А1 .

Задачи:

1. Дайте нормальную(матричную) форму представления приведенной игры.



2.Играется следующая игра: партнер дает Вам $ 100. Вы можете взять эти деньги себе или же отдать их обратно первому игроку, добавив к ним еще $ 100 . Подобная передача денег ( с соответствующим добавлением $ 100) может быть повторена 5 раз. Как Вам следует поступить?

3. Для игры, дерево которой приведено ниже, определите, пользуясь методом обратной индукции, оптимальный ход первого игрока.


Определите методом обратной индукции равновесные по Нэшу чистые стратегии всех трех игроков:

Стратегия третьего игрока:

если первый игрок выберет Т, если второй игрок выберет Т, выбрать ...

если первый игрок выберет Т, если второй игрок выберет В, выбрать ...

если первый игрок выберет В, выбрать ...

Стратегия второго игрока:

если первый игрок выберет Т, выбрать ...

Стратегия первого игрока: выбрать ...

Теорема Zermelo(Zermelo'sTheorem)(Zermelо,1913; Kuhn,1953)

Любая конечная игра с совершенной информацией имеет равновесие по Нэшу в чистых стратегиях, которое может быть найдено методом обратной индукции. Более того, если игроки не имеют одинаковых выигрышей в различных окончательных позициях, методом обратной индукции возможно найти только одно единственное равновесие по Нэшу( что не исключает возможности существования прочихNEв чистых стратегиях)

Доказательство - см.Mas- Colell A., Whinston M.D., Green J.R. Microeconomic Theory, с. 272-273

Экономические приложения:

- модель дуополии Штакельберга( 1934 г)

- Леонтьевская(1946 г.) модель взаимоотношений между фирмой и профсоюзом (монопольным поставщиком рабочей силы).

Модель торга(bargaininggame) Рубинштейна - Стиглица(Rubinstein-Stiglitz)

Пример простейшей модели торга:

А и В делят между собой один доллар.На этот процесс отведено 3 дня.

В первый день предложение о пропорциях раздела делает А. В принимает предложение или отказывается от него.

В случае отказа во второй день соответствующее предложение делает В . Если А отказывается от него, то в третий день он делает В последнее предложение. Если В вновь отклоняет его, то оба игрока не получают ничего.

Игроки различаются между собой индивидуальными ставками дисконта ( для А доллар завтра эквивалентен а долл сегодня, а для В - bдолл.), т.е. один из них менее терпелив.Дополнительно предполагается, что будучи безразличным между двумя предложениями каждый из игроков выберет вариант, более предпочтительный для партнера

Определите, какую часть доллара должен предложить первый игрок второму в первый день, с тем, чтобы он принял это предложение сразу же.






А

В

Используется метод обратной индукции.

3 день

1

0

Если в последний день А предложит В ноль, тот согласится его принять(см.предпосылку)


2 день


а


(1- а)

Зная, что в третий день А может получить доллар целиком, В во второй день предлагает ему сумму (а), эквивалентную 1 доллару в третий день. А должен принять это предложение, доля В при этом (1- а).

1

день



1-(1-a)b


(1- а)b

Зная, что во второй день В получит(1- а), А в первый день предлагает ему (1- а)b, оставляя себе [1-(1- a)b]. В соглашается.

Обратите внимание, что если а =1, b< 1, все достанется А.

Иногда в такого рода моделях задается иное более общее правило раздела средств между игроками на последней стадии игры , а именно - оговорено, что в том случае, если игроки не смогут договориться между собой, эти средства будут поделены между ними в некоей изначально заданной пропорции. Разумеется, с тем чтобы стимулировать заключение соглашения между сторонами, это правило предполагает своего рода штраф: не достигнув компромисса, стороны смогут неким образом разделить между собой лишь оговоренную часть первоначальной суммы. Рассмотренная здесь модель есть частный случай этой более общей постановки, предполагающая , что участники наказываются изъятием всего объекта, подлежавшего разделу.

Задача:

1.(модификация рассмотренной выше задачи)Определите, какую часть доллара должен предложить первый игрок второму в первый день, с тем, чтобы он принял это предложение сразу же, если известно, что в случае, если соглашение не будет достигнуто, на третий день каждый получит по 40 центов.
2.Игроки А и В делят между собой 131 тыс рублей. Процентная ставка для А- 10%, для В - 5 % в день. В первый день В делает предложение А. Если оно отклоняется, то во второй день предложение о пропорциях раздела делает А. В случае отказа В от предложения А, инициатива вновь переходит к В, и он делает последнее предложение А. Если в течение 3-х дней договоренности так и не удалось достичь, в четвертый день А достается 121 тыс руб, а В - 10 тыс руб.

Определите, какую часть доллара должен предложить игрок А игроку В в первый день, с тем чтобы он согласился на него.

2(а)Определите, какую часть доллара должен предложить игрок А игроку В в первый день, с тем чтобы он согласился на него, если во второй день игрок А может сделать повторное предложение игроку В,

а в третий день инициатива переходит к игроку В.

2(б)Определите, какую часть доллара должен предложить игрок В игроку А в первый день, с тем чтобы он согласился на него, если в первый день он делает предложение игроку А(а в дальнейшем они чередуются).
2.2 СОВЕРШЕННЫЕ РАВНОВЕСИЯ ПО НЭШУ (SPNE - SUBGAMEPERFECTNASHEQUILIBRIUM ) ДЛЯ ИГР С СОВЕРШЕННОЙ ИНФОРМАЦИЕЙ. УСЕЧЕНИЕ ИГРЫ(SUBGAME). НЕОБОСНОВАННЫЕ УГРОЗЫ(INCREDIBLETHREATS).

В динамических играх, так же как и в играх статических, остро стоит проблема выбора из равновесий по Нэшу тех из них, которые представляются более "reasonable", т.е. более разумными. Такого роды равновесия, впервые выделенные R. Selten в 1965 году, получили названиe совершенных равновесий по Нэшу (subgameperfectNashequilibrium - SPNE).

Ведем необходимые определения.

Def. "Усечение игры" или "усеченная игра"(subgame) Gsпредставляет собой меньшую игру в пределах большой исходной игры G, которая начинается в одной из неокончательных определенных позиций(decisionnodes) и включает все неокончательные и окончательные позиции, следующие вслед за начальной для данной игры позицией. Иначе говоря, начав играть в усечении игры Gs, партнеры продожают делать это до конца игры G.

Для игр с совершенной информацией - любая из "ветвей" дерева игры G.

Def. (Selten, 1965): равновесное по Нэшу сочетание стратегий игроков (NEequilibrium) обладает свойством совершенства (т.е. является subgameperfectNashequilibrium - SPNE) , если она одновременно является равновесной по Нэшу для всех усечений (subgames) Gsисходной игры G.

Пример 1.

Рассмотрим проблему вхождения фирмы в отрасль, монополизированную другой фирмой. Монополия может смириться с вхождением на рынок новой фирмы, оставив цену на прежнем уровне(высокая - Н), но может и временно снизить ее , чтобы отпугнуть конкурента. В зависимости от того, как она себя поведет, он, в свою очередь, решает для себя вопрос о целесообразности вхождения в отрасль.



Используя метод обратной индукции, найдем равновесный по Нэшу исход этой игры

(a1 *, R2(aM*)) =(низкая; не входить),

где R2(a1*) - реакция конкурента на оптимальное решение монополии aM*, т.е. снижение цены.

С тем, чтобы сформулировать стратегии игрока 2 и выделить все равновесные сочетания стратегий игроков, целесообразно перейти от экстенсивной к нормальной форме представления этой игры:

стратегии игрока 1(монополии):{ цена высокая; цена низкая}

стратегии игрока 2 (конкурента):

1- не входить,если цена низкая; входить, если высокая .

2- никогда не входить

(т.е.не входить,если цена низкая; не входить, если цена высокая)

3- входить всегда

(т.е. входить,если цена низкая; входить, если высокая)

4- не входить, если цена высокая; входить, если низкая







Игрок 2(конкурент)

Игрок 1




1

2

3

4

(монополист)

высокая

40,10

80,0

40,10

80,0




низкая

43,0

43,0

38, -25

38,-25
1   2   3   4


написать администратору сайта