Главная страница

институциональная экономика коллоквиум 1 бизнес-информатика 4 курс 2018 год. Институциональная экономика вопросы к коллоквиуму


Скачать 1.78 Mb.
НазваниеИнституциональная экономика вопросы к коллоквиуму
Анкоринституциональная экономика коллоквиум 1 бизнес-информатика 4 курс 2018 год
Дата31.10.2019
Размер1.78 Mb.
Формат файлаpdf
Имя файлаInstitutional_Economics.pdf
ТипДокументы
#92908
страница3 из 6
1   2   3   4   5   6
Рассмотрим игру:
H
H
H
H
H
P
1
P
2
L
R
T
3;5*
2;4
B
*5;3*
*3;2
Вне зависимости от стратегии игрока 2, B является лучшей стратегией игрока 1 по сравнению с
T . В таком случае говорят, что B доминирует T .
Различают слабое и сильное доминирование. Слабое доминирование означает, что все выигрыши в доминируемой стратегии не меньше соответствующих выигрышей в доминирующей. Формально "s слабо доминирует s
0
"записывается следующим образом:
∀s
−i
∈ S
−i
: u(s, s
−i
) ≥ u(s
0
, s
−i
),
где s
−i
- набор ходов всех игроков, кроме i.
Сильное доминирование означает, что все выигрыши доминируемой стратегии меньше соответству- ющих выигрышей доминирующей:
∀s
−i
∈ S
−i
: u(s, s
−i
) > u(s
0
, s
−i
),
В некоторых играх у одного из игроков есть стратегия, сильно доминирующая все остальные - в таком случае игра сильно упрощается, так как остальные игроки знают, что он будет играть именно эту стратегию, и будут выбирать свои ходы соответствующим образом. Но такое происходит далеко не всегда.
Однако есть еще один способ воспользоваться концепцией доминирования при решении игр. Если какая-то стратегия строго доминируема хотя бы одной другой, то мы точно знаем, что игрок не будет ее играть, так как при любом раскладе ему выгоднее поменять решение. Поэтому мы можем вычеркнуть эту стратегию из игры - если все игроки знают, что ее никогда не будут играть, то ее нет смысла учитывать в анализе. Этот прием называется элиминированием строго доминируемых стратегий.
20

В некоторых играх участники могут элиминировать несколько стратегий по очереди. Например,
рассмотрим такую игру:
H
H
H
H
H
P
1
P
2
L
M
R
T
2;2 5;1 2;0
M
3;1 1;-1 3;5
B
4;5 4;-1 4;3
Мы видим, что стратегия M второго игрока строго доминируется L, поэтому мы можем ее элими- нировать:
H
H
H
H
H
P
1
P
2
L
M
R
T
2;2 5; 1 2;0
M
3;1 1; −1 3;5
B
4;5 4; −1 4;3
Т.к. стратегия M второго игрока элиминирована, мы можем больше ее не учитывать и, по сути,
получили новую, редуцированную, игру. Теперь мы видим, что в редуцированной игре стратегия
B первого игрока доминирует все остальные. Поэтому мы можем их элиминировать:
H
H
H
H
H
P
1
P
2
L
M
R
T
2; 2 5; 1 2; 0
M
3; 1 1; −1 3; 5
B
4;5 4; −1 4;3
Наконец, у второго игрока в оставшихся двух стратегиях L доминирует R:
H
H
H
H
H
P
1
P
2
L
M
R
T
2; 2 5; 1 2; 0
M
3; 1 1; −1 3; 5
B
4;5 4; −1 4; 3
Таким образом, мы получили s = {B, L} - равновесие, достигнутое удалением строго доми- нируемых стратегий. Это равновесие будет являться равновесием Нэша (см. пункт 16).
Следует упомянуть, что также можно искать равновесие путем удаления слабо доминируемых стратегий, однако этот способ может привести к разным равновесиям в зависимости от порядка исключения.
Напоследок следует рассмотреть доминирование смешанными стратегиями. Смешанная стра- тегия - это стратегия, составленная из чистых стратегий (то есть стратегий, заданных в игре изначально) с некоторыми вероятностями. На практике это означает, что игрок "подбросит мо- нетку" , когда придет время игры, и сыграет какую то из чистых стратегий в зависимости от результата
1
. Игрок может найти такие смешанные стратегии, что он сможет вычеркнуть чистые стратегии, которые до этого не были доминируемыми.
Рассмотрим следующую игру:
1
Здесь и далее мы будем считать, что в ячейках уже стоят значения полезности, а не выигрыши. Это позволит нам абстрагироваться от отношения игрока к риску, т.к. иначе бы пришлось искать ожидаемую полезность, подставляя значения в функцию полезности, которую мы даже не знаем.
21

H
H
H
H
H
P
1
P
2
L
R
T
9;1 1;0
M
5;2 4;3
B
2;5 10;2
С одной стороны, ни у одного игрока нет строго доминируемых стратегий, с другой, мы можем заметить, что у стратегий T и B первого игрока большой разброс значений. Если мы возьмем их с некоторыми вероятностями, мы можем получить такие ожидаемые полезности, что смешанная стратегия будет доминировать M . Пусть игрок 1 играет стратегию T с вероятностью α, а стратегию
B с вероятностью, соответственно, 1 − α. Тогда ожидаемая полезность будет равна выигрышам от стратегий T и B с данными весами, и она должна быть больше, чем ожидаемая полезность стратегии M :
(
9α + 2(1 − α) > 5,
α + 10(1 − α) > 4 3
7
< α <
2 3
Действительно, мы нашли, что при определенных значениях α смешанная стратегия доминирует
M , поэтому мы можем ее элиминировать:
H
H
H
H
H
P
1
P
2
L
R
T
9;1 1;0
M
5; 2 4; 3
B
2;5 10;2
В редуцированной игре L доминирует R, и мы можем найти равновесие:
H
H
H
H
H
P
1
P
2
L
R
T
9;1 1; 0
M
5; 2 4; 3
B
2; 5 10; 2 15
Дилемма заключенных. Равновесие в доминирующих стра- тегиях. Примеры взаимодействий, описываемых этой иг- рой.
Интересной игрой, предложенной Фладом и Дрешером в 1950, является "Дилемма заключенно- го". Она показывает, что игроки, преследуя частные цели, могут отказаться от кооперации, даже когда она в их интересах.
Игра формулируется следующим образом: двух преступников, участвовавших в одном ограблении,
ловят и разводят по разным комнатам. Им обоим предлагают дать показания на своего подельника в обмен на свободу. Если она оба сдают друг друга, им обоим присуждают срок среднего размера.
Если только один сдает другого, то он остается на свободе, в то время как другой преступник получает большой срок. Наконец, если никто никого не сдает, то оба получают небольшой срок,
так как никаких улик ни нак кого из них нет.
В биматричном виде игру можно представить следующим образом:
22

H
H
H
H
H
P
1
P
2
S
B
S
5;5 0;9
B
9;0 1;1
Мы видим, что в данном случае у обоих игроков доминирующей стратегией является предательство
(B), поэтому мы можем сразу найти единственное оставшееся решение:
H
H
H
H
H
P
1
P
2
S
B
S
5; 5 0; 9
B
9; 0 1;1
Такое решение будет называться равновесием в доминирующих стратегиях. По сути, такое равновесие можно считать частным случаем равновесия, полученного элиминированием строго доминируемых стратегий (см. пункт 14), в котором у каждого игрока есть стратегия, строго до- минирующая все остальные, поэтому игру можно в один шаг редуцировать к однозначному набору стратегий.
Что же до самой игры, то мы видим, что эгоистичный выбор игроком лучшей для него стратегии ведет игроков к неоптимальному равновесию, худшему по сравнению с получаемым при коопера- ции. Но каждому из игроков выгодно отклониться от кооперации, потому что при предательстве он получит больше.
В реальной жизни достаточно много примеров дилеммы заключенного:
• В поведенческой экономике примером модифицированной игры заключенного является нар- котическая зависимость. Зависимый, по сути, играет с самим собой в будущем, и у него есть выбор - он может принять наркотики или воздержаться сейчас или в будущем. Данный пример не является примером "чистой"дилеммы заключенного, так как принятие наркотика в буду- щем при воздержании сейчас сводит на нет все усилия, связанные с воздержанием, и поэтому размер выигрыша "будущего"зависимого при принятии наркотика сейчас, но воздержании в будущем, выше, чем воздержании сейчас и релапсе. В итоге доминирующей стратегией зависимого становится принятие наркотика в текущие момент на каждом шаге игры.
• В спорте примером дилеммы заключенного является допинг. Если два спортсмена соревнуют- ся, у каждого из них есть выбор - принимать допинг или нет. Если никто из них не принимает допинг, то они просто соревнуются между собой без явного преимущества. Если один при- нимает допинг, а другой не принимает, то спортсмен с допингом побеждает. Если же оба принимают допинг, то никто не получает явного преимущества, но оба получают проблемы медицинского и юридического характера.
• В экономике примером дилеммы заключенного является реклама. Если две фирмы в дуополь- ной индустрии чрезмерно много рекламируются, то это отпугивает покупателей и уменьша- ет прибыль обоих фирм. Они бы могли получить большую прибыль, если бы одновременно уменьшили интенсивность рекламы. Однако, если одна фирма уменьшит интенсивность ре- кламы, а вторая ничего не будет делать, то все клиенты будут знать только о второй фирме,
и она получит монопольную власть на рынке.
Можно также привести несколько приверов дилеммы заключенного с большим количеством игро- ков:
• В welfare economics сбор добровольных пожертвований на социальное благо является дилем- мой заключенного с множеством игроков. Если один гражданин на заплатит сбор, а осталь- ные заплатят, то он выиграет за счет того, что он все равно сможет пользоваться социальным благом, при этом сохранив деньги. Однако, если все граждане применят такую стратегию,
социальное благо будет недоступно из-за недостатки финансирования.
• Картельный сговор всегда разрушается, потому что сводится, по сути, к дилемме заклю- ченного. Участники картеля должен поддерживать одну и ту же цену, однако если один из
23
участников понизит свои цены, он сможет переманить покупателей у остальных и получить монопольную власть.
16
Наилучшие реакции и равновесие по Нэшу. Нахождение равновесия по Нэшу в биматричных играх. Возможная неединственность или отсутствие равновесия по Нэшу.
До этого (см. пункты 13-15) мы находили различные виды равновесий, однако есть вид равно- весия обобщающий все предыдущие - равновесие Нэша.
Равновесие Нэша - это такой набор (профиль) стратегий игроков, что им невыгодно отклоняться в какую-либо другую стратегию при заданных стратегиях других игроков. Формально это обозна- чается следующим образом:
∀i, ∀s i
∈ S
i
: U
i
(s

i
, s

−i
) ≥ U
i
(s i
, s

−i
),
где s

i
- стратегия i-го игрока из оптимального по Нэшу профиля, s

−i
- стратегии из оптимального по Нэшу профиля всех игроков, кроме i.
Найти равновесие по Нэшу можно при помощи выделения наилучших реакций игроков. Например,
рассмотрим следующую игру:
H
H
H
H
H
P
1
P
2
L
R
T
3;5 2;6*
B
*5;3*
*3;2
В этой игре наилучшей реакцией на стратегию B первого игрока является стратегия L второго игрока, и в то же время на стратегию L второго игрока лучшая реакция - стратегия B. В данном случае равновесием Нэша будет s

= {B, L}. Если мы проверим его определение, то мы увидим,
что игрокам действительно некуда отклониться при фиксированном ходе другого игрока.
При этом следует помнить, что равновесие Нэша может существовать и в смешанных стратегиях.
Для того, чтобы его найти, нам нужно вычислить так называемые функции реакции - зависи- мости стратегии одного игрока от стратегии другого.
Рассмотрим следующую игру:
H
H
H
H
H
P
1
P
2
L
R
T
5;3 4;-8
B
-5;-7 7;-2
Здесь есть два явных равновесия Нэша - s

1
= {T, L} и s

2
= {B, R}. Но нам необходимо проверить,
присутствуют ли еще равновесия в смешанных стратегиях.
Игроки изначально не знают стратегию другого игрока, поэтому они будут оптимизировать свою стратегию относительно какого-то параметра, например, относительно вероятности сыграть ту или иную стратегию, или относительно объема производства (как в дуополии Курно).
Пусть 1 игрок играет стратегию T с вероятностью α и B с вероятностью 1 − α, а второй игрок играет L с вероятностью β, а R - с вероятностью 1 − β.
Тогда найдем ожидаемую полезность каждого игрока. Она будет равна сумме вероятностей про- филей стратегий, умноженных на полезность игрока от профиля, а именно:
EU
1
= 5αβ − 5(1 − α)β + 4α(1 − β) + 7(1 − α)(1 − β)
24

EU
2
= 3αβ − 7(1 − α)β − 8α(1 − β) − 2(1 − α)(1 − β)
Если мы теперь найдем производные ожидаемых полезностей по параметрам, контролируемым игроками, мы сможем определить кривые реакции:
dEU
1

= 5β − 5β + 4 − 4β + 7β − 7 = 13β − 3
dEU
2

= 3α − 7 + 7α + 8α + 2 − 2α = 16α − 5
Отсюда мы можем вывести кривые реакции. Например, для первого игрока β <
3 13
полезность убывает, поэтому ему имеет смысл приравнять вероятность α к нулю в этом случае, а если β =
3 13
,
то α может быть любым, т.к. производная равна нулю и функция не зависит от α. В итоге мы получаем следующие кривые реакции:
α

=





1, β >
3 13
,
0, β <
3 13
,
∀, β =
3 13
,
β

=





1, α >
5 16
,
0, α <
5 16
,
∀, α =
5 16
,
Если мы изобразим их на графике, то сразу сможем найти все равновесия Нэша:
Пересечения кривых реакции будут равновесиями Нэша.
В данном случае мы получили два равновесия Нэша в чистых стратегиях (это говорит о том, что равновесия в чистых стратегиях являются частным случаем равновесия в смешанных стратегиях с какой-то из вероятностей, равной 1). Мы также нашли третье равновесие, а именно s

3
= {
5 16
T +
11 16
B,
3 13
L +
10 13
R}.
По этому же примеру мы можем увидеть, что равновесие Нэша часто бывает не единственным.
При этом по теореме Нэша, принесшей ему Нобелевскую премию, в любой некооперативной игре есть хотя бы одно равновесие Нэша в смешанных стратегиях.
25

17
Сопоставление равновесия в доминирующих стратегиях и равновесия по Нэшу.
Очевидно, что любое равновесие в доминирующих стратегиях будет равновесием по Нэшу. Ес- ли профиль является равновесным в доминирующих стратегиях, то все остальные стратегии по определению являются доминируемыми, и игроку невыгодно в них отклоняться. Поэтому данный профиль будет по определению равновесным по Нэшу.
Более, того, учитывая, что в определении равновесия по Нэшу стратегии в равновесии должны давать просто не меньшую полезность, чем остальные стратегии, любое равновесие в слабо доми- нирующих стратегиях так же будет равновесием по Нэшу.
Про остальную информацию про равновесие по Нэшу и равновесие в доминирующих стратегиях,
см. пункты 15 и 16.
18
Динамические игры и их представление в виде дерева иг- ры. Понятие стратегии в динамических играх.
Мы хотим анализировать не только статические игры, где есть только один ход, но и пошаговые.
Традиционный способ представления пошаговых, или динамических, игр - в виде дерева:
Заметим, что в зависимости от первого хода игрока 1 возможные ходы игрока 2 будут разными.
В данном дереве вершины, из которых совершают ход игроки, называются позициями, а ребра из каждой вершины - альтернативами. Окончательные позиции называются терминальными.
Важно различать понятие стратегии в статических и динамических играх. В то время как в ста- тических играх игроки могли сделать только один ход, и поэтому понятия стратегии и хода были эквивалентны, в динамических играх стратегия будет представлять набор ходов, а, если быть точ- нее, ход игрока (альтернативу) в каждой позиции, где он может ходить. Даже если рассматриваемое равновесие никогда не войдет в вершину, ход из нее все равно должен быть отражен в стратегии игрока. Если же все ходы является оптимальными на каждом этапе и в каждой ветке, профиль стратегий игроков называется совершенным по подыграм равновесием по Нэшу (SPNE).
Более формально - профиль стратегий является SPNE, если в каждой подыгре (поддереве) соот- ветствующие стратегии образуют равновесие по Нэшу.
26

19
Предпосылка "общего знания(common knowledge)"и метод обратной индукции
Для разрешения динамических игр мы можем использовать метод обратной индукции. Он за- ключается в следующем - зная, что на своем ходу индивид пытается максимизировать свою полез- ность, мы можем пойти с конца и начать сворачивать несколько альтернатив к одному результату,
зная, что индивид всегда выберет для себя лучшую из альтернатив. Например, рассмотрим следу- ющую игру:
Данная игра называется моделью торга (bargaining model).
Посмотрим на последнюю нетерминальную вершину, в которой ходит 1 игрок: в нем он выбирает между тем, чтобы получить 0 или 3, поэтому он, очевидно, выберет B. После этого 2 игрок выбирает между T , который, в результате хода 1 игрока, даст ему 0, или B, дающим ему 1. Разворачивая таким образом игру, мы можем прийти к конечному решению:
Как мы видим, метод обратной индукции позволил нам прийти к равновесию Нэша: 2 игрок не будет менять свой единственный ход, потому что иначе он получит 0, а 1 игрок получит 1, если поменяет свой первый ход, и ничего не изменит, если поменяет второй.
Теорема Цермело говорит нам, что в любой конечной динамической игре есть равновесие Нэша,
которое можно найти обратной индукцией, причем, если у индивидов нет равных выигрышей среди альтернатив, оно будет единственным. Однако важно понимать, что у игры могут быть и другие равновесия Нэша, как в чистых, так и смешанных стратегиях.
Метод обратной индукции опирается на предпосылку "общего знания", говорящую нам о том,
что индивиды способны следить за этой рекурсивной логикой: я знаю, что другой игрок походит следующим образом, поэтому я похожу так, но другой игрок знает об этом, и на этом ходу походит так...
Если мы принимаем предпосылку о том, что индивиды абсолютно рациональны, мы можем пред- положить, что они способны проследить за логической цепочкой любой длины, однако на практике это будет смелым предположением. Если игра достаточно большая и разветвленная, то индивид скорее всего не сможет в какое-то разумное время "свернуть"все альтернативы и найти решение
(возьмите за пример шахматы, где число альтернатив растет экспоненциально с каждым ходом).
27

20
Простейшая модель торга (дележка доллара). Факторы,
обусловливающие пропорции раздела.
Рассмотрим следующую задачу, называемую моделью торга Рубинштейна-Стиглица:
А и В делят между собой один доллар.На этот процесс отведено 3 дня. В первый день предложение о пропорциях раздела делает А. В принимает предложение или отказывается от него. В случае отказа во второй день соответствующее предложение делает В. Если А отказывается от него, то в третий день он делает В последнее предложение. Если В вновь отклоняет его, то оба игрока не получают ничего. Игроки различаются между собой индивидуальными ставками дисконта (
1   2   3   4   5   6


написать администратору сайта