Главная страница
Навигация по странице:

  • LEC

  • Статические игры

  • 4 бескоалиционные(некооперативные) игры


    Скачать 261.08 Kb.
    Название4 бескоалиционные(некооперативные) игры
    Дата22.01.2019
    Размер261.08 Kb.
    Формат файлаdocx
    Имя файла1 games 12.docx
    ТипДокументы
    #64751
    страница1 из 5
      1   2   3   4   5

    ТЕМА 4 БЕСКОАЛИЦИОННЫЕ(НЕКООПЕРАТИВНЫЕ) ИГРЫ.

    БЕСКОАЛИЦИОННЫЕ(НЕКООПЕРАТИВНЫЕ) ИГРЫ С ПОЛНОЙ (СOMPLETE)ИНФОРМАЦИЕЙ.

    ЧАСТЬ1

    СТАТИЧЕСКИЕ (ОДНОШАГОВЫЕ)ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ .

    1.1

    Смешанные стратегии.

    1.2.

    Стратегии доминирующие и доминируемые.

    1.3.

    Равновесие по Нэшу в чистых стратегиях. Наилучшая реакция (best response). Равновесие по Курно.

    1.4.

    Равновесие по Нэшу в смешанных стратегиях.

    ЧАСТЬ2

    ДИНАМИЧЕСКИЕ(МНОГОШАГОВЫЕ) ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ.

    2.1

    Динамические игры с полной (complete) и cовершенной (perfect)информацией. Метод обратной индукции. Модель Штакельберга. Модель торга(bargainingmodel)Рубинштейна- Стиглица. Совершенные равновесия по Нэшу - SPNE(subgameperfectNashequilibrium)для игр с совершенной информацией. Усечение игры(subgame). Необоснованные угрозы.

    . 2.2.

    Динамические игры с полной, но неcовершенной информацией. Информационные множества. Усечения игры в условиях несовершенства информации.

    2.3.

    Игры с полной и "почти" совершенной информацией). Повторяемые игры.

    2.3.1

    Повторяемые игры с конечным числом повторений при единственности равновесия по Нэшу.

    2.3.2

    Повторяемые игры с бесконечным (или неизвестным) числом повторений .

    Стратегия курка: равновесие по Нэшу Условия, способствующие устойчивости соглашений. Стратегия "tit-for-tat".


    Дополн. итература:

    MIT 14.12 Economic Applications of Game Theory


    http://ocw.mit.edu/OcwWeb/Economics/14-12Fall-2005/CourseHome/index.htm

    Lecture Notes

    This section contains documents that could not be made accessible to screen reader software. A "#" symbol is used to denote such documents.

    Below is a selection of lecture notes and recitation notes that approximate chronologically the topics and themes listed on the calendar.

    LEC #

    TOPICS

    LECTURE NOTES

    1

    Introduction to Game Theory

    Lecture (PDF)#

    Slides (PDF)

    2

    Theory of Choice

    Lecture (PDF)#

    Slides (PDF)

    3-6

    Representations of Games

    Extensive Forms and Normal Forms

    How to Play?

    Dominant Strategy Equilibrium and Iterative Elimination of Strictly
    Dominated Strategies

    Nash Equilibrium

    Lecture (PDF)#

    Slides (PDF 1) (PDF 2) (PDF 3) (PDF 4)

    7-9

    Backward Induction

    Subgame Perfection

    Sequential Bargaining

    Lecture (PDF)#

    Slides (PDF 1) (PDF 2)#

    10-11

    Subgame-Perfect Equilibrium and Applications

    Applications of SPE and Single Deviation-Principle

    Slides (PDF 1)# (PDF 2)

    12-13

    Repeated Games

    Finitely and Infinitely Repeated Games with Observable Actions

    Lecture (PDF)#

    Slides (PDF 1) (PDF 2)

    15-18

    Static Games with Incomplete Information

    Applications

    Lecture (PDF 1)# (PDF 2)#

    Slides (PDF 1) (PDF 2)

    РАЗЛИЧНЫЕ ТИПЫ ИГР.

    игры антагонистические (1)

    моделируют конфликты двух лиц , интересы которых прямо противоположны: выигрыш одной стороны составляет проигрыш второй, поэтому у игроков нет почвы для согласования действий.

    игры неантагонистические (2-3)

    описывают конфликты, в которых интересы игроков не являются диаметрально противоположными( в частности, могут совпадать).

    1. игры с фиксированнной суммой


    2. некооперативные

    (бескоалиционные)

    В бескоалиционных играх правила игры не предусматривают возможности вступления игроков в коалиции. В реальных конфликтах такие ограничения возникают иногда из-за "физической" невозможности оъединения или в силу законодательных актов.

    3. кооперативные

    Природа ряда конфликтов допускает возникновение сотрудничества между участниками конфликта(кооперирование, согласование способов действий,обмен информацией и т.п.) В результате стороны могут использовать совместную стратегию. Поэтому эти игры назыв-ся нестратегическими (кооперативными)

    игры стратегические

    (1-2)

    игры нестратегические

    (3)



    Игры:

    критерий разграничения

    cтатические и динамические (многошаговые)

    количество ходов

    с совершенной(perfect) и несовершенной (imperfect) информацией

    Обозримость предыдущих ходов

    с полной(complete) и неполной(incomplete) информацией

    открытость матрицы выигрышей

    конечные и бесконечные игры

    (чистая стратегия - выбор того или иного значения параметра, который изменяется непрерывно: например, цена в модели Штакельберга) .

    Следует отличать от(см. ниже)

    бесконечность множества чистых стратегий хотя бы у одного игрока

    для повторяющихся игр:

    игры с конечным и бесконечным числом повторений

    число повторений исходной игры


    Игрой называется система G= {I; S1,S2 , ..., Sn; U1,U2, ...,Un }

    I- множество игроков;

    Si - множество чистых стратегий i-го игрока (Si =(si1, si2, si3, ..., sik ))

    Ui- функция выигрыша i-го игрока.

    Стратегическая форма представления игры (платежная матрица или матрица выигрышей)

    Пример: бросание монеты (MatchingPennies)







    второй игрок










    орел

    решка




    первый

    орел

    -1,+1

    +1,-1




    игрок

    решка

    +1,-1

    -1,+1




    Игроки выбирают одну из сторон монеты одновременно или же просто не информируя друг друга. Если в результате выясняется, что их выбор совпал первый игрок платит второму $ 1 , если же они выбрали разные стороны монеты, то второй игрок платит$ 1 первому(антагонистическая игра).


    Статические игры

    1.1 CМЕШАННЫЕ СТРАТЕГИИ.

    Если бы во внешнем мире отсутствовала бы неопределенность, то возможно было бы выработать некую чистую стратегию, в наибольшей степени соответствующую складывающейся ситуации (например, купить акции именно той компании, которой уготован наибольший успех, или выбрать специальность, которая окажется наиболее востребованной на рынке в будущем). Но подобный точный прогноз невозможен: игрок не в состоянии предугадать "состояние мира " и предсказать заранее реакцию партнеров по игре(например, тех, кто стоит перед аналогичным выбором ) и пр. Кстати говоря, выпадающее "состояние мира" также может быть рассмотрено как результат действия игрока –«Природа» (Nature).

    В некоторых ситуациях непредсказуемость действий партнеров по игре(включая "природу") искупается тем, что существуют так называемые доминирующие стратегии, т.е. стратегии наиболее предпочтительные вне зависимости от поведения прочих игроков. Впрочем, существование доминирующих стратегий, т.е. полная независимость выбора от поведения прочих игроков, встречается нечасто, и, как прав ило, игрок все же выигрывает от повышения степени своей информированности, подобно вратарю, знающему в какую часть ворот будет пробит пенальти.

    Сталкиваясь с неопределенностью, игрок, выбирая собственную стратегию, опирается на имеющееся у него представление о вероятностях, с которыми его партнеры будут избирать ту или иную стратегию, т.е. приписывает некие субъективные вероятности (subjectiveprobabilities) возможным стратегиям поведения партнеров по игре.

    С учетом этих вероятностей индивид и выбирает чистую стратегию, обеспечивающую ему получение наивысшей ожидаемой полезности. Но могут ли индивиды отклоняться от некоторой заданной линии поведения(чистой стратегии) прибегая к использованию смешанных стратегий, и что может служить объяснением такого рода отклонений ?

    Впрочем, следует вначале дать определение смешанной стратегии.

    Def. При данном (конечном) множестве чистых стратегий i-го игрока Siсмешанная стратегия i представляет собой вероятностное распределение, приписывающее каждой чистой стратегии i - го игрока

    sikSi , k=1,...K, вероятность ≥ 0, k= 1.

    Чистая стратегия может рассматриваться как частный случай смешанной стратегии, в которой одной из чистых стратегий приписана вероятность 1.

    1(s1k)- вероятность, с которой игрок 1 выберет k- ую чистую стратегию s1kS1 , где S1 - множество чистых стратегий игрока 1.

    2(s2j)- вероятность, с которой игрок 2выберет j- ую чистую стратегию s2jS2 , где S2 - множество чистых стратегий второго игрока

    Смешанная стратегия первого игрока

    1 =(1(s11),1(s12),...,1(s1K))

    Смешанная стратегия второго игрока

    2 =(2(s2 1),2(s22), ...,2(s2 J))

    Смешанные стратегии игроков можно рассматривать как задаваемые своими барицентрическими координатами точки ( k -1)-мерного симплекса(рис.4.1.).

    Рис.4.1.

    Возвращаясь к интерпретациям смешанных стратегий, следует указать как на возможность того, что , прибегая к смешанным стратегиям, игрок повышает свой выигрыш за счет понижения степени предсказуемости своего поведения. Но такого рода объяснение уместно лишь в повторяющихся динамических играх. Если же говорить о играх статических, то возможно указать на две причины, обусловливающие целесообразность рассмотрения смешанных стратегий.

    Во-первых, использование смешанных стратегий( например, диверсификация портфеля ценных бумаг) может иметь преимущества перед использованием чистых стратегий( вложением средств в акции лишь одной из фирм). Вспомним пример, упомянутый ранее. Доходность акций первой фирмы составляет 20 % в первом и 10% - во втором состоянии( будем полагать их равновероятными) и наоборот.







    Состояние 1

    Состояние 2

    Инвестор

    Акции первой фирмы

    u(110), ...

    u(120), ...




    Акции второй фирмы

    u(120), ...

    u(110), ...


    Поровну распределив исходные средства ( 100 долл) между покупкой этих акций, инвестор обеспечит себе гарантированное получение 15% дохода. В подобном случае полезность u(E(W)) будет выше, чем ожидаемая полезность выбора любой из чистых стратегий  Eu.
    Во-вторых, смешанные стратегии упрощают рассмотрение ситуаций асимметричной информации. Например, часть игроков всегда выбирают одну чистую стратегию, а оставшаяся часть - другую чистую стратегию(например, одни всегда тщательно запирают машины, а другие - нет). Не будучи в состоянии различить, к какой из этих подгрупп принадлежит агент, вступающий в игру(например, обращающийся за страховкой), его партнер по игре будет предполагать, что он имеет дело с неким игроком, прибегающим к смешанной стратегии( вероятности использования чистых стратегий которым будут определяться относительной численностью подгрупп).

    1.2. СТРАТЕГИИ ДОМИНИРУЮЩИЕ И ДОМИНИРУЕМЫЕ.

    Обозначим S-i множество стратегий всех игроков за исключением i- го игрока.

    Def. Доминирующейстратегией i- го игроканазывается стратегия , обеспечивающая игроку наибольший выигрыш(полезность) вне зависимости от выбора, , который делают его партнеры по игре, т.е.

    U ( si*, s-i) ≥ U( si, s-i) для любых













    COLUMN













    left(L)

    right(R)







    ROW

    top(T)

    1,1

    2,2










    bottom(B)

    2,3

    3,4

      Графически доминирующая стратегия может иллюстрироваться двояким образом. На рисунке 4.2.а вертикальным осям, каждая из которых соответствует той или иной чистой стратегии противника(второго игрока), откладываются все возможные выигрыши первого игрока. Каждой чистой стратегии первого игрока соотвествует некий набор точек(по одной на каждой из вертикальных осей). Доминирующей же стратегии соответствует набор точек, занимающих наивысшие позиции на каждой из осей ( или прямая линия, проходящая выше линий, соответствующих прочим чистым стратегиям).

    Рис.4.2.а

    Рис.4.2.б

    Иначе те же вертикальные оси можно полагать осями n- мерного пространства (где n- количество чистых стратегий второго игрока). Тогда каждой чистой стратегии первого игрока будет соответствовать некая точка этого пространства(рис.4.2.б), адоминирующую стратегию можно представить как точку лежащую северо-восточнее всех прочих точек.

    Строго доминирующие стратегии могут существовать у обоих игроков, (в нашем примере - это стратегии В иR). В подобных случаях наблюдается равновесие в доминирующих стратегиях, предполагающее полную независимость игроков друг от друга.

    При наличии у игрока доминирующей стратегии все прочие его стратегии стратегии являются доминируемыми и могут быть отброшены.

    Подобное элиминирование доминируемых стратегий, разумеется, возможно не только при наличии у игрока доминирующей статегии. Некоторые стратегии, не являясь доминирующими(т.е. абсолютно предпочительными), могут в то же время быть относительно предпочтительней части других , так называемых доминируемых стратегий.

    Рассмотрим новую игру, отличающуюся от предыдущей лишь добавлением третьей статегии (М) первого игрока . В этой игре отсутствую доминирующие стратегии, но стратегия В по-прежнему доминирует стратегию T.













    COLUMN













    left(L)

    right(R)







    ROW

    top(T)

    1,1

    2,2










    middle(М)

    4,2

    1.5, 1










    bottom(B)

    2,3

    3,4




    Рис.4.3.а

    Рис.4.3.б

    Строго доминируемые стратегии имеют строго меньшие значения выигрыша(полезности) по всем возможным стратегиям партнеров s-i, чем некая иная стратегия или стратегии этого игрока, а слабо доминируемые - значения равные и меньшие(хотя бы для одного s-i).

    Иначе говоря:

    Def.1 Стратегия i-го игрока в игре G является строго доминируемой, если существует иная стратегия , такая, что для всех

    U ( si*, s-i) ≥ U ( si, s-i), т.е. при любых обстоятельствах есть другая стратегия - более предпочтительная.

    Строго доминируемые стратегии следует вычеркнуть из игры, упростив ее структуру. При этом вычеркивание одной из чистых доминируемых стратегий одного игрока, часто позволяет избавиться и от части чистых стратегий другого игрока. Рассмотрим следующую игру:







    B










    B1

    b2

    b3

    b4

    А1

    1, 3

    3,0

    2,2

    10,1

    A а2

    2, 0

    4,4

    5,3

    0,2

    А3

    5,2

    0,3

    3,2

    10,0

    А4

    5,1

    6,4

    0,2

    3,0

    Среди стратегий игрока Aнет доминируемых стратегий, лишь стратегия b4 второго игрока доминируется стратегией b3. Но элиминирование стратегии b4 позволяет избавиться от стратегии а1( после вычеркивания последнего столбца, содержащего высокий выигрыш именно в первой строке) она начинает доминироваться стратегией а2. Вычеркивание первой строки устраняет возможность нулевого выигрыша при выборе b2 , и эта стратегия начинает доминировать b2 и т.д(продолжите сами). Однако следует подчеркнуть, что для элиминирования строго доминируемых стратегий недостаточно простого предположения о рациональности игроков. Необходимо предположить нечто большее:

    • игрок Aзнает, что игрок В рационален ( и не выберет b4),

    • игрок В знает, что игрок Aзнает, что игрок В рационален

    ( и, соответственно, игрок A никогда не выберет а1),

    • игрок А знает, что игрок В знает, что игрок А рационален и т.д.

    Подобное предположение нетождественно обычной рациональности, а представяет собой нечто большее - так называемое "общее знание" - commonknowledge). Длина цепочки зависит от количества последовательных шагов по элиминированию стратегий, чем она длинее - тем большие сомнения начинает порождать принятие подобной предпосылки.

    Допустимость последовательного элиминирования доминируемых стратегий становится тем более сомнительным, если речь идет о элиминировании слабо доминируемых стратегий. Дело в том, что эта процедура может значительно изменить стратегическую природу игры, поскольку конечный результат в некоторых случаях находится в непосредственной зависимости от от порядка (последовательности) элиминирования слабо доминируемых стратегий.

    Пример:




    L

    R

    В приведенном примере выделите слабо доминируемые

    T

    5,1

    4,0

    стратегии и попытайтесь получить конечный результат,

    M

    6,0

    3,1

    Начав вначале с одной, а затем с другой слабо

    B

    6,4

    4,4

    доминируемой стратегии.

    Дальнейшее уточнение определения доминируемой стратегии обусловлено учетом того обстоятельства, что при определенных ситуациях стратегия siможет доминироваться одной стратегией , а при других - другой. Например: если игрок 2 будет выбирать L , то игроку 1 выгоднее выбрать T, а если игрок 2 предпочтет сыграть R, то игроку 1 следует играть B
      1   2   3   4   5


    написать администратору сайта