Главная страница

теориия игр. Лекции по теории игр вводный уровень


Скачать 1.71 Mb.
НазваниеЛекции по теории игр вводный уровень
Анкортеориия игр
Дата29.03.2023
Размер1.71 Mb.
Формат файлаpdf
Имя файлаgamestheory0_230130_141053.pdf
ТипЛекции
#1022531
страница3 из 10
1   2   3   4   5   6   7   8   9   10
x
2
оказались совместимы, графически совмеще- ны. Выбор потребителя с выпуклым предпочтением есть точка (или точки) касания бюджетного треугольнике наивысшей из его линий уровня, задевающих бюджетное множество. Если это точка не угловая, то это касание означает пропорциональность градиентов полезности и цен:
∇u
i
= α p,
то есть, MRS
i
(k/ˆk) :=
˙u
ik
(x
i
)
˙u
iˆ
k
(x
i
)
=
p
k
p
ˆ
k
∀k, ˆk.
Тем самым, внутренние равновесия будут характеризоваться такими же диффе- ренциальными условиями, что и Парето-граница, плюс бюджетные ограничения в форме равенгств: px
i
=
i
. Это и означает, что ценовая линия, выходя из точки на- чальных запасов, должна отделить в точке равновесия более желательное множество одного от более желательного множества другого участника.

1.4. Вальрасовское равновесие и ядро в игре обмена
17 6
-
0
¾
?
x
2
x
1
z
1
z
2
ω
¯
x
6
-
0
¾
?
x
2
x
1
z
1
z
2
ω
¯
x
0 0
µ
µ
ª
®
µ
µ
ª
ª
*
*
¾
®
6
Рис. 1.1: Графическое нахождение равновесий Вальраса.
По сути, диаграмма Эджворта – это и есть два бюджетных треугольника (один из которых перевернут), совмещенные ценовой линией и начальными запасами.
Если выборы участников на бюджетных множествах (у каждого на своем) совме- стились, то это равновесие.
Та же идея для краевых равновесий. Рассмотрим
Пример. Два участника, целевые функции линейны: u
x
= x
1
+ x
2
, u
z
= z
1
+ 2z
2
,
ω
x
= (1, 1), ω
z
= (3, 2). Найдем последовательно сужая: Парето, ядро и равнове- сие. Легко видеть по критерию "зоны улучшения для двоих"(см. выше), что Парето пойдет по правой и нижней грани ящика. Далее,как мы выясняли, ядро окажется от- резком из Парето, лежащим между двух линий уровня, проходящих через начальный запас, см. Рис.
Остается выбрать равновесие.
1) Предположим, равновесие где-то посредине отрезка ядра. Тогда, легко понять,
второй участник выбрал бы свое потребление z на верхнем для него (нижнем на рисунке) углу своего бюджетного множества. Потому, что он ценит 2-й товар вдвое выше первого, а любая ценовая линия идущая из начального запаса во внутренность ядра, ценит 2-й менее чем вдвое против 1-го товара. Этот угол выходит за край бюджетного множества, но потребителя это не должно волновать. Аукционист его спросил: сколько бы ты хотел потреблять при таких ценах, он и ответил. Не его дело учитывать обще системные ограничения наличия товаров, а дело аукциониста.
Итак, во внутренности ядра равновесий нет. В левом углу ядра равновесия нет по тем же причинам: 2-й потребитель предъявляет слишком большой спрос на 2-й товар, это не равновесие. Но где-то же оно должно быть, по теореме существования:
целевые функции непрерывны, возрастают и вогнуты, запасы внутренние.
Проверяя правый угол ядра, увидим, что это равновесие. Для второго участника ценовая линия параллельна линиям уровня, и он согласен на любой выбор из нее. А
первый выбирает свой правый угол. Они договорятся в отмеченной точке ¯
x.
Общее правило таких краевых равновесий: условие касательности линии уровня

18
Глава 1. Предпочтения, кооперативные игры, общее равновесие
и ценовой линии обязательно для того участника, для кого равновесие внутреннее а не краевое в его бюджетной линии.
Для участника же, для которого равновесие в углу, условие аргмаксимума выра- зится в "касательности” в форме неравенства:
¯
x
2
= 0 =>
˙u
x2

x)
˙u
x1

x)

p
2
p
1
.
1.5
Ядро в играх с трансферабельной полезностью и дележи
(Лекция 5)
Напомним:
Определение.
Ядром игры называется множество альтернатив, не блокируемое никакой коалицией. Калиция S блокирует (отвергает)
какую-либо альтернативу x, если имеет в своем распоряжении (что бы ни делали остальные участники) другую альтернативу y, строго лучшую,
чем x для всех участников из S.
В том числе,
слабая Парето-граница есть просто множество альтернатив, не блокиру- емых большой (полной) коалицией
Определение блокирования имеет ясный смысл только в тех играх, где возможно- сти коалиций ясно описаны. Например, они бывают описаны в терминах простран- ства выигрышей, которое мы здесь преимущественно и обсуждаем. Тогда понимаем,
что x, y ∈ R
n
– это вектора выигрышей. Или, в экономике обмена, x, y ∈ R
nl
– это распределения товаров.
Рассмотрим пример: Аня и Боб решили ловить рыбу. Аня может грести, а Боб бросать спиннинг или наоборот. Пусть, их полезности в этих двух вариантах такие...
Пусть, индивидуальные возможности – если отказаться ловить вместе рыбу и остать- ся дома – приносят каждому по 0.5 полезности. Где ядро?
Теперь допустим, что они измеряют полезность в одинаковых единицах – напри- мер в пирожках, и способны передавать друг другу пирожки за уступку в вопросе кто гребет, а кто ловит. Тогда допустимое множество заметно расширилось и стало плоским, т.е., полупространством. Теперь ясно, кто станет грести, неясно только как поделят выигрыши. Это получилась "игра с трансферабельной полезностью".

Глава 2
Статические или “одновременные”
некооперативные игры
2.0.1
Обозначения и термины
“Нормальную” форму игры часто соотносят со случаем “статической” или одновре- менной игры (однократные одновременные ходы участников), а развернутую форму
— с “динамическими” играми (последовательные ходы), хотя мы увидим, что воз- можны и другие трактовки. Нормальная форма описывает физическую и целевую структуру игры как объект
1
G := hI, X, u(.)i = hI, {X
i
}
i∈I
, {u
i
(.)}
i∈I
i , где
I := {1, ..., m} — множество участников i,
X := (X
i
)
i∈I
:=
Q
i
X
i
= (X
1
×X
2
×...×X
m
) — набор (профиль) допустимых множеств стратегий (x
i
)
i∈I
участников,
u := (u
i
)
I
= (u
i
)
i∈I
— набор (профиль) целевых функций участников, причем, каж- дая целевая функция u
i
: X
i
7→ IR зависит, вообще говоря, от всех выбранных стратегий (x
j
)
j∈I
), а не только от своей.
Состоянием игры в нормальной форме будем называть или профиль x = (x
i
)
i∈I
выбранных стратегий, или, более полно, пару (x, β) выбранных стратегий и ожида- ний всех участников. Ожидание β
i
∈ X каждого участника о ходах всех партнеров может совпадать с настоящими, намеченными к исполнению, стратегиями, или не совпадать.
Проиллюстрируем используемые далее принципы обозначений и простейшее понятие решения на примере.
Пример 2.0.1 “Игра координации” (известная в учебниках игр как “семейный спор” = “Battle of Sexes”: Luce and Raiffa, 1953).
Далее, как и здесь, мы будем большими буквами обозначать участников или мно- жества, а малыми латинскими буквами – переменные, то есть стратегии. Греческие
1
Возможно также более общее представление игр (оно соответствует, в частности, Вальрасовско- му равновесию игр обмена): не только выигрыши, но и текущее допустимое множество стратегий каждого участника может зависеть от текущих действий других участников.
19

20
Глава 2. Статические или “одновременные” некооперативные игры
буквы используются для ожиданий или вероятностей, в данном случае β
V
– это ожи- дание (belief) Виктора о ходе Анны.
Играют Анна (персонаж, который далее во всех обсуждаемых динамических иг- рах ходит первым и обозначается А) и Виктор (персонаж, который в других играх,
не как здесь, ходит позже Анны и, соответственно, обозначается буквой V стоя- щей позже в латинском алфавите). Здесь Анна и Виктор ходят одновременно, после хода “Природы”, сформировавшей у них какие-то “ожидания” (beliefs) о поведении партнера. Они почему-либо не имеют возможности переговариваться. Возможно, это период симпатии еще до того как они “познакомились”, или это супруги, уже устав- шие спорить и каждый молча гнет свою линию :-). Каждый выбирает, пойти ли вечером на футбол или в кино. Оба предпочли бы оказаться где-нибудь вместе,
что отражено в таблице выигрышей на Рис. 2.0.1. А именно, совместное попада- ние в кино ( x = (x
A
, x
V
) := (c
A
, c
V
) ) дало бы вектор полезностей (выигрышей)
(u
A
(c
A
, c
V
), u
V
(c
A
, c
V
)) := (3, 2), а совместное попадание на футбол дает выигрыши
(u
A
(f
A
, f
V
), u
V
(f
A
, f
V
)) := (1, 4).
U
q
Nature
Victor
Anna
*
j j
N
3, 2 0, 0 0, 0 1, 4
cinema (c
A
)
cinema (c
V
) football (f
V
)
footb. (f
A
)
Ann’s belief (β
A
)
Vic.’s belief (β
V
)
Payoff matrix
Рис. 2.1: Игра координации типа “Семейный спор” или “Chicken game”.
2
В каждой клетке, соответствующей одному из 4-х возможных исходов, помещен сначала субъективный выигрыш строчного игрока – Анны (измеренный в некоторых единицах полезности), затем - выигрыш Виктора. Стрелки отражают последователь- ность ходов, в данном случае - то, что игроки вынуждены принять решения одно- временно, не зная выбора другого, а только имея какие-то “ожидания” (expectations,
beliefs) об этом выборе, предопределенные природой (случаем).
Что может произойти? Очевидно, если оба ожидают от партнера выбор “футбол”,
то есть β
A
= f ootb
V
, β
V
= f ootb
A
, тогда рациональный выбор каждого — присо- единиться к выбору партнера, и исходом будет счастливая (более счастливая для
Виктора) встреча на футболе: x
A
= f ootb
A
, x
V
= f ootb
V
. Аналогично, совпадающие ожидания о кино привели бы к счастливой, особенно для Анны, встрече в кино, а несовпадающие гипотезы – к развлечениям порознь.
3 3
Заметим, что здесь независимое принятие решений игроками может приводить к Парето- неэффективному исходу, что вообще типично в не-кооперативных играх. Эффективных же вари- антов координации оказалось 2, причем один выгоднее для одного игрока, а другой для другого,
поэтому если кто-то имеет возможность пойти первым и этим вынудить партнера подстроиться, то

21
Итак, мы описали простейший вариант решения игры – “решение с заданными извне (не согласованными с реальностью) ожиданиями”. Далее будем в основном рассматривать другие, согласованные, типы решений, в том числе, для этой же игры.
О понятиях решения. Вообще говоря, найти решение игры означает, предска- зать множество ее возможных состояний, соответствующих нашим (наблюдателя)
гипотезам о принципах поведения и информации участников. Совокупность наших гипотез задает некоторое “согласование” стратегий и ожиданий. Обычно оно фор- мализуется в “концепции решения” или “равновесия”, то есть состояния, от которых участники не станут переходить к другим состояниям, если игра повторится.
В приведенном примере для предсказания исхода мы использовали простейшую концепцию – решение с заданными заранее ожиданиями ходов, ожиданиями, из- вестными откуда-то нам, предсказывающему исход игры наблюдателю. Ожидания не предполагались “согласованными”, или “обоснованными” истинными намерения- ми партнера, поэтому такая концепция мало применима. Перечислим более сложные концепции решения игр, изучаемые в этом разделе. (Табл.1):
Информация, на которую
Тип возникающих решений
ориентируется участник j ∈ I :
(равновесий), т.е., поведения:
- только на знание множеств (X
i
)
I
⇒ MM — “осторожное” (максимин),
IDE, SIDE — “доминирующее”,
- еще и на чужие цели (u
i
)
I\{j}
⇒ IND
S
, IND
W
— “итерац.домин.”,
- на текущий чужой ход (x
i
)
I\{j}
⇒ NE — “Нэшевское”
- на текущую вероятность ходов
⇒ NEm — “Нэшевское в смешанных стратегиях”
- лидер знает цели, ведомые - теку-
⇒ StE
щий ход
“Штакельберговское”
- на соглашение с партнерами
⇒ C — ядро — “кооперативное”
Таблица 2.1: Разные типы решений игр в нормальной форме, в зависимости от ин- формации о партнерах (это не значит, что решение Нэша нельзя применять в си- туации знания чужих целей или в ситуации переговоров, таблица говорит только о типичности применения понятий). Всюду в таблице подразумевается знание соб- ственных целей, и “общее знание” множества возможных стратегий всех участников.
Обсудим последовательно каждую из концепций решения, начав с простых.
2.0.2
Максимин и доминирование
Будем обозначать через x
−i
:= (x
j
)
j∈I\{i}
профиль (набор) стратегий всех игроков кроме i, и аналогично индексировать множества и функции.
Сначала рассмотрим случай, когда игроки не обладают информацией ни о це- лях, ни о намеченных стратегиях партнеров. Если они к тому же ведут себя “очень осторожно”, то подходит следующая концепция решения.
лидер в выигрыше. Такую ситуацию часто называют “chicken game”: кто из двух цыплят первым клюнул червяка, тому больше досталось.

22
Глава 2. Статические или “одновременные” некооперативные игры
Определение 2.0.2.1 Множество X
M M i
осторожных или максиминных страте-
гий игрока i задается как аргументы, максимизирующие гарантированный выигрыш:
4
X
M M i
:= {x
i
∈ X
i
| ∀x
−i
⇒ u
i
(x
i
, x
−i
) sup
y
i
∈X
i
( inf
z
−i
∈X
−i
u
i
(y
i
, z
−i
) ) },
(2.1)
при этом
MM :=
Q
i∈I
X
M M i
– множество максиминных решений игры.
Поясним: выбирая осторожно-оптимальную стратегию игрок ожидает от партне- ров самого худшего для себя, то есть ожидания игрока есть β
i
= (inf
z
−i
∈X
−i
u
i
(y
i
, z
−i
) )
(равновесием решение ММ обычно называть нельзя, поскольку ожидание всего худ- шего может не оправдаться и при новом розыгрыше подобной игры они переходят по-другому). Каждый максимизирует выигрыш при этих мрачных ожиданиях, то есть в целом – максимизирует гарантированный выигрыш. Такое поведение кажется правдоподобным при неизвестности целей партнеров, крайней осторожности игроков и однократном розыгрыше (см. пример “Перекресток” - Табл. 2.2). Однако теоретики считают его вполне адекватно применимым только в ситуации антагонистической
игры, то есть игры с противоположными интересами, где ожидания враждебности вполне реалистичны.
Victor
Go
V
Stop
V
An- Go
A
-1000, -1000 1,
-1 (NE)
na
Stop
A
-1, 1 (NE)
0,
0 (MM)
Victor
Go
V
Stop
V
A Go
A
0, 0 1, -1
Stop
A
-1, 1 0,
0
Таблица 2.2: Игра координации “Нерегулируемый перекресток” (тоже “chicken game”). Нет правил, и каждый может продолжать быстро ехать или затормозить.
Худший исход – столкновение – игроки оценивают для себя в -1000$, а возможность опередить соперника – в 1$. Осторожное решение – MM: (Stop
A
, Stop
V
). Рядом, для сравнения - “антагонистический” вариант этой игры при невозможности разбить ма- шины: нулевая сумма выигрышей всюду.
В антагонистической игре (т.е. “игре с нулевой суммой” или, вообще, с постоян- ной суммой выигрышей) концепция максимина очень естественна (см. ниже понятие
“седла”). В других ситуациях, как видно из примера “Перекресток”, максиминные решения могут не вызывать доверия как прогнозируемый результат повторяющейся
игры. Игра типа “Перекресток”, разыгрываемая многократно, вряд ли будет приво- дить к взаимно-осторожному решению (Stop,Stop), означающему по сути несогласо-
ванные с истинными намерениями партнера ожидания. Скорее всего, ожидания тем или иным путем скорректируются и согласуются (см. “повторяющиеся игры”).
Концепция максимина при осторожности имеет альтернативы: если игроки осто- рожны, то почему не внести степень их неприятия риска в явном виде в значения выигрышей, приписывая одновременно некоторые вероятности ожидаемым ходам партнеров?
Впрочем, бывают случаи, когда ожидания о партнерах не играют роли; это ситу- ации, где имеет место
“доминирование”.
4
Как обычно, sup = max, inf = min, если max
1   2   3   4   5   6   7   8   9   10


написать администратору сайта