Главная страница

методичка Теория игр 2014. Методические указания и контрольные задания по дисциплине теория игр для студентовзаочников 2 курса, специальности 080100 семестр 4 Москва 2014


Скачать 1.28 Mb.
НазваниеМетодические указания и контрольные задания по дисциплине теория игр для студентовзаочников 2 курса, специальности 080100 семестр 4 Москва 2014
Анкорметодичка Теория игр 2014.pdf
Дата26.04.2017
Размер1.28 Mb.
Формат файлаpdf
Имя файламетодичка Теория игр 2014.pdf
ТипМетодические указания
#5966
страница6 из 8
1   2   3   4   5   6   7   8
D
, то решением будет являться весь единичный квадрат
]
1
,
0
[

p
, Если
0

D
,
0


, то решением является либо
0

q
, либо Если
0

D
, то получим следующие решения
1) если
0

q
, то
D
p


; 2) если
1

q
, то
D
p


; 3) если
1 0


q
, то Если
0

D
, то решения будут следующие
1) если
0

q
, то
D
p


; 2) если
1

q
, то
D
p


; 3) если
1 0


q
, то Графическая интерпретация множества решений игрока
B
: Риса
Рис.11б
1 1
0
p
q
C
>
0
(p,

/C
)
1 1
0
p
q
C
<
0
(p,

/C
)
1 1
0
p
q
D>
0
(

/D,
q)
1 1
0
p
q
D<
0
(

/D,
q)
Решением игры является пересечение множеств решений для игроков
A
и
B
. Графически решение будет выглядеть как пересечение двух зигзагов, варианты которых приведены на рисунках выше. При этом эти зигзаги могут быть как противоположными, таки одинаковой направленности. В первом случае мы получим три точки пересечения, те. три состояния равновесия, а во втором – одну. Укажем решения конкретных примеров. Пример 1.
Рассмотрим игру борьба за рынки. Платежные матрицы игроков
A
и
B
имеют следующий вид









1 1
2 10
A
,









1 1
2 Вычисляем коэффициенты
C
,

,
D
и

:
14 1
1 2
10







C
,
3 2
1






,
9 1
)
1
(
)
2
(
5







D
, Так как
0

C
, то решения для игрока
A
будут следующие
1) если
0

p
, то
14 3

q
; 2) если
1

p
, то
14 3

q
; 3) если
1 0


p
, то
14 Так как
0

D
, то решения для игрока
B
будут следующие
1) если
0

q
, то
9 2

p
; 2) если
1

q
, то
9 2

p
; 3) если
1 0


q
, то
9 Нанесем полученные решения на график. для игрока для игрока объединение Риса
Рис.12б
Рис.12в Точка пересечения построенных зигзагов – это точка равновесия. Она имеет координаты


14
/
3
;
9
/
2
)
,
(
*
*

q
p
. Тогда оптимальной смешанной стратегией игрока
A
будет


9
/
7
;
9
/
2
*

A
x
, ау игрока
B
: Средние выигрыши игроков вычисляем по формулам (60а)-(61а):
7 4
1 14 3
2 9
2
)
3
(
14 3
9 2
14 14 3
;
9 2

















A
H
,







14 3
;
9 2
B
H
3 1
1 14 3
2 9
2 3
14 3
9 2
9








1 1
0
p
q
14 3
1 1
0
p
q
2/9 1
1 0
p
q
2/9 14 3
Разобьем данную биматричную игруна две матричные с нулевой суммой и найдем их решения.
1. Игра с матрицей









1 1
2 10
A
P
имеет следующее решение (см.
(15)-(16)):


7 6
;
7 1
*

A
x
(оптимальная стратегия игрока
A
), оптимальная стратегия игрока
B
),
7 4
*


A
v
(цена игры.
2. Игра с матрицей









1 1
2 5
B
P
имеет такое решение


9 оптимальная стратегия игрока
A
),


3
/
2
;
3
/
1
*

B
y
(оптимальная стратегия игрока
B
),
3
/
1
*

B
v
(цена игры. Сравнивая полученные решения с решением биматричной игры, видим, что
1. оптимальный средний выигрыш игрока в матричной игре совпадает сего выигрышем при равновесной ситуации в биматричной;
2. по своей матрице игрок может определить только оптимальную стратегию (равновесную по Нэшу) другого игрока, ноне свою, а для определения своей стратегии нужна матрица противника. Полученные выводы можно использовать для решения биматричных игр большей размерности, чем 2

2. Для этого нужно всего лишь решить две матричные игры той же размерности. В биматричных играх принцип равновесия по Нэшу не всегда приводит к ситуации, выгодной обоим игрокам. Рассмотрим в связи с этим второй пример "дилемма узников. Пример 2.
В игре "дилемма узников" выигрыши игроков описываются матрицами










6 0
9 1
A
,










6 9
0 Решаем эту игру как биматричную:
2 6
0
)
9
(
1







C
,
3
)
9
(
6






,
2 6
)
9
(
0 1







D
, Так как
0

C
, то решения для игрока
A
будут следующие
1) если
0

p
, то
2 3

q
; 2) если
1

p
, то
2 3

q
; 3) если
1 0


p
, то
2 Так как
0

D
, то решения для игрока
B
будут следующие
1) если
0

q
, то
2 3

p
; 2) если
1

q
, то
2 3

p
; 3) если
1 0


q
, то
2 Нанесем полученные решения на график (см. рис.
Из рис видно, что зигзаги для и
B
пересекаются только водной точке
(0,0). Это ситуация ситуация равновесия, в которой каждый из игроков выбирает вторую чистую стратегию "сознаться" и они теряют полет, те.
 
 
6 0
;
0 Как уже отмечалось ранее, отклонение от ситуации равновесия одного из игроков не дает ему никаких преимуществ. Однако при одновременном отклонении обоих игроков каждый из них может получить больший выигрыш, чем в равновесной ситуации. Именно, в ситуации
)
1
,
1
(
)
,
(

q
p
, когда каждый из игроков
A
и
B
выбирает первую чистую стратегию "молчать, они теряют лишь 1 (год. При этом очевидно, что ситуация (1, 1) неустойчива, так как любой из игроков, изменяя свою стратегию, может увеличить свой выигрыш (избежать наказания. Решим данную биматричную игру как две матричные с нулевой суммой.
1. Для игры с матрицей










6 0
9 1
A
P
получим следующее решение
 
1
;
0
*

A
x
,
 
1
;
0
*

B
y
,
6
*


A
v
(цена игры.
2. Игра с матрицей










6 9
0 1
B
P
имеет такое решение
 
0
;
1
*

A
x
,
 
0
;
1
*

B
y
,
1
*


B
v
(цена игры. Те. игроку
B
рекомендуется придерживаться второй стратегии, а игроку
A
– первой, но тогда
0
,
9



B
A
H
H
. Такая ситуация хуже для игрока
A
, чем для игрока Таким образом, в биматричной игре ситуация равновесия обоих игроков определяется не столько стремлением увеличить собственный выигрыш, сколько стремлением минимизировать выигрыш другого игрока.
2.4. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО Дадим определение другого способа определения оптимальности в биматричных играх, который основан на принципе оптимальности по
Парето. Ситуация
)
,
(


q
p
в биматричной игре двух лиц
A
и
B
называется оптимальной по Парето, если из того, что А В

p
q
0 1
3/2 1
3/2 Рис.




 
q
p
H
q
p
H
A
A
,
,



,


 
q
p
H
q
p
H
B
B
,
,



(63) следуют равенства




q
q
p
p
,
, те. не существует ситуации


q
p,
, для которой имеют место неравенства (63). Среди этих неравенств по крайней мере одно должно быть строгим. В оптимальной по Парето ситуации, все игроки, действуя совместно, не могут увеличить выигрыш каждого, не уменьшив при этом выигрыш одного из них. В отличие от этого, в ситуации равновесия по Нэшу ни один из игроков, действуя в одиночку, не может увеличить своего собственного выигрыша. Покажем, как на практике отыскать оптимальную по Парето ситуацию в биматричной игре 2

2. Введем обозначения
 
q
p
H
U
A
,

,
 
q
p
H
V
B
,

,
(64) и рассмотрим плоскость
)
,
(
V
U
. На плоскости
)
,
(
V
U
найдем целевую точку, в качестве координат которой часто выбирается сочетание наилучших значений
U
и
V
. В данном случае это будет точка
)
,
(
m ax m ax
V
U
T

, где
)
,
(
max
,
max
q
p
H
U
A
q
p

, Вследствие того, что обычно такая точка T при заданных ограничениях не реализуется, ее называют точкой утопии. Далее, строим множество точек, отвечающее соотношениям (64), определяем на нем множество Парето, отвечающее заданным условиям на переменные
q
p,
, и находим на нем точку, ближайшую к точке утопии T. Именно такая точка и будет идеальной точкой
)
,
(
П
П


V
U
P
, отвечающей принципу оптимальности по Парето. Найдя идеальную точку
P
, можно определить (используя соотношения (64)) и значения


П
П
q
p ,
, при которых она достигается. Здесь
)
,
(


П
П
q
p
– это оптимальная ситуация по

Парето. Множество Парето – это множество тех граничных точек, отвечающих соотношениям
(64), перемещение которых по границе построенного множества уменьшает одну из координат здесь
U
или
V
) при одновременном увеличении другой (см. рис, дуга

). Построим множество Парето в примере 2 и найдем точку оптимальную по Парето. По формулам (60а)-(61а) находим
,
6 3
6 2
)
,
(
,
6 6
3 2
)
,
(










q
p
pq
q
p
H
V
q
p
pq
q
p
H
U
B
A
1
,
0


q
p
(65)
P
T
U
V
0
V
max
U
max
V
*
U
* Рис.
Найдем границы множества точек, удовлетворяющих (65). Для этого можно рассматривать крайние значения переменных
p
и
q
:
1) при
0

p
имеем
6 3
,
6 6





q
V
q
U

9 2
/
1



U
V
,
6 9
,
0 6







V
U
;
2) при
1

p
имеем
q
V
q
U




,
9 8

8
/
)
9
(



U
V
,
0 1
,
1 9







V
U
;
3) при
0

q
имеем
6 6
,
6 3





p
V
p
U

U
V
2 18



,
0 6
,
6 9







V
U
;
4) при
1

q
имеем
9 8
,




p
V
p
U

9 8



U
V
,
1 9
,
0 На рис изображено множество, удовлетворяющее уравнениям
(65). Получился четырехугольник с вершинами в точках
)
0
,
9
(

A
,
)
1
,
1
(


B
,
)
9
,
0
(

C
, Точкой утопии здесь будет точка T(0; 0), так как
0
m ax

U
и
0
m Множеству Парето здесь отвечают отрезки прямых при
1

p
и
1

q
. Как видно из рис ближайшей точкой множества Парето к точке утопии
T является точка
)
1
;
1
(



B
P
, те.
1
,
1
П
П






V
U
. Решая систему уравнений
1
)
,
(




П
П
A
q
p
H
,
1
)
,
(




П
П
В
q
p
H
, находим, что П, П. Это означает, что оптимальной ситуацией по Парето будет ситуация
)
1
,
1
(
)
,
(



П
П
q
p
(те. игроки
A
и
B
применяют свои первые чистые стратегии. Заметим, что точка
)
6
;
6
(


D
соответствует точке равновесия по Нэшу в данном примерено при этом эта точка намного дальше от точки утопии, чем точка
P
. Ясно, что оптимальная ситуация по Парето здесь лучше, чем по
Нэшу. В заключение укажем оптимальные ситуации по Парето в других рассмотренных примерах. Так, в примере 1 "борьба за рынки" оптимальной ситуацией по Парето будет ситуация
)
0
,
0
(
)
,
(



П
П
q
p
, те.
1
,
1
П
П





V
U
. В примере 3 "семейный спор" есть две оптимальные
T
P
D
q
=1
p
=1
B
A
C
U
V
0
–1
–1
–6
–6
–9
–9
p
=0 Рис.
ситуации по Парето, именно
)
0
,
1
(
)
,
(
1 1



П
П
q
p
и
)
1
,
0
(
)
,
(
2 2



П
П
q
p
, при этом они одновременно являются и ситуациями равновесия по Нэшу (есть также одна ситуация равновесия по Нэшу в смешанных стратегиях, но она хуже указанных выше двух. В примере 4 "студент-преподаватель" оптимальной ситуацией по Парето будет ситуация
)
1
,
1
(
)
,
(



П
П
q
p
, она же будет и равновесной по Нэшу. СПИСОК ВОПРОСОВ ПО КУРСУ ТЕОРИЯ ИГР Задачи теории игр. Примеры, виды игровых задач. Антагонистические матричные игры. Примеры игр. Максимин и минимакс. Выигрыши двух игроков. Ситуации равновесия в игре. Понятие седловой точки. Чистые стратегии двух игроков. Смешанные стратегии двух игроков в матричной игре. Выигрыши игроков в игре. Теорема Дж. фон Неймана о ситуации равновесия. Аналитическое решение игры 2

2. Геометрическое решение игры 2

2. Лемма о масштабе. Условия эквивалентности смешанных стратегий двух игр. Свойства оптимальных смешанных стратегий в матричной игре. Графический метод решения матричной игры (2

n). Графический метод решения матричной игры (m

2). Активные (существенные) стратегии игроков. Теоремы об активных стратегиях. Принцип доминирования стратегий двух игроков. Теоремы о доминируемых стратегиях. Вполне смешанная игра. Решение матричной игры n

n методом обратной матрицы. Сведение матричной игры n

m к двойственной задаче линейного программирования. Общий подход. Постановка задач линейного программирования. Примеры, различные формы задачи подходы решения. Задача линейного программирования в канонической форме. Основные теоремы о множествах оптимальных решений этой задачи. Допустимые базисные решения. Аналитический метод решения задачи линейного программирования m

n (симплекс-метод). Симплекс-таблицы. Метод искусственного базиса в симплекс-методе. Двойственные задачи линейного программирования.
Решение матричной игры симплекс-методом. Сведение к двойственной задаче линейного программирования.
21.
Биматричные неантагонистические игры. Постановка задачи. Функции выигрышей. Примеры биматричных игр борьба за рынки, дилемма узников, семейный спор, студент-преподаватель. Ситуация равновесия по Нэшу в чистых стратегиях в биматричной игре. Пример поиска ситуаций равновесия для игры 2

2. Ситуация равновесия по Нэшу в смешанных стратегиях в биматричной игре. Теорема Нэша. Свойства ситуаций равновесия. Ситуация равновесия по Нэшу в смешанных стратегиях для игры
2

2. Поиск решений для двух игроков. Графическая интерпретация решения биматричной игры 2

2 по
Нэшу. Принцип оптимальности по Парето в биматричной игре. Пример для игры 2

2. Поиск оптимальных стратегий по Парето в биматричной игре 2

2. Множество Парето. Точка утопии.
КОНТРОЛЬНАЯ РАБОТА ПО ДИСЦИПЛИНЕ ТЕОРИЯ ИГР Вариант 0 1. В матричной игре с платежной матрицей
1   2   3   4   5   6   7   8


написать администратору сайта