первая матрица. 1я матрица. Решение игры в чистых стратегиях
Скачать 40.79 Kb.
|
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 1, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 4. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 1 ≤ y ≤ 4. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии). 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью. Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая. Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой. Стратегия A1 доминирует над стратегией A3 (все элементы строки 1 больше или равны значениям 3-ой строки), следовательно, исключаем 3-ую строку матрицы. Вероятность p3 = 0.
В платежной матрице отсутствуют доминирующие столбцы. Мы свели игру 3 x 2 к игре 2 x 2. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I. 3. Находим решение игры в смешанных стратегиях. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x 2) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем нижнюю границу выигрыша B1NB2. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B1B1 и B2B2, для которых можно записать следующую систему уравнений: y = 1 + (4 - 1)p2 y = 5 + (1 - 5)p2 Откуда p1 = 3/7 p2 = 4/7 Цена игры, y = 19/7 Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений q1+5q2 = y 4q1+q2 = y q1+q2 = 1 или q1+5q2 = 19/7 4q1+q2 = 19/7 q1+q2 = 1 Решая эту систему, находим: q1 = 4/7. q2 = 3/7. Также решение можно найти по следующим формулам: Ответ: Цена игры: y = 19/7, векторы стратегии игроков: Q(4/7, 3/7), P(3/7, 4/7) 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (1*4/7) + (5*3/7) = 2.714 = v M(P2;Q) = (4*4/7) + (1*3/7) = 2.714 = v M(P;Q1) = (1*3/7) + (4*4/7) = 2.714 = v M(P;Q2) = (5*3/7) + (1*4/7) = 2.714 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде: P(3/7,4/7,0) Q(4/7,3/7) |