Главная страница
Навигация по странице:

  • Смешанной стратегией

  • Аналитический метод решения игры 2х2.

  • Геометрический метод решения игры 2х2.

  • Решение типового примера

  • Пример

  • Лекция_05_03_2023. Решение матричных игр 2х2 в смешанных стратегиях и моделирование результатов


    Скачать 458.14 Kb.
    НазваниеРешение матричных игр 2х2 в смешанных стратегиях и моделирование результатов
    Дата09.03.2023
    Размер458.14 Kb.
    Формат файлаdocx
    Имя файлаЛекция_05_03_2023.docx
    ТипРешение
    #977267


    Решение матричных игр 2х2 в смешанных стратегиях и

    моделирование результатов

    Краткая теоретическая справка

    Если матричная игра не имеет седловой точки, то решение находят в смешанных стратегиях.

    Смешанной стратегией игрока называется вектор Х(p1, p2, … , pm), координатами которого являются вероятности (относительные частоты) использования игроком своих чистых стратегий. Так как события, заключающиеся в выборе игроком своих чистых стратегий образуют полную группу, то сумма их вероятностей равна 1, т.е.:


    Если эта игра не имеет седловой точки, то ее решение составляет пара оптимальных стратегий Х*(p1, p2) и Y*(q1, q2). Причем использование игроком А своей оптимальной стратегии гарантирует ему получение среднего выигрыша не меньшего, чем цена игры ν. При этом, если игрок В использует свою оптимальную стратегию, то средний выигрыш игрока будет равен ν, если игрок В не использует свою оптимальную стратегию, то средний выигрыш игрока А будет больше ν.

    Записанное выше положение имеет вероятностный смысл, т.е. средний выигрыш будет тем ближе к ν, чем больше партий сыграют игроки: средний выигрыш стремится к ν по вероятности (другими словами, средний выигрыш будет не точно равен ν, а примерно равен и чем больше партий, тем меньше отклонение). Кроме того, определение смешанной стратегии требует выбирать чистые стратегии игроками случайно в соответствии с вероятностями (относительными частотами) их использования (условие секретности выбора чистой стратегии).

    Для решения матричных игр 2х2 можно использовать аналитический и геометрический методы.
    Аналитический метод решения игры 2х2.

    Чтобы найти оптимальную смешанную стратегию игрока А: Х*(p1, p2) и соответствующую цену игры ν, необходимо решить систему уравнений:



    Первое уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В1; второе уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В2; третье уравнение – свойство компонентов смешанной стратегии игрока.

    Аналогично для игрока В. Чтобы найти оптимальную смешанную стратегию игрока В: Y*(q1, q2) и соответствующую цену игры ν, необходимо решить систему уравнений:



    Цена игры ν общая для обоих игроков, поэтому при решении систем уравнений (1) и (2) должно получиться одинаковое значение ν.

    Геометрический метод решения игры 2х2.

    В точках х = 0, х = 1 оси Ох восстановим перпендикуляры и обозначим их А1 и А2 –в соответствии со стратегиями игрока А (см. рис 1).




    Изобразим стратегию В1. На прямой А1 отложим а11, а на прямой А2 отложим а21.

    Соединим эти точки и получим прямую В1В1 (см. рис. 1). Аналогично изобразим стратегию В2, отложив на прямой А1 значение а12, а на прямой А2 значение а22.

    Каждой точке на отрезке [0; 1] соответствует смешанная стратегия игрока А, причем р2 – расстояние от этой точки до нуля, а р1 – расстояние от этой точки до точки 1 (см. рис. 1).

    Ломанная В2МВ1 (на рисунке 1 выделена полужирно) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий. Точка М (самая высокая точка ломанной) – определяет наилучший средний выигрыш игрока А из всех минимальных. Она соответствует оптимальной смешанной стратегии игрока А. При этом: если М (х, у), то р1 = 1 – х, р2 = х, ν = y.

    Таким образом, задача сводится к нахождению координат точки М, которая является точкой пересечения прямых В1В1 и В2В2. Для нахождения уравнений прямых В1В1 и В2В2.можно воспользоваться уравнением прямой, проходящей через две точки:



    с учетом того, что прямую В1В1 определяют точки В1(0; a11), В1(1; а21), а прямую В2В2 определяют точки В2(0; a12), В2(1; а22).

    Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рисунке 2.


    Найдя координаты точки М (х, у), как точки пересечения прямых А1А1 и А2А2, компоненты оптимальной смешанной стратегии игрока В и цену игры: Y*(q1, q2), ν можно найти по следующим формулам:




    Решение типового примера

    Матричную игру 2х2 решить в смешанных стратегиях:

    1. аналитически (для игрока А); геометрически (для игрока В)














    ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА

    И НЕОПРЕДЕЛЕННОСТИ



    Очень часто выбор наилучшего варианта действий происходит в условиях риска или неопределенности. Последствия принимаемых решений определяются будущим развитием событий, которое может происходить по различным сценариям. Осуществление каждого сценария возможно с некоторой известной (риск) или неизвестной (неопределенность) вероятностью.

    Для формализации таких задач принято составлять таблицу, в которой строкам соответствуют имеющиеся варианты решения, столбцам – возможные сценарии развития событий, а на пересечении строк и столбцов проставляют количественные оценки последствий, связанных с принятием данного решения в условиях реализации данного сценария. В качестве таких оценок могут выступать как положительные характеристики (доход, прибыль, полезный эффект, полезность), так и отрицательные (потери, убытки, ошибки).

      1. ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА



    Для выбора оптимального решения в условиях риска, когда известны вероятности реализации всех сценариев, определяют вариант действий, связанный с наилучшими возможными результатами. При этом используют стандартную формулу математического ожидания1:
    Ожидаемый результат (действие)=


    и выбирают в качестве наилучшего решения тот вариант, который обеспечивает максимум ожидаемого положительного результата или минимум ожидаемого отрицательного результата (критерий оптимальности при принятии решений в условиях риска).

    Пример. Владелец небольшого магазина в начале каждого дня закупает для реализации некий скоропортящийся продукт по цене 50 рублей за единицу. Цена реализации этого продукта — 60 рублей за единицу. Из наблюдений известно, что спрос на этот продукт за день может быть равен 1, 2, 3 или 4 единицам. Пусть известно, что на практике спрос 1 наблюдался 15 раз, спрос 2 наблюдался 30 раз, спрос 3 наблюдался 30 раз, спрос 4 наблюдался 25 раз. Если продукт в течение дня не распродан, то в конце дня его всегда покупают по цене 30 рублей за единицу. Сколько единиц этого продукта должен закупать владелец магазина каждый день?

    Решение. Составим таблицу решения для данной задачи (табл.1). В ней будет четыре строки, так как владелец магазина может выбирать из четырех вариантов действий (закупить 1, 2, 3 или 4 единицы продукта), и четыре столбца, так как последствия принятого решения будут определяться тем, по какому из четырех возможных сценариев станут развиваться события (составит спрос 1, 2, 3 или 4 единицы продукта). В клетках таблицы укажем финансовые последствия каждого варианта решения в условиях реализации различных сценариев (прибыль владельца магазина). Эти последствия (результаты) рассчитаем по формуле:

    (количество проданных продуктов∙ цена продажи)—

    —(количество закупленных продуктов∙цена закупки).

    Табл.1.

    Объем закупки, единиц продукта/день

    Спрос в течение дня,

    единиц продукта/день

    1

    2

    3

    4

    1

    10

    10

    10

    10

    2

    -10

    20

    20

    20

    3

    -30

    0

    30

    30

    4

    -50

    -20

    10

    40


    Например, при закупке 3 единиц и спросе 2 единицы прибыль составит 2∙60+1∙30-3∙50=0 (две единицы продукции проданы по цене 60 руб./шт., одна единица продана по цене 30 руб./шт., что в сумме составляет 150 руб., и на закупку затрачено 150 руб.).

    В тексте задачи имеются данные о том, сколько раз наблюдался тот или иной сценарий (спрос), и по ним можно рассчитать относительную частоту, с которой каждый из них реализуется, и таким образом эмпирически оценить вероятность каждого варианта развития событий, p(j), :






    Теперь по формуле математического ожидания рассчитаем ожидаемую прибыль для каждого возможного решения (расчеты сведем в таблицу 2).

    Выбираем максимум среди математических ожиданий (последние выделены в таблице жирным шрифтом): max(10; 15,5; 12; -0,5) = 15,5. Он достигается в результате второго варианта решения. Следовательно, оптимальным решением является закупка 2 единиц продукта.
    Табл.2




    Результат, x

    Вероятность, p

    x∙р

    Возможное

    решение 1


    10

    0,15

    10∙0,15= 1,5

    10

    0,30

    10∙0,30 = 3

    10

    0,30

    10∙0,3 = 3

    10

    0,25

    10∙0,25 = 2,5

    Итого

    1,00

    10

    Возможное

    решение 2

    -10

    0,15

    -10∙0,15 = -1,5

    20

    0,30

    20∙0,30 = 6

    20

    0,30

    20∙0,3 = 6

    20

    0,25

    20∙0,25 = 5

    Итого

    1,00

    15,5

    Возможное

    решение 3

    -30

    0,15

    -30∙0,15 = -4,5

    0

    0,30

    0∙0,30 = 0

    30

    0,30

    30∙0,3 = 9

    30

    0,25

    30∙0,25 = 7,5

    Итого

    1,00

    12

    Возможное

    решение 4

    -50

    0,15

    -50∙0,15 = -7,5

    -20

    0,30

    -20∙0,30 = -6

    10

    0,30

    10∙0,3 = 3

    40

    0,25

    40∙0,25= 10

    Итого

    1,00

    -0,5


    1 Будем рассматривать только дискретный случай.


    написать администратору сайта