Лекция_05_03_2023. Решение матричных игр 2х2 в смешанных стратегиях и моделирование результатов
Скачать 458.14 Kb.
|
Решение матричных игр 2х2 в смешанных стратегиях и моделирование результатов Краткая теоретическая справка Если матричная игра не имеет седловой точки, то решение находят в смешанных стратегиях. Смешанной стратегией игрока называется вектор Х(p1, p2, … , pm), координатами которого являются вероятности (относительные частоты) использования игроком своих чистых стратегий. Так как события, заключающиеся в выборе игроком своих чистых стратегий образуют полную группу, то сумма их вероятностей равна 1, т.е.: Если эта игра не имеет седловой точки, то ее решение составляет пара оптимальных стратегий Х*(p1, p2) и Y*(q1, q2). Причем использование игроком А своей оптимальной стратегии гарантирует ему получение среднего выигрыша не меньшего, чем цена игры ν. При этом, если игрок В использует свою оптимальную стратегию, то средний выигрыш игрока будет равен ν, если игрок В не использует свою оптимальную стратегию, то средний выигрыш игрока А будет больше ν. Записанное выше положение имеет вероятностный смысл, т.е. средний выигрыш будет тем ближе к ν, чем больше партий сыграют игроки: средний выигрыш стремится к ν по вероятности (другими словами, средний выигрыш будет не точно равен ν, а примерно равен и чем больше партий, тем меньше отклонение). Кроме того, определение смешанной стратегии требует выбирать чистые стратегии игроками случайно в соответствии с вероятностями (относительными частотами) их использования (условие секретности выбора чистой стратегии). Для решения матричных игр 2х2 можно использовать аналитический и геометрический методы. Аналитический метод решения игры 2х2. Чтобы найти оптимальную смешанную стратегию игрока А: Х*(p1, p2) и соответствующую цену игры ν, необходимо решить систему уравнений: Первое уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В1; второе уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В2; третье уравнение – свойство компонентов смешанной стратегии игрока. Аналогично для игрока В. Чтобы найти оптимальную смешанную стратегию игрока В: Y*(q1, q2) и соответствующую цену игры ν, необходимо решить систему уравнений: Цена игры ν общая для обоих игроков, поэтому при решении систем уравнений (1) и (2) должно получиться одинаковое значение ν. Геометрический метод решения игры 2х2. В точках х = 0, х = 1 оси Ох восстановим перпендикуляры и обозначим их А1 и А2 –в соответствии со стратегиями игрока А (см. рис 1). Изобразим стратегию В1. На прямой А1 отложим а11, а на прямой А2 отложим а21. Соединим эти точки и получим прямую В1В1 (см. рис. 1). Аналогично изобразим стратегию В2, отложив на прямой А1 значение а12, а на прямой А2 значение а22. Каждой точке на отрезке [0; 1] соответствует смешанная стратегия игрока А, причем р2 – расстояние от этой точки до нуля, а р1 – расстояние от этой точки до точки 1 (см. рис. 1). Ломанная В2МВ1 (на рисунке 1 выделена полужирно) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий. Точка М (самая высокая точка ломанной) – определяет наилучший средний выигрыш игрока А из всех минимальных. Она соответствует оптимальной смешанной стратегии игрока А. При этом: если М (х, у), то р1 = 1 – х, р2 = х, ν = y. Таким образом, задача сводится к нахождению координат точки М, которая является точкой пересечения прямых В1В1 и В2В2. Для нахождения уравнений прямых В1В1 и В2В2.можно воспользоваться уравнением прямой, проходящей через две точки: с учетом того, что прямую В1В1 определяют точки В1(0; a11), В1(1; а21), а прямую В2В2 определяют точки В2(0; a12), В2(1; а22). Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рисунке 2. Найдя координаты точки М (х, у), как точки пересечения прямых А1А1 и А2А2, компоненты оптимальной смешанной стратегии игрока В и цену игры: Y*(q1, q2), ν можно найти по следующим формулам: Решение типового примера Матричную игру 2х2 решить в смешанных стратегиях: аналитически (для игрока А); геометрически (для игрока В) ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКАИ НЕОПРЕДЕЛЕННОСТИОчень часто выбор наилучшего варианта действий происходит в условиях риска или неопределенности. Последствия принимаемых решений определяются будущим развитием событий, которое может происходить по различным сценариям. Осуществление каждого сценария возможно с некоторой известной (риск) или неизвестной (неопределенность) вероятностью. Для формализации таких задач принято составлять таблицу, в которой строкам соответствуют имеющиеся варианты решения, столбцам – возможные сценарии развития событий, а на пересечении строк и столбцов проставляют количественные оценки последствий, связанных с принятием данного решения в условиях реализации данного сценария. В качестве таких оценок могут выступать как положительные характеристики (доход, прибыль, полезный эффект, полезность), так и отрицательные (потери, убытки, ошибки). ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКАДля выбора оптимального решения в условиях риска, когда известны вероятности реализации всех сценариев, определяют вариант действий, связанный с наилучшими возможными результатами. При этом используют стандартную формулу математического ожидания1: Ожидаемый результат (действие)= и выбирают в качестве наилучшего решения тот вариант, который обеспечивает максимум ожидаемого положительного результата или минимум ожидаемого отрицательного результата (критерий оптимальности при принятии решений в условиях риска). Пример. Владелец небольшого магазина в начале каждого дня закупает для реализации некий скоропортящийся продукт по цене 50 рублей за единицу. Цена реализации этого продукта — 60 рублей за единицу. Из наблюдений известно, что спрос на этот продукт за день может быть равен 1, 2, 3 или 4 единицам. Пусть известно, что на практике спрос 1 наблюдался 15 раз, спрос 2 наблюдался 30 раз, спрос 3 наблюдался 30 раз, спрос 4 наблюдался 25 раз. Если продукт в течение дня не распродан, то в конце дня его всегда покупают по цене 30 рублей за единицу. Сколько единиц этого продукта должен закупать владелец магазина каждый день? Решение. Составим таблицу решения для данной задачи (табл.1). В ней будет четыре строки, так как владелец магазина может выбирать из четырех вариантов действий (закупить 1, 2, 3 или 4 единицы продукта), и четыре столбца, так как последствия принятого решения будут определяться тем, по какому из четырех возможных сценариев станут развиваться события (составит спрос 1, 2, 3 или 4 единицы продукта). В клетках таблицы укажем финансовые последствия каждого варианта решения в условиях реализации различных сценариев (прибыль владельца магазина). Эти последствия (результаты) рассчитаем по формуле: (количество проданных продуктов∙ цена продажи)— —(количество закупленных продуктов∙цена закупки). Табл.1.
Например, при закупке 3 единиц и спросе 2 единицы прибыль составит 2∙60+1∙30-3∙50=0 (две единицы продукции проданы по цене 60 руб./шт., одна единица продана по цене 30 руб./шт., что в сумме составляет 150 руб., и на закупку затрачено 150 руб.). В тексте задачи имеются данные о том, сколько раз наблюдался тот или иной сценарий (спрос), и по ним можно рассчитать относительную частоту, с которой каждый из них реализуется, и таким образом эмпирически оценить вероятность каждого варианта развития событий, p(j), : Теперь по формуле математического ожидания рассчитаем ожидаемую прибыль для каждого возможного решения (расчеты сведем в таблицу 2). Выбираем максимум среди математических ожиданий (последние выделены в таблице жирным шрифтом): max(10; 15,5; 12; -0,5) = 15,5. Он достигается в результате второго варианта решения. Следовательно, оптимальным решением является закупка 2 единиц продукта. Табл.2
1 Будем рассматривать только дискретный случай. |