Решение игры в смешанных стратегиях Цель лабораторной работы
Скачать 450.3 Kb.
|
ЛАБОРАТОРНАЯ РАБОТАРешение игры в смешанных стратегияхЦель лабораторной работыОзнакомление с играми в нормальной форме на примере задачи решения матричных игр и её реализация в математических пакетах. Матричная играМатричная игра – это антогонистическая игра, которая задаётся набором чистых стратегий {X1, …, Xn} и {Y1, …, Ym} первого и второго игроков, а так- же платёжной матрицей aij , определяющей выигрыш первого игрока nm (или проигрыш второго игрока) при выборе игроками чистых стратегий Xiи Yjсоответственно. Антагонистическая игра – это некооперативная игра двух игроков, выиг- рыши которых противоположны. Цель первого игрока – максимизация своего выигрыша. Цель второго игрока – минимизация выигрыша противника. Решение матричных игр в чистых стратегиях Принцип максиминаПредположим, что второй игрок заранее знает все ходы первого игрока. Тогда на каждую стратегию Xiон отвечает наилучшей контрстратегией Yj(i), для которой aij(i) aij для всех j1,m. Оптимальной чистой стратегией первого игрока является стратегия Xp (максиминная стратегия), для которой выполняется: max min aij apq . 1in1 jm Величину называют нижней ценой игры в чистых стратегиях. Принцип минимакса Рассмотрим аналогичную ситуацию для первого игрока. Оптимальной чистой стратегией второго игрока является стратегия Yq (минимаксная стратегия), для которой выполняется: min max a a . 1 jm1in ij pq Величину называют верхней ценой игры в чистых стратегиях. Нижняя цена игры не может быть больше верхней цены игры ( v ). Цена игры в чистых стратегиях – значение выигрыша первого игрока при условии выбора игроками их оптимальных чистых стратегий. Стратегия Xp1 доминирует стратегию Xp2 , если для всех j1,m спра- ведливы неравенства ap1k ap2k. ap1 j ap2 j и существует такая стратегия Yk, что Стратегия Yq1 доминирует стратегию Yq2 , если для всех i1,n справед- ливы неравенства akq1 akq2 . aiq1 aiq2 и существует такая стратегия Xk, что Решение матричных игр в смешанных стратегияхЕсли нижняя и верхняя цены игры не совпадают ( ), то решения мат- ричной игры в чистых стратегиях не существует. В таких случаях ищут ре- шение игры в смешанных стратегиях. Смешанная стратегия – это произвольное вероятностное распределение на множестве чистых стратегий: P p1,, pn n смешанная стратегия первого игрока, pi1 ; i1 m Qq1,,qm смешанная стратегия второго игрока, qj1 . j1 Цена игры в смешанных стратегиях – это математическое ожидание выигрыша первого игрока при применении игроками смешанных стратегий P и Q: nm v aijpiqj. i1 j1 n Так как P– оптимальная смешанная стратегия первого игрока, то она должна давать выигрыш первого игрока не меньший, чем цена игры v, тогда: aijpi v j1,m. i1 Разделим эти неравенства на цену игры vи обозначим xipi, получаем: v n aijpi1 i1 j1,m, v v F n p npi 1 min. i i1 i1 Допустим, что цена игры v 0 , получаем задачу линейного программиро- вания: F n p 1 min, i i1 v n aijpi1 j1,m, i1 xi 0 i1,n. Цена игры в смешанных стратегиях: v 1 . F Оптимальная смешанная стратегия первого игрока: pi v xii1,n. Применяя аналогичные рассуждения для второго игрока, получаем сле- дующую задачу линейного программирования: m F qjj1 1 max, v m aijqj1 i1,n, j1 yj 0 j1,m. Оптимальная смешанная стратегия второго игрока: qj v yj j1,m. Игра с природойРассмотрим ситуацию неопределённости – ситуация, когда противник не имеет противоположных интересов, но выигрыш действующего игрока во многом зависит от неизвестного заранее состояния противника. В таких задачах выбор решения зависит от состояния объективной действительности, называемой «природой», а математические модели называются «Игры с природой». Игра с природой – игра, в которой осознанно действует только один из игроков. Природа – это обобщенное понятие противника, который не преследует собственных целей в данном конфликте (такая ситуация может быть названа конфликтом лишь условно). Природа может принимать одно из своих возможных состояний и не име- ет целью получение выигрыша. Игра с природой представляется в виде пла- тёжной матрицы, элементы которой – это выигрыши игрока, которые не яв- ляются проигрышами природы. Для отбора стратегии применяют критерии оптимальности. Критерий оптимизма: предназначен для выбора наибольшего элемента платёжной матрицы из её максимально возможных элементов: KO max max aij . 1in1 jm Данный критерий используется тогда, когда игрок оказывается в безвы- ходном положении и любой его шаг равновероятно может оказаться абсо- лютным выигрышем или полным провалом. При этом предполагается, что развитие ситуации будет благоприятным для игрока. Вследствие этого, опти- мальным выбором будет вариант с наибольшим значением выигрыша в пла- тёжной матрице. Критерий пессимизма: предназначен для выбора наименьшего элемента платёжной матрицы из её минимально возможных элементов: KP min min aij. 1in1 jm Данный критерий используется тогда, когда игрок оказывается в безвы- ходном положении и любой его шаг равновероятно может оказаться абсо- лютным выигрышем или полным провалом. При этом предполагается, что возможна потеря контроля над ситуацией, поэтому необходимо исключить все потенциальные риски и выбрать вариант с минимальным выигрышем. Критерий Вальда предназначен для выбора наибольшего элемента пла- тёжной матрицы из её минимально возможных элементов: KW max min aij. 1in1 jm Данный критерий обеспечивает максимизацию минимального выигрыша, который может быть получен при реализации каждого из вариантов страте- гий. Критерий ориентирует игрока на осторожную линию поведения, направ- ленную на получение дохода и минимизацию возможных рисков одновре- менно. Критерий Сэвиджа предназначен для выбора наименьшего элемента матрицы рисков из её максимально возможных элементов: KS min max rij. 1in1 jm Необходимо провести оценку рисков в условиях, когда реальная ситуация неизвестна. Если бы игрок знал, что будет j-е состояние природы, то выбрал бы наилучшее решение, то есть то, которое принесёт наибольший выигрыш: max aij. 1in Матрица рисков характеризует риск выбора определённого варианта стра- тегии: rij max aij aij. 1in Пессимистично настроенный игрок предполагает, что состояние природы будет таким, что для любой его стратегии риск будет максимальным, поэтому он выбирает такую стратегию, для которой риск будет минимальным. Критерий Гурвица: предназначен для выбора среднего элемента платёж- ной матрицы, отличающегося от крайних минимального и максимального состояний: KH max max aij1 min aij. 1in 1 jm 1 jm Данный критерий ориентирован на установление баланса между случаями крайнего пессимизма и крайнего оптимизма, позволяет избежать погранич- ных состояний при принятии решения и выбрать наиболее вероятный вариант стратегии, обеспечивающий наилучшую эффективность. Коэффициент опти- мизма 0 1 выражает количественно меру оптимизма игрока при вы- боре стратегии и определяется им из субъективных соображений на основе статистических исследований или личного опыта. Обобщённый критерий для выбора наиболее эффективного варианта стратегии применяются все критерии оптимальности одновременно: каждый из критериев позволяет отобрать только один вариант, оптимальным же будет являться та стратегия, на которую указывает большинство критериев опти- мальности. ЗаданиеВыберите и согласуйте с преподавателем средство практической реали- зации решения матричных игр (допускается использовать любые математиче- ские пакеты и языки программирования). С помощью теста электронного курса «Домашнее задание №14. Инди- видуальное задание №3» сгенерируйте условия четырёх задач и сохраните их. Решите сгенерированные задачи с помощью выбранного средства прак- тической реализации. Проведите анализ полученных результатов. Составьте отчёт по проделанной работе, оформление отчёта должно со- ответствовать требованиям ОС ТУСУР 01.2013. Содержание отчёта: титульный лист (пример оформления приведён в приложении А); введение: цель лабораторной работы, краткая теоретическая справка, описание выбранного средства практической реализации; задача: условие сгенерированной задачи; практическая реализация: описание основных этапов выполнения практической реализации решения задачи с помощью выбранного средства, описание основных функций программы и так далее; решение задачи: демонстрация полученного решения задачи с помо- щью выбранного средства практической реализации; заключение: выводы по проделанной работе. Отправьте файл отчёта в формате PDF через соответствующее задание электронного курса «Лабораторная работа №6: Матричные игры». Отправьте файл архива с реализацией решения через соответствующее задание электронного курса «Лабораторная работа №6: Матричные игры (реализация)». Защитите отчёт. Ход работыС помощью теста электронного курса «Домашнее задание №14: Индиви- дуальное задание №3» генерируем условия четырёх задач (рис. 6.1–6.4). Рис. 6.1. Условие сгенерированной задачи №1 Рис. 6.2. Условие сгенерированной задачи №2 Рис. 6.3. Условие сгенерированной задачи №3 Рис. 6.4. Условие сгенерированной задачи №4 Рассмотрим пример решения сгенерированных задач с помощью про- граммы Microsoft Excel. Записываем исходные данные задачи №1 (рис. 6.5). Рис. 6.5. Исходные данные задачи №1 в Microsoft Excel С помощью функций «МИН()» и «МАКС()» вычислим значение нижней цены игры 2 (рис. 6.6). Рис. 6.6. Расчёт нижней цены игры Аналогично определяем значение верхней цены игры 2 (рис. 6.7). Рис. 6.7. Расчёт верхней цены игры Так как нижняя и верхняя цены игры совпадают ( 2 ), значит в дан- ной матричной игре существует решение в чистых стратегиях (рис. 6.8): X2 – оптимальная чистая стратегия первого игрока; Y2 – оптимальная чистая стратегия второго игрока; v apq a22 2 – цена игры в чистых стратегиях. Рис. 6.8. Решение в чистых стратегиях Записываем исходные данные задачи №2 (рис. 6.9). Рис. 6.9. Исходные данные задачи №2 в Microsoft Excel С помощью функций «МИН()» и «МАКС()» определяем значения нижней цены игры 7 и верхней цены игры 3 (рис. 6.10). Рис. 6.10. Расчёт нижней и верхней цен игры Так как нижняя и верхняя цены игры не совпадают ( ), значит в дан- ной матричной игре нет решения в чистых стратегиях, поэтому необходимо найти решение в смешанных стратегиях. Для этого сначала необходимо пре- образовать платёжную матрицу, избавившись от отрицательных платежей (рис. 6.11). Рис. 6.11. Преобразование платёжной матрицы По преобразованной платёжной матрице составляем задачу линейного программирования для первого игрока: F1x1 1x2 min, 0x1 7x2 1, 5x 4x1, 1 2 10x1 1x2 1, x1, x2 0. Чтобы построить область допустимых решений в соответствии с ограни- чениями, необходимо для каждого ограничения построить прямую по двум точкам (рис. 6.12). Рис. 6.12. Координаты точек для построения прямых Далее нужно построить прямые на графике (рис. 6.13). Рис. 6.13. Прямые, соответствующие ограничениям на ресурсы Затем для каждой прямой определяем полуплоскость, которая удовлетво- ряет ограничению, и делаем соответствующие отметки – заштриховываем полуплоскость, которая не удовлетворяет ограничению (рис. 6.14). При этом нужно не забыть об ограничении на неотрицательность переменных. Рис. 6.14. Отметки о соответствии ограничениям В результате получаем область допустимых решений (рис. 6.15). Рис. 6.15. Область допустимых решений Запишем в виде таблицы координаты угловых точек области допустимых решений. Также вычислим значение целевой функции в каждой угловой точ- ке области допустимых решений (рис. 6.16). Рис. 6.16. Координаты угловых точек и расчёт значений целевой функции Получаем решение для задачи линейного программирования: x1 3 0,08571, 35 x2 1 0,14286, 7 F1x1 1x2 8 . 35 На основе полученного решения находим решение в смешанных стратеги- ях для исходной матричной игры (рис. 6.17): v* 1 35; F 8 p1 v* x1 35 3 3; 8 35 8 p2 v* x2 35 1 5; 8 7 8 8 8 8 v v* minaij 35 8 35 64 29. Рис. 6.17. Решение в смешанных стратегиях (графический метод) В рамках задачи №3 необходимо решить такую же задачу, но для двух иг- роков, используя симплекс-метод. Для этого нужно найти решение следую- щих двух задач линейного программирования: для первого игрока: F1 1x1 1x2 min, 0x1 7x2 1, 5x 4x1, 1 2 x1 1x2 1, 10 x1, x2 0. для второго игрока (двойственная задача): F2 1y1 1y2 1y3 max, 0 y1 5 y2 10 y3 1, 7 y1 4 y2 1y3 1, y1, y2 , y3 0. Получим решение для данных задач с помощью надстройки «Поиск реше- ния». Подготавливаем исходные данные для первой задачи линейного про- граммирования (рис. 6.18). Рис. 6.18. Исходные данные для первой задачи линейного программирования Подготавливаем исходные для второй задачи линейного программирова- ния (рис. 6.19). Рис. 6.19. Исходные данные для второй задачи линейного программирования Далее открываем надстройку «Поиск решения» и вносим всю необходи- мую информацию о задаче линейного программирования (рис. 6.20). Рис. 6.20. Надстройка «Поиск решения» для первой задачи линейного программирования В результате получаем оптимальное решение, которое полностью совпа- дает с решением с помощью графического метода (рис. 6.21). Рис. 6. 21. Решение для первой задачи линейного программирования На основе полученного ответа находим решение в смешанных стратегиях для первого игрока (рис. 6.22). Рис. 6. 22. Решение в смешанных стратегиях для первого игрока Аналогично находим решение для второй задачи линейного программиро- вания. В результате получаем оптимальное решение для двойственной задачи (рис. 6.23). Рис. 6.23. Решение для второй задачи линейного программирования На основе полученного ответа находим решение в смешанных стратегиях для второго игрока (рис. 6.24). Рис. 6.24. Решение в смешанных стратегиях для второго игрока Записываем исходные данные задачи №4 (рис. 6.25). Рис. 6.25. Исходные данные задачи №4 в Microsoft Excel С помощью функций «МИН()» и «МАКС()» вычислим все вспомогатель- ные значения, которые необходимы для расчёта критериев оптимальности (рис. 6.26). Рис. 6.26. Расчёт вспомогательных значений для критериев оптимальности Далее с помощью функций «МИН()» и «МАКС()» вычислим значения критериев оптимальности (рис. 6.27). Также с помощью функции «ЕСЛИ()» делаем соответствующие отметки об оптимальности стратегий. В результате получаем, что по обобщённому критерию лидирует стратегия X2, так как она является оптимальной по большинству критериев оптимальности – критерии оптимизма, Вальда, Сэвиджа и Гурвица (рис. 6.28). Рис. 6.27. Расчёт критериев оптимальности Рис. 6.28. Значения критериев оптимальности Контрольные вопросыЧто такое матричная игра? Что такое оптимальная чистая стратегия? Что такое цена игры в чистых стратегиях? Опишите процесс удаления доминируемых стратегий. Что такое оптимальная смешанная стратегия? Что такое цена игры в смешанных стратегиях? Что такое игра с природой? Чем она отличается от матричной игры? Опишите критерий оптимизма/пессимизма/Вальда/Сэвиджа/Гурвица. |