Системы поддержки принятия решения

Название	Системы поддержки принятия решения
Дата	27.02.2023
Размер	3.85 Mb.
Формат файла
Имя файла	Metodichka_SPPRLR240408.doc
Тип	Методическое пособие #957823
страница	11 из 28

1 ... 7 8 9 10 11 12 13 14 ... 28

Игры с противником.

Рассмотрим задачу разработки управленческого решения с одним неопределенным фактором

, принимающим только два возможных значения

при выборе противником соответственно стратегий

. Заметим, что хотя мы не знаем, какие конкретно значения на практике будут принимать неопределенные факторы, но мы можем предположить, что они примут определенные значения и вести дальнейшие рассуждения в отношении именно предполагаемых нами значений

. Будем считать, что этот фактор влияет на критериальную функцию

или на ограничения

. Найдем два оптимальных решения

, с учетом двух возможных и предполагаемых нами стратегий противника

соответствующие выражениям

Полученные решения

представляют собой наши наилучшие действия (стратегии)

в том случае, когда мы угадали дальнейшее развитие событий. Используя уже полученные решения

, рассчитаем значения показателя эффективности при условии, что мы не угадали ответ противника:

Занесем полученные значения в так называемую платежную матрицу, где строки

представляют собой наши возможные стратегии, а столбцы

возможные стратегии противника

Стратегии

Очевидно, что аналогичная матрица может быть построена и при большем числе возможных стратегий

, а также при большем числе неопределенных факторов

.

Отыщем решение игры, пользуясь методами теории игр. Найдем нашу оптимальную стратегию, не зависящую от действий противника. В этом случае возникает вопрос о выборе критерия оптимальности. Например, в качестве используемой стратегии можно выбрать стратегию, которая приносит возможный максимальный выигрыш. Такая стратегия может оказаться весьма рискованной, поскольку в конкретной ситуации противник может ответить стратегией, приводящей к большему проигрышу. Более разумным представляется воспользоваться стратегией, которая минимизирует наш возможный проигрыш. Обозначим

минимальный выигрыш при выборе стратегии

при всех возможных стратегиях противника

.

Из всех возможных наших стратегий выберем стратегию, которая обеспечит нам наибольшее значение нашего минимального выигрыша

.

Назовем

нижней ценой игры (наш гарантированный выигрыш при любой стратегии противника).

Если цели игроков противоположны, что имеет место в антагонистической игре, то противник заинтересован уменьшить наш выигрыш, и будет выбирать соответствующие стратегии. Вполне естественно предположить, что противник владеет методами оптимизации и теории игр и в свою очередь проводит аналогичные вычисления. Тогда полученная им платежная матрица будет иметь другие числовые значения, но ее смысл в отношении выбираемых стратегий не изменится. Поэтому мы можем анализировать возможные стратегии противника исходя из имеющейся у нас нашей платежной матрицы. Очевидно, что все это справедливо только в том случае, когда мы рассмотрели все возможные стратегии противника.

Примечание. Если противник не будет пользоваться оптимальными методами, то это просто приведет к его дополнительному проигрышу.

Найдем наш максимальный выигрыш при каждой стратегии противника

.

Для того чтобы минимизировать свой проигрыш, противник выберет стратегию, в которой наш выигрыш минимален

.

Назовем выигрыш

верхней ценой игры. Очевидно, что если по каким-то причинам противник не воспользовался своей оптимальной стратегией, то наш выигрыш только возрастет. Если верхняя и нижняя цены игры совпадают, то их значение

называют чистой ценой игры

.

Стратегии, соответствующие чистой цене игры, называются чистыми, а их совокупность дает оптимальное решение. Используя оптимальное решение, мы получаем минимальный гарантированный выигрыш

независимо от поведения противника. Пара чистых стратегий

дает оптимальное решение игры тогда и только тогда, когда соответствующий им элемент

является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация называется седловой точкой, а соответствующая ей игра - игрой с седловой точкой.

Если седловая точка в платежной матрице отсутствует, то существует несколько наших чистых стратегий и стратегий противника, позволяющих получить цену игры. Выбор нами одной из стратегий наталкивается на естественное противодействие противника, желающего минимизировать свой проигрыш и выбирающего ответную стратегию с учетом информации о нашем выборе. Это обстоятельство приводит к тому, что мы вынуждены хранить свой выбор в тайне и, кроме этого, чередовать свои стратегии при многократном повторении игры по случайному закону. Если так не делать, то противник привыкнет к тому, что мы играем одинаково, и с учетом этого будет строить свою игру. Смешанной стратегией

называется применение стратегий

,...,

с вероятностями

,…,

, причем

. (8)

Будем записывать смешанные стратегии в виде матрицы

,

или в виде вектора

. Смешанные стратегии противника запишем аналогично, обозначая соответствующие вероятности буквой

,

или

. Найдем оптимальную стратегию

, обеспечивающую нам средний выигрыш не меньший, чем цена игры

(

). Математическое ожидание нашего выигрыша при реализации противником стратегии

.

Если

- цена игры, то при условии

имеем набор

ограничений

.

Учитывая (1)), будем искать набор

, обеспечивающий максимальную цену игры

, для чего сделаем замену переменных

. Запишем итоговые выражения для целевой функции и ограничений задачи оптимизации выбора стратегий

и решим задачу линейного программирования. Элементы нашей оптимальной смешанной стратегии

определяются подстановкой

. Оптимальная смешанная стратегия противника определяется аналогично:

а задача линейного программирования формулируется в виде

Тогда результатом решения задачи разработки управленческого решения будет последовательность наших стратегий, реализуемых по случайному закону с заданными вероятностями их появления.

Лабораторная работа №6. Решение однокритериальной статической задачи в условиях неопределенности при играх с противником

Задание

Используйте придуманную вами задачу разработки управленческого решения. Задайтесь параметром, который может быть в условиях неопределенности в результате возможных действий противника. Рассматривайте случай дуальной игры с противником с нулевой суммой и решите задачу.

Порядок выполнения работы

Из общего числа параметров вашей задачи разработки управленческого решения выберите один, который будет рассматриваться в условиях неопределенности. Согласуйте с преподавателем выбранный вами параметр.
На основе анализа ситуации в зависимости от возможных действий противника задайтесь возможными значениями случайного параметра , для которых будет делаться расчет. Каждое значение этого параметра будет определять одну из наших стратегий и одну из возможных стратегий противника.
Решая задачу с помощью надстройки Поиск решения, определите значение критериальной функции и соответствующие ему решения в предположении, что стратегия противника угадана, то есть мы предполагаем значение параметра , и в результате действий противника он принимает именно такое значение.
Постройте платежную матрицу, заполните ее диагональ значениями и отдельно запишите соответствующие им решения .
Используя выражение для показателя эффективности, рассчитайте значения критериальной функции в предположении, мы используем стратегию , то есть решение , а в результате действий противника параметр принимает значение .
Заполните значениями свободные клетки платежной матрицы.
Просматривая колонки платежной матрицы ( ), найдите для каждой строки наш гарантированный минимальный выигрыш .
Найдите номер нашей стратегии, обеспечивающей нам максимум гарантированного выигрыша (нижнюю цену игры) .
Просматривая строки платежной матрицы ( ), найдите для каждого столбца гарантированный максимальный проигрыш противника (верхнюю цену игры) .
Найдите номер стратегии противника, обеспечивающей ему минимум гарантированного выигрыша .
Сравните верхнюю и нижнюю цены игры и определите факт наличия или отсутствия седловой точки.
Если седловая точка существует ( ), то определите оптимальное решение задачи соответствующее номеру чистой стратегии, обеспечивающей .
Если седловая точка отсутствует ( ), то определите набор своих стратегий , которые обеспечивают значение , имеют свой выигрыш и будут чередоваться нами в случайном порядке. Аналогично определите набор стратегий противника . Сформируйте новую матрицу размером , элементы которой представляют выборку из платежной матрицы в соответствии с принятыми в рассмотрение стратегиями.
Отдельно сформулируйте и решите еще одну задачу линейного программирования, принимая во внимание ограничений

В соответствии с полученным решением по формуле определите набор вероятностей , с которыми необходимо чередовать стратегии .

Контрольные вопросы

Чем задача в условиях неопределенности отличается от задачи в условиях риска?
Что такое стратегия?
Что такое дуальная игра?
В каком случае игра может называться игрой с нулевой суммой?
В каком случае игра классифицируется как игра с противником?
Как составляется платежная матрица?
Чем элементы диагонали платежной матрицы отличаются от других элементов?
Что такое седловая точка?
В каком случае седловая точка может отсутствовать?
Что такое нижняя и верхняя цены игры?

Отчет о работе

Подготовьте отчет о выполненной лабораторной работе. Он должен содержать титульный лист, формулировку задания, исходные данные, описание проблемы, которая была разрешена. Укажите случайный параметр, взятый в рассмотрение, и обоснуйте его выбор. Приведите обоснование выбора его значений. Представьте платежную матрицу и результаты ее обработки. Определите факт наличие или отсутствия седловой точки. Если она существует, то приведите результаты решения задачи. Если седловой точки нет, то приведите набор стратегий, взятых в рассмотрение, представьте формулировку и результаты решения задачи определения набора вероятностей, с которыми будут чередоваться стратегии, и поставьте каждой в соответствие решение. Сформулируйте выводы, которые можно сделать по результатам выполненной работы.

Пример содержания отчета о выполнении лабораторной работы приведен в приложении Б.

Игры с природой.

Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению наших целей. Как и в случае игр с противником, нам должна быть известна платежная матрица, соответствующая нашему выигрышу при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации нам полезно дополнительно располагать информацией о вероятностях появления возможных состояний природы, заданной, например, в виде смешанных стратегий

.

Задача заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии, а отбрасывать «невыгодные» с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [3] вводится понятие риска

,

где

наш риск при использовании стратегии

в ответ на состояние природы

, а

- максимально возможный наш выигрыш при состоянии природы

. Если нам известны вероятности возможных состояний природы

, то было бы логичным в качестве своей стратегии принять одну из наших возможных стратегий

, максимизирующую наш средний выигрыш

.

Отметим, что указанная стратегия одновременно минимизирует средний риск.

Примечание. В случае игры с природой количество наших возможных стратегий

может отличаться от количества возможных стратегий природы

.

При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей

. Если нет никаких гипотез о вероятности появления определенного состояния природы, то используется принцип недостаточного основания Лапласа, когда вероятности назначаются равными друг другу

.

Если у нас существуют некоторые предположения о вероятностях появления определенных событий, то мы можем их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный, в том числе, и экспертным путем. Отметим, что в любом случае справедливо утверждение