Учебник. Кафедра Математических методов принятия решений
Скачать 1.84 Mb.
|
Пример решения матричной игры со смешанным расширением. Рассмотрим пример решения матричной игры со смешанным расширением. Платёжную матрицу игры составим на основе исходных данных задачи, решённой при выполнении занятия 3, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (табл. 31). Таблица 31. Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию Цена реализации 1 ед. продукции, д.е. Доля продукции предприятия 1, купленной населением Предп. 1 Предп. 2 10 10 0,31 10 6 0,33 10 2 0,18 6 10 0,7 6 6 0,3 6 2 0,2 2 10 0,9 2 6 0,85 2 2 0,69 Применив к исходным данным задачи формулу (40) определения разницы прибыли от производства продукции, получим следующую платёжную матрицу (рис. 24) Рис. 24. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона» В данной матрице (рис. 24) нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию. Решение задачи. 1. В данной матрице имеются отрицательные коэффициенты. Для соблюдения условия неотрицательности в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 – значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу, преобразованную для выполнения условия не отрицательности (рис. 25) Рис. 25. Платёжная матрица, преобразованная для выполнения условия неотрицательности 2. Опишем задачу линейного программирования для каждого игрока в виде системы линейных неравенств: Для игрока 1: Для игрока 2: 3. Решим обе задачи с использованием симплекс-метода, применяя программный комплекс «Линейная оптимизация». В результате решения задачи получим следующие значения целевой функции и переменных: 4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения переменных на , : , 5. Определим значение цены игры. Для этого из величины V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента). Таким образом, в данной игре выиграет предприятие 1 (значение ). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 – с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 – с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е. Вопрос 3. Принятие решений в условиях неопределенности Понятие о статистических играх. Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени. Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР). [3,6,9,10]. В общем виде платёжная матрица статистической игры приведена на рис. 26. Рис. 26. Общий вид платёжной матрицы статистической игры В данной игре строки матрицы (A i ) – стратегии ЛПР, а столбцы матрицы (S j ) – состояния окружающей среды. Критерии принятия решения. ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (A i ) приписывается некоторый результат W i , характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПР выбирает элемент W, который наилучшим образом отражает мотивацию его поведения. Критерий максимального математического ожидания выигрыша. Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР: (41) где – вероятность -го состояния окружающей среды. Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально: Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая: 1. ЛПР известны вероятности всех состояний окружающей среды; 2. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша. Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия. Критерий недостаточного основания Лапласа. Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша: (42) Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: Использование данного критерия оправдано в следующей ситуации: 1. ЛПР не имеет информации, либо имеет неполную информацию о вероятностях состояний окружающей среды; 2. Вероятности состояний окружающей среды близки по своим значениям; 3. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша. Максиминный критерий Вальда. Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом: Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР: (43) Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать ММ-критерий одним из фундаментальных. Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая: 1. О возможности появления состояний окружающей среды ничего не известно. 2. Решение реализуется только один раз. 3. Необходимо исключить какой бы то ни было риск. Критерий минимаксного риска Сэвиджа. Величина ( ), где – максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией. На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска. Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой ( ) определяется по формуле: (44) Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов по каждой из стратегий ЛПР: Оптимальной по данному критерию считается та стратегия, в которой значение минимально: Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ- критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша. Критерий пессимизма-оптимизма Гурвица. В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска. Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях. Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле: (45) Где – коэффициент пессимизма. Оптимальной по данному критерию считается стратегия, в которой значение максимально: При критерий Гурвица превращается в ММ-критерий. При он превращается в критерий «азартного игрока», делающего ставку на то, что «выпадет» наилучший случай. Критерий Гурвица применяется в ситуации, когда: 1. Информация о состояниях окружающей среды отсутствует или недостоверна. 2. Необходимо считаться с появлением каждого состояния окружающей среды. 3. Реализуется только малое количество решений. 4. Допускается некоторый риск. Критерий Ходжа-Лемана. Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале . Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае – ММ-критерий. Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле: (46) где u – параметр достоверности информации о вероятностях состояний окружающей среды. Оптимальной по данному критерию считается та стратегия, в которой значение максимально: Данный критерий применим в следующем случае: 1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться. 2. Принятое решение теоретически допускает бесконечно много реализаций. 3. При малом числе реализации допускается некоторый риск. Пример решения статистической игры. Рассмотрим пример решения статистической игры в экономической задаче. Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации – с осени до начала лета следующего года. Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации: A1 – реализовать всю капусту осенью, непосредственно после уборки; A2 – заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев; A3 – заложить всю капусту на хранение и реализовать её в весенние месяцы. Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц. На региональном рынке капусты может сложиться одна из следующих трёх ситуаций: S1 – поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта; S2 – в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен – в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации; S3 – в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются. Поэтому рынок испытывает значительные сезонные колебания цен. Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 32. Таблица 32. Выручка от реализации капусты, тыс. д.е. Стратегии хозяйства Выручка от реализации капусты, тыс. д.е. S1 S2 S3 A1 30 25 22 A2 30 40 33 A3 30 40 60 В задаче необходимо определить: 1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно. 2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо: а) получить минимально гарантированный выигрыш; б) учесть значения риска от принятия различных решений; в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3. 3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7. 4. Дать экономическую интерпретацию результатов решения задачи. Решение. 1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (рис. 27.). Рис. 27. Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты 2. Определим наиболее выгодную стратегию по критерию максимального математического ожидания выигрыша: Рис. 28. Определение оптимальной стратегии в статистической игре по критерию максимального математического ожидания Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 ( ) (рис. 28.). 3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма (на рисунке – ПО-критерий, рис. 29). Рис. 29. Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма Значения для ММ-критерия: Оптимальной стратегией по максиминному критерию является стратегия A1 ( ). Определим оптимальную стратегию по критерию недостаточного основания Лапласа. По данному критерию оптимальной является стратегия A1 ( ). По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 – стратегия A3 ( ). 4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (рис. 30). Рис. 30. Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков Оптимальной стратегией по критерию минимаксного риска является стратегия A2 ( ). 5. Определим наиболее выгодную стратегию предприятия по критерию Ходжа-Лемана ( рис. 31). Рис. 31. Определение оптимальной стратегии в статистической игре по критерию Ходжа- Лемана По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 ( ). 6. Проведём экономическую интерпретацию результатов решения задачи. Если предприятие имеет информацию о вероятностях состояния рынка капусты и значения этих вероятностей соответствуют исходным данным задачи, наиболее выгодной стратегией является продажа части капусты в осенние месяцы и хранение оставшейся капусты для реализации в течение зимних месяцев (прибыль составит 6,3 тыс. д.е.). Эта же стратегия является наиболее эффективной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо минимизировать степень возможного риска потери прибыли в процессе принятия решения (значение возможного риска составит 17 тыс. д.е.). В случае, когда при отсутствии информации о состоянии рынка наиболее существенным для предприятия является не максимизация прибыли в абсолютном выражении, а получение её гарантированного объема, хотя бы и минимального, наиболее целесообразным решением является реализация всей капусты в осенние месяцы (прибыль составит 2 тыс. д.е.). Это же стратегия является наиболее выгодной, если предприятие имеет информацию о вероятностях состояний рынка, соответствующую исходным данным, но эта информация не вполне достоверна (в случае, если информация имеет достоверность 0,7, прибыль составит 4,94 тыс. д.е.). В случае, если информация о вероятностях состояний рынка отсутствует и риск значительных потерь не является для предприятия определяющим фактором при принятии решения, или если есть основания для оптимистической оценки ситуации на рынке капусты, при котором предприятие имеет возможность получить наибольшую прибыль от производства капусты, ему следует сохранить произведённую продукцию и реализовать её в весенние месяцы (прибыль составит соответственно 5.7 и 11 тыс. д.е.). |