Системы поддержки принятия решения
![]()
|
Игры с противником.Рассмотрим задачу разработки управленческого решения с одним неопределенным фактором ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Полученные решения ![]() ![]() ![]() ![]() ![]() ![]() ![]() Занесем полученные значения в так называемую платежную матрицу, где строки ![]() ![]() ![]() ![]()
Очевидно, что аналогичная матрица может быть построена и при большем числе возможных стратегий ![]() ![]() Отыщем решение игры, пользуясь методами теории игр. Найдем нашу оптимальную стратегию, не зависящую от действий противника. В этом случае возникает вопрос о выборе критерия оптимальности. Например, в качестве используемой стратегии можно выбрать стратегию, которая приносит возможный максимальный выигрыш. Такая стратегия может оказаться весьма рискованной, поскольку в конкретной ситуации противник может ответить стратегией, приводящей к большему проигрышу. Более разумным представляется воспользоваться стратегией, которая минимизирует наш возможный проигрыш. Обозначим ![]() ![]() ![]() Из всех возможных наших стратегий выберем стратегию, которая обеспечит нам наибольшее значение нашего минимального выигрыша ![]() Назовем ![]() Если цели игроков противоположны, что имеет место в антагонистической игре, то противник заинтересован уменьшить наш выигрыш, и будет выбирать соответствующие стратегии. Вполне естественно предположить, что противник владеет методами оптимизации и теории игр и в свою очередь проводит аналогичные вычисления. Тогда полученная им платежная матрица будет иметь другие числовые значения, но ее смысл в отношении выбираемых стратегий не изменится. Поэтому мы можем анализировать возможные стратегии противника исходя из имеющейся у нас нашей платежной матрицы. Очевидно, что все это справедливо только в том случае, когда мы рассмотрели все возможные стратегии противника. Примечание. Если противник не будет пользоваться оптимальными методами, то это просто приведет к его дополнительному проигрышу. Найдем наш максимальный выигрыш при каждой стратегии противника ![]() Для того чтобы минимизировать свой проигрыш, противник выберет стратегию, в которой наш выигрыш минимален ![]() Назовем выигрыш ![]() ![]() ![]() Стратегии, соответствующие чистой цене игры, называются чистыми, а их совокупность дает оптимальное решение. Используя оптимальное решение, мы получаем минимальный гарантированный выигрыш ![]() ![]() ![]() ![]() Если седловая точка в платежной матрице отсутствует, то существует несколько наших чистых стратегий и стратегий противника, позволяющих получить цену игры. Выбор нами одной из стратегий наталкивается на естественное противодействие противника, желающего минимизировать свой проигрыш и выбирающего ответную стратегию с учетом информации о нашем выборе. Это обстоятельство приводит к тому, что мы вынуждены хранить свой выбор в тайне и, кроме этого, чередовать свои стратегии при многократном повторении игры по случайному закону. Если так не делать, то противник привыкнет к тому, что мы играем одинаково, и с учетом этого будет строить свою игру. Смешанной стратегией ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Будем записывать смешанные стратегии в виде матрицы ![]() или в виде вектора ![]() ![]() ![]() ![]() или ![]() ![]() ![]() ![]() ![]() ![]() Если ![]() ![]() ![]() ![]() Учитывая (1)), будем искать набор ![]() ![]() ![]() ![]() и решим задачу линейного программирования. Элементы нашей оптимальной смешанной стратегии ![]() ![]() ![]() а задача линейного программирования формулируется в виде ![]() Тогда результатом решения задачи разработки управленческого решения будет последовательность наших стратегий, реализуемых по случайному закону с заданными вероятностями их появления. Лабораторная работа №6. Решение однокритериальной статической задачи в условиях неопределенности при играх с противникомЗаданиеИспользуйте придуманную вами задачу разработки управленческого решения. Задайтесь параметром, который может быть в условиях неопределенности в результате возможных действий противника. Рассматривайте случай дуальной игры с противником с нулевой суммой и решите задачу. Порядок выполнения работыИз общего числа параметров вашей задачи разработки управленческого решения выберите один, который будет рассматриваться в условиях неопределенности. Согласуйте с преподавателем выбранный вами параметр. На основе анализа ситуации в зависимости от возможных действий противника задайтесь ![]() ![]() Решая задачу с помощью надстройки Поиск решения, определите значение критериальной функции и соответствующие ему решения в предположении, что стратегия противника угадана, то есть мы предполагаем значение параметра ![]() Постройте платежную матрицу, заполните ее диагональ значениями ![]() ![]() Используя выражение для показателя эффективности, рассчитайте значения критериальной функции ![]() ![]() ![]() ![]() Заполните значениями ![]() Просматривая колонки платежной матрицы ( ![]() ![]() ![]() Найдите номер нашей стратегии, обеспечивающей нам максимум гарантированного выигрыша (нижнюю цену игры) ![]() Просматривая строки платежной матрицы ( ![]() ![]() ![]() Найдите номер стратегии противника, обеспечивающей ему минимум гарантированного выигрыша ![]() Сравните верхнюю и нижнюю цены игры и определите факт наличия или отсутствия седловой точки. Если седловая точка существует ( ![]() ![]() ![]() Если седловая точка отсутствует ( ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Отдельно сформулируйте и решите еще одну задачу линейного программирования, принимая во внимание ![]() ![]() В соответствии с полученным решением ![]() ![]() ![]() ![]() Контрольные вопросыЧем задача в условиях неопределенности отличается от задачи в условиях риска? Что такое стратегия? Что такое дуальная игра? В каком случае игра может называться игрой с нулевой суммой? В каком случае игра классифицируется как игра с противником? Как составляется платежная матрица? Чем элементы диагонали платежной матрицы отличаются от других элементов? Что такое седловая точка? В каком случае седловая точка может отсутствовать? Что такое нижняя и верхняя цены игры? Отчет о работеПодготовьте отчет о выполненной лабораторной работе. Он должен содержать титульный лист, формулировку задания, исходные данные, описание проблемы, которая была разрешена. Укажите случайный параметр, взятый в рассмотрение, и обоснуйте его выбор. Приведите обоснование выбора его значений. Представьте платежную матрицу и результаты ее обработки. Определите факт наличие или отсутствия седловой точки. Если она существует, то приведите результаты решения задачи. Если седловой точки нет, то приведите набор стратегий, взятых в рассмотрение, представьте формулировку и результаты решения задачи определения набора вероятностей, с которыми будут чередоваться стратегии, и поставьте каждой в соответствие решение. Сформулируйте выводы, которые можно сделать по результатам выполненной работы. Пример содержания отчета о выполнении лабораторной работы приведен в приложении Б. Игры с природой.Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению наших целей. Как и в случае игр с противником, нам должна быть известна платежная матрица, соответствующая нашему выигрышу при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации нам полезно дополнительно располагать информацией о вероятностях появления возможных состояний природы, заданной, например, в виде смешанных стратегий ![]() ![]() Задача заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии, а отбрасывать «невыгодные» с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [3] вводится понятие риска ![]() где ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Отметим, что указанная стратегия одновременно минимизирует средний риск. Примечание. В случае игры с природой количество наших возможных стратегий ![]() ![]() При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей ![]() ![]() Если у нас существуют некоторые предположения о вероятностях появления определенных событий, то мы можем их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный, в том числе, и экспертным путем. Отметим, что в любом случае справедливо утверждение ![]() Лабораторная работа №7. Решение однокритериальной статической задачи в условиях неопределенности при играх с природойЗаданиеИспользуйте придуманную вами задачу разработки управленческого решения. Задайтесь параметрами, которые могут быть в условиях неопределенности. Рассмотрите случай игры с природой и решите задачу. Порядок выполнения работыИз общего числа параметров вашей задачи разработки управленческого решения выберите один, который будет рассматриваться в условиях неопределенности. Согласуйте с преподавателем выбранный вами параметр. На основе анализа ситуации в зависимости от возможных воздействий природы задайтесь ![]() ![]() ![]() Из числа значений случайного параметра ![]() ![]() ![]() ![]() ![]() ![]() Решая задачу с помощью надстройки Поиск решения, определите значение критериальной функции и соответствующие ему решения в предположении, что стратегия природы угадана, то есть мы предполагаем значение параметра ![]() Постройте платежную матрицу, заполните ее диагональ значениями ![]() ![]() Используя полученное решение ![]() ![]() ![]() ![]() ![]() В соответствии с максиминным критерием Вальда выберите стратегию, гарантирующая выигрыш не меньший, чем ![]() Определите наш максимальный выигрыш ![]() ![]() В соответствии с критерием минимаксного риска Сэвиджа определите стратегию, обеспечивающую минимальный риск ![]() Задайтесь несколькими значениями ![]() ![]() ![]() Сравните результаты расчетов и принятые решения при использовании критериев Вальда, Сэвиджа и Гурвица при различных ![]() Контрольные вопросыЧем игры с природой отличаются от игр с противником? Почему при играх с природой можно задавать значения вероятностей возникновения стратегий природы? Как можно определить вероятность возникновения стратегии природы? Чем матрица риска отличается от платежной матрицы? В чем заключается разница между критерием Вальда и критерием Сэвиджа? В чем заключается разница между критерием Вальда и критерием Гурвица? Почему игры с природой оказываются сложнее игр с противником? Что общего и в чем отличие методик разработки управленческого решения при играх с противником и играх с природой? Что такое смешанная стратегия? Из каких соображений следует выбирать параметр ![]() Отчет о работеПодготовьте отчет о выполненной лабораторной работе. Он должен содержать титульный лист, формулировку задания, исходные данные, описание проблемы, которая была разрешена. Укажите случайный параметр, взятый в рассмотрение, и обоснуйте его выбор. Приведите обоснование выбора его значений. Представьте платежную матрицу и результаты ее обработки. Укажите решение, полученное при использовании критерия Вальда. Представьте матрицу риска и укажите решение, полученное при использовании критерия Сэвиджа. Приведите результаты решения задачи с использованием критерия Гурвица. Покажите зависимость принятого решения от значения параметра ![]() Пример содержания отчета о выполнении лабораторной работы приведен в приложении Б. Игры с природой с экспериментами.Рассмотренные выше игры с природой предусматривали необходимость принятия нами решения в условиях неопределенности на основе имеющихся у нас данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами. Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а мы можем только делать вывод о целесообразности его проведения на основании имеющейся априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки ![]() Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания мы можем принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте), или быть неограниченным (неограниченный последовательный эксперимент). Будем считать, что в нашем распоряжении имеется набор ![]() ![]() ![]() ![]() ![]() ![]() Известна также платежная матрица ![]() ![]() Наш средний выигрыш ![]() ![]() ![]() В качестве оптимальной стратегии может быть выбрана стратегия ![]() ![]() Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы ![]() ![]() Оценим теперь средний возможный выигрыш после проведения эксперимента ![]() где ![]() ![]() или ![]() Преобразовывая неравенство, имеем ![]() Выражение в круглых скобках есть ничто иное как риск ![]() Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной следует выбрать стратегию максимизирующую средний выигрыш или минимизирующую средний риск. Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из ![]() ![]() ![]() ![]() ![]() ![]() ![]() Будем считать, что все значения ![]() ![]() ![]() ![]() Далее для каждой стратегии рассчитаем величину условного среднего выигрыша при условии результата эксперимента ![]() ![]() Очевидно, что оптимальной будет стратегия ![]() ![]() ![]() Вероятность появления условного выигрыша ![]() ![]() ![]() ![]() Величина выигрыша с использованием эксперимента ![]() С другой стороны наш выигрыш без проведения эксперимента определяется выражением ![]() Отсюда вытекает условие целесообразности проведения эксперимента ![]() Если проведение эксперимента признано целесообразным, то необходимо разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию ![]() ![]() Лабораторная работа №8. Решение однокритериальной статической задачи в условиях неопределенности при играх с природой с экспериментамиЗаданиеИспользуйте придуманную вами задачу разработки управленческого решения. Задайтесь параметрами, которые могут быть в условиях неопределенности. Рассмотрите случай игры с природой с экспериментами и решите задачу. Порядок выполнения работыИз общего числа параметров вашей задачи разработки управленческого решения выберите один, который будет рассматриваться в условиях неопределенности. Согласуйте с преподавателем выбранный вами параметр. На основе анализа ситуации в зависимости от возможных воздействий природы задайтесь ![]() ![]() ![]() Из числа значений случайного параметра ![]() ![]() ![]() ![]() ![]() ![]() Решая задачу с помощью надстройки Поиск решения, определите значение критериальной функции и соответствующие ему решения в предположении, что стратегия природы угадана, то есть мы предполагаем значение параметра ![]() Постройте платежную матрицу, заполните ее диагональ значениями ![]() ![]() Используя полученное решение ![]() ![]() ![]() ![]() ![]() По формуле (1)) рассчитайте средний выигрыш при использовании каждой из ![]() Определите величину максимального среднего выигрыша и соответствующую ему стратегию ![]() Предположите, что в результате эксперимента вам удалось точно узнать состояние природы. Тогда по формуле (1)) вычислите его величину ![]() Учитывая, что стратегии природы чередуются с некоторыми вероятностями ![]() ![]() Задайтесь неким значением ![]() ![]() Определите результат вычисления неравенства ![]() Проведите исследование зависимости целесообразности проведения эксперимента от величины затрат ![]() Контрольные вопросыЧем игры с природой с экспериментами отличаются от обычных игр с природой? Что такое априорные данные? Когда целесообразно проведение эксперимента? Что такое единичный эксперимент? Что такое последовательный эксперимент? Как определить наш средний возможный выигрыш после проведения эксперимента? Как рассчитать максимальный средний выигрыш? Что представляет собой решение задачи? В чем отличие методики целесообразности определения эксперимента по критериям Вальда и Сэвиджа? Что такое апостериорные данные? Отчет о работеПодготовьте отчет о выполненной лабораторной работе. Он должен содержать титульный лист, формулировку задания, исходные данные, описание проблемы, которая была разрешена. Укажите случайный параметр, взятый в рассмотрение, и обоснуйте его выбор. Приведите обоснование выбора его значений. Представьте платежную матрицу и результаты ее обработки. Укажите предполагаемые затраты на эксперимент и полученные в соответствии с ними решения. Сформулируйте выводы, которые можно сделать по результатам выполненной работы. Пример содержания отчета о выполнении лабораторной работы приведен в приложении Б. |