Прикладная математика. шпоры по прикладной математике. 1. слау основные определения, каноническая форма записи слау
Скачать 0.72 Mb.
|
Если игроки договорятся играть по 3) или 5) вариантам то есть: 3) Первый игрок по 2-й чистой стратегии, а Второй по оптимальной стратегии или 4) Первый по оптимальной, а Второй по3-й чистой стратегии, то они смогут сократить риск игры по сравнению с оптимальными стратегиями (с 2 до ), при этом цена игры останется такой же, как если бы оба они играли по оптимальным стратегиям. 36. Матричная игра типа m*n. Критерий оптимальности стратегий. 37. Теорема о преобразовании матрицы игры, сохраняющем оптимальные стратегии игроков. 38. Основная теорема теории игр, выражение оптимальных стратегий игроков через решения пары двойственных задач ЛП. Математической моделью такого конфликта двух участников с противоположными интересами является игра с нулевой суммой. Участники это – игроки. Стратегия игрока – это выбор одного из множества возможных вариантов его действий. Рассмотрим конечные игры, в кот. множества стратегий игроков конечны; стратегии первого игрока пронумеруем от 1 до m, а стратегии второго игрока – от 1 до n. Если первый игрок выбрал свою i-ю стратегию, а второй игрок свою j-ю стратегию, то результатом такого совместного выбора будет платеж aij второго игрока первому. Таким образом, игра с нулевой суммой однозначно определяется платежной матрицей. Строки - соответствуют стратегиям первого игрока, столбцы -второго игрока. Игра происходит партиями. а11 а21 а1n П= а21 а22 а2n аm1 аm2 аmn Смешанной стратегий первого игрока называется вектор P (p1, p2,…pm ), где все pi 0 (i=1,2,…,m), а p =1. при этом p - вероятность, с которой первый игрок выбирает вою i-ю стратегию. Аналогично определяются смешанные стратегии и Q (q1, q2,…qn)второго игрока. Чистая стратегия также попадает под определение смешанной – если все вероятности равны нулю, кроме одной, равной единице. Если игроки применяют свои смешанные стратегии P (p1, p2,…pm ) и Q (q1, q2,…qn) соответственно, Выигрыш первого: выигрыш aij Вероятность pi qj. То есть первый игрок с вероятностью pi gj. выигрывает aij.. Математическое ожидание выигрыша первого игрока равно М(P,Q)= pi qj aij есть средний выигрыш. И это равно математическому ожиданию проигрыша второго игрока. Если игроки озабочены только максимизацией среднего дохода за партию игры то они будут играть со своими оптимальными стратегиями: – Первый игрок и – второй, оптимальны стратегии если М(P,Q*) М(P*,Q*) М(P*,Q) Математическое ожидание с. в. называется ценой игры, обозначим ее . Строка k доминирует над строкой i, если все элементы строки k не меньше соответствующих элементов строки i и хотя бы один строго больше. Доминируемую строку можно временно удалить, потому что в оптимальной стратегии ей будет соответствовать вероятность ноль. Столбец l доминирует над столбцом j, если все его элементы не больше соответствующих элементов столбца j, а хотя бы один строго меньше. Доминируемый столбец j можно временно удалить, т.к. в оптимальной стратегии 2-го игрока ей будет соответствовать вероятность ноль. Основная теорема теории матричных игр: В матричной игре с нулевой суммой у игроков есть оптимальные стратегии. Другими словами: Всякая матричная игра имеет седловую точку в смешанных стратегиях. 39. Игры с природой: основные понятия, матрицы рисков, критерии Вальда, Севиджа, Гурвица. Предположим, что лицо, принимающее решения может выбрать одну из возможных решений . Ситуация является неопределенной, понятно лишь, что наличествует какой-то из вариантов . Если будет принято -e решение, а состояние внешней среды соответствует -й ситуации, то фирма, возглавляемая ЛПР, получит доход . Матрица называется матрицей последствий (возможных решений). Неопределенная ситуация похожа на матричную игру, отличие состоит в том, что противником в данном случае является природа, цели которой не всегда противоположны нашим: они могут совпадать с целями ЛПР, а могут и не совпадать. Поэтому ситуация с неопределенностью называют еще играми с природой. В ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме? Допустим, мы хотим оценить риск, который несет -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть -я , то было бы принято решение, дающее доход . Значит, принимая -e решение мы рискуем получить не , а только , значит принятие -го решения несет риск недобрать . Матрица называется матрицей рисков. Более широкое понятие – неопределенность. Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации. Правило Вальда (крайнего пессимизма): рекомендует принять такое решение i0 , что Правило Сэвиджа (правило минимального риска): анализируется матрица рисков . Рекомендует принять решение , такое что Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение , на котором достигается максимум где . Значение выбирается из субъективных соображений. 40. Многокритериальная оптимизация. Задачи многокритериальной, или векторной, оптимизации возникают в тех случаях, когда имеется несколько целей, которые не могут быть отражены одним критерием (стоимость, надежность и т.п.) Требуется найти точку области допустимых решений, которая максимизирует или минимизирует все эти критерии. Обозначим i-й частный критерий через I(x), а область допустимых решений через Q. Учитывая, что изменением знака функции всегда можно свести задачу минимизации к задаче максимизации и наоборот, можно сформулировать задачу векторной оптимизации следующим образом: max x В идеальном случае в этой задаче можно вести поиск такого решения, которое принадлежит пересечению множеств оптимальных решений однокритериальных задач. Однако указанное пересечение обычно оказывается пустым множеством, и потому приходится рассматривать переговорное множество решений Парето. Вектор х* Q называется эффективным решением, если не существует такого х что Z (x) Z (x*), i=1,2, .,m, причем хотя бы для одного i имеет место строгое неравенство. Множество допустимых решений, для которых невозможно одновременно улучшить все частные показатели эффективности, принято называть областью Парето или областью компромиссов, а принадлежащие ей решения – эффективными или оптимальными по Парето. Основной вопрос, который изучается в многокритериальной оптимизации, - формулировка подходящего обобщенного критерия в зависимости от конкретной ситуации. В некоторых случаях вместо одного обобщенного критерия и решения одной задачи скалярной оптимизации предлагается рассматривать последовательность задач скалярной оптимизации. |