Главная страница
Навигация по странице:

  • 36. Матричная игра типа m * n . Критерий оптимальности стратегий. 37. Теорема о преобразовании матрицы игры, сохраняющем оптимальные стратегии игроков.

  • 38. Основная теорема теории игр, выражение оптимальных стратегий игроков через решения пары двойственных задач ЛП.

  • Если игроки применяют свои смешанные стратегии

  • 39. Игры с природой: основные понятия, матрицы рисков, критерии Вальда, Севиджа, Гурвица.

  • 40. Многокритериальная оптимизация.

  • Прикладная математика. шпоры по прикладной математике. 1. слау основные определения, каноническая форма записи слау


    Скачать 0.72 Mb.
    Название1. слау основные определения, каноническая форма записи слау
    АнкорПрикладная математика
    Дата18.08.2022
    Размер0.72 Mb.
    Формат файлаdoc
    Имя файлашпоры по прикладной математике.doc
    ТипДокументы
    #648287
    страница5 из 5
    1   2   3   4   5


    Если игроки договорятся играть по 3) или 5) вариантам то есть:

    3) Первый игрок по 2-й чистой стратегии, а Второй по оптимальной стратегии или

    4) Первый по оптимальной, а Второй по3-й чистой стратегии,

    то они смогут сократить риск игры по сравнению с оптимальными стратегиями (с 2 до ), при этом цена игры останется такой же, как если бы оба они играли по оптимальным стратегиям.
    36. Матричная игра типа m*n. Критерий оптимальности стратегий.

    37. Теорема о преобразовании матрицы игры, сохраняющем оптимальные стратегии игроков.

    38. Основная теорема теории игр, выражение оптимальных стратегий игроков через решения пары двойственных задач ЛП.

    Математической моделью такого конфликта двух участников с противоположными интересами является игра с нулевой суммой. Участники это – игроки. Стратегия игрока – это выбор одного из множества возможных вариантов его действий. Рассмотрим конечные игры, в кот. множества стратегий игроков конечны; стратегии первого игрока пронумеруем от 1 до m, а стратегии второго игрока – от 1 до n. Если первый игрок выбрал свою i-ю стратегию, а второй игрок свою j-ю стратегию, то результатом такого совместного выбора будет платеж aij второго игрока первому. Таким образом, игра с нулевой суммой однозначно определяется платежной матрицей. Строки - соответствуют стратегиям первого игрока, столбцы -второго игрока. Игра происходит партиями.

    а11 а21 а1n

    П= а21 а22 а2n
    аm1 аm2 аmn
    Смешанной стратегий первого игрока называется вектор P (p1, p2,…pm ), где все pi 0 (i=1,2,…,m), а p =1. при этом p - вероятность, с которой первый игрок выбирает вою i-ю стратегию. Аналогично определяются смешанные стратегии и Q (q1, q2,…qn)второго игрока. Чистая стратегия также попадает под определение смешанной – если все вероятности равны нулю, кроме одной, равной единице.

    Если игроки применяют свои смешанные стратегии P (p1, p2,…pm ) и Q (q1, q2,…qn) соответственно, Выигрыш первого: выигрыш aij

    Вероятность pi qj.

    То есть первый игрок с вероятностью pi gj. выигрывает aij.. Математическое ожидание выигрыша первого игрока равно М(P,Q)= pi qj aij есть средний выигрыш. И это равно математическому ожиданию проигрыша второго игрока. Если игроки озабочены только максимизацией среднего дохода за партию игры то они будут играть со своими оптимальными стратегиями: – Первый игрок и – второй, оптимальны стратегии если М(P,Q*) М(P*,Q*) М(P*,Q)

    Математическое ожидание с. в. называется ценой игры, обозначим ее .

    Строка k доминирует над строкой i, если все элементы строки k не меньше соответствующих элементов строки i и хотя бы один строго больше. Доминируемую строку можно временно удалить, потому что в оптимальной стратегии ей будет соответствовать вероятность ноль. Столбец l доминирует над столбцом j, если все его элементы не больше соответствующих элементов столбца j, а хотя бы один строго меньше.

    Доминируемый столбец j можно временно удалить, т.к. в оптимальной стратегии 2-го игрока ей будет соответствовать вероятность ноль.

    Основная теорема теории матричных игр:

    В матричной игре с нулевой суммой у игроков есть оптимальные стратегии.

    Другими словами: Всякая матричная игра имеет седловую точку в смешанных стратегиях.
    39. Игры с природой: основные понятия, матрицы рисков, критерии Вальда, Севиджа, Гурвица.

    Предположим, что лицо, принимающее решения может выбрать одну из возможных решений . Ситуация является неопределенной, понятно лишь, что наличествует какой-то из вариантов .

    Если будет принято -e решение, а состояние внешней среды соответствует -й ситуации, то фирма, возглавляемая ЛПР, получит доход . Матрица называется матрицей последствий (возможных решений).

    Неопределенная ситуация похожа на матричную игру, отличие состоит в том, что противником в данном случае является природа, цели которой не всегда противоположны нашим: они могут совпадать с целями ЛПР, а могут и не совпадать. Поэтому ситуация с неопределенностью называют еще играми с природой.

    В ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?

    Допустим, мы хотим оценить риск, который несет -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть -я , то было бы принято решение, дающее доход .

    Значит, принимая -e решение мы рискуем получить не , а только , значит принятие -го решения несет риск недобрать . Матрица называется матрицей рисков.

    Более широкое понятие – неопределенность. Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации.

    Правило Вальда (крайнего пессимизма): рекомендует принять такое решение i0 , что Правило Сэвиджа (правило минимального риска): анализируется матрица рисков . Рекомендует принять решение , такое что

    Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение , на котором достигается максимум где . Значение выбирается из субъективных соображений.
    40. Многокритериальная оптимизация.

    Задачи многокритериальной, или векторной, оптимизации возникают в тех случаях, когда имеется несколько целей, которые не могут быть отражены одним критерием (стоимость, надежность и т.п.)

    Требуется найти точку области допустимых решений, которая максимизирует или минимизирует все эти критерии. Обозначим i-й частный критерий через I(x), а область допустимых решений через Q. Учитывая, что изменением знака функции всегда можно свести задачу минимизации к задаче максимизации и наоборот, можно сформулировать задачу векторной оптимизации следующим образом: max x

    В идеальном случае в этой задаче можно вести поиск такого решения, которое принадлежит пересечению множеств оптимальных решений однокритериальных задач. Однако указанное пересечение обычно оказывается пустым множеством, и потому приходится рассматривать переговорное множество решений Парето. Вектор х* Q называется эффективным решением, если не существует такого х что Z (x) Z (x*), i=1,2, .,m, причем хотя бы для одного i имеет место строгое неравенство. Множество допустимых решений, для которых невозможно одновременно улучшить все частные показатели эффективности, принято называть областью Парето или областью компромиссов, а принадлежащие ей решения – эффективными или оптимальными по Парето.

    Основной вопрос, который изучается в многокритериальной оптимизации, - формулировка подходящего обобщенного критерия в зависимости от конкретной ситуации. В некоторых случаях вместо одного обобщенного критерия и решения одной задачи скалярной оптимизации предлагается рассматривать последовательность задач скалярной оптимизации.

    1   2   3   4   5


    написать администратору сайта