Главная страница
Навигация по странице:

  • Критерий Вальда

  • Критерий Сэвиджа

  • Компромиссный критерий Гурвица

  • Теоретико-игровые методы принятия решений (Еремеев А. П.). Теоретико-игровые методы принятия решений (Еремеев А. П. Учебное пособие по курсам Теория игр и исследование операций, Теория принятия решений


    Скачать 1.18 Mb.
    НазваниеУчебное пособие по курсам Теория игр и исследование операций, Теория принятия решений
    АнкорТеоретико-игровые методы принятия решений (Еремеев А. П.).doc
    Дата27.03.2018
    Размер1.18 Mb.
    Формат файлаdoc
    Имя файлаТеоретико-игровые методы принятия решений (Еремеев А. П.).doc
    ТипУчебное пособие
    #17282
    КатегорияМатематика
    страница12 из 15
    1   ...   7   8   9   10   11   12   13   14   15

    5.2.Методы решения игр «с природой»

    5.2.1.Случай стохастической неопределенности


    В случае стохастической неопределенности предполагаются известными вероятности qj состояний «природы» Пj, j = 1, …, n. Для поиска оптимального решения применяется критерий Лапласа, согласно которому оптимальной для ЛПР является та стратегия, которая максимизирует средний выигрыш ai:



    Легко показать, что эта же стратегия будет минимизировать средний риск ri:



    В качестве примера рассмотрим игру, матрицы выигрышей и рисков которой представлены табл. 5.2 и табл. 5.3 соответственно.

    Пусть заданы вероятности qj: q1=0,1;q2=0,5;q3=q4=0,2.

    Тогда:

    a1 = 1·0,1+4·0,5+14·0,2 = 4,9;

    a2 = 3·0,1+8·0,5+7·0,2 = 5,7;

    a3= 4·0,1+6·0,5+8·0,2 = 5.

    Согласно критерию Лапласа оптимальной является стратегия А2.

    Расчет относительно рисков также приведет к стратегии А2:

    r1= 3·0,1+4·0,5+1·0,2 = 2,5;

    r2 = 1·0,1+0·0,5+8·0,2 = 1,7;

    r3 = 0·0,1+2·0,5+7·0,2 = 2.4.

    5.2.2.Случай с неизвестными вероятностями
    состояний «природы»


    Если вероятности состояний «природы» не известны, то для поиска решения ЛПР может применять различные критерии оптимальности. Рассмотрим наиболее используемые критерии.

    Критерий Вальда – наиболее осторожный критерий (критерий крайнего пессимизма), согласно которому оптимальной для ЛПР является стратегия, максимизирующая минимальный выигрыш:

    .

    Критерий Сэвиджа также осторожный критерий, согласно которому оптимальной для ЛПР является стратегия, минимизирующая максимальный риск:

    .

    Компромиссный критерий Гурвица – компромиссный критерий, согласно которому в качестве оптимальной для ЛПР выбирается стратегия, максимизирующая следующее выражение:

    ,

    где k – коэффициент осторожности (пессимизма), 0   1. Заметим, что при k = 1 критерий Гурвица переходит в критерий Вальда, а при k = 0 имеем так называемый критерий «крайнего оптимизма», предлагающий ЛПР в качестве оптимальной стратегию, максимизирующую максимальный выигрыш.

    Естественно, чем ответственнее выбор и чем меньше склонен рисковать ЛПР, тем ближе к 1 следует выбирать коэффициент k. При отсутствии у ЛПР информации для выбора или «по умолчанию» рекомендуется выбирать k 0,6.

    Если ЛПР сомневается при выборе критерия оптимальности, то рекомендуется применить несколько критериев и выбрать ту стратегию, которую рекомендует большинство из них.

    В качестве примера рассмотрим игру с «природой», матрицы G(34)и R(34)которой с некоторыми дополнительными столбцами представлены соответственно табл. 5.4 и табл. 5.5.

    Таблица 5.29

    G(34)

    Пj

    Ai

    П1

    П2

    П3

    П4

    i

    wi

    hi

    A1

    19

    30

    41

    49

    19

    49

    31

    A2

    51

    38

    10

    20

    10

    51

    26,4

    A3

    73

    718

    81

    11

    11

    81

    39


    Таблица 5.30

    G(34)

    Пj

    Ai

    П1

    П2

    П3

    П4

    si

    A1

    54

    8

    0

    0

    54

    A2

    22

    0

    71

    29

    71

    A3

    0

    30

    40

    38

    40


    Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: , , , .

    Применение соответствующих критериев приведет к следующим результатам:

    • согласно критерию Вальда оптимальной для ЛПР стратегией будет A1;

    • согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A3;

    • согласно критерию Гурвица (с k = 0,6) оптимальной для ЛПР стратегией будет A3.

    Два критерия из трех рекомендуют ЛПР выбрать стратегию A3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегию A1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.

    Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:

    • в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;

    • аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qi состояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.
    1   ...   7   8   9   10   11   12   13   14   15


    написать администратору сайта