Теоретико-игровые методы принятия решений (Еремеев А. П.). Теоретико-игровые методы принятия решений (Еремеев А. П. Учебное пособие по курсам Теория игр и исследование операций, Теория принятия решений
Скачать 1.18 Mb.
|
5.2.Методы решения игр «с природой»5.2.1.Случай стохастической неопределенностиВ случае стохастической неопределенности предполагаются известными вероятности qj состояний «природы» Пj, j = 1, …, n. Для поиска оптимального решения применяется критерий Лапласа, согласно которому оптимальной для ЛПР является та стратегия, которая максимизирует средний выигрыш ai: Легко показать, что эта же стратегия будет минимизировать средний риск ri: В качестве примера рассмотрим игру, матрицы выигрышей и рисков которой представлены табл. 5.2 и табл. 5.3 соответственно. Пусть заданы вероятности qj: q1=0,1;q2=0,5;q3=q4=0,2. Тогда: a1 = 1·0,1+4·0,5+14·0,2 = 4,9; a2 = 3·0,1+8·0,5+7·0,2 = 5,7; a3= 4·0,1+6·0,5+8·0,2 = 5. Согласно критерию Лапласа оптимальной является стратегия А2. Расчет относительно рисков также приведет к стратегии А2: r1= 3·0,1+4·0,5+1·0,2 = 2,5; r2 = 1·0,1+0·0,5+8·0,2 = 1,7; r3 = 0·0,1+2·0,5+7·0,2 = 2.4. 5.2.2.Случай с неизвестными вероятностями |
Пj Ai | П1 | П2 | П3 | П4 | i | wi | hi |
A1 | 19 | 30 | 41 | 49 | 19 | 49 | 31 |
A2 | 51 | 38 | 10 | 20 | 10 | 51 | 26,4 |
A3 | 73 | 718 | 81 | 11 | 11 | 81 | 39 |
Таблица 5.30
G(34)
Пj Ai | П1 | П2 | П3 | П4 | si |
A1 | 54 | 8 | 0 | 0 | 54 |
A2 | 22 | 0 | 71 | 29 | 71 |
A3 | 0 | 30 | 40 | 38 | 40 |
Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: , , , .
Применение соответствующих критериев приведет к следующим результатам:
согласно критерию Вальда оптимальной для ЛПР стратегией будет A1;
согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A3;
согласно критерию Гурвица (с k = 0,6) оптимальной для ЛПР стратегией будет A3.
Два критерия из трех рекомендуют ЛПР выбрать стратегию A3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегию A1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.
Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:
в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;
аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qi состояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.