Рабочая тетрадь ТИ. РанхиГС
Скачать 0.89 Mb.
|
Критерий Байеса ( критерий максимального математического ожидания ). 27 При использовании этого критерия игроку А ( статистику ) должны быть известны вероятности , с которыми система ( окружающая среда ) находится в каждом из своих состояний S 1 , S 2 , …, S n Обозначим эти вероятности соответственно p 1 , p 2 , …, p n , при этом 1 = ∑ j j p Информация о вероятностях состояний окружающей среды может быть известна , например , на основе данных статистических наблюдений ( на метеостанциях более ста лет ежедневно фиксируются значения различных метеопараметров , на основе этой информации можно рассчитать статистическую вероятность – относительную частоту интересующего состояния окружающей среды ). Оптимальным можно считать такое поведение игрока А , при котором максимизируется его средний выигрыш ( математическое ожидание выигрыша ). Речь идет о максимизации среднего выигрыша при многократном повторении принятия решения Каждая строка дополняется числом : ∑ = = n j j ij i p a W 1 , m i ..., , 1 = Среди всех W i , выбирается максимальное ( которому и соответствует оптимальная стратегия ): i i W W max = Критерий недостаточного основания Лапласа . Если вероятности состояний окружающей среды примерно равны , или нет о них информации , то можно пользоваться критерием Лапласа : ∑ = = n j ij i a n W 1 1 , m i ..., , 1 = i i W W max = Максиминный критерий Вальда . Это критерий крайнего пессимизма , его использование абсолютно исключает риск : оптимальная стратегия соответствует нижней цене игры ( максимину ): ij j i a W min = , m i ..., , 1 = i i W W max = Критерий пессимизма - оптимизма Гурвица Крайнему пессимизму можно противопоставить крайний оптимизм ( критерий азартного игрока ), когда ставка делается на самый большой возможный выигрыш , т е на самый большой элемент платежной матрицы : ij j i a W max = , m i ..., , 1 = i i W W max = Но такой критерий принятия решения практически не применятся Зато применяется критерий « умеренного оптимизма », который называют критерием пессимизма - оптимизма Гурвица ( а также критерием обобщенного максимума ). Вводится коэффициент пессимизма ] 1 , 0 [ ∈ С , который определяется из соображений правдоподобия , здравого смысла или просто из интуитивных соображений ( чем больше значение С , тем больше пессимизма ). ij j ij j i a C a Ñ W max ) 1 ( min ⋅ − + ⋅ = , m i ..., , 1 = i i W W max = При 0 = C имеем критерий азартного игрока ( пессимизм отсутствует ). При 1 = C имеем максиминный критерий Вальда – позиция крайнего пессимизма Критерий_Ходжа_-_Лемана_.'>Критерий Ходжа - Лемана . 28 Этот критерий является промежуточным между критерием Байеса и максиминным критерием Вальда Если есть сомнения относительно достоверности информации о вероятностях состояний окружающей среды , то можно ввести соответствующий параметр ] 1 , 0 [ ∈ u – параметр достоверности информации о вероятностях состояний окружающей среды Чем меньше значение u, тем сильнее на принятие решения влияет исключение риска по критерию Вальда ij j n j j ij i a u p a u W min ) 1 ( 1 ⋅ − + ⋅ = ∑ = , m i ..., , 1 = i i W W max = При 0 = u имеем критерий Вальда При 1 = u имеем критерий Байеса Критерий минимаксого риска Сэвиджа . Наряду с платежной матрицей можно рассматривать матрицу рисков Если бы игрок А знал , в каком состоянии будет природа , например S j , то он выбрал бы ту свою стратегию , которая соответствует максимальному элементу j- го столбца ( максимальному выигрышу при состоянии природы S j ). В этом случае риск игрока А – потеря этого максимального выигрыша – равен нулю (r = 0). Риски для других стратегий – положительны , они равны разнице между максимальным элементов столбца и данным элементом : ij ij i ij a a r − = max , где ij i a max – максимальный элемент j- го столбца При анализе матрицы рисков цель игрока А – минимизировать свой риск Так , аналогом максиминного критерия Вальда является критерий минимаксного риска Сэвиджа , который также относится к позиции крайнего пессимизма Для матрицы рисков критерий рассчитывается следующим образом : ij j i r W max = , m i ..., , 1 = i i W W min = Можно заметить , что к матрице рисков также применимы и другие критерии , например , критерий Байеса , но теперь нужно минимизировать средний риск и т п Пример 7. Сельскохозяйственное предприятие может реализовать некоторую продукцию : ( А 1) сразу после уборки ; ( А 2) в зимние месяцы ; ( А 3) в весенние месяцы Прибыль зависит от цены реализации в данный период времени , затратами на хранение и возможных потерь Размер прибыли , рассчитанный для разных состояний - соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации , представлен в виде матрицы ( млн руб .): 1 S 2 S 3 S 1 A 2 -3 7 2 A -1 5 4 3 A -7 13 -3 Определить наиболее выгодную стратегию по всем критериям ( критерий Байеса , критерий Лапласа , максиминный критерий Вальда , критерий пессимизма - оптимизма Гурвица , критерий Ходжа - Лемана , критерий минимаксого риска Сэвиджа ), если вероятности состояний спроса : 0,2; 0,5; 0,3; коэффициент пессимизма С = 0,4; коэффициент достоверности информации о состояниях спроса u = 0,6. Решение Результаты расчетов будем заносить в таблицу : 29 S1 S2 S3 Б НО ММ П - О Х - Л А 1 2 -3 7 1 2 -3 3 -0,6 А 2 -1 5 4 3,5 2,7 -1 2,6 1,7 А 3 -7 13 -3 4,2 1 -7 5 -0,28 p j 0,2 0,5 0,3 А 3 А 2 А 2 А 3 А 2 1. Критерий Байеса ( максимального математического ожидания ) Расчет осуществляется по формуле 3 3 2 2 1 1 3 1 p a p a p a p a W i i i j j ij i + + = = ∑ = : 1 1 , 2 5 , 1 4 , 0 3 , 0 7 5 , 0 ) 3 ( 2 , 0 2 1 = + − = ⋅ + ⋅ − + ⋅ = W ; 5 , 3 2 , 1 5 , 2 2 , 0 3 , 0 4 5 , 0 5 2 , 0 1 2 = + + − = ⋅ + ⋅ + ⋅ − = W ; 2 , 4 9 , 0 5 , 6 4 , 1 3 , 0 ) 3 ( 5 , 0 13 2 , 0 7 3 = − + − = ⋅ − + ⋅ + ⋅ − = W Найденные значения заносим в первый столбец ( Б ) и выбираем максимальное 2 , 4 } 2 , 4 ; 5 , 3 ; 1 max{ = = W , значит оптимальной по данному критерию является стратегия А 3 – продавать в весенние месяцы 2. Критерий недостаточного основания Лапласа ( НО ) Находим среднее значение элементов каждой строки ) ( 3 1 3 1 3 2 1 3 1 i i i j ij i a a a a W + + = ⋅ = ∑ = : 2 6 3 1 ) 7 3 2 ( 3 1 1 = ⋅ = + − = W ; 7 , 2 8 3 1 ) 4 5 1 ( 3 1 2 ≈ ⋅ = + + − = W ; 1 3 3 1 ) 3 13 7 ( 3 1 3 = ⋅ = − + − = W Найденные значения заносим во второй столбец ( НО ) и выбираем максимальное 7 , 2 } 1 ; 7 , 2 ; 2 max{ = = W , значит оптимальной по данному критерию является стратегия А 2 – продавать в зимние месяцы 3. Максиминный критерий Вальда ( ММ ) В каждой строке находим минимальный элемент : ij j i a W 3 1 min ≤ ≤ = 3 } 7 ; 3 ; 2 min{ 1 − = − = W ; 1 } 4 ; 5 ; 1 min{ 2 − = − = W ; 7 } 3 ; 13 ; 7 min{ 3 − = − − = W Найденные значения заносим в третий столбец ( ММ ) и выбираем максимальное 1 } 7 ; 1 ; 3 max{ − = − − − = W , значит оптимальной по данному критерию является стратегия А 2 – продавать в зимние месяцы 4. Критерий пессимизма - оптимизма Гурвица ( П - О ) Для каждой строки рассчитываем значение критерия по формуле : ij j ij j i a Ñ a Ñ W 3 1 3 1 max ) 1 ( min ≤ ≤ ≤ ≤ ⋅ − + ⋅ = По условию 4 , 0 = C , значит : 3 2 , 4 2 , 1 7 6 , 0 ) 3 ( 4 , 0 } 7 ; 3 ; 2 max{ ) 4 , 0 1 ( } 7 ; 3 ; 2 min{ 4 , 0 1 = + − = ⋅ + − ⋅ = − ⋅ − + − ⋅ = W 6 , 2 3 4 , 0 5 6 , 0 ) 1 ( 4 , 0 } 4 ; 5 ; 1 max{ ) 4 , 0 1 ( } 4 ; 5 ; 1 min{ 4 , 0 2 = + − = ⋅ + − ⋅ = − ⋅ − + − ⋅ = W 5 8 , 7 8 , 2 13 6 , 0 ) 7 ( 4 , 0 } 3 ; 13 ; 7 max{ ) 4 , 0 1 ( } 3 ; 13 ; 7 min{ 4 , 0 3 = + − = = ⋅ + − ⋅ = − − ⋅ − + − − ⋅ = W 30 Найденные значения заносим в четвертый столбец ( П - О ) и выбираем максимальное 5 } 5 ; 6 , 2 ; 3 max{ = = W , значит оптимальной по данному критерию является стратегия А 3 – продавать в весенние месяцы 5. Критерий Ходжа - Лемана ( Х - Л ) Для каждой строки рассчитываем значение критерия по формуле : ij j j j ij i a u p a u W 3 1 3 1 min ) 1 ( ≤ ≤ = ⋅ − + ⋅ = ∑ По условию 6 , 0 = u и множители в каждом слагаемом уже рассчитаны , их можно взять их первого столбика ( Б ) и из третьего столбика ( ММ ), значит : 6 , 0 2 , 1 6 , 0 ) 3 ( ) 6 , 0 1 ( 1 6 , 0 1 − = − = − ⋅ − + ⋅ = W ; 7 , 1 4 , 0 1 , 2 ) 1 ( 4 , 0 5 , 3 6 , 0 2 = − = − ⋅ + ⋅ = W ; 28 , 0 8 , 2 52 , 2 ) 7 ( 4 , 0 2 , 4 6 , 0 3 − = − = − ⋅ + ⋅ = W Найденные значения заносим в пятый столбец ( Х - Л ) и выбираем максимальное 7 , 1 } 28 , 0 ; 7 , 1 ; 6 , 0 max{ = − − = W , значит оптимальной по данному критерию является стратегия А 2 – продавать в зимние месяцы 5. Критерий минимаксного риска Сэвиджа Рассчитаем матрицу рисков Заполнять ее лучше по столбцам В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца , результаты записываем на соответствующих местах Вот как рассчитывается первый столбец Максимальный элемент в первом столбце : 2 11 = a , значит по формуле ij ij i ij a a r − = max : 0 2 2 2 11 11 = − = − = a r ; 3 ) 1 ( 2 2 21 21 = − − = − = a r ; 9 ) 7 ( 2 2 31 31 = − − = − = a r Рассчитаем второй столбец матрицы рисков Максимальный элемент во втором столбце : 13 32 = a , значит : 16 ) 3 ( 13 13 12 12 = − − = − = a r ; 8 5 13 13 22 22 = − = − = a r ; 0 13 13 13 32 32 = − = − = a r Рассчитаем третий столбец матрицы рисков Максимальный элемент в третьем столбце : 7 13 = a , значит : 0 7 7 7 13 13 = − = − = a r ; 3 4 7 7 23 23 = − = − = a r ; 10 ) 3 ( 7 7 33 33 = − − = − = a r Таким образом , матрица рисков имеет вид ( в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль ): W i 0 16 0 16 3 8 3 8 9 0 10 10 Дополним матрицу рисков рассчитанными значениями критерия W i – в каждой строке выбираем максимальный элемент ( ij j i r W max = ): 16 } 0 ; 16 ; 0 max{ 1 = = W ; 8 } 3 ; 8 ; 3 max{ 2 = = W ; 10 } 10 ; 0 ; 9 max{ 3 = = W ; Найденные значения заносим в столбец (W i ) и выбираем минимальное 8 } 10 ; 8 ; 16 min{ = = W , значит оптимальной по данному критерию является стратегия А 2 – продавать в зимние месяцы Вывод : 1) Стратегия А 1 ( продавать сразу после уборки ) не является оптимальной ни по одному из критериев 31 2) Стратегия А 2 ( продавать в зимние месяцы ) является оптимальной согласно критериям недостаточного основания Лапласа , максиминного критерия Вальда и минимаксного критерия Сэвиджа 3) Стратегия А 3 ( продавать в весенние месяцы ) является оптимальной согласно критериям Байеса , пессимизма - оптимизма Гурвица , Ходжа - Лемана Задания для решения в аудитории 1. Директор финансовой компании проводит рискованную финансовую операцию Страховая компания предлагает застраховать сделку и предлагает 4 варианта страховки : А 1, А 2, А 3, А 4. Компенсация ущерба для каждого варианта зависит от того , какой из возможных страховых случаев произошел Выделяют 5 видов страховых случаев : S1, S2 , S3, S4, S5. Компенсации ( тыс у е .) для каждого вида страховки при каждом страховом случае составляют матрицу выигрышей S1 S2 S3 S4 S5 А 1 43 22 42 49 45 А 2 41 37 40 38 42 А 3 39 48 37 42 36 А 4 37 29 32 58 41 Выбрать наилучшую альтернативу , используя критерий Лапласа , Вальда , Байеса ( при вероятностях исходов , 1 , 0 , 2 , 0 , 3 , 0 3 2 1 = = = p p p 1 , 0 , 3 , 0 5 4 = = p p ), Сэвиджа и Гурвица ( при коэффициенте доверия 4 , 0 ), Ходжа - Лемана |