Главная страница
Навигация по странице:

  • При изучении данной темы необходимо акцентиро- вать внимание на следующих понятиях

  • Для самопроверки по теме 4 необходимо ответить на вопросы

  • Цели и задачи изучения темы: познакомить студента с классической теорией игр с природой – игр, в которых сознательно дейст- вует только один из участников. 4.1. Понятие игры с природой

  • 4.2. Принятие решений в условиях полной неопределенности

  • Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики


    Скачать 1.32 Mb.
    НазваниеМеждународный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики
    Дата25.04.2023
    Размер1.32 Mb.
    Формат файлаpdf
    Имя файлаModelirovanie_riskovykh_situatsiy_Kiseleva_I_A_Uch_-prakt_pos_ME.pdf
    ТипУчебно-практическое пособие
    #1089553
    страница7 из 11
    1   2   3   4   5   6   7   8   9   10   11
    Тема 4.
    Принятие решений в условиях
    неопределенности и риска (игры с природой)
    Изучив данную тему, студент должен
    знать:
    • сущность и основные действия в играх с природой;
    уметь:
    • находить рациональные решения первого игрока в играх с природой;
    • строить таблицу решений стратегий в условиях неопределен- ности;
    • находить рациональное решение в играх с природой;
    • находить методы оценки истинной стоимости информации в условиях неопределенности и риска.
    При изучении данной темы необходимо акцентиро-
    вать внимание на следующих понятиях:
    • игры с природой
    ;
    • интерпретация природы
    ;
    • мажорирование стратегий в играх с природой;

    «дурная неопределенность»
    ;
    • нахождение оптимальных стратегий первого игрока при за- данных вероятностных состояниях природы;
    • оценка истинной стоимости информации.
    Для самопроверки по теме 4 необходимо ответить на
    вопросы:
    1. Что такое «игра с природой».
    2. В чем состоит отличие игр с природой от стратегических.
    3. Принятие решений в условиях полной неопределенности.
    4. Принятие решений в условиях риска.
    5. Осуществлять выбор решений с помощью дерева решений.
    6. Что означает «дурная неопределенность».
    7. Критерии максимакса, Вальда, Сэвиджа, Гурвица.
    8. Различие матрицы выигрышей и рисков.

    Моделирование рисковых ситуаций
    62
    Понятие игры с природой. Отличие игр с природой от стратегических. Принятие решений в условиях полной неопределенности. Принятие решений в условиях рис- ка. Выбор решений с помощью дерева решений (позиционные игры).
    Цели и задачи изучения темы:
    познакомить студента с классической теорией игр с природой – игр, в которых сознательно дейст- вует только один из участников.
    4.1. Понятие игры с природой
    Ситуации, описываемые рассмотренными в гл. 3 моделями в виде стратегических игр, в экономической практике могут не в полной мере оказаться адекватными действи- тельности, поскольку реализация модели предполагает многократность повторения дей- ствий (решений), предпринимаемых в похожих условиях. В реальности количество при- нимаемых экономических решений в неизменных условиях жестко ограничено. Нередко экономическая ситуация является уникальной, и решение в условиях неопределенности должно приниматься однократно. Это порождает необходимость развития методов мо- делирования принятия решений в условиях неопределенности и риска.
    Традиционно следующим этапом такого развития являются так называемые игры с природой. Формально изучение игр с природой, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее тру- доемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.
    Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Иг- рок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по иг- ре. Поэтому термин «природа» характеризует некую объективную действительность, ко- торую не следует понимать буквально, хотя вполне могут встретиться ситуации, в кото- рых «игроком» 2 действительно может быть природа (например, обстоятельства, связан- ные с погодными условиями или с природными стихийными силами).
    На примере игры с природой рассмотрим проблему заготовки угля на зиму.
    Задача 1.
    Необходимо закупить уголь для обогрева дома. Количество хранимого угля ограничено и в течение холодного периода должно быть полностью израсходовано.
    Предполагается, что неизрасходованный зимой уголь в лето пропадает. Покупать уголь можно в любое время, однако летом он дешевле, чем зимой. Неопределенность состоит в том, что не известно, какой будет зима: суровой (тогда придется докупать уголь) или мягкой (тогда часть угля может остаться неиспользованной). Очевидно, что у природы нет злого умысла и она ничего против человека «не имеет». С другой стороны, долго- срочные прогнозы, составляемые метеорологическими службами, неточны и поэтому мо- гут использоваться в практической деятельности только как ориентировочные при при- нятии решений.
    Краткое содержание

    Принятие решений в условиях неопределенности и риска (игры с природой)
    63
    Матрица игры с природой аналогична матрице стратегической игры:
    m,n
    ij
    a
    A =
    , где
    ij
    a – выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2
    (
    )
    n
    j
    m
    i
    ...,
    ,
    ;
    ...,
    ,
    1 1
    =
    =
    Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех j=1, ..., n
    ,
    ...,
    ,
    1
    ,
    ,
    m
    l
    k
    a
    a
    lj
    kj
    =

    то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие страте- гиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопусти- мо, поскольку природа не стремится к выигрышу в «игре» с человеком, для нее нет целе- направленно выигрышных или проигрышных стратегий, она действует неосознанно.
    *
    На первый взгляд, отсутствие обдуманного противодействия упрощает игроку за- дачу выбора решения. Однако, хотя ЛПР никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен.
    Методы принятия решений в играх с природой зависят от характера неопреде- ленности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности. Ниже будут описаны методы, применяемые в обоих случаях.
    Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А
    1
    ,А
    2
    , ..., А
    m
    , а у природы имеется n возможных со- стояний (стратегий): П
    1
    ,П
    2
    , ..., П
    n
    , тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
    





    





    =
    mn
    2
    m
    1
    m
    m
    n
    2
    22
    21
    2
    n
    1
    12
    11
    1
    n
    2
    1
    a
    a
    a
    A
    a
    a
    a
    A
    a
    a
    a
    A
    П
    П
    П
    A
    Платит, естественно, не природа, а некая третья сторона (или совокупность сто- рон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»).
    Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков
    m,n
    ij
    r
    R =
    или матрицы упущен- ных возможностей. Величина риска – это размер платы за отсутствие информации о со- стоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.
    Риском r
    ij
    игрока при использовании им стратегии А
    i
    и при состоянии среды П
    j
    будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состоянием среды будет П
    j
    , и выигрышем, который игрок получит, не имея этой информации.
    Зная состояние природы (стратегию) П
    j
    , игрок выбирает ту стратегию, при кото- рой его выигрыш максимальный, т.е.
    ,
    ij
    j
    ij
    a
    r

    β
    =
    где
    ij
    m
    i
    j
    a


    =
    β
    1
    max при заданном j. Напри- мер, для матрицы выигрышей
    




    




    =
    2 6
    6 4
    3 4
    8 3
    9 5
    4 1
    3 2
    1 4
    3 2
    1
    А
    А
    А
    П
    П
    П
    П
    A
    (97)
    9
    ,
    6
    ,
    8
    =
    ,
    4 4
    3 2
    1
    =
    β
    =
    β
    β
    =
    β

    Моделирование рисковых ситуаций
    64
    Согласно введенным определениям
    j
    ij
    r
    β
    и получаем матрицу рисков
    




    




    =
    7 0
    2 0
    6 2
    0 1
    0 1
    4 3
    3 2
    1 4
    3 2
    1
    А
    А
    А
    П
    П
    П
    П
    R
    . (98)
    Независимо от вида матрицы игры требуется выбрать такую стратегию игрока
    (чистую или смешанную, если последняя имеет смысл), которая была бы наиболее вы- годной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (напри- мер, выбор альтернативных проектов).
    Вначале следует проверить, нет ли среди стратегий игрока мажорируемых, и, если таковые имеются, исключить их.
    4.2. Принятие решений в условиях полной неопределенности
    Неопределенность, связанную с отсутствием информации о вероятностях состоя- ний среды (природы), называют «безнадежной» или «дурной».
    В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.
    Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (97) или связанной с ней матрицы рисков (98).
    Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оп- тимизма. Наилучшим признается решение, при котором достигается максимальный вы- игрыш, равный
    ij
    n
    j
    m
    i
    a
    M
    max
    max




    =
    1 1
    Нетрудно увидеть, что для матрицы А наилучшим решением будет А
    1
    , при кото- ром достигается максимальный выигрыш – 9.
    Следует отметить, что ситуации, требующие применения такого критерия, в эко- номике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игро- ки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».
    Максиминный критерий Вальда. С позиций данного критерия природа рассматри- вается как агрессивно настроенный и сознательно действующий противник типа тех, ко- торые противодействуют в стратегических играх (см. тему 3). Выбирается решение, для которого достигается значение
    ij
    n
    j
    m
    i
    a
    W
    1 1
    min max




    =
    Для платежной матрицы А (3.1) нетрудно рассчитать:
    • для первой стратегии (i=1)
    =


    ij
    j
    a
    min
    4 1
    1;
    • для второй стратегии (i=2)
    =


    ij
    j
    a
    min
    4 1
    3;
    • для третьей стратегии (i=3)
    =


    ij
    j
    a
    min
    4 1
    2.
    Тогда
    3
    min max
    4 1
    3 1
    =
    =




    ij
    j
    i
    a
    W
    , что соответствует второй стратегии А
    2
    игрока 1
    В соответствии с критерием Вальда из всех самых неудачных результатов выбира- ется лучший (W = 3). Это перестраховочная позиция крайнего пессимиста, рассчитанная

    Принятие решений в условиях неопределенности и риска (игры с природой)
    65
    на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинте- ресован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Вы- бор такой стратегии определяется отношением игрока к риску.
    Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору страте- гии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выиг- рышей А (97), а матрицей рисков R (98):
    ij
    n
    j
    m
    i
    r
    S
    1 1
    max min




    =
    Для матрицы R (98) нетрудно рассчитать:
    • для первой стратегии (i=1)
    ij
    j
    r
    4 1
    max


    = 4;
    • для второй стратегии (i=2)
    ij
    j
    r
    4 1
    max


    = 6;
    • для третьей стратегии (i=3)
    ij
    j
    r
    4 1
    max


    = 7.
    Минимально возможный из самых крупных рисков, равный 4, достигается при ис- пользовании первой стратегии А
    1
    Критерий пессимизма—оптимизма Гурвица.
    Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безу- держным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением
    ( )






    =






    ij
    n
    j
    ij
    n
    j
    m
    i
    A
    a
    -p
    a
    p
    H
    max
    1
    +
    min max
    1 1
    1
    , где p – коэффициент пессимизма (0 ≤ р ≤ 1).
    При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при p = 1 – с критерием Вальда.
    Покажем процедуру применения данного критерия для матрицы А (97) при р = 0,5:
    • для первой стратегии
    (
    )
    (
    )
    5 9
    1 5
    0
    max
    +
    min
    5
    ,
    0 1
    =
    i
    4 1
    4 1
    =
    +
    =










    ,
    a
    a
    ij
    j
    ij
    j
    ;
    • для второй стратегии
    (
    )
    (
    )
    5
    ,
    5 8
    3 5
    0
    max
    +
    min
    5
    ,
    0 2
    =
    i
    4 1
    4 1
    =
    +
    =










    ,
    a
    a
    ij
    j
    ij
    j
    ;
    • для третьей стратегии
    (
    )
    (
    )
    4 6
    2 5
    0
    max
    +
    min
    5
    ,
    0 3
    =
    i
    4 1
    4 1
    =
    +
    =










    ,
    a
    a
    ij
    j
    ij
    j
    Тогда
    5 5
    max
    +
    min
    5 0
    max
    4 1
    4 1
    3 1
    ,
    a
    a
    ,
    =
    H
    ij
    j
    ij
    j
    i
    A
    =


















    , т.е. оптимальной является вторая стра- тегия А
    2
    Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
    (
    )













    ij
    n
    j
    ij
    n
    j
    m
    i
    R
    r
    p
    r
    p
    =
    H
    min
    1
    +
    max min
    1 1
    1
    ,
    При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (
    ij
    j
    i
    r
    ,
    min
    ); при р = 1 – по критерию минимаксного риска Сэвиджа.

    Моделирование рисковых ситуаций
    66
    В случае, когда по принятому критерию рекомендуются к использованию не- сколько стратегий, выбор между ними может делаться по дополнительному критерию, например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Данная идея отвечает подходу, рассмотренному в пункте 1.2 (см. рис. 1). Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
    В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:
    





    





    5 45 5
    85 25 25 80 25 20 35 20 75 15 15 30 20 4
    3 2
    1 3
    2 1
    A
    A
    A
    A
    П
    П
    П
    П
    4
    Для игрока 1 лучшими являются стратегии:
    • по критерию Вальда – А
    3
    ;
    • по критерию Сэвиджа – А
    2
    и А
    3
    ;
    • по критерию Гурвица (при р = 0,6) – А
    3
    ;
    • по критерию максимакса – А
    4
    Поскольку стратегия А
    3
    фигурирует в качестве оптимальной по трем критериям выбора из четырех испытанных, степень ее надежности можно признать достаточно вы- сокой для того, чтобы рекомендовать эту стратегию к практическому применению.
    Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем про- ведения исследований или экспериментов. В отсутствие дополнительной информа- ции принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени явля- ется субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распоряжении
    ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению каче- ства принимаемых решений.
    1   2   3   4   5   6   7   8   9   10   11


    написать администратору сайта