Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики
Скачать 1.32 Mb.
|
Тема 4. Принятие решений в условиях неопределенности и риска (игры с природой) Изучив данную тему, студент должен знать: • сущность и основные действия в играх с природой; уметь: • находить рациональные решения первого игрока в играх с природой; • строить таблицу решений стратегий в условиях неопределен- ности; • находить рациональное решение в играх с природой; • находить методы оценки истинной стоимости информации в условиях неопределенности и риска. При изучении данной темы необходимо акцентиро- вать внимание на следующих понятиях: • игры с природой ; • интерпретация природы ; • мажорирование стратегий в играх с природой; • «дурная неопределенность» ; • нахождение оптимальных стратегий первого игрока при за- данных вероятностных состояниях природы; • оценка истинной стоимости информации. Для самопроверки по теме 4 необходимо ответить на вопросы: 1. Что такое «игра с природой». 2. В чем состоит отличие игр с природой от стратегических. 3. Принятие решений в условиях полной неопределенности. 4. Принятие решений в условиях риска. 5. Осуществлять выбор решений с помощью дерева решений. 6. Что означает «дурная неопределенность». 7. Критерии максимакса, Вальда, Сэвиджа, Гурвица. 8. Различие матрицы выигрышей и рисков. Моделирование рисковых ситуаций 62 Понятие игры с природой. Отличие игр с природой от стратегических. Принятие решений в условиях полной неопределенности. Принятие решений в условиях рис- ка. Выбор решений с помощью дерева решений (позиционные игры). Цели и задачи изучения темы: познакомить студента с классической теорией игр с природой – игр, в которых сознательно дейст- вует только один из участников. 4.1. Понятие игры с природой Ситуации, описываемые рассмотренными в гл. 3 моделями в виде стратегических игр, в экономической практике могут не в полной мере оказаться адекватными действи- тельности, поскольку реализация модели предполагает многократность повторения дей- ствий (решений), предпринимаемых в похожих условиях. В реальности количество при- нимаемых экономических решений в неизменных условиях жестко ограничено. Нередко экономическая ситуация является уникальной, и решение в условиях неопределенности должно приниматься однократно. Это порождает необходимость развития методов мо- делирования принятия решений в условиях неопределенности и риска. Традиционно следующим этапом такого развития являются так называемые игры с природой. Формально изучение игр с природой, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее тру- доемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату. Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Иг- рок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по иг- ре. Поэтому термин «природа» характеризует некую объективную действительность, ко- торую не следует понимать буквально, хотя вполне могут встретиться ситуации, в кото- рых «игроком» 2 действительно может быть природа (например, обстоятельства, связан- ные с погодными условиями или с природными стихийными силами). На примере игры с природой рассмотрим проблему заготовки угля на зиму. Задача 1. Необходимо закупить уголь для обогрева дома. Количество хранимого угля ограничено и в течение холодного периода должно быть полностью израсходовано. Предполагается, что неизрасходованный зимой уголь в лето пропадает. Покупать уголь можно в любое время, однако летом он дешевле, чем зимой. Неопределенность состоит в том, что не известно, какой будет зима: суровой (тогда придется докупать уголь) или мягкой (тогда часть угля может остаться неиспользованной). Очевидно, что у природы нет злого умысла и она ничего против человека «не имеет». С другой стороны, долго- срочные прогнозы, составляемые метеорологическими службами, неточны и поэтому мо- гут использоваться в практической деятельности только как ориентировочные при при- нятии решений. Краткое содержание Принятие решений в условиях неопределенности и риска (игры с природой) 63 Матрица игры с природой аналогична матрице стратегической игры: m,n ij a A = , где ij a – выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 ( ) n j m i ..., , ; ..., , 1 1 = = Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех j=1, ..., n , ..., , 1 , , m l k a a lj kj = ≤ то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие страте- гиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопусти- мо, поскольку природа не стремится к выигрышу в «игре» с человеком, для нее нет целе- направленно выигрышных или проигрышных стратегий, она действует неосознанно. * На первый взгляд, отсутствие обдуманного противодействия упрощает игроку за- дачу выбора решения. Однако, хотя ЛПР никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен. Методы принятия решений в играх с природой зависят от характера неопреде- ленности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности. Ниже будут описаны методы, применяемые в обоих случаях. Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А 1 ,А 2 , ..., А m , а у природы имеется n возможных со- стояний (стратегий): П 1 ,П 2 , ..., П n , тогда условия игры с природой задаются матрицей А выигрышей игрока 1: = mn 2 m 1 m m n 2 22 21 2 n 1 12 11 1 n 2 1 a a a A a a a A a a a A П П П A Платит, естественно, не природа, а некая третья сторона (или совокупность сто- рон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»). Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков m,n ij r R = или матрицы упущен- ных возможностей. Величина риска – это размер платы за отсутствие информации о со- стоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А. Риском r ij игрока при использовании им стратегии А i и при состоянии среды П j будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состоянием среды будет П j , и выигрышем, который игрок получит, не имея этой информации. Зная состояние природы (стратегию) П j , игрок выбирает ту стратегию, при кото- рой его выигрыш максимальный, т.е. , ij j ij a r − β = где ij m i j a ≤ ≤ = β 1 max при заданном j. Напри- мер, для матрицы выигрышей = 2 6 6 4 3 4 8 3 9 5 4 1 3 2 1 4 3 2 1 А А А П П П П A (97) 9 , 6 , 8 = , 4 4 3 2 1 = β = β β = β Моделирование рисковых ситуаций 64 Согласно введенным определениям j ij r β и получаем матрицу рисков = 7 0 2 0 6 2 0 1 0 1 4 3 3 2 1 4 3 2 1 А А А П П П П R . (98) Независимо от вида матрицы игры требуется выбрать такую стратегию игрока (чистую или смешанную, если последняя имеет смысл), которая была бы наиболее вы- годной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (напри- мер, выбор альтернативных проектов). Вначале следует проверить, нет ли среди стратегий игрока мажорируемых, и, если таковые имеются, исключить их. 4.2. Принятие решений в условиях полной неопределенности Неопределенность, связанную с отсутствием информации о вероятностях состоя- ний среды (природы), называют «безнадежной» или «дурной». В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (97) или связанной с ней матрицы рисков (98). Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оп- тимизма. Наилучшим признается решение, при котором достигается максимальный вы- игрыш, равный ij n j m i a M max max ≤ ≤ ≤ ≤ = 1 1 Нетрудно увидеть, что для матрицы А наилучшим решением будет А 1 , при кото- ром достигается максимальный выигрыш – 9. Следует отметить, что ситуации, требующие применения такого критерия, в эко- номике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игро- ки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал». Максиминный критерий Вальда. С позиций данного критерия природа рассматри- вается как агрессивно настроенный и сознательно действующий противник типа тех, ко- торые противодействуют в стратегических играх (см. тему 3). Выбирается решение, для которого достигается значение ij n j m i a W 1 1 min max ≤ ≤ ≤ ≤ = Для платежной матрицы А (3.1) нетрудно рассчитать: • для первой стратегии (i=1) = ≤ ≤ ij j a min 4 1 1; • для второй стратегии (i=2) = ≤ ≤ ij j a min 4 1 3; • для третьей стратегии (i=3) = ≤ ≤ ij j a min 4 1 2. Тогда 3 min max 4 1 3 1 = = ≤ ≤ ≤ ≤ ij j i a W , что соответствует второй стратегии А 2 игрока 1 В соответствии с критерием Вальда из всех самых неудачных результатов выбира- ется лучший (W = 3). Это перестраховочная позиция крайнего пессимиста, рассчитанная Принятие решений в условиях неопределенности и риска (игры с природой) 65 на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинте- ресован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Вы- бор такой стратегии определяется отношением игрока к риску. Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору страте- гии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выиг- рышей А (97), а матрицей рисков R (98): ij n j m i r S 1 1 max min ≤ ≤ ≤ ≤ = Для матрицы R (98) нетрудно рассчитать: • для первой стратегии (i=1) ij j r 4 1 max ≤ ≤ = 4; • для второй стратегии (i=2) ij j r 4 1 max ≤ ≤ = 6; • для третьей стратегии (i=3) ij j r 4 1 max ≤ ≤ = 7. Минимально возможный из самых крупных рисков, равный 4, достигается при ис- пользовании первой стратегии А 1 Критерий пессимизма—оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безу- держным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением ( ) = ≤ ≤ ≤ ≤ ≤ ≤ ij n j ij n j m i A a -p a p H max 1 + min max 1 1 1 , где p – коэффициент пессимизма (0 ≤ р ≤ 1). При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при p = 1 – с критерием Вальда. Покажем процедуру применения данного критерия для матрицы А (97) при р = 0,5: • для первой стратегии ( ) ( ) 5 9 1 5 0 max + min 5 , 0 1 = i 4 1 4 1 = + = ≤ ≤ ≤ ≤ , a a ij j ij j ; • для второй стратегии ( ) ( ) 5 , 5 8 3 5 0 max + min 5 , 0 2 = i 4 1 4 1 = + = ≤ ≤ ≤ ≤ , a a ij j ij j ; • для третьей стратегии ( ) ( ) 4 6 2 5 0 max + min 5 , 0 3 = i 4 1 4 1 = + = ≤ ≤ ≤ ≤ , a a ij j ij j Тогда 5 5 max + min 5 0 max 4 1 4 1 3 1 , a a , = H ij j ij j i A = ≤ ≤ ≤ ≤ ≤ ≤ , т.е. оптимальной является вторая стра- тегия А 2 Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид: ( ) − ≤ ≤ ≤ ≤ ≤ ≤ ij n j ij n j m i R r p r p = H min 1 + max min 1 1 1 , При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков ( ij j i r , min ); при р = 1 – по критерию минимаксного риска Сэвиджа. Моделирование рисковых ситуаций 66 В случае, когда по принятому критерию рекомендуются к использованию не- сколько стратегий, выбор между ними может делаться по дополнительному критерию, например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Данная идея отвечает подходу, рассмотренному в пункте 1.2 (см. рис. 1). Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР. В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей: 5 45 5 85 25 25 80 25 20 35 20 75 15 15 30 20 4 3 2 1 3 2 1 A A A A П П П П 4 Для игрока 1 лучшими являются стратегии: • по критерию Вальда – А 3 ; • по критерию Сэвиджа – А 2 и А 3 ; • по критерию Гурвица (при р = 0,6) – А 3 ; • по критерию максимакса – А 4 Поскольку стратегия А 3 фигурирует в качестве оптимальной по трем критериям выбора из четырех испытанных, степень ее надежности можно признать достаточно вы- сокой для того, чтобы рекомендовать эту стратегию к практическому применению. Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем про- ведения исследований или экспериментов. В отсутствие дополнительной информа- ции принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени явля- ется субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распоряжении ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению каче- ства принимаемых решений. |