Главная страница
Навигация по странице:

  • Игры с природой Цель работы изучение сущности и элементов теории игр, в том числе выполнение практико-ориентированных заданий.Теория игр

  • Определения

  • Критерий минимаксного риска Сэвиджа

  • Критерий пессимизма-оптимизма Гурвица

  • Тема 4. Методы и модели теории игр (игры с природой).docx. Решение матричных игр в чистых стратегиях. Решение матричных игр в смешанных стратегиях


    Скачать 475.26 Kb.
    НазваниеРешение матричных игр в чистых стратегиях. Решение матричных игр в смешанных стратегиях
    Дата25.05.2022
    Размер475.26 Kb.
    Формат файлаpdf
    Имя файлаТема 4. Методы и модели теории игр (игры с природой).docx.pdf
    ТипРешение
    #548475
    Тема №4. Методы и модели теории игр
    Основные понятия теории игр. Виды игр матричные, биматричные, позиционные,
    статистические. Математическая модель игры. Решение матричных игр в чистых стратегиях.
    Решение матричных игр в смешанных стратегиях.
    Игры с природой
    Цель работы изучение сущности и элементов теории игр, в том числе выполнение практико-ориентированных заданий.
    Теория игр – это математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу (стратегии) действий каждого из участников входе конфликтной ситуации (игры, те. таких действий, которые обеспечивали бы ему наилучший результат. Становление и систематическое изучение теории игр и ее приложений в экономике начинается с выходом в 1944 г. монографии Дж. фон Неймана и
    О. Моргенштерна Теория игр и экономическое поведение».
    Игра с природой – это игра двух лиц, в которой один из участников безразличен к результату игры. Такие игры встречаются в экономической практике, когда приходится моделировать ситуации, придавая им игровую схему, в которой один из участников безразличен к результату игры. Под термином природа понимают всю совокупность внешних обстоятельств, в которых сознательному игроку (иногда его называют статистиком, а соответствующую игру – статистической) приходится принимать решение.
    Например, определение объема выпуска сезонной продукции в ожидании наиболее выгодного для ее реализации уровня спроса формирование пакета ценных бумаг в расчете на высокие дивиденды и т. д. В таких играх в качестве второго игрока выступает в первом случае – уровень спроса во втором – размеры ожидаемой прибыли. В играх с природой степень неопределенности для сознательного игрока (статистика) возрастает если в стратегических играх каждый из участников постоянно ожидает наихудшего для себя ответного действия партнера, тов статистических играх природа, являясь безразличной в отношении выигрыша инстанцией, может предпринимать и такие ответные действия
    (будем говорить реализовывать такие состояния, которые ей совершенно невыгодны, а выгодны сознательному игроку (статистику).
    Определения:
    1.
    Стратегия
    игрока

    это совокупность правил,
    определяющих последовательность действий. Чистая стратегия решения игроков неслучайные. Смешанная стратегия выбор игрока – случайная величина. Если выигрыш первого игрока равен проигрышу второго, то игра называется с
    седловой точкой в чистых стратегиях. Оптимальная стратегия максимально возможный средний выигрыш.
    Поэтому термин природа характеризует некую объективную действительность,
    которую не следует понимать буквально.
    Матрица игры с природой А = а, где а
    – выигрыш (потеря) игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1, …, m; j=1,…,n).
    Мажорирование стратегий в игре с природой имеет определенную специфику:
    исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех, n akj alj, k, l = 1,…,m, тою стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие стратегиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопустимо,
    поскольку природа не стремится к выигрышу в игре с человеком, для нее нет целенаправленно выигрышных или проигрышных стратегий, она действует неосознанно
    Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий А, А, … , А, ау природы имеется n возможных состояний (стратегий П, П, ..., П, тогда условия игры с природой задаются матрицей
    А выигрышей (потерь) игрока Возможен и другой способ задания матрицы игры с природой не в виде матрицы выигрышей (потерь, а в виде так называемой матрицы рисков R = ||rij||m, n. Величина риска - это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей
    (потерь) А.
    Риск - это разность между результатом, который игрок мог бы получить, если бы он знал действительное состоянием среды и результатом, который игрок получит при ой стратегии.
    Зная состояние природы (стратегию) П, игрок выбирает ту стратегию, при которой его выигрыш максимальный или потеря минимальна, те = j-aij, где j = max aij, при заданном j. 1≤ i ≤ m если а – выигрыш = aij - j
    , где j = min aij, при заданном j. 1≤ i ≤ m если а – потери (затраты)
    Неопределенность, связанную с полным отсутствием информации о вероятностях состояний среды (природы, называют «безнадежной».
    В таких случаях для определения наилучших решений используются следующие критерии Вальда, Сэвиджа, Гурвица.
    Критерий Вальда. С позиций данного критерия природа рассматривается как

    агрессивно настроенный и сознательно действующий противник.
    Если в исходной матрице по условию задачи результат aij представляет выигрыш лица, принимающего решение, то выбирается решение, для которого достигается значение = max min aij, 1 ≤ i ≤ m, 1 ≤ j ≤ n – максиминный критерий.
    Если в исходной матрице по условию задачи результат aij представляет потери лица, принимающего решение, то выбирается решение, для которого достигается значение = min max aij, 1≤ i ≤ m, 1 ≤ j ≤ n – минимаксный критерий.
    В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.
    Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда стем отличием, что игрок руководствуется не матрицей
    выигрышей А, а матрицей рисков R:
    S = min max rij 1≤ i ≤ m, 1 ≤ j ≤ Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).
    Критерий пессимизма-оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.
    Критерий основан наследующих двух предположениях природа может находиться в самом невыгодном состоянии с вероятность (р) ив самом выгодном состоянии с вероятностью р, где р – коэффициент пессимизма.
    Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением
    При p = 0 критерий Гурвица совпадает с критерием Вальда. При p = 1 приходим к решающему правилу вида max max aij, к так называемой стратегии здорового оптимизма, критерий максимакса.
    Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
    При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (min rij); при р = 1 – по критерию минимаксного риска Сэвиджа.
    Значение рот до 1 может определяться в зависимости от склонности лица,
    принимающего решение, к пессимизму или оптимизму. При отсутствии ярко выраженной склонности р = 0,5 представляет наиболее разумный вариант.
    В случае, когда по принятому критерию рекомендуются к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Здесь нет стандартного подхода. Выбор может зависеть от склонности к риску игрока Пример про ценообразование. Известно, что спрос на товары формируется под воздействием различных факторов, в том числе моды, вкусов, предпочтений покупателей,
    природно-климатических факторов. Эти факторы придают товарам характер сезонного спроса, так как на спрос сильное влияние оказывает изменение указанных факторов.
    Влияние перечисленных выше факторов на изменение спроса особенно проявляется на товарах легкой промышленности обуви, одежды, текстиля, галантереи т. д. Не проданные вовремя товары могут не найти ив будущем своих покупателей, что приведет к потерям,
    росту торговых издержек. В связи с этим торговые предприятия в конце сезона организуют расширенную продажу сезонных товаров по сниженным ценам. Понятно, что решение о размере снижения цен при сезонной распродаже не может приниматься необдуманно. Прежде всего должна приниматься во внимание предполагаемая реакция покупателей на снижение цен сезонных товаров, которая, как известно, измеряется эластичностью спроса от цены. На практике эластичность спроса от цены изучается применительно к основным потребительским товарами товарным группам (на пример,
    мужская одежда. Эластичности спроса от цены на отдельные конкретные изделия
    (например, швейные, текстильные, продажа которых носит сезонный характер, являются неизвестными. В этой связи можно полагать, что сезонное снижение цен имеет характер игры торгового предприятия с природой. Принятие решения о размере снижения цен может рассматриваться как поиск оптимальных цен в условиях неопределенности, что полагает возможным использование теории статистических игр.
    Торговое предприятие имеет 500 нераспроданных женских летних платьев, средняя цена которых равна 200 руб, а затраты на их приобретение у производителя — 120 руб.
    Предприятие знает, что данный товар подвержен быстрому изменению моды ив будущем может не найти покупателей, и если его вовремя не продать, то это приведет к увеличению торговых запасов и издержек. Предприятие решает снизить цены, чтобы вызвать дополнительный спрос на платья. Ясно, что решение о размере снижения цен при сезонной распродаже товаров должно быть обдуманными принести минимум потерь торговому предприятию. Предприятие решает рассмотреть четыре варианта снижения цены — на 20,30,40,50%. При этом оно должно учитывать предполагаемую реакцию покупателей на сезонное снижение цен, которая измеряется эластичностью спроса от цены, показывающей, насколько процентов в среднем возрастает спрос на товар, если цена его снижена на 1%. Эластичность спроса от цены определяется по формуле
    где Э — эластичность спроса от цены;
    К — спрос на товар при заданной цене (Ц) на него;
    ΔЦ — абсолютное изменение цены;
    ΔК — прирост спроса на товар при снижении цены (Ц) на него величину ΔЦ.
    Итак, требуется определить оптимальный размер снижения цены на платья, при котором потери торгового предприятия будут минималь ными.
    В рассматриваемой задаче в качестве го игрока (статистика) выступает торговое предприятие. В качестве го игрока (природы) выступает реакция покупателей на изменение цены на рассматриваемые платья, те. эластичность спроса от цены, о которой торговое предприятие в данный момент знает лишь то, что этот спрос на платья может быть как малоэластичным, таки высокоэластичным. Каким в действительности является этот спрос, предприятие не знает, но может либо выявить его на основе проведения экспресс-опроса, либо для его оценки использовать информацию, полученную на основе ранее проведенных наблюдений и расчетов. В качестве показателей, характеризующих стратегию природы, выступает распределение вероятностей, с которыми природа применяет отдельные свои стратегии (малую и высокую эластичность спроса. Из изложенного выше следует, что сезонное снижение цен имеет характер игры торгового предприятия с природой и может определяться на основе теории статистических игр.
    Составим структуру статистической игры, соответствующую проблеме сезонного снижения цен.
    Введем обозначения — множество возможных состояний природы, включающее два Ω=
    1
    , элемента, где соответствует малоэластичному спросу на данную группу одежды при изменении цены, а означает, что эластичность спроса от цены высокая;
    А — множество возможных решений торгового предприятия, включающие элемента А = (а, а, а
    у
    а
    4
    }, где а i
    — решение снизить цену на данный товар в среднем на а на 30%; а на 40%; а на 50%;
    L(θ, a) — функция потерь торгового предприятия, которая имеет конкретное число значений.
    Каждый элемент этой функции потерь определяется на основе следующих данных) количество нераспроданных платьев — 500 штук) закупочная цена товара — 120 руб) продажная цена товара — 200 руб) решение торгового предприятия о снижении продажной цены на 20, 30, 40, 50%;
    5) коэффициенты эластичности (поданным конъюнктурного института) при малой эластичности спроса от цены на аналогичные товары в размере 1; 1; 1,1; 1 и при высокой эластичности спроса от цены в размере 1,5; 2,33; 2; 1,8;
    6) предполагаемый объем продажи платьев (штук) в результате снижения цен
    (который надо определить).
    Предполагаемый объем продажи платьев в результате снижения цены определяется исходя из формулы эластичности спроса от цены, которая имеет вид- снижению цены в процентах, то предполагаемый объем продаж
    ∆К
    i
    (j)
    (i: = 1,1, j = 1,2) в зависимости от коэффициента эластичности Э
    (j = может быть вычислен по формуле Ка *
    К*Э
    j
    (j=1,2).
    4
    Заметим, что если правая часть этого равенства станет больше Кто принимаем
    ΔК = К.)
    При состоянии природы и значения функции потерь для решения а, а, а, а
    4
    вычисляются как разность между закупочной стоимостью нераспределенных 500 платьев и выручкой от предполагаемого объема продаж после снижения цен.
    Представим соответствующие расчеты в табл. 1 и 2 применительно к состоянию природы и В табл указаны:
    гр. 3 - новая цена (руб) средняя продажная цена*(100-а j
    ) Так, новая цена при снижении средней цены на 20% будет равна руби т.д.;
    гр. 4 - предполагаемый объем продаж в результате снижения цен. Он исчисляется по формуле:
    Так, снижение цены, соответственно на 20, 30, 40, 50% вызовет приблизительно следующий дополнительный спрос на платья
    Значения функции потерь Ци, а) запишем в матрицу (тыс. руб) (табл. Анализируя значения функции потерь как элементы матрицы исходной стратегической игры (Ω, A, L), можно быстро заметить, что решения аи а
    4
    доминируются решением ат. е. потери при стратегии а
    3
    явно меньше, чем при стратегиях аи а
    4
    Учитывая ранее изложенные принципы стратегических игр, эти доминируемые стратегии игрока 2 можно не принимать во внимание и вычеркнуть первый и четвертый столбцы матрицы. Вычеркнув доминируемые решения, соответствующие сезонному снижению ценна и 50%, получим новую матрицу значений функций потерь (тыс. руб) (табл. Перед принятием одного из возможных решений (а
    2
    или а) торговое предприятие проводит анкетный опрос покупателей. Цель опроса — понаблюдать, как потенциальные покупатели будут реагировать на предлагаемое снижение центе. выяснить, какой спрос в действительности существует на рассматриваемые платья малоэластичный (х) или высокоэластичный (х. Это и есть дополнительная статистическая информация (оценки) о состоянии природы.
    В результате исходная стратегическая игра (Ω, A, L) с представленной выше функцией потерь преобразуется в собственно статистическую игру (Ω, Д, При проведении анкетного опроса покупатели должны ответить, к примеру, на вопрос При каком размере снижения цен (30,40%) вы не произвели бы покупку Не устраивающее вас значение подчеркнуть. Результаты опроса будут иметь вид двумерного множествах, х, где х
    (
    означает низкую оценку, ах высокую оценку эластичности спроса от цены. Например, представим, что результаты опроса показаличто на снижение цены на 30% согласно 10% опрошенных, на снижение цены на 40% согласно также 10% опрошенных, остальные 80% опрошенных не подчеркнули ни одно число, т. е.
    практически отказались от покупки совсем. Вывод спрос на платья в результате предполагаемого снижения цен оказался в действительности малоэластичным.
    Торговое предприятие при принятии решения о сезонном снижении цен будет учитывать полученную в результате опроса информацию о спросе
    Учитывая возможность ошибок при проведении единовременного анкетного опроса случайно отобранных покупателей, примем следующие условные распределения результатов хи х
    2
    в зависимости от действительного состояния природы и 0 те. от мало- или высокоэлас тичного спроса:
    Таблица 1 7
    Приведенные условные распределения результатов их в зависимости от действительного состояния природы и 0 являются априорными величинами,
    полученными на основе многих ранее проведенных, к примеру конъюнктурным институтом, наблюдений.
    С учетом двух возможных экспериментальных значений оценок хи х, которым соответствует одно из двух допустимых решений торгового предприятия — а
    2
    или а
    3
    ,
    множество нерандомизированных функций будет состоять из 4 элементов. Число элементов множества Д = {d.} равно числу выбираемых статистиком решений (в нашем случае аи а, возведенному в степень, равную числу результатов эксперимента (в нашем случае число это равно хи х, те. Откуда Д = (d
    1
    , d
    2
    , d
    3
    , d
    4
    }. Запишем нерандомизированные функции в следующую таблицу (табл.5)
    Нерандомизированные функции с учетом результатов эксперимента, как было указано выше, помогают сделать выбор того или иного решения. Например, функция означает, что нужно принять решение а, если результатом эксперимента является хи решение а, если результатом эксперимента является х. Для каждой из этих четырех нерандомизированных функций решения можно с учетом обоих состояний природы вычислить значения функции риска R(θ, d). Функция риска R (θ, d) определяется по формуле:
    Для и d
    1
    R(θ
    1
    , d
    1
    ) = 39 * 0,7 + 39 * 0,3 = 39. Функция решения как результату х
    1
    так и результату х
    2
    эксперимента приписывает решение а, которое при действительном состоянии природы обусловливает потерю тыс. руб, причем соответствующие этому состоянию природы условные вероятности результатов хи х
    2
    равны соответственно 0,7 и Вычислим остальные значения функции риска) = 39 * 0,7 + 33,6 * 0,3 = 37,38;
    R(θ
    1
    ,d
    3
    ) = 33,6 * 0,7 + 39 * 0,3 = 35,22;
    R(θ
    1,
    d
    4
    ) = 33,6 * 0,7 + 33,6 * 0,3 = 33,6;
    R(θ
    2
    ,d
    1
    ) = 11*0,2 + 11*0,8 = 11,0;
    R(θ
    2
    ,d
    2
    ) = 11 * 0,2 + 12 * 0,8 = 11,8;
    R(θ
    2
    , d
    3
    ) = 12 * 0,2 + 11 * 0,8 = 11,2;
    R(θ
    2
    ,d
    4
    ) - 12 * 0,2 +12 * О = Значения функции риска R(θ,d) запишем в матрицу (табл. 6). Для полученной матричной игры находим оптимальное решение. Оптимальным будет такое решение о размере сезонного снижения ценна летние платья, которое в максимальной мере оберегает торговое предприятие от высоких потерь. Наиболее осторожной функцией решения будет минимаксная стратегия статистика. Выбираем для каждого столбца матрицы значений функции риска наибольший элемента затем среди них выбираем минимальный элемент, тем самым определяем столбец d с этим минимальным элементом
    В решаемой задаче среди максимальных элементов минимальным является число. Этому числу соответствует нерандомизирован ная минимаксная функция решения Так как эта функция определялась следующим образом) = аи d
    4
    (x
    2
    ) = а
    3
    ,
    то это означает, что оптимальной в данном случаете. наиболее осто рожной,
    стратегией торгового предприятия, намечающего сезонное снижение ценна летние женские платья, будет снижение ценна безотносительно к результатам анкеты как в случае, когда анкета оценила спрос как малоэластичный, таки тогда, когда оценка указывала на высокоэластичный спрос.
    Пример 1. Туристическая фирма “Топ-Тур” реализует туристические путевки.
    Объем реализации путевок изменяется в зависимости от потребительского спроса в пределах от 6 до 9 ед. Если путевок меньше, чем требует спрос на них, то фирма может заказать недостающее количество. При этом возникнут дополнительные расходы в размере 5 усл. ед. за каждую новую путевку. А если количество путевок превышает спрос,
    то потери за невостребованную путевку составят 6 усл. ед. Прибыль от реализации одной путевки составляет 10 усл. ед.
    В данном примере первым игроком является руководство туристической фирмы,
    которое может принять одно из решений:
    а) А – заказать 6 путевок;
    б) А – заказать 7 путевок;
    в) А – заказать 8 путевок;
    г) А – заказать 9 путевок.
    Потребительский спрос выступает в качестве второго игрока, природы, стратегии которой определяются данными спроса, т. е.:
    а) стратегия П – купят 6 путевок”;
    б) стратегия П – купят 7 путевок”;
    в) стратегия П – купят 8 путевок”;
    г) стратегия П – купят 9 путевок”.
    Построим платежную матрицу игры.
    Рассчитаем элементы а
    ij
    платежной матрицы игры.
    Выигрыш игрока А (руководства фирмы, если он заказал 6 путевок (А = 6), а спрос оказался равным также 6 (П = 6) будет равен:
    а
    11
    = 6 × 10 = 60 усл. ед.,
    где 6 × 10 – прибыль от реализации шести путевок
    Выигрыш игрока А, когда заказано А = 6 путевок, а спрос П = 7 путевок:
    а
    12
    = 7 × 10 – 1 × 5 = 70 – 5 = 65 усл. ед.,
    где 7 × 10 – прибыль от реализации семи путевок × 5 – затраты, связанные с заказом дополнительной путевки.
    Аналогично рассчитаем элемента, когда заказано А = 6 путевок, а спрос составил П путевок а 8 × 10 – 2 × 5 = 80 – 10 = 70 усл. ед.,
    где 8 × 10 – прибыль от реализации восьми путевок × 5 – затраты, связанные с заказом двух дополнительных путевок.
    Когда заказано А = 6 путевок, а спрос П = 9 путевок, выигрыш игрока А:
    а
    14
    = 9 × 10 – 3 × 5 = 90 – 15 = 75 усл. ед.
    Рассчитаем элемента, когда заказано А = 7 путевок, а спрос составил П = 6
    путевок:
    а
    21
    = 6 × 10 – 1 × 6 = 60 – 6 = 54 усл. ед,
    где 6 × 10 – прибыль от реализации шести путевок × 6 – потери за одну невостребованную путевку.
    Остальные элементы платежной матрицы вычисляются аналогично:
    а
    22
    = 7 × 10 = 70 усл. еда 8 × 10 – 1 × 5 = 80 – 5 = 75 усл. еда 9 × 10 – 2 × 5 = 90 – 10 = 80 усл. еда × 10 – 2 × 6 = 60 – 12 = 48 усл. еда × 10 – 1 × 6 = 70 – 6 = 64 усл. еда 8 × 10 = 80 усл. еда 9 × 10 – 1 × 5 = 90 – 5 = 85 усл. еда × 10 – 3 × 6 = 60 – 18 = 42 усл. еда × 10 – 2 × 6 = 70 – 12 = 58 усл. еда 8 × 10 – 1 × 6 = 80 – 6 = 74 усл. еда усл. ед.
    Так как вероятности состояния спроса заранее нам неизвестны, использовать критерии Байеса и Лапласа невозможно. Найдем решение игры по критериям Вальда,
    Сэвиджа и Гурвица (λ = Критерий Вальда

    Найдем элементы a
    i
    = min минимальный выигрыш, соответствующий стратегии) и запишем их в дополнительный столбец матрицы игры. Максимальная из этих величин равна a
    1
    = 60, следовательно, оптимальной является стратегия Ат. е. необходимо заказать 6 путевок.
    Критерий Сэвиджа
    Пересчитаем платежную матрицу в матрицу рисков. Для этого найдем максимальный элемент по каждому столбцу (b
    j
    ) и из него последовательно вычтем каждый элемент этого столбца. Получим матрицу рисков
    Затем найдем максимальный риск при выборе игроком А той или иной стратегии
    (максимальный элемент строки) и поместим его в правом добавочном столбце матрицы рисков (столбец r
    i
    ):
    r
    i
    = Найдем минимальную из величин r
    i
    , которая равна 10. Следовательно, по критерию Сэвиджа оптимальной является стратегия Ат. е. заказать 7 путевок.
    Критерий Гурвица
    Добавим в платежную матрицу три дополнительных столбца. min a
    ij
    – столбец минимальных выигрышей игрока А при выборе им той или иной стратегии. max a
    ij
    – столбец максимальных выигрышей игрока А при выборе им той или иной стратегии. Критерий
    – столбец, элементы которого рассчитываются по формуле l×min a
    ij
    +
    (1- l)×maxa
    ij
    ,
    j где l = Из столбца Критерий выбираем наибольшее значение. Таким является число соответствующее стратегии А. Следовательно, по критерию Гурвица, оптимальной является первая стратегия игрока А (заказать 6 путевок).
    Итак, в результате применения критериев Вальда, Сэвиджа и Гурвица оптимальной считается первая стратегия, так как она являлась наилучшей при применении двух критериев из трех. Согласно первой стратегии нужно заказать 6
    путевок.
    Критерий Байеса
    Если предположить, что вероятности состояний природы (в нашем случае спроса) известны и равны соответственно q
    1
    = 0,4; q
    2
    = 0,2; q
    3
    = 0,3; q
    4
    = 0,1, то можно воспользоваться критерием Байеса.
    11
    Для каждой строки, соответствующей стратегии сознательного игрока А, найдем сумму произведений вероятностей состояний природы на элементы соответствующих столбцов. Для расчета среднего выигрыша можно воспользоваться пакетом MS Затем в столбце Среднее выберем максимальное значение. Это значение находится во второй строке (66,1). Следовательно, по критерию Байеса оптимальной является вторая стратегия игрока А (заказать 7 путевок).
    Критерий Лапласа
    Если известно, что все состояния спроса равновероятны, то можно применить критерий Лапласа. Согласно этому критерию, нужно вычислить средний выигрыш как среднее арифметическое по строке (60 + 65 + 70 + 75)/4 = 67,5; a
    2
    = (54 + 70 + 75 + 80)/4 = 69,75;
    a
    2
    = (48 + 64 + 80 + 85)/4 = 69,25; a
    2
    = (42 + 58 + 74 + 90)/4 = Наибольший средний выигрыш составит:
    Таким образом, ив этом случае предпочтение следует отдать второй стратегии.
    Пример 2. Транспортное предприятие должно определить уровень своих производственных возможностей так, чтобы удовлетворить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен,
    но прогнозируется, что он может принять одно из четырех значений 10, 15, 20 или 25 тыс.
    т. Для каждого уровня спроса существует наилучший уровень провозных возможностей транспортного предприятия. Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения провозных возможностей над спросом (из-за простоя подвижного состава, либо из-за неполного удовлетворения спроса на транспортные услуги. Возможные прогнозируемые затраты на развитие провозных возможностей представлены в таблице.
    Варианты провозных возможностей транспортного предприятия
    Варианты спроса на транспортные услуги 2
    3 4
    1 6
    12 20 24 2
    9 7
    9 28 3
    23 18 15 19 4
    27 24 21 Необходимо выбрать оптимальную стратегию. Использовать критерий Вальда,
    критерий Сэвиджа, критерий Гурвица.
    12

    Решение
    Имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний природы П, П, П, П. Известны также четыре стратегии развития провозных возможностей транспортного предприятия А, А, А, А4.
    Затраты на развитие провозных возможностей при каждой паре Пи А заданы следующей матрицей:
    Построим матрицу рисков. В примере aij представляет затраты те. потери значит для построения матрицы рисков используется принцип rij = aij - bj, где bj = min Для П bj = Для П bj = Для П bj = Для П bj = Матрица рисков имеет следующий вид:
    Критерий Вальда
    Так как в данном примере aij представляет затраты те. потери, то применятся минимаксный критерий.
    Для А max aij = Для А max aij = Для А max aij = Для А max aij = 27
    W = min max aij = 23 → наилучшей стратегией развития провозных возможностей в соответствии с минимаксным критерием Вальда будет третья стратегия (А3).
    Критерий минимаксного риска Сэвиджа
    Для А max rij = Для А max rij = Для А max rij = Для А max rij = 21
    S = min max rij = 11 → наилучшей стратегией развития провозных возможностей в соответствии с критерием Сэвиджа будет первая стратегия (А1).
    Критерий пессимизма-оптимизма Гурвица
    Положим значение коэффициента пессимизма р = Так как в данном примере aij представляет затраты (потери, то применяется критерий

    min aij
    max aij
    p min aij + (1-p) max Для А 6
    24 Для А 7
    28 Для А 15 23 Для А 15 27 Оптимальное решение заключается в выборе стратегии А1.
    Рассчитаем оптимальную стратегию применительно к матрице рисков rij

    max rij
    p max rij + (1-p) min Для А 0
    11 Для А 0
    13 Для А 4
    17 Для А 0
    21 Оптимальное решение заключается в выборе стратегии А1.
    Вывод: в примере предстоит сделать выбор, какое из возможных решений предпочтительнее по критерию Вальда – выбор стратегии А по критерию Сэвиджа – выбор стратегии А по критерию Гурвица – выбор стратегии А1.
    Контрольные вопросы
    1.
    Что такое игра с природой ив чем ее особенности?
    2.
    Опишите два способа задания матрицы игры с природой.
    3.
    Что такое риск в теории матричных игр Как рассчитывается матрица рисков?
    4.
    Какие критерии применяются в случае, когда известны вероятности состояний природы?
    5.
    Какие критерии используются в условиях полной неопределенности?
    6.
    В чем состоит отличительная особенность принятия решения в игре с
    «природой»?
    7.
    Опишите критерий Вальда.
    8.
    Опишите критерий Сэвиджа.
    9.
    Опишите критерий Гурвица.
    10.
    Что такое коэффициент пессимизма в критерии Гурвица?
    11.
    В каких критериях используется матрица выигрышей?
    12.
    В каких критериях используется матрица рисков
    Задание для самостоятельного выполнения Вариант Найти наилучшие стратегии по критериям Вальда, Сэвиджа, Гурвица (коэффициент пессимизма равен 0,2), Гурвица применительно к матрице рисков (коэффициент пессимизма равен 0,4) для следующей платежной матрицы игры с природой (элементы матрицы - выигрыши):
    Вариант Дана матрица игры с природой в условиях полной неопределенности (элементы матрицы - выигрыши):
    Требуется: проанализировать оптимальные стратегии игрока, используя критерии пессимизма-оптимизма Гурвица применительно к платежной матрице Аи матрице рисков при коэффициенте пессимизма р = 0; 0,5; 1. При этом выделить критерии максимакса,
    Вальда и Сэвиджа.
    Вариант Дана следующая матрица выигрышей:
    Определите оптимальную стратегию используя критерии Вальда, Сэвиджа и
    Гурвица (коэффициент пессимизма равен 0,4).
    15
    Вариант Один из пяти станков должен быть выбран для изготовления партии изделий, размер которой Q может принимать три значения 150, 200, 350. Производственные затраты С для станка задаются следующей формулой = Pi + Данные Pi и ci приведены в таблице.
    Показатели
    Модель станка 2
    3 4
    5
    P
    i
    30 80 50 160 100
    c i
    14 6
    10 Решите задачу для каждого из следующих критериев Вальда, Сэвиджа, Гурвица
    (критерий пессимизма равен 0,6). Полученные решения сравните.
    Вариант При выборе стратегии Aj по каждому возможному состоянию природы Si соответствует один результат Vij. Элементы Vij являющиеся мерой потерь при принятии решения, приведены в таблице.
    Стратегии
    Состояние природы 2
    6 5
    8
    A2 3
    9 1
    4
    A3 5
    1 Выберите оптимальное решение в соответствии с критериями Вальда, Сэвиджа,
    Гурвица (при коэффициенте пессимизма равном 0,5).
    16
    Вариант Намечается крупномасштабное производство легковых автомобилей. Имеются четыре варианта проекта автомобиля Rj. Определена экономическая эффективность Vji каждого проекта в зависимости от рентабельности производства. По истечении трех сроков Si рассматриваются как некоторые состояния среды (природы. Значения экономической эффективности для различных проектов и состояний природы приведены в таблице.
    Проекты
    Состояние природы 20 25 15
    R2 25 24 10
    R3 15 28 12
    R4 9
    30 Требуется выбрать лучший проект легкового автомобиля для производства, используя критерий Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,1. Сравнить решения и сделать выводы.
    Вариант Определите тип электростанции, которую необходимо построить для удовлетворения энергетических потребностей комплекса крупных промышленных предприятий.
    Множество возможных стратегий в задаче включает следующие параметры – сооружается гидростанция – сооружается теплостанция;
    R3 – сооружается атомная станция.
    Экономическая эффективность сооружения электростанции зависит от влияния случайных факторов, образующих множество состояний природы Результаты расчета экономической эффективности приведены в таблице.
    Тип станции
    Состояние природы 40 70 30 25 45
    R2 60 50 45 20 30
    R3 50 30 40 35 60 17
    Вариант Фирма рассматривает вопрос о строительстве станции технического обслуживания
    (СТО) автомобилей. Составлена смета расходов на строительство станции с различным количеством обслуживаемых автомобилей, а также рассчитан ожидаемый доход в зависимости от удовлетворения прогнозируемого спроса на предлагаемые услуги СТО
    (прогнозируемое количество обслуженных автомобилей в действительности. В
    зависимости от принятого решения – проектного количества обслуживаемых автомобилей в сутки (проект СТО) Rj и величины прогнозируемого спроса на услуги СТО – построена в табл. 4.6 ежегодных финансовых результатов (доход д.е.):
    Проекты
    СТО
    Прогнозируемая величина удовлетворяемости спроса 10 20 30 40 50 20
    -120 60 240 250 250 250 30
    -160 15 190 380 390 390 40
    -210
    -30 150 330 500 500 50
    -270
    -80 100 280 470 Определите наилучший проект СТО с использованием критериев Вальда, Сэвиджа,
    Гурвица при коэффициенте пессимизма Вариант Магазин может завести один из трех типов товара А их реализация и прибыль магазина зависит от типа товара и состояния спроса. Предполагается, что спрос может иметь три состояния В (таблица. Гарантированная прибыль представлена в матрице прибыли:
    Тип товара
    Спрос
    В1
    В2
    В3
    А1 20 15 А 16 12 А 13 18 Определить какой товар закупать магазину
    Вариант Дана следующая матрица выигрышей:
    Определите оптимальную стратегию используя критерии Вальда, Сэвиджа и Гурвица
    (коэффициент пессимизма равен Вариант Администрации театра нужно решить, сколько заказать программок для представлений. Стоимость заказа 200 ф. ст. плюс 30 пенсов за штуку. Программки продаются по 60 пенсов за штуку, и к тому же доход от рекламы составит дополнительные ф. ст. Из прошлого опыта известна посещаемость театра (таблица).
    Посещаемость
    4000 4500 5000 5500 Ее вероятность 0,3 0,3 0,2 Ожидается, что 40% зрителей купят программки. Используя критерии Вальда, Сэвиджа и Гурвица, определите, сколько программок должна заказать администрация театра. Допустим, что рекламодатели увеличат сумму с 300 до 400 ф. ст. число посетителей будет больше 5250, к тому же спрос на программки будет полностью удовлетворен. Как это повлияет на рекомендации в п.1?
    Вариант При выборе стратегии Aj по каждому возможному состоянию природы Si соответствует один результат Vij. Элементы Vij являющиеся мерой потерь при принятии решения, приведены в таблице:
    Стратегии
    Состояние природы 20 12 15 15
    A2 14 23 12 26
    A3 25 21 24 Выберите оптимальное решение в соответствии с критериями Вальда, Сэвиджа,
    Гурвица (при коэффициенте пессимизма равном 0,6).
    19
    Вариант Пекарня печет хлеб на продажу магазинам. Себестоимость одной булки составляет пенсов, ее продают за 40 пенсов. В таблица приведены данные о спросе за последние дней:
    Спрос вдень, тыс. шт 12 14 16 Число дней 10 15 15 Если булка испечена, ноне продана, то убытки составят 20 пенсов за штуку.
    Используя критерии Вальда, Сэвиджа, Гурвица (при коэффициентах 0,4 - вероятность максимальной покупки, 0,6 – вероятность минимальной покупки, определите, сколько булок нужно выпекать в день.
    Вариант Компания выбирает, какой вид продукции целесообразно производить. Имеются четыре вида продукции А. Определена прибыль от производства каждого вида продукции в зависимости от состояний экономической среды В. Значения прибыли для различных видов продукции и состояний природы приведены в таблице.
    Вид продукции
    Состояние экономической среды
    В1
    В2
    В3
    А1 40 52 А 58 45 А 45 36 А 36 89 Требуется выбрать лучший проект легкового автомобиля для производства, используя критерии Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,4. Сравнить решения и сделать выводы.
    Вариант Компания "Kilroy" выпускает очень специфичный безалкогольный напиток, который упаковывается в 40-пинтовые бочки. Напиток готовится в течение недели, и каждый понедельник очередная партия готова к употреблению. Однако водно из воскресений всю готовую к продаже партию пришлось выбросить. Секретный компонент, используемый для приготовления напитка, покупается в небольшой лаборатории, которая может производить каждую неделю в течение полугода (так налажено производство) только определенное количество этого компонента. Причем он должен быть использован в кратчайший срок.
    Переменные затраты на производство одной пинты напитка составляют 70 пенсов,
    продается она за 1,50 ф. ст. Однако компания предвидит, что срыв поставок приведет к потере части покупателей в долгосрочной перспективе, а следовательно, придется снизить цену на 30 пенсов. За последние 50 недель каких-либо явных тенденций в спросе выявлено не было (таблица
    Спрос на бочки в неделю 4
    5 Число недель 10 15 10 Определите, что нужно предпринять, используя критерии Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,5. Сравнить решения и сделать выводы


    написать администратору сайта