Теоретико-игровые методы принятия решений (Еремеев А. П.). Теоретико-игровые методы принятия решений (Еремеев А. П. Учебное пособие по курсам Теория игр и исследование операций, Теория принятия решений
Скачать 1.18 Mb.
|
4.3.Рефлексивная играДля поиска решения биматричной игры может быть использована игровая модель в виде так называемой рефлексивной игры, т.е. игры, в которой игрок моделирует поведение соперника. Рассмотрим рефлексивную игру на примере приведенной выше игры «конкурирующие фирмы» (см. табл. 4.3) в предположении, что игрок А моделирует поведение (выбор) игрока В.Соответствующая матрица игры G(24) представлена табл. 4.5. Таблица 4.22
У игрока В (в отличие от табл. 4.3) добавились еще две «предполагаемые» стратегии – В3+ – отвечать той же по номеру стратегией, что выбрал игрок А, и В4– – отвечать противоположной стратегией. Доказано, что в рефлексивной игре выигрывает тот игрок, у которого ранг рефлексии на единицу больше, чем у соперника. Если ранг рефлексии отличается больше, чем на единицу, то исход игры не ясен. 4.4.Практический примерПусть имеется фирма, состоящая из двух отделов – производственного (П), в задачу которого входит производство некоторого товара, и транспортного (Т), который должен доставить произведенный товар потребителю. Известно, что доход отдела П от выпуска продукции в объеме одной машины равен a денежных единиц, затраты отдела Т на отправку потребителю одной машины с грузом равен c денежных единиц, а затраты на хранение на складе невывезенной продукции в объеме одной машины составляют b денежных единиц и делятся поровну между отделами П и Т. Пусть также известно, что в интересующий период времени (например за рабочий день) отдел П может произвести продукции в объеме 5 или 10 машин, а отдел Т для ее перевозки выделить малую автоколонну (4 машины), большую автоколонну (7 машин), две малые автоколонны (8 машин) или одну большую и одну малую автоколонны (11 машин). Моделью описанной ситуации может быть биматричная игра, представленная табл. 4.6. Таблица 4.23
Необходимо дать рекомендации руководителю отдела П о наиболее выгодном для него объеме производимой продукции (т.е. о выборе стратегии П1 или П2), учитывая, что отдел П заинтересован в максимизации своего дохода, а отдел Т – в минимизации своих затрат. Для получения численных результатов примем a = 10, b = 6, c = 2. Тогда табл. 4.6 примет вид табл.4.7. Таблица 4.24
Воспользуемся сначала методом максимина, ориентирующим руководителя отдела П на наиболее осторожное поведение. В этом случае оптимальной является стратегия П1, гарантирующая отделу П доход в 37 денежных единиц (см. последний столбец табл. 4.7). Учитывая интересы отдела Т (как видно из табл. 4.7, минимальные затраты для Т будут при выборе стратегии Т1), именно этот доход и будет получен отделом П. Отметим, однако, что выбор стратегии П1 вряд ли является наилучшим для отдела П. Так, если он выберет стратегию П2 и сообщит о своем выборе руководителю отдела Т, то тот, руководствуясь интересами своего отдела, должен будет выбрать стратегии Т3 или Т4, что гарантирует доход отдела П в 74 или 100 денежных единиц. Более того, можно «стимулировать» отдел Т на выбор стратегии Т4, поделившись с ним в этом случае частью дохода, например в 10 денежных единиц (при этом доход отдела П составит 90 денежных единиц, а затраты отдела Т – всего 12 единиц). Именно так скооперировано и рекомендуется действовать руководителю отдела П. Изменим несколько исходную ситуацию, повысив стоимость хранения не вывезенной продукции: a = 10, b = 10, c = 2. Получим соответствующую таблицу табл. 4.8. Таблица 4.25
Хотя в этом случае минимально возможный доход для отдела П при выборе стратегии П1 в 3,5 раза больше, чем при выборе стратегии П2 (35 и 10 соответственно),однако и в этом случае лучше выбрать стратегию П2, проинформировав о своем решении руководителя отдела Т. Тот, руководствуясь интересами своего отдела, должен будет выбрать стратегию Т4 (соответствующую минимальным затратам отдела Т), что гарантирует доход отдела П в 100 денежных единиц. Заметим, что в этой ситуации в «стимулировании» отдела Т нет необходимости. |