Учебник. Кафедра Математических методов принятия решений

Название	Кафедра Математических методов принятия решений
Анкор	wqeeqwq
Дата	25.04.2023
Размер	1.84 Mb.
Формат файла
Имя файла	Учебник.pdf
Тип	Решение #1088275
страница	3 из 5

1 2 3 4 5

Тема 3. Теория игр
Цели и задачи.
Цель изученияданной темы – получение общетеоретических знаний о теории игр.
Задачи изученияданной темы:
·
Изучение классификации игр.
·
Изучение особенностей решения матричных игр в чистых стратегиях.
·
Изучение смешанных стратегий в матричных играх.
·
Изучение критериев принятия решений в статистических играх.
Вопросы темы:

1.
Решение матричных игр в чистых стратегиях.
2.
Смешанные стратегии в матричных играх.
3.
Принятие решений в условиях неопределенности.
Вопрос 1. Решение матричных игр в чистых стратегиях.
Определение. «Игра (в математике) – это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны». [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом.
Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
Классификация игр.
Классификацию игр можно проводить: по количеству игроков, количеству стратегий,
характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д. [2,7,8].
В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) – могут вступать в коалиции.
В кооперативных играх коалиции заранее определены.
По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные,
выпуклые и др.
Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.

Запись матричной игры в виде платёжной матрицы.
В общем виде матричная игра может быть записана следующей платёжной матрицей [1, 2,
7] (рис. 19.),
Рис. 19. Общий вид платёжной матрицы матричной игры
где A
i
– названия стратегий игрока 1, B
j
– названия стратегий игрока 2,
– значения выигрышей игрока 1 при выборе им i – й стратегии, а игроком 2 – j – й стратегии. Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположенной по знаку значению выигрыша игрока 1.
Понятие о нижней и верхней цене игры. Решение игры в чистых стратегиях.
Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину
,
или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений. Величина называется максимином матрицы или нижней ценой игры.
Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение
Или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина Vв называется минимаксом матрицы или верхней ценой игры.
В случае, если значения и не совпадают, при сохранении правил игры (коэффициентов
) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым.
Устойчивость он приобретает лишь при равенстве
. В этом случае говорят, что игра имеет решение в чистых стратегиях, а стратегии, в которых достигается V – оптимальными чистыми стратегиями. Величина V называется чистой ценой игры. [8].
Например, в матрице (рис. 20)

Рис. 20. Платёжная матрица, в которой существует решение в чистых стратегиях
существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия A1, а для игрока 2 – стратегия B4.
В матрице (рис. 21)
Рис. 21. Платёжная матрица, в которой не существует решения в чистых стратегиях
решения в чистых стратегиях не существует, так как нижняя цена игры достигается в стратегии A1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии
B4 и её значение равно 3.
Уменьшение порядка платёжной матрицы.
Порядок платёжной матрицы (количество строк и столбцов) может быть уменьшен за счёт исключения доминируемых и дублирующих стратегий.
Стратегия K* называется доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение
,
где A
k
* и A
k
** – значения выигрышей при выборе игроком, соответственно, стратегий K*
и K**.
В случае, если выполняется соотношение
,
стратегия K* называется дублирующей по отношению к стратегии K**.
Например, в матрице
Рис. 22. Платёжная матрица с доминируемыми и дублирующими стратегиями

Стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6
является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.
Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето (по имени итальянского экономиста
Вильфредо Парето, занимавшегося исследованиями в данной области)
Пример решения матричной игры в чистых стратегиях.
Рассмотрим пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона.
Задача.
Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.
Каждое из предприятий имеет возможность производить продукцию с применением одной из трёх различных технологий. В зависимости от качества продукции, произведённой по каждой технологии, предприятия могут установить цену единицы продукции на уровне 10, 6 и 2
денежных единиц соответственно. При этом предприятия имеют различные затраты на производство единицы продукции.
Таблица 28.
Затраты на единицу продукции, произведенной на предприятиях региона (д.е.)
Технология
Цена реализации
единицы продукции, д.е.
Полная себестоимость единицы
продукции, д.е.
Предприятие 1
Предприятие 2
I
10 5
8
II
6 3
4
III
2 1.5 1
В результате маркетингового исследования рынка продукции региона была определена функция спроса на продукцию:
,
где Y – количество продукции, которое приобретёт население региона (тыс. ед.), а X –
средняя цена продукции предприятий, д.е.
Данные о спросе на продукцию в зависимости от цен реализации приведены в таблице 29.
Таблица 29.
Спрос на продукцию в регионе, тыс. ед.
Цена реализации 1 ед. продукции, д.е.
Средняя цена
реализации 1 ед.
продукции, д.е.
Спрос на продукцию,
тыс. ед.
Предприятие 1
Предприятие 2
10 10 10 1

10 6
8 2
10 2
6 3
6 10 8
2 6
6 6
3 6
2 4
4 2
10 6
3 2
6 4
4 2
2 2
5
Значения Долей продукции предприятия 1, приобретенной населением, зависят от соотношения цен на продукцию предприятия 1 и предприятия 2. В результате маркетингового исследования эта зависимость установлена и значения вычислены.
Таблица 30.
Доля продукции предприятия 1, приобретаемой населением в зависимости от
соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е.
Доля продукции предприятия
1, купленной населением
Предприятие 1
Предприятие 2
10 10 0,31 10 6
0,33 10 2
0,18 6
10 0,7 6
6 0,3 6
2 0,2 2
10 0,92 2
6 0,85 2
2 0,72
По условию задачи на рынке региона действует только 2 предприятия. Поэтому долю продукции второго предприятия, приобретённой населением, в зависимости от соотношения цен на продукцию можно определить как единица минус доля первого предприятия.
Стратегиями предприятий в данной задаче являются их решения относительно технологий производства продукции. Эти решения определяют себестоимость и цену реализации единицы продукции. В задаче необходимо определить:
1.
Существует ли в данной задаче ситуация равновесия при выборе технологий производства продукции обоими предприятиями?
2.
Существуют ли технологии, которые предприятия заведомо не будут выбирать вследствие невыгодности?
3.
Сколько продукции будет реализовано в ситуации равновесия? Какое предприятие окажется в выигрышном положении?
Решение задачи.
1.
Определим экономический смысл коэффициентов выигрышей в платёжной матрице задачи. Каждое предприятие стремится к максимизации прибыли от производства продукции.
Но кроме того, в данном случае предприятия ведут борьбу за рынок продукции в регионе. При этом выигрыш одного предприятия означает проигрыш другого. Такая задача может быть сведена к матричной игре с нулевой суммой. При этом коэффициентами выигрышей будут значения разницы прибыли предприятия 1 и предприятия 2 от производства продукции. В

случае, если эта разница положительна, выигрывает предприятие 1, а в случае, если она отрицательна – предприятие 2.
2.
Рассчитаем коэффициенты выигрышей платёжной матрицы. Для этого необходимо определить значения прибыли предприятия 1 и предприятия 2 от производства продукции.
Прибыль предприятия в данной задаче зависит:
·
от цены и себестоимости продукции;
·
от количества продукции, приобретаемой населением региона;
·
от доли продукции, приобретённой населением у предприятия.
Таким образом, значения разницы прибыли предприятий, соответствующие коэффициентам платёжной матрицы, необходимо определить по формуле (40):
(40),
где D – значение разницы прибыли от производства продукции предприятия 1 и предприятия 2;
p – доля продукции предприятия 1, приобретаемой населением региона;
S – количество продукции, приобретаемой населением региона;
R1 и R2 – цены реализации единицы продукции предприятиями 1 и 2;
C1 и C2 – полная себестоимость единицы продукции, произведённой на предприятиях 1 и
2.
Вычислим один из коэффициентов платёжной матрицы.
Пусть, например, предприятие 1 принимает решение о производстве продукции в соответствии с технологией III, а предприятие 2 – в соответствии с технологией II. Тогда цена реализации единицы. продукции для предприятия 1 составит 2 д.е. при себестоимости единицы.
продукции 1,5 д.е. Для предприятия 2 цена реализации единицы. продукции составит 6 д.е. при себестоимости 4 д.е. (табл. 28).
Количество продукции, которое население региона приобретёт при средней цене 4 д.е.,
равно 4 тыс. ед. (таблица 29). Доля продукции, которую население приобретёт у предприятия 1,
составит 0,85, а у предприятия
(табл. 30). Вычислим коэффициент платёжной матрицы по формуле (40):
тыс. ед.
где i=3 – номер технологии первого предприятия, а j=2 – номер технологии второго предприятия.
Аналогично вычислим все коэффициенты платёжной матрицы. В платёжной матрице стратегии A1 – A3 – представляют собой решения о технологиях производства продукции предприятием 1, стратегии B1 – B3 – решения о технологиях производства продукции предприятием 2, коэффициенты выигрышей – разницу прибыли предприятия 1 и предприятия 2.
Рис. 23. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».

В данной матрице нет ни доминируемых, ни дублирующих стратегий. Это значит, что для обоих предприятий нет заведомо невыгодных технологий производства продукции. Определим минимальные элементы строк матрицы. Для предприятия 1 каждый из этих элементов имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии.
Минимальные элементы матрицы по строкам имеют значения: 0,17, -1,5, 0,4.
Определим максимальные элементы столбцов матрицы. Для предприятия 2 каждый из этих элементов также имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Максимальные элементы матрицы по столбцам имеют значения: 3,
0,62, 0,4.
Нижняя цена игры в матрице равна 0,4. Верхняя цена игры также равна 0,4. Таким образом, нижняя и верхняя цена игры в матрице совпадают. Это значит, что имеется технология производства продукции, которая является оптимальной для обоих предприятий в условиях данной задачи. Эта технология III, которая соответствует стратегиям A3 предприятия 1 и B3
предприятия 2. Стратегии A3 и B3 – чистые оптимальные стратегии в данной задаче.
Значение разницы прибыли предприятия 1 и предприятия 2 при выборе чистой оптимальной стратегии положительно. Это означает, что предприятие 1 выиграет в данной игре.
Выигрыш предприятия 1 составит 0,4 тыс. д.е. При этом на рынке будет реализовано 5 тыс. ед.
продукции (реализация равна спросу на продукцию, таблица 29).. Оба предприятия установят цену за единицу продукции в 2 д.е. При этом для первого предприятия полная себестоимость единицы продукции составит 1,5 д.е., а для второго – 1 д.е (таблица 28). Предприятие 1
окажется в выигрыше лишь за счёт высокой доли продукции, которую приобретёт у него население.
Вопрос 2. Смешанные стратегии в матричных играх
Понятие о матричных играх со смешанным расширением.
Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.
Определение. Смешанной стратегией игрока называется полный набор чистых стратегий,
применённых в соответствии с установленным распределением вероятностей. Матричная игра,
решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.
Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.
Доказано [1,2,4,7,8,11], что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:
При этом условии величина V называется ценой игры.
Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от

того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.
Решение матричных игр со смешанным расширением методами линейного
программирования.
Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.
Для матричной игры, платёжная матрица которой показана на рис. 19,
, определим такие значения вероятностей выбора стратегий для игрока 1 (
) и для игрока 2 (
), при которых игроки достигали бы своего максимально гарантированного выигрыша.
Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:
Для первого игрока:
Для второго игрока:
Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину обозначим через , а
– через .
Для игрока 1 получим следующую систему неравенств, из которой найдём значение
:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение должно стремиться к минимуму.
Целевая функция задачи будет иметь следующий вид:
Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:
Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение должно стремиться к максимуму.
Целевая функция задачи будет иметь следующий вид:
Все переменные в данных системах линейных неравенств должны быть неотрицательными:
. Значения и не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие не отрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина
Для решения задач линейного программирования используется симплекс-метод. [1,5].
В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных и
Величина определяется по формуле:
Значения вероятностей выбора стратегий определяются: для игрока 1:
: для игрока 2:
Для определения цены игры V из величины V* необходимо вычесть число K.

1 2 3 4 5