ВВедение в теорию управления организационными системами. В теорию управления организационными
Скачать 1.89 Mb.
|
Граф рефлексивной игры. Если структура информированно- сти имеет конечную сложность, то можно построить граф рефлек- сивной игры, наглядно показывающий взаимосвязь между действия- ми агентов (как реальных, так и фантомных), участвующих в равновесии. Вершинами этого ориентированного графа являются действия x t , t Î S + , отвечающие попарно нетождественным структурам ин- формированности I t , или компоненты структуры информированно- сти q t , или просто номер t реального или фантомного агента, t Î S + Между вершинами проведены дуги по следующему правилу: к каждой вершине x si проведены дуги от (n – 1) вершин, отвечающих структурам I sij , j Î N \ {i}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками. Подчеркнем, что граф рефлексивной игры соответствует систе- ме уравнений (5.6) (то есть определению информационного равно- весия), в то время как решения ее может и не существовать. Итак, граф G I рефлексивной игры Г I (см. определение рефлек- сивной игры выше), структура информированности которой имеет конечную сложность, определяется следующим образом: 1) вершины графа G I соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетож- дественным структурам информированности; 2) дуги графа G I отражают взаимную информированность аген- тов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом. Если в вершинах графа G I изображать представления соответст- вующего агента о состоянии природы, то рефлексивная игра Г I с конечной структурой информированности I может быть задана 152 кортежем Г I = {N,(X i ) i Î N , f i ( ×) i Î N , G I }, где N – множество реальных агентов, X i – множество допустимых действий i-го агента, f i ( ×):W ´ X’ ®  1 – его целевая функция, i Î N, G I – граф рефлексив- ной игры. Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа G I , а не дерева информационной структуры (см. ниже примеры графов рефлексивных игр). 5.3. Информационное равновесие Если задана структура I информированности игры, то тем са- мым задана и структура информированности каждого из агентов (как реальных, так и фантомных). Выбор t-агентом своего действия x t в рамках гипотезы рационального поведения определяется его структурой информированности I t , поэтому, имея перед собой эту структуру, можно смоделировать его рассуждения и определить это его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определе- нии исхода игры необходимо учитывать действия как реальных, так и фантомных агентов. Набор действий x t * , t Î S + , называется информационным равно- весием [30], если выполнены следующие условия: (5.6) 1) структура информированности I имеет конечную слож- ность n; 2) S Î " m l, I li = I mi Þ x li * = x mi * ; 3) " i Î N," s Î S ) ..., , , ,..., , ( max Arg * , * 1 , * 1 , * 1 * n i i i i i i i i i X x i x x x x x f x i i s s s s s s q + - Î Î Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реаль- ных и фантомных агентов. Второе условие отражает требование того, что одинаково ин- формированные агенты выбирают одинаковые действия. И, наконец, третье условие отражает рациональное поведение агентов – каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее дейст- вия других агентов, которые оказываются рациональными с точки 153 зрения рассматриваемого агента в рамках имеющихся у него пред- ставлений о других агентах. В соответствии с условием 2, для определения информационно- го равновесия требуется решить, казалось бы, бесконечное (счетное) число уравнений и получить столько же значений x t * . Однако оказы- вается, что на самом деле число уравнений и значений конечно. Утверждение 5.1. Если информационное равновесие x t * , t Î S + , существует, то оно состоит из не более чем n попарно различных действий, а в системе (5.6) содержится не более чем n попарно различных уравнений. Доказательство. Пусть x t * , t Î S + , – информационное равнове- сие. Тогда из конечности структуры информированности и условия 2 сразу следует, что попарно различных чисел x t * не более n. Рассмотрим две любые тождественные структуры информиро- ванности: I l = I m . Соответственно, имеем q l = q m и x l * =x m * . Далее, для любого i Î N справедливо I li = I mi , следовательно, x li * = x mi * . Поэтому два уравнения системы (5.6), у которых в левой части стоят действия x l * и x m * , тождественно совпадают. Так как имеется n попарно раз- личных структур информированности, количество попарно различ- ных условий (5.6) не превышает n. · Таким образом, для нахождения информационного равновесия x t * , t Î S + , достаточно записать n условий (5.6) для каждого из n попарно различных значений x t * , отвечающих попарно различным структурам информированности I t Если все агенты являются одинаково информированными, то сложность структуры информированности минимальна и равна числу агентов. В этом случае система (5.6) переходит в определение равновесия Нэша, а информационное равновесие – в равновесие Нэша. Итак, в случае, когда все реальные агенты являются одинаково информированными (то есть рефлексивная реальность является общим знанием), информационное равновесие переходит в равнове- сие Нэша (фантомных агентов «не возникает»). Информационное равновесие (см. (5.6)) является достаточно громоздкой конструкцией, и сразу увидеть связь между информаци- онной структурой и информационным равновесием зачастую бывает затруднительно. Удобным языком описания взаимной информиро- ванности агентов и выразительным средством анализа свойств 154 информационного равновесия является граф рефлексивной игры, описанный выше. Рассмотрим несколько примеров нахождения информационного равновесия с помощью графа рефлексивной игры. Примеры 5.1, 5.2. В этих примерах участвуют три агента с целе- выми функциями следующего вида: , 2 ) ( ) , , , ( 2 3 2 1 3 2 1 i i i x x x x x x x x f - - - - = q q где x i ³ 0, i Î N = {1, 2, 3}; q Î W = {1, 2}. Содержательно, x i – объем выпуска продукции i-м агентом, q – спрос на производимую продукцию. Тогда первое слагаемое в целе- вой функции может интерпретироваться как произведение цены на объем продаж – выручка от продаж (см. модели олигополии Курно в [1, 35, 36]), а второе слагаемое – как затраты на производство. Для краткости будем называть агента, считающего, что спрос низкий ( q = 1), пессимистом, а считающего, что спрос высокий ( q = 2) – оптимистом. Таким образом, в примерах 5.1, 5.2 ситуации различаются лишь вследствие различных структур информирован- ности. Пример 5.1. Пусть первые два агента оптимисты, а третий – пес- симист, причем все трое одинаково информированы. В соответствии со свойством 2 определения информационного равновесия, аналогичные соотношения выполняются для равновес- ных действий x s * Видно, что любая структура информированности тождественна одной из трех, образующих базис: {I 1 , I 2 , I 3 }. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 5.3. x 1 x 2 x 3 Рис. 5.3. Граф рефлексивной игры в примере 5.1 155 Для нахождения информационного равновесия надо решить следующую систему уравнений (см. (5.6)): ï ï ï î ï ï ï í ì - - = - - = - - = , 3 1 , 3 2 , 3 2 * 2 * 1 * 3 * 3 * 1 * 2 * 3 * 2 * 1 x x x x x x x x x Û ï ï ï î ï ï ï í ì = = = 0 , 2 1 , 2 1 * 3 * 2 * 1 x x x Таким образом, действия агентов в ситуации информационного равновесия будут следующими: x 1 * = x 2 * = 1/2, x 3 * = 0. · Пример 5.2. Пусть первые два агента оптимисты, а третий – пессимист, который считает всех трех агентов одинаково информи- рованными пессимистами. Первые два агента одинаково информи- рованы, причем оба они адекватно информированы о третьем агенте. Сложность данной структуры информированности равна пяти, а глубина равна двум [20]. Граф рефлексивной игры изображен на Рис. 5.4. x 1 x 2 x 3 x 31 x 32 Рис. 5.4. Граф рефлексивной игры в примере 5.2 Для нахождения информационного равновесия надо решить следующую систему уравнений (см. (5.6)): 156 ï ï ï ï ï ï î ï ï ï ï ï ï í ì - - = - - = - - = - - = - - = , 3 1 , 3 1 , 3 1 , 3 2 , 3 2 * 3 * 31 * 32 * 3 * 32 * 31 * 32 * 31 * 3 * 3 * 1 * 2 * 3 * 2 * 1 x x x x x x x x x x x x x x x Û ï ï ï ï ï ï î ïï ï ï ï ï í ì = = = = = 5 1 , 5 1 , 5 1 , 20 9 , 20 9 * 32 * 31 * 3 * 2 * 1 x x x x x Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими: x 1 * = x 2 * = 9/20, x 3 * = 1/5. Отметим, что лишь изменением информированности (перехо- дом от информационной структуры Рис. 5.3 к структуре Рис. 5.4) удалось увеличить как суммарный объем выпускаемой агентами продукции, так и их суммарный выигрыш. · Стабильное информационное равновесие. Одной из особен- ностей «классического» равновесия Нэша является его самоподдер- живающийся характер – если игра повторяется несколько раз и все игроки, кроме i-го, выбирают одни и те же равновесные действия, то и i-му нет резона отклоняться от своего равновесного действия. Это обстоятельство очевидным образом связано с тем, что представле- ния всех игроков о реальности адекватны – значение состояния природы является общим знанием. В случае информационного равновесия ситуация, вообще гово- ря, может быть иной. Действительно, в результате однократного разыгрывания игры может оказаться, что какие-то из игроков (или даже все) наблюдают не тот результат, на который они рассчитыва- ли. Это может быть связано как с неверным представлением о со- стоянии природы, так и с неадекватной информированностью о представлениях оппонентов. В любом случае, самоподдерживаю- щийся характер равновесия нарушается – если игра повторяется, действия игроков могут измениться. Однако в некоторых случаях самоподдерживающийся характер равновесия может иметь место и при различных (и, вообще говоря, неверных) представлениях агентов. Говоря неформально, это проис- 157 ходит тогда, когда каждый агент (как реальный, так и фантомный) наблюдает тот результат игры, которого ожидает. Для формального изложения нам понадобится дополнить описание рефлексивной игры. Напомним, что рефлексивная игра задается кортежем {N,(X i ) i Î N , f i ( ×) i Î N , W, I}, где N = {1,2, …, n} – множество участни- ков игры (игроков, агентов), X i – множество допустимых действий i- го агента, f i ( ×):W ´ X’ ®Â 1 – его целевая функция, i Î N, I – струк- тура информированности. Дополним эту конструкцию набором функций w i ( ×):W ´ X’ ® W i , i Î N, каждая из которых отображает вектор ( q, x) в элемент w i некоторого множества W i . Этот элемент w i и есть то, что i-й агент наблюдает в результате разыгрывания игры. Функцию w i ( ×) будем называть функцией наблюдения i-го агента [31]. Будем считать, что функции наблюдения являются общим знанием среди агентов. Если w i ( q, x) = (q, x), то есть W i = W ´ X’, то i-й агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество W i состоит из одного элемента, то i-й агент ничего не наблюдает. Пусть в рефлексивной игре существует информационное равно- весие x t , t Î S + (напомним, что t – произвольная непустая конечная последовательность индексов из N). Зафиксируем i Î N и рассмот- рим i-го агента. Он ожидает в результате игры пронаблюдать вели- чину: (5.7) w i ( q i , x i1 , …, x i,i-1 , x i , x i,i+1 , …, x in ). На самом же деле он наблюдает величину: (5.8) w i ( q, x 1 , …, x i-1 , x i , x i+1 , …, x n ). Поэтому требование стабильности для i-агента означает совпа- дение величин (5.7) и (5.8) (напомним, что эти величины являются элементами некоторого множества W i ). Пусть величины (5.7) и (5.8) равны, то есть i-агент и после ра- зыгрывания игры не сомневается в истинности своих представле- ний. Однако является ли это достаточным основанием для того, чтобы он и в следующий раз выбрал то же действие x i ? Ясно, что ответ отрицательный, что продемонстрируем на следующем приме- ре. Пример 5.3. Пусть в рефлексивной биматричной игре, где W = {1, 2}, выигрыши заданы биматрицами (агент 1 выбирает стро- 158 ку, агент 2 – столбец, то есть X 1 = X 2 = {1; 2}), приведенными на Рис. 5.5, q = 1 q = 2 ÷÷ ø ö çç è æ ) 0 , 2 ( ) 1 , 0 ( ) 0 , 0 ( ) 1 , 1 ( ÷÷ ø ö çç è æ ) 2 , 2 ( ) 1 , 1 ( ) 2 , 1 ( ) 1 , 0 ( Рис. 5.5. Матрицы выигрышей в примере 5.3 а граф рефлексивной игры имеет вид, изображенный на Рис. 5.6. 1 12 121 1 2 21 Рис. 5.6. Граф рефлексивной игры в примере 5.3 Пусть при этом q = q 1 =1, q 2 = q 21 = 2, и каждый агент наблюдает свой выигрыш (то есть функция наблюдения агента совпадает с его функцией выигрыша). Ясно, что информационным равновесием является набор x 1 = x 2 = x 21 = 2, то есть первый и второй агенты, а также 21-агент и все прочие фантомные агенты выбирают вторые действия. Однако реальное состояние природы q = 1 становится известным второму агенту после розыгрыша игры (и получения им выигрыша 0 вместо ожидаемого 2). Поэтому в следующий раз вто- рой агент выберет действие x 2 = 1, что побуждает и первого агента изменить свое действие (выбрать x 1 = 1). · Таким образом, для стабильности равновесия необходимо что- бы и ij-агент, i, j Î N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать: (5.9) w j ( q ij , x ij1 , …, x ij,j-1 , x ij , x ij,j+1 , …, x ijn ). На самом же деле (то есть i-субъективно, ведь ij-агент сущест- вует в сознании i-агента) он наблюдает величину: (5.10) w j ( q i , x i1 , …, x i,j-1 , x ij , x i,j+1 , …, x in ). Поэтому требование стабильности для ij-агента означает совпа- дение величин (5.9) и (5.10). В общем случае, то есть для ti-агента, ti Î S + , условие стабиль- ности определим следующим образом. Информационное равновесие x ti , ti Î S + , будем называть ста- бильным при заданной структуре информированности I, если для любого ti Î S + выполняется 159 (5.11) w i ( q ti , x ti1 , …, x ti,i-1 , x ti , x ti,i+1 , …, x tin ) = = w i ( q t , x t1 , …, x t,i-1 , x ti , x t,i+1 , …, x tn ). Информационное равновесие, не являющееся стабильным, бу- дем называть нестабильным. В частности, информационное равно- весие в примере 5.3 является нестабильным. Утверждение 5.2. Пусть структура информированности I имеет сложность n и существует информационное равновесие x ti , ti Î S + Тогда система соотношений (5.11) содержит не более чем n попарно различных условий. Доказательство. Рассмотрим две любые тождественные [20] структуры информированности: I li = I mi . Поскольку x ti – равновесие, имеем q li = q mi , x li =x mi , I lij =I mij , x lij =x mij для любого j Î N. Поэтому условия стабильности (5.11) для li- и mi-агентов тождественно совпадают. Так как имеется n попарно различных структур инфор- мированности, количество попарно различных условий (5.11) не превышает n. · |