Главная страница
Навигация по странице:

  • 5.3. Информационное равновесие

  • Стабильное информационное равновесие

  • ВВедение в теорию управления организационными системами. В теорию управления организационными


    Скачать 1.89 Mb.
    НазваниеВ теорию управления организационными
    АнкорВВедение в теорию управления организационными системами
    Дата21.05.2020
    Размер1.89 Mb.
    Формат файлаpdf
    Имя файлаВВедение в теорию управления организационными системами.pdf
    ТипУчебник
    #124282
    страница13 из 23
    1   ...   9   10   11   12   13   14   15   16   ...   23
    Граф рефлексивной игры. Если структура информированно- сти имеет конечную сложность, то можно построить граф рефлек-
    сивной игры, наглядно показывающий взаимосвязь между действия- ми агентов (как реальных, так и фантомных), участвующих в равновесии.
    Вершинами этого ориентированного графа являются действия
    x
    t
    ,
    t Î S
    +
    , отвечающие попарно нетождественным структурам ин- формированности I
    t
    , или компоненты структуры информированно- сти
    q
    t
    , или просто номер
    t реального или фантомного агента, t Î S
    +
    Между вершинами проведены дуги по следующему правилу: к каждой вершине x
    si
    проведены дуги от (n – 1) вершин, отвечающих структурам I
    sij
    , j
    Î N \ {i}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.
    Подчеркнем, что граф рефлексивной игры соответствует систе- ме уравнений (5.6) (то есть определению информационного равно- весия), в то время как решения ее может и не существовать.
    Итак, граф G
    I
    рефлексивной игры Г
    I
    (см. определение рефлек- сивной игры выше), структура информированности которой имеет конечную сложность, определяется следующим образом:
    1) вершины графа G
    I
    соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетож- дественным структурам информированности;
    2) дуги графа G
    I
    отражают взаимную информированность аген- тов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.
    Если в вершинах графа G
    I
    изображать представления соответст- вующего агента о состоянии природы, то рефлексивная игра Г
    I
    с конечной структурой информированности I может быть задана

    152 кортежем Г
    I
    = {N,(X
    i
    )
    i
    Î N
    , f
    i
    (
    ×)
    i
    Î N
    , G
    I
    }, где N – множество реальных агентов, X
    i
    – множество допустимых действий i-го агента,
    f
    i
    (
    ×):W ´ X’ ® Â
    1
    – его целевая функция, i
    Î N, G
    I
    – граф рефлексив- ной игры.
    Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа G
    I
    , а не дерева информационной структуры (см. ниже примеры графов рефлексивных игр).
    5.3. Информационное равновесие
    Если задана структура I информированности игры, то тем са- мым задана и структура информированности каждого из агентов
    (как реальных, так и фантомных). Выбор
    t-агентом своего действия
    x
    t
    в рамках гипотезы рационального поведения определяется его структурой информированности I
    t
    , поэтому, имея перед собой эту структуру, можно смоделировать его рассуждения и определить это его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определе- нии исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.
    Набор действий x
    t
    *
    ,
    t Î S
    +
    , называется информационным равно-
    весием [30], если выполнены следующие условия:
    (5.6) 1) структура информированности I имеет конечную слож- ность
    n;
    2)
    S
    Î
    "
    m
    l,
    I
    li
    = I
    mi
    Þ x
    li
    *
    = x
    mi
    *
    ;
    3)
    " i Î N,"
    s Î S
    )
    ...,
    ,
    ,
    ,...,
    ,
    (
    max
    Arg
    *
    ,
    *
    1
    ,
    *
    1
    ,
    *
    1
    *
    n
    i
    i
    i
    i
    i
    i
    i
    i
    i
    X
    x
    i
    x
    x
    x
    x
    x
    f
    x
    i
    i
    s
    s
    s
    s
    s
    s
    q
    +
    -
    Î
    Î
    Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реаль- ных и фантомных агентов.
    Второе условие отражает требование того, что одинаково ин- формированные агенты выбирают одинаковые действия.
    И, наконец, третье условие отражает рациональное поведение агентов – каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее дейст- вия других агентов, которые оказываются рациональными с точки

    153 зрения рассматриваемого агента в рамках имеющихся у него пред- ставлений о других агентах.
    В соответствии с условием 2, для определения информационно- го равновесия требуется решить, казалось бы, бесконечное (счетное) число уравнений и получить столько же значений x
    t
    *
    . Однако оказы- вается, что на самом деле число уравнений и значений конечно.
    Утверждение 5.1. Если информационное равновесие x
    t
    *
    ,
    t Î S
    +
    , существует, то оно состоит из не более чем n попарно различных действий, а в системе (5.6) содержится не более чем n попарно различных уравнений.
    Доказательство. Пусть x
    t
    *
    ,
    t Î S
    +
    , – информационное равнове- сие. Тогда из конечности структуры информированности и условия
    2 сразу следует, что попарно различных чисел x
    t
    *
    не более
    n.
    Рассмотрим две любые тождественные структуры информиро- ванности: I
    l
    = I
    m
    . Соответственно, имеем
    q
    l
    =
    q
    m
    и x
    l
    *
    =x
    m
    *
    . Далее, для любого i
    Î N справедливо I
    li
    = I
    mi
    , следовательно, x
    li
    *
    = x
    mi
    *
    . Поэтому два уравнения системы (5.6), у которых в левой части стоят действия
    x
    l
    *
    и x
    m
    *
    , тождественно совпадают. Так как имеется
    n попарно раз- личных структур информированности, количество попарно различ- ных условий (5.6) не превышает
    n. ·
    Таким образом, для нахождения информационного равновесия
    x
    t
    *
    ,
    t Î S
    +
    , достаточно записать
    n условий (5.6) для каждого из n попарно различных значений x
    t
    *
    , отвечающих попарно различным структурам информированности I
    t
    Если все агенты являются одинаково информированными, то сложность структуры информированности минимальна и равна числу агентов. В этом случае система (5.6) переходит в определение равновесия Нэша, а информационное равновесие – в равновесие
    Нэша.
    Итак, в случае, когда все реальные агенты являются одинаково информированными (то есть рефлексивная реальность является общим знанием), информационное равновесие переходит в равнове- сие Нэша (фантомных агентов «не возникает»).
    Информационное равновесие (см. (5.6)) является достаточно громоздкой конструкцией, и сразу увидеть связь между информаци- онной структурой и информационным равновесием зачастую бывает затруднительно. Удобным языком описания взаимной информиро- ванности агентов и выразительным средством анализа свойств

    154 информационного равновесия является граф рефлексивной игры, описанный выше.
    Рассмотрим несколько примеров нахождения информационного равновесия с помощью графа рефлексивной игры.
    Примеры 5.1, 5.2. В этих примерах участвуют три агента с целе- выми функциями следующего вида:
    ,
    2
    )
    (
    )
    ,
    ,
    ,
    (
    2 3
    2 1
    3 2
    1
    i
    i
    i
    x
    x
    x
    x
    x
    x
    x
    x
    f
    -
    -
    -
    -
    =
    q
    q
    где x
    i
    ³ 0, i Î N = {1, 2, 3};
    q Î W = {1, 2}.
    Содержательно, x
    i
    – объем выпуска продукции i-м агентом,
    q – спрос на производимую продукцию. Тогда первое слагаемое в целе- вой функции может интерпретироваться как произведение цены на объем продаж – выручка от продаж (см. модели олигополии Курно в
    [1, 35, 36]), а второе слагаемое – как затраты на производство.
    Для краткости будем называть агента, считающего, что спрос низкий (
    q = 1), пессимистом, а считающего, что спрос высокий
    (
    q = 2) – оптимистом. Таким образом, в примерах 5.1, 5.2 ситуации различаются лишь вследствие различных структур информирован- ности.
    Пример 5.1. Пусть первые два агента оптимисты, а третий – пес- симист, причем все трое одинаково информированы.
    В соответствии со свойством 2 определения информационного равновесия, аналогичные соотношения выполняются для равновес- ных действий x
    s
    *
    Видно, что любая структура информированности тождественна одной из трех, образующих базис: {I
    1
    , I
    2
    , I
    3
    }. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 5.3.
    x
    1
    x
    2
    x
    3
    Рис. 5.3. Граф рефлексивной игры в примере 5.1

    155
    Для нахождения информационного равновесия надо решить следующую систему уравнений (см. (5.6)):
    ï
    ï
    ï
    î
    ï
    ï
    ï
    í
    ì
    -
    -
    =
    -
    -
    =
    -
    -
    =
    ,
    3 1
    ,
    3 2
    ,
    3 2
    *
    2
    *
    1
    *
    3
    *
    3
    *
    1
    *
    2
    *
    3
    *
    2
    *
    1
    x
    x
    x
    x
    x
    x
    x
    x
    x
    Û
    ï
    ï
    ï
    î
    ï
    ï
    ï
    í
    ì
    =
    =
    =
    0
    ,
    2 1
    ,
    2 1
    *
    3
    *
    2
    *
    1
    x
    x
    x
    Таким образом, действия агентов в ситуации информационного равновесия будут следующими:
    x
    1
    *
    = x
    2
    *
    = 1/2, x
    3
    *
    = 0.
    ·
    Пример 5.2. Пусть первые два агента оптимисты, а третий – пессимист, который считает всех трех агентов одинаково информи- рованными пессимистами. Первые два агента одинаково информи- рованы, причем оба они адекватно информированы о третьем агенте.
    Сложность данной структуры информированности равна пяти, а глубина равна двум [20]. Граф рефлексивной игры изображен на
    Рис. 5.4.
    x
    1
    x
    2
    x
    3
    x
    31
    x
    32
    Рис. 5.4. Граф рефлексивной игры в примере 5.2
    Для нахождения информационного равновесия надо решить следующую систему уравнений (см. (5.6)):

    156
    ï
    ï
    ï
    ï
    ï
    ï
    î
    ï
    ï
    ï
    ï
    ï
    ï
    í
    ì
    -
    -
    =
    -
    -
    =
    -
    -
    =
    -
    -
    =
    -
    -
    =
    ,
    3 1
    ,
    3 1
    ,
    3 1
    ,
    3 2
    ,
    3 2
    *
    3
    *
    31
    *
    32
    *
    3
    *
    32
    *
    31
    *
    32
    *
    31
    *
    3
    *
    3
    *
    1
    *
    2
    *
    3
    *
    2
    *
    1
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    x
    Û
    ï
    ï
    ï
    ï
    ï
    ï
    î
    ïï
    ï
    ï
    ï
    ï
    í
    ì
    =
    =
    =
    =
    =
    5 1
    ,
    5 1
    ,
    5 1
    ,
    20 9
    ,
    20 9
    *
    32
    *
    31
    *
    3
    *
    2
    *
    1
    x
    x
    x
    x
    x
    Таким образом, действия реальных агентов в ситуации инфор- мационного равновесия будут следующими:
    x
    1
    *
    = x
    2
    *
    = 9/20, x
    3
    *
    = 1/5.
    Отметим, что лишь изменением информированности (перехо- дом от информационной структуры Рис. 5.3 к структуре Рис. 5.4) удалось увеличить как суммарный объем выпускаемой агентами продукции, так и их суммарный выигрыш.
    ·
    Стабильное информационное равновесие. Одной из особен- ностей «классического» равновесия Нэша является его самоподдер- живающийся характер – если игра повторяется несколько раз и все игроки, кроме i-го, выбирают одни и те же равновесные действия, то и i-му нет резона отклоняться от своего равновесного действия. Это обстоятельство очевидным образом связано с тем, что представле- ния всех игроков о реальности адекватны – значение состояния природы является общим знанием.
    В случае информационного равновесия ситуация, вообще гово- ря, может быть иной. Действительно, в результате однократного разыгрывания игры может оказаться, что какие-то из игроков (или даже все) наблюдают не тот результат, на который они рассчитыва- ли. Это может быть связано как с неверным представлением о со- стоянии природы, так и с неадекватной информированностью о представлениях оппонентов. В любом случае, самоподдерживаю- щийся характер равновесия нарушается – если игра повторяется, действия игроков могут измениться.
    Однако в некоторых случаях самоподдерживающийся характер равновесия может иметь место и при различных (и, вообще говоря, неверных) представлениях агентов. Говоря неформально, это проис-

    157 ходит тогда, когда каждый агент (как реальный, так и фантомный) наблюдает тот результат игры, которого ожидает. Для формального изложения нам понадобится дополнить описание рефлексивной игры.
    Напомним, что рефлексивная игра задается кортежем
    {N,(X
    i
    )
    i
    Î N
    , f
    i
    (
    ×)
    i
    Î N
    ,
    W, I}, где N = {1,2,, n} – множество участни- ков игры (игроков, агентов), X
    i
    – множество допустимых действий i- го агента, f
    i
    (
    ×):W ´ X’ ®Â
    1
    – его целевая функция, i
    Î N, I – струк- тура информированности. Дополним эту конструкцию набором функций w
    i
    (
    ×):W ´ X’ ® W
    i
    , i
    Î N, каждая из которых отображает вектор (
    q, x) в элемент w
    i
    некоторого множества W
    i
    . Этот элемент w
    i
    и есть то, что i-й агент наблюдает в результате разыгрывания игры.
    Функцию w
    i
    (
    ×) будем называть функцией наблюдения i-го агента
    [31]. Будем считать, что функции наблюдения являются общим знанием среди агентов.
    Если w
    i
    (
    q, x) = (q, x), то есть W
    i
    =
    W ´ X’, то i-й агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество W
    i
    состоит из одного элемента, то i-й агент ничего не наблюдает.
    Пусть в рефлексивной игре существует информационное равно- весие x
    t
    ,
    t Î S
    +
    (напомним, что
    t – произвольная непустая конечная последовательность индексов из N). Зафиксируем i
    Î N и рассмот- рим i-го агента. Он ожидает в результате игры пронаблюдать вели- чину:
    (5.7) w
    i
    (
    q
    i
    , x
    i1
    , …, x
    i,i-1
    , x
    i
    , x
    i,i+1
    , …, x
    in
    ).
    На самом же деле он наблюдает величину:
    (5.8) w
    i
    (
    q, x
    1
    , …, x
    i-1
    , x
    i
    , x
    i+1
    , …, x
    n
    ).
    Поэтому требование стабильности для i-агента означает совпа- дение величин (5.7) и (5.8) (напомним, что эти величины являются элементами некоторого множества W
    i
    ).
    Пусть величины (5.7) и (5.8) равны, то есть i-агент и после ра- зыгрывания игры не сомневается в истинности своих представле- ний. Однако является ли это достаточным основанием для того, чтобы он и в следующий раз выбрал то же действие x
    i
    ? Ясно, что ответ отрицательный, что продемонстрируем на следующем приме- ре.
    Пример 5.3. Пусть в рефлексивной биматричной игре, где
    W = {1, 2}, выигрыши заданы биматрицами (агент 1 выбирает стро-

    158 ку, агент 2 – столбец, то есть X
    1
    = X
    2
    = {1; 2}), приведенными на
    Рис. 5.5,
    q = 1 q = 2
    ÷÷
    ø
    ö
    çç
    è
    æ
    )
    0
    ,
    2
    (
    )
    1
    ,
    0
    (
    )
    0
    ,
    0
    (
    )
    1
    ,
    1
    (
    ÷÷
    ø
    ö
    çç
    è
    æ
    )
    2
    ,
    2
    (
    )
    1
    ,
    1
    (
    )
    2
    ,
    1
    (
    )
    1
    ,
    0
    (
    Рис. 5.5. Матрицы выигрышей в примере 5.3 а граф рефлексивной игры имеет вид, изображенный на Рис. 5.6.
    1 12 121 1
    2 21
    Рис. 5.6. Граф рефлексивной игры в примере 5.3
    Пусть при этом
    q = q
    1
    =1,
    q
    2
    =
    q
    21
    = 2, и каждый агент наблюдает свой выигрыш (то есть функция наблюдения агента совпадает с его функцией выигрыша). Ясно, что информационным равновесием является набор x
    1
    = x
    2
    = x
    21
    = 2, то есть первый и второй агенты, а также 21-агент и все прочие фантомные агенты выбирают вторые действия. Однако реальное состояние природы
    q = 1 становится известным второму агенту после розыгрыша игры (и получения им выигрыша 0 вместо ожидаемого 2). Поэтому в следующий раз вто- рой агент выберет действие x
    2
    = 1, что побуждает и первого агента изменить свое действие (выбрать x
    1
    = 1).
    ·
    Таким образом, для стабильности равновесия необходимо что- бы и ij-агент, i, j
    Î N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать:
    (5.9) w
    j
    (
    q
    ij
    , x
    ij1
    , …, x
    ij,j-1
    , x
    ij
    , x
    ij,j+1
    , …, x
    ijn
    ).
    На самом же деле (то есть i-субъективно, ведь ij-агент сущест- вует в сознании i-агента) он наблюдает величину:
    (5.10) w
    j
    (
    q
    i
    , x
    i1
    , …, x
    i,j-1
    , x
    ij
    , x
    i,j+1
    , …, x
    in
    ).
    Поэтому требование стабильности для ij-агента означает совпа- дение величин (5.9) и (5.10).
    В общем случае, то есть для
    ti-агента, ti Î S
    +
    , условие стабиль- ности определим следующим образом.
    Информационное равновесие x
    ti
    ,
    ti Î S
    +
    , будем называть ста-
    бильным при заданной структуре информированности I, если для любого
    ti Î S
    +
    выполняется

    159
    (5.11) w
    i
    (
    q ti
    , x
    ti1
    , …, x
    ti,i-1
    , x
    ti
    , x
    ti,i+1
    , …, x
    tin
    ) =
    = w
    i
    (
    q
    t
    , x
    t1
    , …, x
    t,i-1
    , x
    ti
    , x
    t,i+1
    , …, x
    tn
    ).
    Информационное равновесие, не являющееся стабильным, бу- дем называть нестабильным. В частности, информационное равно- весие в примере 5.3 является нестабильным.
    Утверждение 5.2. Пусть структура информированности I имеет сложность
    n и существует информационное равновесие x
    ti
    ,
    ti Î S
    +
    Тогда система соотношений (5.11) содержит не более чем
    n попарно различных условий.
    Доказательство. Рассмотрим две любые тождественные [20] структуры информированности: I
    li
    = I
    mi
    . Поскольку x
    ti
    – равновесие, имеем
    q
    li
    =
    q
    mi
    , x
    li
    =x
    mi
    , I
    lij
    =I
    mij
    , x
    lij
    =x
    mij
    для любого j
    Î N. Поэтому условия стабильности (5.11) для
    li- и mi-агентов тождественно совпадают. Так как имеется
    n попарно различных структур инфор- мированности, количество попарно различных условий (5.11) не превышает
    n. ·
    1   ...   9   10   11   12   13   14   15   16   ...   23


    написать администратору сайта