Главная страница
Навигация по странице:

  • 5.1. Модель информационного управления

  • Моделирование информационного управления.

  • Классификация задач информационного управления.

  • 5.2. Рефлексивные игры

  • Стратегическая и информационная рефлексия

  • ВВедение в теорию управления организационными системами. В теорию управления организационными


    Скачать 1.89 Mb.
    НазваниеВ теорию управления организационными
    АнкорВВедение в теорию управления организационными системами
    Дата21.05.2020
    Размер1.89 Mb.
    Формат файлаpdf
    Имя файлаВВедение в теорию управления организационными системами.pdf
    ТипУчебник
    #124282
    страница12 из 23
    1   ...   8   9   10   11   12   13   14   15   ...   23
    ГЛАВА 5. Механизмы информационного
    управления в организационных системах
    Управлением, в соответствии с определением, приведенным выше, называется воздействие на управляемую систему с целью обеспечения требуемого ее поведения. Управляемая система с за- данными составом и структурой – множество рациональных аген- тов, принимающих самостоятельные решения о выбираемых дейст- виях – в рамках теоретико-игровой модели описывается множеством агентов N, совокупностью их целевых функций (f
    i
    (
    ×))
    i
    Î N
    , допусти- мых множеств (X
    i
    )
    i
    Î N
    и информированностью I. Значит, управление фиксированным множеством агентов может заключаться в воздей- ствии на: целевые функции (мотивационное управление [17]), до- пустимые множества (институциональное управление [15]) и ин- формированность (информационное управление [19, 20]). В настоящей главе более подробно рассматривается именно информа- ционное управление.
    5.1. Модель информационного управления
    С теоретико-игровой точки зрения задача управления состоит в том, чтобы сформировать для управляемых субъектов (агентов) такую игру, чтобы ее исход был наиболее благоприятным для управляющего органа (центра). Соответственно, задачу информаци- онного управления можно неформально (качественно) сформулиро- вать следующим образом: найти такую структуру информированно- сти, чтобы исход рефлексивной игры (см. раздел 5.2) агентов
    (информационное равновесие) был бы наиболее благоприятен для центра.
    Перейдем к формальной постановке задачи. Пусть на множест- ве действий реальных агентов и структур информированности зада- на целевая функция центра
    F(x, I). Пусть, далее, центр может сфор- мировать любую структуру информированности из некоторого множества
    Á’. При структуре информированности I Î Á’ вектор действий реальных агентов является элементом множества равно- весных векторов [31]
    Y
    X
    (I). Множество
    Y
    X
    (I) может быть пустым, тогда центр, ввиду отсутствия равновесия, не может рассчитывать на тот или иной исход игры. Поэтому введем множество допусти- мых структур, для которых существует хотя бы одно равновесие:
    Á = {I Î Á’ | Y
    X
    (I)
    ¹ Æ}.

    142
    Если при заданной структуре I
    Î
    Á множество равновесных векторов
    Y
    X
    (I) состоит более чем из одного элемента, то обычно
    (см., например, [2, 3, 36]) принимается одно из следующих двух предположений:
    1) гипотеза благожелательности (ГБ), состоящая в том, что у центра есть возможность обеспечить выбор агентами «нужного» равновесия;
    2) принцип максимального гарантированного результата
    (МГР), состоящий в том, что центр рассчитывает на наихудшее для себя равновесие игры агентов.
    В соответствии с ГБ и МГР получаем, соответственно, постановку задачи информационного управления в двух вариантах:
    (5.1) max;
    )
    ,
    (
    max
    )
    (
    ¾
    ¾®
    ¾
    F
    Á
    Î
    Y
    Î
    I
    I
    x
    I
    x
    X
    (5.2) max
    )
    ,
    (
    min
    )
    (
    ¾
    ¾®
    ¾
    F
    Á
    Î
    Y
    Î
    I
    I
    x
    I
    x
    X
    Разумеется, в случае, когда для любого I
    Î
    Á множество Y
    X
    (I) состоит ровно из одного элемента, (5.1) и (5.2) совпадают.
    Задачу (5.1) (либо (5.2)) будем называть задачей информацион- ного управления в форме целевой функции.
    Опишем теперь задачу информационного управления в не- сколько иной постановке, не зависящей от целевой функции центра.
    Пусть центр стремится добиться от агентов выбора вектора дейст- вий x
    Î X'. Зададимся вопросом: для каких векторов x и каким обра- зом (то есть при помощи формирования какой структуры I) центр может это сделать? Иначе говоря, вторая возможная постановка задачи информационного управления состоит в нахождении множе-
    ства достижимости – множества векторов x
    Î X', для каждого из которых множество структур
    Y
    I
    (x)
    Ç
    Á
    (5.3) непусто, либо
    (5.4) состоит ровно из одного элемента, а также соответствующих допустимых структур информированно- сти I
    ÎY
    I
    (x)
    Ç
    Á для каждого такого вектора x. Условие (5.3) соот- ветствует ГБ, условие (5.4) – МГР.
    Задачу (5.3) (либо (5.4)) будем называть задачей информацион- ного управления в форме множества достижимости.
    Еще раз подчеркнем, что вторая постановка не зависит от целе- вой функции центра и отражает лишь его возможность при помощи

    143 информационного управления привести систему в то или иное состояние.
    Как в первой, так и во второй постановке центр может либо ин- тересоваться, либо не интересоваться стабильностью (см. раздел 5.3) получившегося информационного равновесия. Если требуется осу- ществить стабильное информационное управление, то есть привести систему в стабильное информационное равновесие, то в приведен- ных выше постановках требуется заменить
    Y на Y
    s
    , а термины
    «равновесие» и «равновесный» – на «стабильное равновесие» и
    «стабильно-равновесный» соответственно.
    Моделирование информационного управления. Предлагае- мая модель информационного управления представлена на Рис. 5.1.
    Модель включает в себя агента (агентов) и управляющий орган
    – центр. Каждый агент характеризуется циклом «информирован- ность агента
    ® действие агента ® наблюдаемый агентом результат
    ® информированность агента», и у разных агентов эти три компо- ненты цикла являются, вообще говоря, различными. В то же время, и это отражает надпись «Агент(ы)» на Рис. 5.1, можно считать этот цикл общим для всей управляемой подсистемы, то есть для всего набора агентов.
    ДЕЙСТВИЕ
    НАБЛЮДАЕМЫЙ
    РЕЗУЛЬТАТ
    ИНФОРМИ-
    РОВАННОСТЬ
    Агент(ы)
    Управляющий
    орган (центр)
    Управляющее воздействие
    Реальный результат
    Рис. 5.1. Модель информационного управления

    144
    Что касается взаимодействия агента (агентов) и центра, то оно характеризуется:
    1) информационным воздействием центра, формирующим ту или иную информированность агента (агентов)
    21
    ;
    2) реальным результатом действия агента (агентов), который оказывает влияние на интересы центра.
    Обсудим модель, изображенную на Рис. 5.1, более подробно.
    Математическим аппаратом, моделирующим теоретико-игровое взаимодействие агентов, являются рефлексивные игры, в которых агенты выбирают действия на основе своих структур информиро-
    ванности – иерархии представлений о существенных параметрах ситуации («состоянии природы»), представлений о представлениях оппонентов (других агентов) и т.д. Таким образом, в терминах реф- лексивных игр информированность агента моделируется при помо- щи его структуры информированности (соответственно, информи- рованность всей управляемой подсистемы моделируется при помощи структуры информированности игры, являющейся объеди- нением структур информированности агентов).
    Исходя из своей структуры информированности, агент выбира- ет то или иное действие. Для заданной структуры информированно- сти действия агентов являются компонентами информационного
    равновесия, являющегося решением рефлексивной игры. Информа- ционное равновесие является обобщением равновесия Нэша – наи- более распространенной концепции решения некооперативных игр.
    Информированность агента о ситуации и о представлениях оппонен- тов может быть, вообще говоря, неадекватной. Поэтому наблюдае- мый агентом результат рефлексивной игры может как соответство- вать его ожиданиям, так и не соответствовать им. Соответствие определяется двумя факторами:
    1) насколько адекватно информирован агент на момент выбора своего действия;
    2) насколько подробную информацию о результатах игры он наблюдает.
    Например, наблюдаемым результатом может быть значение его целевой функции, действия оппонентов, истинное значение неопре-
    21
    Отметим, что можно рассматривать и воздействие центра на наблю-
    даемый агентом (агентами) результат, то есть «центр
    ® наблюдаемый
    результат» на Рис. 5.1. Однако это рассмотрение (в некотором смысле
    сближающее информационное управление с мотивационным) выходит за
    рамки настоящей работы.

    145 деленного параметра и пр. В общем случае агент наблюдает значе- ние некоторой функции, зависящей от состояния природы и дейст- вий оппонентов. Эта функция называется функцией наблюдения, и воздействие ее значения на информированность отображено на рисунке фрагментом «наблюдаемое действие
    ® информирован- ность». Если все агенты наблюдают именно тот результат, на какой рассчитывают (то есть реальное значение функции наблюдения каждого агента равно ожидаемому), то естественным является пред- положение о том, что структура информированности не меняется. В этом случае информационное равновесие является стабильным (см. ниже).
    Рассмотрим теперь взаимодействие агентов с центром. Осуще- ствляя информационное управление, центр стремится к максимиза- ции своей полезности (разумеется, это относится и к другим типам управления). Если считать, что центр может сформировать любую структуру информированности из некоторого допустимого множе- ства, то задачу информационного управления можно сформулиро- вать следующим образом: найти такую структуру информированно- сти из допустимого множества структур, чтобы полезность центра в информационном равновесии была максимальной (быть может, с учетом затрат центра на формирование структуры).
    Подчеркнем следующее важное обстоятельство: в рамках пред- лагаемой модели мы исходим из предположения о том, что центр может сформировать у агентов любую структуру информированно- сти. За рамками наших рассмотрений остается вопрос о том, каким образом центру следует «убедить» агентов в том, что имеют место те или иные состояния природы и представления оппонентов.
    Можно, однако, в рамках рассматриваемой модели классифи- цировать способы управляющего воздействия на информирован- ность агентов для формирования той или иной структуры. Такими способами являются:
    1) информационное регулирование – целенаправленное влияние на информацию о состоянии природы;
    2) рефлексивное управление – целенаправленное влияние на ин- формацию о представлениях оппонентов;
    3) активный прогноз – целенаправленное сообщение информа- ции о будущих значениях параметров, зависящих от состояния природы и действий агентов.
    Классификация задач информационного управления. В дан- ной главе рассматриваются двухуровневые ОС с одним центром и

    146 многими агентами в условиях неполной информированности аген- тов – каждый из субъектов может иметь свои представления о при- роде.
    Задачу информационного управления будем рассматривать
    1) в форме целевой функции либо множества достижимости;
    2) с использованием гипотезы благожелательности (ГБ) либо принципа максимально гарантированного результата (МГР);
    3) с требованием стабильности или без требования стабильно- сти.
    Выбор одного из этих восьми вариантов определяется конкрет- ной моделируемой ситуацией. Однако в любом случае необходимым
    (и, как показывает опыт, наиболее сложным и трудоемким для исследователя) этапом является установление связи между структу- рой информированности и вектором действий агентов, то есть ис- следование информационного равновесия.
    5.2. Рефлексивные игры
    Рассмотрим множество N = {1,2,, n} агентов. Если в ситуа- ции присутствует неопределенный параметр
    q Î W (будем считать, что множество
    W является общим знанием), то структура информи-
    рованности I
    i
    (как синоним будем употреблять термины информа-
    ционная структура и иерархия представлений) i-го агента включает в себя следующие элементы. Во-первых, представление i-го агента о параметре
    q – обозначим его q
    i
    ,
    q
    i
    Î W. Во-вторых, представления i- го агента о представлениях других агентов о параметре
    q – обозна- чим их
    q
    ij
    ,
    q
    ij
    Î W, j Î N. В-третьих, представления i-го агента о представлении j-го агента о представлении k-го агента – обозначим их
    q
    ijk
    ,
    q
    ijk
    Î W, j, k Î N. И так далее.
    Таким образом, структура информированности I
    i
    i-го агента за- дается набором всевозможных значений вида
    l
    j
    ij ...
    1
    q
    , где l пробегает множество целых неотрицательных чисел, j
    1
    , …, j
    l
    Î N, а
    l
    i
    i ...
    1
    q
    Î W.
    Аналогично задается структура информированности I игры в целом – набором значений
    l
    i
    i ...
    1
    q
    , где l пробегает множество целых неотрицательных чисел, j
    1
    , …, j
    l
    Î N, а
    l
    j
    ij ...
    1
    q
    Î W. Подчеркнем, что структура информированности I «недоступна» наблюдению агентов, каждому из которых известна лишь некоторая ее часть (а именно –
    I
    i
    ).

    147
    Таким образом, структура информированности – бесконечное n- дерево (то есть тип структуры постоянен и является n-деревом), вершинам которого соответствует конкретная информированность реальных и фантомных агентов.
    Рефлексивной игрой Г
    I
    называется игра, описываемая следую- щим кортежем:
    (5.5) Г
    I
    = {N,(X
    i
    )
    i
    Î N
    , f
    i
    (
    ×)
    i
    Î N
    ,
    W, I}, где N – множество реальных агентов, X
    i
    – множество допустимых действий i-го агента, f
    i
    (
    ×):W ´ X’ ®Â
    1
    – его целевая функция, i
    Î N,
    W – множество возможных значений неопределенного параметра, I – структура информированности.
    Таким образом, рефлексивная игра [20] является обобщением понятия игры в нормальной форме, задаваемой кортежем
    {N,(X
    i
    )
    i
    Î N
    , f
    i
    (
    ×)
    i
    Î N
    }, на случай, когда информированность агентов отражена иерархией их представлений (информационной структу- рой I). В рамках принятого определения «классическая» игра в нормальной форме является частным случаем рефлексивной игры – игры с общим знанием. В «предельном» случае – когда состояние природы является общим знанием – предлагаемая в настоящей работе концепция решения рефлексивной игры (информационное равновесие – см. ниже) переходит в равновесие Нэша.
    Совокупность связей между элементами информированности агентов можно изобразить в виде дерева (см. Рис. 5.2). При этом структура информированности i-го агента изображается поддеревом, исходящим из вершины
    q
    i
    q
    1
    q
    i
    q
    n
    q
    i1
    q
    ij
    q
    in




    Рис. 5.2. Дерево информационной структуры

    148
    Сделаем важное замечание: в настоящей работе мы ограничим- ся рассмотрением «точечной» структуры информированности, компоненты которой состоят лишь из элементов множества
    W.
    (Более общим случаем является, например, интервальная или веро- ятностная информированность.)
    Стратегическая и информационная рефлексия. Итак, реф- лексивной является игра, в которой информированность игроков не является общим знанием. С точки зрения теории игр и рефлексив- ных моделей принятия решений целесообразно разделять стратеги- ческую и информационную рефлексию [30].
    Информационная рефлексия – процесс и результат размышле- ний игрока о том, каковы значения неопределенных параметров, что об этих значениях знают и думают его оппоненты (другие игроки).
    При этом собственно «игровая» компонента отсутствует, так как никаких решений игрок не принимает.
    Иными словами, информационная рефлексия относится к ин- формированности агента о природной реальности (какова игра), и о рефлексивной реальности (какой видят игру другие).
    Информационная рефлексия логически предшествует рефлексии несколько иного рода – стратегической рефлексии.
    Стратегическая рефлексия – процесс и результат размышлений игрока о том, какие принципы принятия решений используют его оппоненты (другие игроки) в рамках той информированности, кото- рую он им приписывает в результате информационной рефлексии.
    Таким образом, информационная рефлексия имеет место только в условиях неполной информированности, и ее результат использует- ся при принятии решений (в том числе – при стратегической реф- лексии). Стратегическая рефлексия имеет место даже в случае пол- ной информированности, предваряя принятие игроком решения о выборе действия (стратегии). Другими словами, информационная и стратегическая рефлексии могут изучаться независимо, однако в условиях неполной информированности обе они имеют место.
    Далее для формулировки некоторых определений и свойств нам понадобятся следующие обозначения:
    S
    +
    – множество всевозможных конечных последовательностей индексов из N;
    S – объединение S
    +
    с пустой последовательностью;
    |
    s| – количество индексов в последовательности s (для пустой последовательности принимается равным нулю), которое выше было названо длиной последовательности индексов.

    149
    Если
    q
    i
    – представления i-го агента о неопределенном парамет- ре, а
    q
    ii
    – представления i-го агента о собственном представлении, то естественно считать, что
    q
    ii
    =
    q
    i
    . Иными словами, i-й агент правиль- но информирован о собственных представлениях, а также считает, что таковы и другие агенты и т.д. Формально это означает, что выполнена аксиома автоинформированности, которую далее будем предполагать выполненной:
    " i Î N "
    t, s Î S q
    tiis
    =
    q
    tis
    Эта аксиома означает, в частности, что, зная
    q
    t
    для всех
    t Î S
    +
    таких, что |
    t| = g, можно однозначно найти q
    t
    для всех
    t Î S
    +
    таких, что |
    t| < g.
    Наряду со структурами информированности I
    i
    , i
    Î N, можно рассматривать структуры информированности I
    ij
    (структура инфор- мированности j-го агента в представлении i-го агента), I
    ijk
    и т.д.
    Отождествляя структуру информированности с характеризуемым ею агентом, можно сказать, что, наряду с n реальными агентами (i-
    агентами, где i
    Î N) со структурами информированности I
    i
    , в игре участвуют фантомные агенты(
    t-агенты, где t Î S
    +
    , |
    t| ³ 2) со структурами информированности I
    t
    = {
    q
    ts
    },
    s Î S. Фантомные агенты, существуя в сознании реальных агентов, влияют на их дей- ствия, о чем пойдет речь далее.
    Определим фундаментальное для дальнейших рассмотрений понятие тождественности структур информированности.
    Структуры информированности I
    l
    и I
    m
    (
    l, m Î S
    +
    ) называются
    тождественными, если выполнены два условия:
    1)
    q
    ls
    =
    q
    ms
    для любого
    s Î S;
    2) последние индексы в последовательностях
    l и m совпадают.
    Будем обозначать тождественность структур информированно- сти следующим образом: I
    l
    = I
    m
    Первое из двух условий в определении тождественности струк- тур прозрачно, второе же требует некоторых пояснений. Дело в том, что далее мы будем обсуждать действие
    t-агента в зависимости от его структуры информированности I
    t
    и целевой функции f
    i
    , которая как раз определяется последним индексом последовательности
    t.
    Поэтому удобно считать, что тождественность структур информи- рованности означает в том числе и тождественность целевых функ- ций.
    Назовем
    l-агента t-субъективно адекватно информированным о представлениях
    m-агента (или, короче, о m-агенте), если

    150
    I
    tlm
    = I
    tm
    (
    l, m Î S
    +
    ,
    t Î S).
    Будем обозначать
    t-субъективную адекватную информирован- ность
    l-агента о m-агенте следующим образом: I
    l
    >
    t
    I
    m
    Понятие тождественности структур информированности позво- ляет определить их важное свойство – сложность. Заметим, что наряду со структурой I имеется счетное множество структур I
    t
    ,
    t Î S
    +
    , среди которых можно при помощи отношения тождествен- ности выделить классы попарно нетождественных структур. Коли- чество этих классов естественно считать сложностью структуры
    информированности.
    Будем говорить, что структура информированности I имеет ко-
    нечную сложность
    n = n(I), если существует такой конечный набор попарно нетождественных структур {
    1
    t
    I
    ,
    2
    t
    I
    , …,
    n
    t
    I
    },
    t
    l
    Î S
    +
    ,
    l
    Î {1, …,
    n}, что для любой структуры
    s
    I
    ,
    s Î S
    +
    , найдется тожде- ственная ей структура
    l
    I
    t
    из этого набора. Если такого конечного набора не существует, будем говорить, что структура I имеет беско- нечную сложность:
    n(I) = ¥.
    Структуру информированности, имеющую конечную слож- ность, будем называть конечной (еще раз отметим, что при этом дерево структуры информированности все равно остается бесконеч- ным). В противном случае структуру информированности будем называть бесконечной.
    Ясно, что минимально возможная сложность структуры инфор- мированности в точности равна числу участвующих в игре реальных агентов (напомним, что по определению тождественности структур информированности они попарно различаются у реальных агентов).
    Любой набор (конечный или счетный) попарно нетождествен- ных структур I
    t
    ,
    t Î S
    +
    , такой, что любая структура I
    s
    ,
    s Î S
    +
    , тож- дественна одной из них, называется базисом структуры информиро- ванности I.
    Если структура информированности I имеет конечную слож- ность, то можно определить максимальную длину последовательно- сти индексов
    g такую, что, зная все структуры I
    t
    ,
    t Î S
    +
    , |
    t| =g , можно найти и все остальные структуры. Эта длина в определенном смысле характеризует ранг рефлексии, необходимый для описания структуры информированности.
    Будем говорить, что структура информированности I,
    n(I) < ¥, имеет конечную глубину
    g = g (I), если:

    151 1) для любой структуры I
    s
    ,
    s Î S
    +
    , найдется тождественная ей структура I
    t
    ,
    t Î S
    +
    , |
    t| £g ;
    2) для любого целого положительного числа
    x, x <g , существу- ет структура I
    s
    ,
    s Î S
    +
    , не тождественная никакой из структур I
    t
    ,
    t Î S
    +
    , |
    t| =x .
    Если
    n(I) = ¥, то и глубину будем считать бесконечной: g(I) = ¥.
    Понятия сложности и глубины структуры информированности игры можно рассматривать
    t-субъективно. В частности, глубину структуры информированности игры с точки зрения
    t-агента, t ÎS
    +
    , будем называть рангом рефлексии
    t-агента.
    1   ...   8   9   10   11   12   13   14   15   ...   23


    написать администратору сайта