ВВедение в теорию управления организационными системами. В теорию управления организационными
Скачать 1.89 Mb.
|
ГЛАВА 5. Механизмы информационного управления в организационных системах Управлением, в соответствии с определением, приведенным выше, называется воздействие на управляемую систему с целью обеспечения требуемого ее поведения. Управляемая система с за- данными составом и структурой – множество рациональных аген- тов, принимающих самостоятельные решения о выбираемых дейст- виях – в рамках теоретико-игровой модели описывается множеством агентов N, совокупностью их целевых функций (f i ( ×)) i Î N , допусти- мых множеств (X i ) i Î N и информированностью I. Значит, управление фиксированным множеством агентов может заключаться в воздей- ствии на: целевые функции (мотивационное управление [17]), до- пустимые множества (институциональное управление [15]) и ин- формированность (информационное управление [19, 20]). В настоящей главе более подробно рассматривается именно информа- ционное управление. 5.1. Модель информационного управления С теоретико-игровой точки зрения задача управления состоит в том, чтобы сформировать для управляемых субъектов (агентов) такую игру, чтобы ее исход был наиболее благоприятным для управляющего органа (центра). Соответственно, задачу информаци- онного управления можно неформально (качественно) сформулиро- вать следующим образом: найти такую структуру информированно- сти, чтобы исход рефлексивной игры (см. раздел 5.2) агентов (информационное равновесие) был бы наиболее благоприятен для центра. Перейдем к формальной постановке задачи. Пусть на множест- ве действий реальных агентов и структур информированности зада- на целевая функция центра F(x, I). Пусть, далее, центр может сфор- мировать любую структуру информированности из некоторого множества Á’. При структуре информированности I Î Á’ вектор действий реальных агентов является элементом множества равно- весных векторов [31] Y X (I). Множество Y X (I) может быть пустым, тогда центр, ввиду отсутствия равновесия, не может рассчитывать на тот или иной исход игры. Поэтому введем множество допусти- мых структур, для которых существует хотя бы одно равновесие: Á = {I Î Á’ | Y X (I) ¹ Æ}. 142 Если при заданной структуре I Î Á множество равновесных векторов Y X (I) состоит более чем из одного элемента, то обычно (см., например, [2, 3, 36]) принимается одно из следующих двух предположений: 1) гипотеза благожелательности (ГБ), состоящая в том, что у центра есть возможность обеспечить выбор агентами «нужного» равновесия; 2) принцип максимального гарантированного результата (МГР), состоящий в том, что центр рассчитывает на наихудшее для себя равновесие игры агентов. В соответствии с ГБ и МГР получаем, соответственно, постановку задачи информационного управления в двух вариантах: (5.1) max; ) , ( max ) ( ¾ ¾® ¾ F Á Î Y Î I I x I x X (5.2) max ) , ( min ) ( ¾ ¾® ¾ F Á Î Y Î I I x I x X Разумеется, в случае, когда для любого I Î Á множество Y X (I) состоит ровно из одного элемента, (5.1) и (5.2) совпадают. Задачу (5.1) (либо (5.2)) будем называть задачей информацион- ного управления в форме целевой функции. Опишем теперь задачу информационного управления в не- сколько иной постановке, не зависящей от целевой функции центра. Пусть центр стремится добиться от агентов выбора вектора дейст- вий x Î X'. Зададимся вопросом: для каких векторов x и каким обра- зом (то есть при помощи формирования какой структуры I) центр может это сделать? Иначе говоря, вторая возможная постановка задачи информационного управления состоит в нахождении множе- ства достижимости – множества векторов x Î X', для каждого из которых множество структур Y I (x) Ç Á (5.3) непусто, либо (5.4) состоит ровно из одного элемента, а также соответствующих допустимых структур информированно- сти I ÎY I (x) Ç Á для каждого такого вектора x. Условие (5.3) соот- ветствует ГБ, условие (5.4) – МГР. Задачу (5.3) (либо (5.4)) будем называть задачей информацион- ного управления в форме множества достижимости. Еще раз подчеркнем, что вторая постановка не зависит от целе- вой функции центра и отражает лишь его возможность при помощи 143 информационного управления привести систему в то или иное состояние. Как в первой, так и во второй постановке центр может либо ин- тересоваться, либо не интересоваться стабильностью (см. раздел 5.3) получившегося информационного равновесия. Если требуется осу- ществить стабильное информационное управление, то есть привести систему в стабильное информационное равновесие, то в приведен- ных выше постановках требуется заменить Y на Y s , а термины «равновесие» и «равновесный» – на «стабильное равновесие» и «стабильно-равновесный» соответственно. Моделирование информационного управления. Предлагае- мая модель информационного управления представлена на Рис. 5.1. Модель включает в себя агента (агентов) и управляющий орган – центр. Каждый агент характеризуется циклом «информирован- ность агента ® действие агента ® наблюдаемый агентом результат ® информированность агента», и у разных агентов эти три компо- ненты цикла являются, вообще говоря, различными. В то же время, и это отражает надпись «Агент(ы)» на Рис. 5.1, можно считать этот цикл общим для всей управляемой подсистемы, то есть для всего набора агентов. ДЕЙСТВИЕ НАБЛЮДАЕМЫЙ РЕЗУЛЬТАТ ИНФОРМИ- РОВАННОСТЬ Агент(ы) Управляющий орган (центр) Управляющее воздействие Реальный результат Рис. 5.1. Модель информационного управления 144 Что касается взаимодействия агента (агентов) и центра, то оно характеризуется: 1) информационным воздействием центра, формирующим ту или иную информированность агента (агентов) 21 ; 2) реальным результатом действия агента (агентов), который оказывает влияние на интересы центра. Обсудим модель, изображенную на Рис. 5.1, более подробно. Математическим аппаратом, моделирующим теоретико-игровое взаимодействие агентов, являются рефлексивные игры, в которых агенты выбирают действия на основе своих структур информиро- ванности – иерархии представлений о существенных параметрах ситуации («состоянии природы»), представлений о представлениях оппонентов (других агентов) и т.д. Таким образом, в терминах реф- лексивных игр информированность агента моделируется при помо- щи его структуры информированности (соответственно, информи- рованность всей управляемой подсистемы моделируется при помощи структуры информированности игры, являющейся объеди- нением структур информированности агентов). Исходя из своей структуры информированности, агент выбира- ет то или иное действие. Для заданной структуры информированно- сти действия агентов являются компонентами информационного равновесия, являющегося решением рефлексивной игры. Информа- ционное равновесие является обобщением равновесия Нэша – наи- более распространенной концепции решения некооперативных игр. Информированность агента о ситуации и о представлениях оппонен- тов может быть, вообще говоря, неадекватной. Поэтому наблюдае- мый агентом результат рефлексивной игры может как соответство- вать его ожиданиям, так и не соответствовать им. Соответствие определяется двумя факторами: 1) насколько адекватно информирован агент на момент выбора своего действия; 2) насколько подробную информацию о результатах игры он наблюдает. Например, наблюдаемым результатом может быть значение его целевой функции, действия оппонентов, истинное значение неопре- 21 Отметим, что можно рассматривать и воздействие центра на наблю- даемый агентом (агентами) результат, то есть «центр ® наблюдаемый результат» на Рис. 5.1. Однако это рассмотрение (в некотором смысле сближающее информационное управление с мотивационным) выходит за рамки настоящей работы. 145 деленного параметра и пр. В общем случае агент наблюдает значе- ние некоторой функции, зависящей от состояния природы и дейст- вий оппонентов. Эта функция называется функцией наблюдения, и воздействие ее значения на информированность отображено на рисунке фрагментом «наблюдаемое действие ® информирован- ность». Если все агенты наблюдают именно тот результат, на какой рассчитывают (то есть реальное значение функции наблюдения каждого агента равно ожидаемому), то естественным является пред- положение о том, что структура информированности не меняется. В этом случае информационное равновесие является стабильным (см. ниже). Рассмотрим теперь взаимодействие агентов с центром. Осуще- ствляя информационное управление, центр стремится к максимиза- ции своей полезности (разумеется, это относится и к другим типам управления). Если считать, что центр может сформировать любую структуру информированности из некоторого допустимого множе- ства, то задачу информационного управления можно сформулиро- вать следующим образом: найти такую структуру информированно- сти из допустимого множества структур, чтобы полезность центра в информационном равновесии была максимальной (быть может, с учетом затрат центра на формирование структуры). Подчеркнем следующее важное обстоятельство: в рамках пред- лагаемой модели мы исходим из предположения о том, что центр может сформировать у агентов любую структуру информированно- сти. За рамками наших рассмотрений остается вопрос о том, каким образом центру следует «убедить» агентов в том, что имеют место те или иные состояния природы и представления оппонентов. Можно, однако, в рамках рассматриваемой модели классифи- цировать способы управляющего воздействия на информирован- ность агентов для формирования той или иной структуры. Такими способами являются: 1) информационное регулирование – целенаправленное влияние на информацию о состоянии природы; 2) рефлексивное управление – целенаправленное влияние на ин- формацию о представлениях оппонентов; 3) активный прогноз – целенаправленное сообщение информа- ции о будущих значениях параметров, зависящих от состояния природы и действий агентов. Классификация задач информационного управления. В дан- ной главе рассматриваются двухуровневые ОС с одним центром и 146 многими агентами в условиях неполной информированности аген- тов – каждый из субъектов может иметь свои представления о при- роде. Задачу информационного управления будем рассматривать 1) в форме целевой функции либо множества достижимости; 2) с использованием гипотезы благожелательности (ГБ) либо принципа максимально гарантированного результата (МГР); 3) с требованием стабильности или без требования стабильно- сти. Выбор одного из этих восьми вариантов определяется конкрет- ной моделируемой ситуацией. Однако в любом случае необходимым (и, как показывает опыт, наиболее сложным и трудоемким для исследователя) этапом является установление связи между структу- рой информированности и вектором действий агентов, то есть ис- следование информационного равновесия. 5.2. Рефлексивные игры Рассмотрим множество N = {1,2, …, n} агентов. Если в ситуа- ции присутствует неопределенный параметр q Î W (будем считать, что множество W является общим знанием), то структура информи- рованности I i (как синоним будем употреблять термины информа- ционная структура и иерархия представлений) i-го агента включает в себя следующие элементы. Во-первых, представление i-го агента о параметре q – обозначим его q i , q i Î W. Во-вторых, представления i- го агента о представлениях других агентов о параметре q – обозна- чим их q ij , q ij Î W, j Î N. В-третьих, представления i-го агента о представлении j-го агента о представлении k-го агента – обозначим их q ijk , q ijk Î W, j, k Î N. И так далее. Таким образом, структура информированности I i i-го агента за- дается набором всевозможных значений вида l j ij ... 1 q , где l пробегает множество целых неотрицательных чисел, j 1 , …, j l Î N, а l i i ... 1 q Î W. Аналогично задается структура информированности I игры в целом – набором значений l i i ... 1 q , где l пробегает множество целых неотрицательных чисел, j 1 , …, j l Î N, а l j ij ... 1 q Î W. Подчеркнем, что структура информированности I «недоступна» наблюдению агентов, каждому из которых известна лишь некоторая ее часть (а именно – I i ). 147 Таким образом, структура информированности – бесконечное n- дерево (то есть тип структуры постоянен и является n-деревом), вершинам которого соответствует конкретная информированность реальных и фантомных агентов. Рефлексивной игрой Г I называется игра, описываемая следую- щим кортежем: (5.5) Г I = {N,(X i ) i Î N , f i ( ×) i Î N , W, I}, где N – множество реальных агентов, X i – множество допустимых действий i-го агента, f i ( ×):W ´ X’ ®Â 1 – его целевая функция, i Î N, W – множество возможных значений неопределенного параметра, I – структура информированности. Таким образом, рефлексивная игра [20] является обобщением понятия игры в нормальной форме, задаваемой кортежем {N,(X i ) i Î N , f i ( ×) i Î N }, на случай, когда информированность агентов отражена иерархией их представлений (информационной структу- рой I). В рамках принятого определения «классическая» игра в нормальной форме является частным случаем рефлексивной игры – игры с общим знанием. В «предельном» случае – когда состояние природы является общим знанием – предлагаемая в настоящей работе концепция решения рефлексивной игры (информационное равновесие – см. ниже) переходит в равновесие Нэша. Совокупность связей между элементами информированности агентов можно изобразить в виде дерева (см. Рис. 5.2). При этом структура информированности i-го агента изображается поддеревом, исходящим из вершины q i q 1 q i q n q i1 q ij q in … … … … Рис. 5.2. Дерево информационной структуры 148 Сделаем важное замечание: в настоящей работе мы ограничим- ся рассмотрением «точечной» структуры информированности, компоненты которой состоят лишь из элементов множества W. (Более общим случаем является, например, интервальная или веро- ятностная информированность.) Стратегическая и информационная рефлексия. Итак, реф- лексивной является игра, в которой информированность игроков не является общим знанием. С точки зрения теории игр и рефлексив- ных моделей принятия решений целесообразно разделять стратеги- ческую и информационную рефлексию [30]. Информационная рефлексия – процесс и результат размышле- ний игрока о том, каковы значения неопределенных параметров, что об этих значениях знают и думают его оппоненты (другие игроки). При этом собственно «игровая» компонента отсутствует, так как никаких решений игрок не принимает. Иными словами, информационная рефлексия относится к ин- формированности агента о природной реальности (какова игра), и о рефлексивной реальности (какой видят игру другие). Информационная рефлексия логически предшествует рефлексии несколько иного рода – стратегической рефлексии. Стратегическая рефлексия – процесс и результат размышлений игрока о том, какие принципы принятия решений используют его оппоненты (другие игроки) в рамках той информированности, кото- рую он им приписывает в результате информационной рефлексии. Таким образом, информационная рефлексия имеет место только в условиях неполной информированности, и ее результат использует- ся при принятии решений (в том числе – при стратегической реф- лексии). Стратегическая рефлексия имеет место даже в случае пол- ной информированности, предваряя принятие игроком решения о выборе действия (стратегии). Другими словами, информационная и стратегическая рефлексии могут изучаться независимо, однако в условиях неполной информированности обе они имеют место. Далее для формулировки некоторых определений и свойств нам понадобятся следующие обозначения: S + – множество всевозможных конечных последовательностей индексов из N; S – объединение S + с пустой последовательностью; | s| – количество индексов в последовательности s (для пустой последовательности принимается равным нулю), которое выше было названо длиной последовательности индексов. 149 Если q i – представления i-го агента о неопределенном парамет- ре, а q ii – представления i-го агента о собственном представлении, то естественно считать, что q ii = q i . Иными словами, i-й агент правиль- но информирован о собственных представлениях, а также считает, что таковы и другие агенты и т.д. Формально это означает, что выполнена аксиома автоинформированности, которую далее будем предполагать выполненной: " i Î N " t, s Î S q tiis = q tis Эта аксиома означает, в частности, что, зная q t для всех t Î S + таких, что | t| = g, можно однозначно найти q t для всех t Î S + таких, что | t| < g. Наряду со структурами информированности I i , i Î N, можно рассматривать структуры информированности I ij (структура инфор- мированности j-го агента в представлении i-го агента), I ijk и т.д. Отождествляя структуру информированности с характеризуемым ею агентом, можно сказать, что, наряду с n реальными агентами (i- агентами, где i Î N) со структурами информированности I i , в игре участвуют фантомные агенты( t-агенты, где t Î S + , | t| ³ 2) со структурами информированности I t = { q ts }, s Î S. Фантомные агенты, существуя в сознании реальных агентов, влияют на их дей- ствия, о чем пойдет речь далее. Определим фундаментальное для дальнейших рассмотрений понятие тождественности структур информированности. Структуры информированности I l и I m ( l, m Î S + ) называются тождественными, если выполнены два условия: 1) q ls = q ms для любого s Î S; 2) последние индексы в последовательностях l и m совпадают. Будем обозначать тождественность структур информированно- сти следующим образом: I l = I m Первое из двух условий в определении тождественности струк- тур прозрачно, второе же требует некоторых пояснений. Дело в том, что далее мы будем обсуждать действие t-агента в зависимости от его структуры информированности I t и целевой функции f i , которая как раз определяется последним индексом последовательности t. Поэтому удобно считать, что тождественность структур информи- рованности означает в том числе и тождественность целевых функ- ций. Назовем l-агента t-субъективно адекватно информированным о представлениях m-агента (или, короче, о m-агенте), если 150 I tlm = I tm ( l, m Î S + , t Î S). Будем обозначать t-субъективную адекватную информирован- ность l-агента о m-агенте следующим образом: I l > t I m Понятие тождественности структур информированности позво- ляет определить их важное свойство – сложность. Заметим, что наряду со структурой I имеется счетное множество структур I t , t Î S + , среди которых можно при помощи отношения тождествен- ности выделить классы попарно нетождественных структур. Коли- чество этих классов естественно считать сложностью структуры информированности. Будем говорить, что структура информированности I имеет ко- нечную сложность n = n(I), если существует такой конечный набор попарно нетождественных структур { 1 t I , 2 t I , …, n t I }, t l Î S + , l Î {1, …, n}, что для любой структуры s I , s Î S + , найдется тожде- ственная ей структура l I t из этого набора. Если такого конечного набора не существует, будем говорить, что структура I имеет беско- нечную сложность: n(I) = ¥. Структуру информированности, имеющую конечную слож- ность, будем называть конечной (еще раз отметим, что при этом дерево структуры информированности все равно остается бесконеч- ным). В противном случае структуру информированности будем называть бесконечной. Ясно, что минимально возможная сложность структуры инфор- мированности в точности равна числу участвующих в игре реальных агентов (напомним, что по определению тождественности структур информированности они попарно различаются у реальных агентов). Любой набор (конечный или счетный) попарно нетождествен- ных структур I t , t Î S + , такой, что любая структура I s , s Î S + , тож- дественна одной из них, называется базисом структуры информиро- ванности I. Если структура информированности I имеет конечную слож- ность, то можно определить максимальную длину последовательно- сти индексов g такую, что, зная все структуры I t , t Î S + , | t| =g , можно найти и все остальные структуры. Эта длина в определенном смысле характеризует ранг рефлексии, необходимый для описания структуры информированности. Будем говорить, что структура информированности I, n(I) < ¥, имеет конечную глубину g = g (I), если: 151 1) для любой структуры I s , s Î S + , найдется тождественная ей структура I t , t Î S + , | t| £g ; 2) для любого целого положительного числа x, x <g , существу- ет структура I s , s Î S + , не тождественная никакой из структур I t , t Î S + , | t| =x . Если n(I) = ¥, то и глубину будем считать бесконечной: g(I) = ¥. Понятия сложности и глубины структуры информированности игры можно рассматривать t-субъективно. В частности, глубину структуры информированности игры с точки зрения t-агента, t ÎS + , будем называть рангом рефлексии t-агента. |