Главная страница
Навигация по странице:

  • 1.4. Классификация задач управления организационными системами

  • Функции управления Механизмы управления

  • Задачи и упражнения к главе 1 171.1 («Фермеры на общем поле»).

  • ВВедение в теорию управления организационными системами. В теорию управления организационными


    Скачать 1.89 Mb.
    НазваниеВ теорию управления организационными
    АнкорВВедение в теорию управления организационными системами
    Дата21.05.2020
    Размер1.89 Mb.
    Формат файлаpdf
    Имя файлаВВедение в теорию управления организационными системами.pdf
    ТипУчебник
    #124282
    страница4 из 23
    1   2   3   4   5   6   7   8   9   ...   23
    1.3. Элементы теории игр
    Теория игр описывает игру – такое взаимодействие субъектов, что выигрыш каждого из них в общем случае зависит от действий всех.
    Формализуем эту ситуацию. Пусть задано множество игроков
    }
    ...,
    ,
    2
    ,
    1
    {
    n
    N
    =
    . i-ый игрок выбирает действие y
    i
    из множества своих допустимых действий
    ,
    i
    i
    A
    y
    Î
    N
    i
    Î
    . Действия всех игроков называются ситуацией игры:
    )
    ,...,
    (
    1
    n
    y
    y
    y
    =
    . Целевая функция i-го игрока зависит от вектора действий всех игроков y и является ото- бражением
    1
    :
    )
    (
    Â
    ®
    ¢
    A
    y
    f
    i
    множества, являющегося декартовым произведением множества допустимых действий всех игроков
    Õ
    Î
    =
    ¢
    N
    i
    i
    A
    A
    , в числовую ось. То есть каждой ситуации – комбинации действий игроков – соответствует некоторый выигрыш каждого из них. Совокупность
    }
    }
    {
    ,
    )}
    (
    {
    ,
    {
    0
    N
    i
    i
    N
    i
    i
    A
    f
    N
    Г
    Î
    Î
    ×
    =
    множества игроков
    (агентов), целевых функций и допустимых множеств действий агентов называется игрой в нормальной форме при условии, что каждый из игроков выбирает свои действия однократно, одновре- менно с другими игроками и независимо (не имея возможности

    35 договариваться с ними о своих стратегиях поведения) – модель некооперативного поведения.
    Рассмотрим целевую функцию i-го игрока и попробуем приме- нить к ней гипотезу рационального поведения. Игрок рационален, i- ый игрок выбирает i-ую компоненту вектора y, и своим выбором пытается максимизировать свою целевую функцию: max
    )
    (
    ®
    y
    f
    i
    Но то его действие, на котором достигается максимум его целевой функции, будет зависеть от выбора других агентов. Задача такого вида в некотором смысле бессмысленна, так как ее решением будет действие
    )
    (
    *
    i
    i
    y
    y
    -
    , зависящее от действий всех других игроков – его
    оппонентов – вектора
    )
    ,...,
    ,
    ,...,
    (
    1 1
    1
    n
    i
    i
    i
    y
    y
    y
    y
    y
    +
    -
    -
    =
    , который называ- ется обстановкой игры для i-го игрока (агента).
    Для того чтобы выбрать свое действие, агенту нужно знать, как будут себя вести остальные. Значит, нужно делать предположения о поведении остальных игроков. По аналогии с тем, как устранялась неопределенность в случае, когда решения принимал один субъект, здесь имеется множество игроков с так называемой игровой неопре-
    деленностью, то есть неопределенностью, порождаемой целена- правленным поведением других игроков. Каждый игрок не всегда может априори точно сказать, что сделают остальные. Рассмотрим возможные варианты.
    1) Пусть i-ый игрок считает, что все остальные игроки играют против него. Это – критерий пессимизма, который соответствует тому, что есть
    i-ый игрок выбирает действие
    )
    ,
    (
    min max
    Arg
    i
    i
    i
    A
    y
    A
    y
    г
    i
    y
    y
    f
    y
    i
    i
    i
    i
    -
    Î
    Î
    -
    -
    Î
    , где
    Õ
    ¹
    -
    =
    i
    j
    j
    i
    A
    A
    . Он считает, что остальные игроки, несмотря на свои собственные интересы, будут действовать против него, а уж выбором своего действия он будет максимизировать то, что зависит от него самого. Плох такой прин- цип принятия решений тем, что игрок забывает про то, что у осталь- ных есть свои интересы, и, наверное, цель каждого игрока – макси- мизировать свою целевую функцию, а не «напакостить» оппоненту
    (это может быть частным случаем целевой функции, но, к счастью, не всегда в жизни так бывает).
    Определенный выше вектор действий игроков называется мак-
    симинным, или гарантирующим равновесием. Это один из вариантов определения исхода игры. То есть, можно предполагать, что воз-

    36 можный вариант поведения игроков – выбор всеми гарантирующих стратегий, что реализует максиминное равновесие.
    Но этот вариант не единственен. И основная проблема теории игр на сегодняшний день заключается в том, что не существует единой универсальной концепции решения игры – ее устойчивого в том или ином смысле исхода. В разных моделях используются разные предположения, которые приводят к различным концепциям равновесия. Поэтому рассмотрим некоторые другие варианты.
    2) Представим себе такую ситуацию, что целевая функция i-го игрока
    )
    ( y
    f
    i
    достигает максимума по его действию в точке, которая не зависит от действий других игроков. Это оптимальное действие, не зависящее от обстановки, называется доминантной стратегией агента. Формально: стратегия
    d
    i
    y
    будет доминантной стратегией, если какая бы обстановка не складывалась, его выигрыш будет максимальным при выборе именно доминантной стратегии:
    i
    i
    A
    y
    Î
    "
    i
    i
    A
    y
    -
    -
    Î
    "
    )
    ,
    (
    )
    ,
    (
    i
    i
    i
    i
    d
    i
    i
    y
    y
    f
    y
    y
    f
    -
    -
    ³
    Отметим, что в обеих частях неравенства фигурирует произвольная, но одна и та же обстановка.
    Если у каждого игрока существует доминантная стратегия, то совокупность доминантных стратегий называется равновесием в
    доминантных стратегиях (РДС)
    N
    i
    d
    i
    y
    Î
    }
    {
    . Это – идеальная ситуация для исследователя, описывающего математическую модель. Если существует равновесие в доминантных стратегиях, то каждый из игроков принимает решение независимо. А описывать независимое принятие решений гораздо проще. Но такая ситуация встречается очень редко.
    3) Гораздо чаще существует равновесие Нэша (РН). Джон Нэш, американский математик, в начале 50-х годов XX века предложил следующее: устойчивым исходом взаимодействия агентов можно считать такой вектор их действий, от которого в одиночку никому не выгодно отклоняться. Это значит, что ни один из агентов, в оди- ночку меняя свою стратегию на другую, не может увеличить свой выигрыш при условии, что остальные своих стратегий не меняют.
    Формальное определение равновесия Нэша
    A
    y
    N
    ¢
    Î
    таково:
    N
    i
    Î
    "
    i
    i
    A
    y
    Î
    "
    )
    ,
    (
    )
    ,
    (
    N
    i
    i
    i
    N
    i
    N
    i
    i
    y
    y
    f
    y
    y
    f
    -
    -
    ³
    , то есть для любого агента и для любого допустимого его действия выбор им равновесного по
    Нэшу действия дает ему выигрыш не меньший, чем при выборе

    37 любого другого действия при условии, что остальные игроки выби- рают равновесные по Нэшу стратегии.
    Пример 1.3. Рассмотрим двух агентов, представляющих подраз- деления некоторого предприятия. Каждый из агентов принимает решение о выборе неотрицательного объема производства. Продук- ция каждого из агентов продается на рынке по единичной цене.
    Затраты агента зависят от эффективности его производства (коэф- фициента r функции его затрат) и объема производства другого агента, причем чем выше объем производства оппонента, тем ниже затраты данного агента. Целевая функция i-го агента f
    i
    (y) представ- ляет собой разность между его доходом y
    i
    и затратами
    с
    i
    (y, r
    i
    ) =
    )
    (
    2
    )
    (
    3 2
    i
    i
    i
    y
    r
    y
    - a
    +
    , i = 1, 2, где a Î [0; 1) – известная константа, отражающая степень взаимовлияния агентов.
    Дифференцируя вогнутые по соответствующим переменным y
    i
    целевые функции f
    i
    (y) = y
    )
    (
    2
    )
    (
    3 2
    i
    i
    i
    y
    r
    y
    - a
    +
    , i = 1, 2, приравнивая производные нулю и решая соответствующую систему уравнений относительно действий агентов, получаем равновесие Нэша игры агентов:
    *
    1
    y
    =
    2 2
    1 1
    a
    - a
    + r
    r
    ,
    *
    2
    y
    =
    2 1
    2 1
    a
    - a
    + r
    r
    Видно, что с ростом степени взаимовлияния агентов их равно- весные действия увеличиваются.
    ·
    Отличие между изложенными подходами заключается в том, что в определении равновесия в доминантных стратегиях фигуриру- ет произвольная обстановка, то есть доминантная стратегия – наи- лучшая независимо от обстановки. А стратегия Нэша – наилучшая при «нэшевской» обстановке.
    Равновесие Нэша хорошо тем, что в большинстве моделей оно существует. Недостатком его является то, что оно не всегда единст- венно. Представьте, если есть два равновесия, то как предсказать, в каком из них окажутся агенты? Нужны дополнительные предполо- жения.
    Кроме того, равновесие Нэша не устойчиво к отклонению двух и более игроков. По определению одному агенту не выгодно откло- няться, но это не значит, что если два агента договорились и одно- временно отклонились, то они не смогут оба выиграть. То есть

    38 равновесие Нэша – существенно некооперативная концепция равно- весия.
    4) Помимо вышесказанного, необходимо ввести понятие точки
    Парето. Вектор действий агентов
    A
    y
    P
    ¢
    Î
    , принадлежащий множе- ству A' допустимых векторов действий, будет эффективным по
    Парето, если для любого другого вектора действий найдется агент такой, что значение его целевой функции будет строго меньше, чем в точке Парето
    P
    y
    y
    ¹
    "
    N
    i
    Î
    $
    )
    (
    )
    (
    P
    i
    i
    y
    f
    y
    f
    <
    То есть точка Парето – такая точка, отклоняясь от которой, нельзя одновременно увеличить значения целевых функций всех игроков. Идея хороша тем, что позволяет утверждать, что если мы можем сделать лучше всем, то это надо делать. Любая разумная модель должна удовлетворять эффективности по Парето. Вопрос заключается в том, как соотносятся все вышеперечисленные страте- гии с эффективностью по Парето, так как хочется, чтобы результат, соответствующий индивидуальным максимумам, был бы еще эф- фективным для общества в целом. Оказывается, что эффективность по Парето, к сожалению, никак не соотносится ни с одной из трех концепций решения игры, изложенных выше.
    Пример 1.4. Рассмотрим хрестоматийный пример со следую- щими целевыми функциями. Пусть каждый игрок выбирает дейст- вия из отрезка
    ]
    1
    ;
    0
    [
    =
    i
    A
    Выигрыш
    i-го агента

    å
    ¹
    -
    +
    =
    i
    j
    j
    i
    i
    y
    y
    y
    f
    )
    1
    (
    )
    (
    . Исследуем, существует ли в рассматривае- мом примере равновесие в доминантных стратегиях или равновесие
    Нэша.
    Из анализа целевой функции видно, что i-му агенту выгодно, максимизируя свою целевую функцию, выбирать максимальное значение своего действия, независимо от того, какие действия выби- рают остальные агенты (производная целевой функции i-го агента по его действию строго положительна независимо от обстановки).
    Значит, каждый агент будет выбирать максимальное значение сво- его действия, то есть для него существует доминантная стратегия.
    Что бы не сделали остальные, он, увеличивая свое действие, выиг- рывает, а больше единицы он (в силу ограниченности множества его допустимых действий) выбрать не может, значит,
    1
    =
    d
    i
    y

    39
    Посчитаем выигрыш каждого агента от равновесия в доминант- ных стратегиях. Если все выбрали по единице, то каждый получил выигрыш, равный единице:
    1
    )
    (
    =
    d
    i
    y
    f
    Рассчитаем вектор действий, эффективный по Парето. Это – вектор нулевых действий:
    0
    =
    P
    i
    y
    . Если все агенты выбирают нуле- вые действия, выигрыш i-го агента равен
    1
    )
    (
    -
    = n
    y
    f
    P
    i
    . Невозмож- но увеличить выигрыш одновременно всех агентов. Если мы хотим увеличить выигрыш i-го агента и начинаем увеличивать его дейст- вие, то тем самым уменьшаем выигрыши остальных, потому что это действие входит со знаком минус в целевые функции других аген- тов.
    Если в рассматриваемой игре участвуют три или более агентов, то, выбирая действия, эффективные по Парето, они получают строго больше, чем выбирая доминантные стратегии, так как n – 1 > 1 при
    n
    ³ 3.
    Спрашивается, будет ли точка Парето точкой равновесия Нэша
    (ведь любое РДС является равновесием Нэша), то есть рациональ- ным исходом с точки зрения индивидуального поведения. Если кто- то из игроков выберет ненулевую стратегию, он выиграет. Поэтому он увеличит свое действие до единицы, остальные поступят анало- гично, и все скатится к ситуации равновесия в доминантных страте- гиях, которая никому не выгодна, но устойчива.
    ·
    Рассмотренный пример иллюстрирует, что устойчивость отно- сительно индивидуальных отклонений никак не связана с эффектив- ностью по Парето. Решить эту проблему можно следующим обра- зом: если разыгрывается повторяющаяся игра, и игроки договариваются наказывать того, кто отклоняется от коллективного оптимума, то есть от равновесия по Парето, то оказывается, если наказание достаточно сильно, то каждый будет выбирать индивиду- ально устойчиво ту стратегию, которая выгодна для всех.
    Существует другой вариант, как можно достичь того же. Если агенты равноправны, то можно принять решение назначить им начальника, который будет ответственен за то, чтобы они не откло- нялись, не пытались локально увеличить свой выигрыш, а выбирали равновесие, эффективное по Парето. То есть функция начальника – предотвратить отклонения агентов от оптимума по Парето. В случае трансферабельной полезности можно даже рассчитать, сколько агенты могут выделить на содержание такого начальника (как раз-

    40 ность между тем суммарным выигрышем, который они имели в точке Парето, и тем, что они в сумме имеют при равновесии в доми- нантных стратегиях). Подобные рассуждения являются одним из теоретико-игровых обоснований возникновения иерархий (см. [16]).
    Иерархические игры. С точки зрения управления наибольший интерес представляют модели игр, в которых агенты принимают решения не одновременно, а последовательно, то есть, если имеются управляющий орган и управляемые субъекты, то сначала начальник определяет правила игры, а дальше субъекты принимают решения, исходя из этих правил. Такие игры называются иерархическими. По определению, иерархическая игра – игра с фиксированной последо- вательностью ходов.
    Простейшая модель иерархической игры – игра двух лиц, в ко- торой первый (делающий первый ход) игрок – центр (управляющий орган), второй игрок – агент (см. Рис. 1.11).
    Ц
    А
    Рис. 1.11. Базовая структура «центр-агент»
    Пусть целевая функция центра
    )
    ,
    ( y
    u
    Ф
    зависит от выбираемого им действия
    U
    u
    Î
    и действия y
    Î A агента, и целевая функция агента
    )
    ,
    ( y
    u
    f
    зависит от тех же самых переменных. С одной сто- роны, если не введено условие последовательности выбора страте- гий, то получается игра двух лиц в нормальной форме, тогда воз- можно достижение равновесия Нэша и т.п.
    Предположим, что ситуация такова: центр выбрал своё действие и сообщил его агенту. Соответствующая игра называется игрой
    1
    Г
    и ее исследование состоит в следующем – описать, каким образом будет вести себя агент, зная выбор центра.
    Найдем множество тех действий, на которых достигается мак- симум целевой функции агента при фиксированном выборе центра:
    )
    ,
    (
    max
    Arg
    )
    (
    y
    u
    f
    и
    Р
    A
    y
    Î
    =
    . Понятно, что это множество зависит от

    41 того выбора u
    Î U, который сделал центр. Другими словами, дейст- вие центра может интерпретироваться как «управление», так как от него зависит «состояние» агента. Если центр и агент знают целевые функции и допустимые множества друг друга, то центр может пред- сказать, как отреагирует агент: «если агент рационален, то в ответ на мое действие, он выберет одно из действий из множества действий, доставляющих максимум его целевой функции». Как же следует вести себя центру, чтобы побудить агента выбрать действие, нужное центру? Зная свой выигрыш
    )
    ,
    ( y
    u
    Ф
    , который зависит от своего действия и действия агента, центр должен определить, какое дейст- вие выберет агент из известного множества P(u).
    Это множество может состоять из одной точки или из несколь- ких. Во втором случае следует ввести определенное предположение, как поведет себя агент. Типичных предположений два: критерии оптимизма и пессимизма (см. выше). Критерий оптимизма: агенту в принципе все равно (с точки зрения значений его целевой функции), какое действие из множества P(u) выбирать. Центр может рассуж- дать так: если агенту все равно, какое действие выбирать, будем считать, что он выберет действие, которое выгодно мне. Это пред- положение соответствует принципу оптимизма в теории принятия решений (см. выше). Называется оно гипотезой благожелательно-
    сти. То есть агент настроен благожелательно к центру и выбирает из множества действий, которые максимизируют его целевую функ- цию, то действие, которое наиболее выгодно для центра.
    Если вычислить максимум функции
    )
    ,
    ( y
    u
    Ф
    по действию аген- та, то останется зависимость только от действий центра. Центр, как рациональный игрок, будет выбирать такое свое действие, которое максимизирует его целевую функцию. Значит, оптимальным
    «управлением» (решением иерархической игры) будет действие центра, которое доставляет максимум по множеству допустимых управлений от его выигрыша
    )
    ,
    ( y
    u
    Ф
    , в который подставлен мак- симум по множеству реакций агента:
    )
    ,
    (
    max max
    Arg
    )
    (
    y
    u
    Ф
    u
    u
    P
    y
    U
    u
    o
    Î
    Î
    Î
    Пессимистический подход (принцип максимального гарантиро- ванного результата) – центр рассуждает так: агенту все равно, какое действие выбрать из множества P(u), поэтому я буду ориентировать- ся на наихудший случай. Тогда решение следующее:

    42
    )
    ,
    (
    min max
    Arg
    )
    (
    y
    u
    Ф
    u
    u
    P
    y
    U
    u
    g
    Î
    Î
    Î
    Т.е., центр вычисляет минимум своей целевой функции по дей- ствию агента из множества P(u), а дальше максимизирует выбором своего действия.
    Таким образом, мы получаем два различных решения игры.
    Первое определение решения игры называется решением Штакель-
    берга (немецкий экономист, в 30-х годах XX века разработавший рассматриваемую модель игры). Второе решение называется реше- нием игры Г
    1
    Рассмотрим теперь игру, когда центр сообщает агенту не кон- кретное значение управления, а то, каким будет управление в зави- симости от действия агента.
    Эта ситуация моделируется игрой
    2
    Г
    , которая имеет следую- щий вид: выбор центра является функцией от действия агента
    )
    (
    ˆ y
    u
    u
    =
    . Дальнейшая логика рассуждений аналогична предыду- щей: центр может предсказать, что в зависимости от той функции, которую он назначит, агент выберет действие, которое будет макси- мизировать его целевую функцию, в которую подставлен выбор центра:
    )
    ),
    (
    ˆ
    (
    max
    Arg
    ))
    (
    ˆ
    (
    y
    y
    u
    f
    u
    P
    A
    y
    Î
    =
    ×
    Зная это, центр может решать задачу, например, такую:
    )
    (
    ˆ
    ))
    (
    ˆ
    (
    max
    )
    ),
    (
    ˆ
    (
    min
    ×
    ×
    Î
    ®
    ×
    u
    u
    P
    y
    y
    u
    Ф
    Данное выражение является стандартной записью простейшей
    теоретико-игровой задачи управления в организационной системе.
    С содержательной точки зрения задача очень простая: есть два агента, известны их целевые функции, допустимые множества, нет никакой неопределенности.
    С точки зрения математики: есть функционал, следует взять минимум этого функционала по переменной, которая принадлежит множеству, зависящему от искомой функции. Потом то, что получе- но, нужно максимизировать выбором этой функции.
    Решение игры Г
    2
    было найдено советским ученым
    Ю.Б. Гермейером [9], который доказал, что в случае, когда возмож- ны побочные платежи (аддитивно входящие в целевые функции игроков), оптимальная стратегия центра состоит из двух режимов:
    режима поощрения (агент поощряется за выбор требуемых центру действий) и режима наказания (агент наказывается центром при выборе действий, невыгодных для последнего). Этот результат

    43 широко используется при решении задач стимулирования в органи- зационных системах (см. главу 3).
    Кроме того, можно построить игру
    3
    Г
    , в которой центр будет сообщать агенту зависимость управления от того, как в зависимости от управления будет вести себя агент. То есть стратегия агента становится функцией, а стратегия центра является функцией от этой функции (для сравнения: в игре
    1
    Г
    имеем два скаляра, в игре
    2
    Г
    – функцию и скаляр и т.д.).
    Возможно построить игру
    4
    Г
    , где стратегия центра будет функцией от функции от функции от функции. То есть с точки зрения математики усложнять структуру выбираемых участниками действий можно до бесконечности, и можно строить игры любого сколь угодно большого порядка, только проинтерпретировать их будет сложно.
    У игры
    3
    Г
    простая интерпретация: начальник говорит подчи- ненному: «Я тебе выделяю ресурс, ты сообщи мне, как ты его бу- дешь использовать в зависимости от того, сколько ресурса полу- чишь. А в зависимости от этого, я буду его выделять».
    У
    4
    Г
    интерпретация уже сложнее. Возникает вопрос: а дает ли что-нибудь начальнику вложенность игр (рост «уровня рефлексии»).
    Например, выгоднее ли ему
    106
    Г
    , чем
    1015
    Г
    ?
    Н.С. Кукушкин доказал теорему [9], которая утверждает, что все четные игры вида
    к
    Г
    2
    , где k = 1, 2, …, эквивалентны (с точки зрения выигрыша центра) игре
    2
    Г
    . Все нечетные игры
    1 2
    +
    к
    Г
    экви- валентны игре
    3
    Г
    . То есть всю бесконечную совокупность иерархи- ческих игр порядка больше трех свели к двум играм – Г
    2
    и Г
    3
    . Кроме этого, было доказано, что с точки зрения центра эффективность этих игр упорядочена следующим образом:
    2 3
    1
    Г
    Г
    Г
    £
    £
    [9]
    Вывод из теоремы Кукушкина следующий: если центр может, то ему надо разыгрывать игру
    2
    Г
    , она для него наиболее выгодная и наиболее простая. Если не может, то игру
    3
    Г
    , если не может разы- грать и ее, то – Г
    1
    . Играть же игры порядка 4 и выше не имеет смыс- ла никогда!
    Игры и структуры. Логичным продолжением перехода от игр в нормальной форме к иерархическим играм может быть следующее

    44 рассуждение: можно усложнять структуру дальше, но на самом деле существует единая технология описания теоретико-игровых задач управления в различных структурах.
    Рассмотрим основную идею, которая позволяет видеть картину целиком и следить за логикой перехода от более простых к более сложным задачам, чтобы более сложная задача могла быть декомпо- зирована на более простые, и не казалась чем-то необычным.
    Рассмотрим следующую картинку – см. Рис. 1.12. Одного субъ- екта (Рис. 1.12а) мы описывали с точки зрения гипотезы рациональ- ного поведения (ГРП), то есть агент стремится максимизировать свою функцию полезности, выбирая действие, которое доставляет максимум этой функции. Далее мы усложнили ситуацию и рассмот- рели несколько субъектов на одном уровне (Рис. 1.12б). Описали это взаимодействие игрой Г
    0
    в нормальной форме. Затем была рассмот- рена ситуация с двумя агентами, но взаимодействующими по верти- кали (Рис. 1.12в). Описывается их взаимодействие игрой Г
    i
    , где
    i = 1, 2, 3.

    ГРП
    0
    Г
    i
    Г
    ,
    3
    ,
    2
    ,
    1
    =
    i
    )
    (
    0
    Г
    Г
    i
    а) б) в) г)
    ))
    (
    (
    0 0
    Г
    Г
    Г
    i
    )...))
    (
    (...
    (
    0 0
    Г
    Г
    Г
    Г
    i
    i
    д) е)
    Рис. 1.12. Игры и структуры
    Представим себе, что имеется структура «один начальник – не- сколько подчиненных» (Рис. 1.12г). Как ее можно описать? Взаимо- действие агентов, находящихся на одном уровне, можно описывать

    45 игрой Г
    0
    . Взаимодействие «начальник-подчиненный» описывается игрой Г
    i
    . Тогда условно такую структуру можно представить игрой
    Г
    i
    , определенной «на игре» Г
    0
    . То есть это – иерархическая игра, но уже не на одном субъекте, который максимизирует свою целевую функцию, а на наборе субъектов, разыгрывающих свою игру.
    Далее пусть есть несколько начальников (центров) и несколько подчиненных – агентов (Рис. 1.12д). В общем случае каждый связан с каждым. Как это можно отразить? На нижнем уровне агенты иг- рают игру Г
    0
    . Над ними центры разыгрывают иерархическую игру
    Г
    i
    , но центры в свою очередь разыгрывают на своем уровне игру Г
    0
    Получим игру Г
    0
    (Г
    i
    (Г
    0
    )).Такова конструкция: берется сложная структура и разбивается (декомпозируется) на более простые.
    Можно взять более сложную структуру с более сложным взаи- модействием (например, Рис. 1.12е). Это будет иерархическая игра между уровнями, на горизонтальных уровнях – обычная игра и т.д.
    Качественно ничего не меняется, усложняется только формальная задача, идеология описания остается та же.
    1.4. Классификация задач управления
    организационными системами
    Выше (в разделе 1.1) были выделены несколько видов управле- ния:
    Управление ОС, понимаемое как воздействие на управляемую систему с целью обеспечения требуемого ее поведения, может затрагивать каждый из следующих шести параметров ее модели:
    1) управление составом [12, 16, 19, 23];
    2) управление структурой [8, 18];
    3) институциональное управление (управление ограничениями и нормами деятельности) [15, 23];
    4) мотивационное управление [19, 23] (управление предпочте- ниями и интересами);
    5) информационное управление (управление информацией, ко- торой обладают участники ОС на момент принятия решений) [25,
    26];
    6) управление порядком функционирования (управление после- довательностью получения информации и выбора стратегий участ- никами ОС) [18].
    Следовательно, первым основанием системы классификаций
    механизмов управления ОС (процедур принятия управленческих

    46 решений) является предмет управления – изменяемый в процессе и результате управления компонент ОС. Итак, выше классификация управлений строилась на основании тех компонентов управляемой системы (точнее, ее модели), на которые оказывается воздействие при использовании управлений тех или иных типов: состав, струк- тура, допустимые множества, целевые функции и информирован- ность. Понятно, что изменения могут и должны касаться в общем случае всех перечисленных параметров, и поиск оптимального управления заключается в определении наиболее эффективной допустимой комбинации всех параметров ОС.
    Тем не менее, традиционно в теории управления социально- экономическими системами рассматривается система вложенных задач управления (решения более «частных» задач используются при решении более «общих»). На сегодняшний день существуют два общих подхода к описанию модели ОС и постановке и решению задач управления – «снизу вверх» и «сверху вниз».
    При использовании первого подхода («снизу вверх») сначала решаются частные задачи, а затем общие, использующие получен- ные решения частных задач. Например, частной задачей может быть разработка системы мотивации. Если она решена для любого соста- ва участников ОС, то можно ставить задачу оптимизации состава – выбора такого состава, эффективность которого (при соответствую- щей оптимальной мотивации) максимальна. Достоинством такого подхода является его конструктивность, недостатком – высокая сложность, так как число вариантов решения задачи верхнего уров- ня может быть очень велико, а для каждого такого варианта необхо- димо решить соответствующий набор частных подзадач.
    Бороться с этим недостатком можно, используя второй подход
    («сверху вниз»), в рамках которого сначала решаются задачи верх- него уровня, а полученные решения используются в качестве огра- ничений для решения более частных задач. Действительно, вряд ли руководитель крупной организации, создавая новый отдел, будет сначала детально продумывать регламенты взаимодействия сотруд- ников – скорее он возложит эту задачу на руководителя отдела, обеспечив его соответствующими ресурсами и полномочиями.
    Построение эффективной системы управления организацией требует совместного использования обоих подходов как в теории, так и на практике.
    Продолжим классификацию управлений организационными системами.

    47
    Расширениями базовой модели (см. Рис. 1.11 и Рис. 1.12в) явля- ются:
    1) динамические ОС (в которых участники принимают решения многократно – расширение по предмету управления «порядок функ- ционирования»);
    2) многоэлементные ОС (в которых имеется несколько агентов, принимающих решения одновременно и независимо, – расширение по предмету управления «состав»);
    3) многоуровневые ОС (имеющие трех- и более уровневую ие- рархическую структуру – расширение по предмету управления
    «структура»);
    4) ОС с распределенным контролем (в которых имеется не- сколько центров, осуществляющих управление одними и теми же агентами – расширение по предмету управления «структура»);
    5) ОС с неопределенностью (в которых участники не полно- стью информированы о существенных параметрах – расширение по предмету управления «информированность»);
    6) ОС с ограничениями совместной деятельности (в которых существуют глобальные ограничения на совместный выбор агента- ми своих действий – расширение по предмету управления «множе- ства допустимых стратегий»);
    7) ОС с сообщением информации (в которых одним из действий агентов является сообщение информации друг другу и/или центру – расширение по предмету управления «множества допустимых стра- тегий»).
    Таким образом, вторым основанием системы классификаций может также служить основание расширения базовой модели – наличие или отсутствие:
    1) динамики [22];
    2) множества взаимосвязанных агентов [10, 23];
    3) многоуровневости [8, 16, 18];
    4) распределенного контроля [10, 24];
    5) неопределенности [20, 21];
    6) ограничений совместной деятельности [15, 23];
    7) сообщения информации [13, 21, 29].
    Третьим основанием системы классификаций является метод
    моделирования. По этому основанию можно выделить механизмы

    48 управления, основывающиеся на оптимизационных
    15
    [1, 4] и теоре-
    тико-игровых моделях [11].
    Механизмы, основывающиеся на оптимизационных моделях, в свою очередь подразделяются на механизмы, использующие аппа- рат: теории вероятностей (в том числе теория надежности, теория массового обслуживания, теория статистических решений), теории
    оптимизации – линейное и нелинейное (а также стохастическое, целочисленное динамическое и др.) программирование, дифферен-
    циальных уравнений, оптимального управления; дискретной мате-
    матики – в основном теория графов (транспортная задача, задача о назначении, выбор кратчайшего пути, календарно-сетевое планиро- вание и управление, задачи о размещении, распределение ресурсов на сетях и т.д.).
    Механизмы, основывающиеся на теоретико-игровых моделях в свою очередь подразделяются на механизмы, использующие аппа- рат: некооперативных игр [11, 19, 29], кооперативных игр [10],
    повторяющихся игр [22], иерархических игр [11, 21, 18] и рефлексив-
    ных игр [25, 26].
    Четвертым основанием системы классификации механизмов управления ОС являются функции управления, реализацию которых призван обеспечить тот или иной механизм. В разделе 1.1 были перечислены четыре основных функции управления: планирование, организация, стимулирование и контроль.
    Пятым основанием являются задачи управления, решение кото- рых призван обеспечить тот или иной механизм управления ОС. В качестве значений признаков классификации целесообразно пред- ложить выделенные в теории управления (хорошо исследованные как с теоретической точки зрения, так и с точки зрения эффективно- сти практического использования) механизмы [3], уже ставшие своего рода «ключевыми словами» (см. Табл. 1.2).
    Отметим, что классификация, приведенная в Табл. 1.2, является достаточно условной, так как, с одной стороны, значениями призна- ков классификации являются подробно исследованные классы меха-
    15
    Суть оптимизационных моделей заключается в поиске оптимальных
    значений изменяемых параметров системы (то есть допустимых значе-
    ний, наилучших с точки зрения заданного критерия). В теоретико-игровых
    моделях часть этих значений выбирают участники системы, обладающие
    собственными интересами, поэтому задача управления заключается в
    нахождении таких правил игры, в рамках которых управляемые субъекты
    выбирали бы требуемые значения.

    49 низмов управления, а, с другой стороны, один и тот же класс меха- низмов может использоваться для реализации нескольких различ- ных функций управления.
    Табл. 1.2. Функции и механизмы управления [27]
    Функции
    управления
    Механизмы управления
    Планирование механизмы распределения ресурса; механизмы активной экспертизы; механизмы внутренних цен; конкурсные механизмы; механизмы обмена.
    Организация
    (как процесс) механизмы смешанного финансирования; противозатратные механизмы; механизмы «затраты – эффект»; механизмы самоокупаемости; механизмы страхования; механизмы оптимизации производственного цикла; механизмы назначения.
    Стимули- рование механизмы стимулирования за индивидуальные результаты; механизмы стимулирования за результаты коллективной деятельности; механизмы унифицированного стимулирования; механизмы «бригадной» оплаты труда; механизмы стимулирования в матричных структурах управления.
    Контроль механизмы комплексного оценивания; механизмы согласия; многоканальные механизмы; механизмы дополнительных соглашений.
    Шестым основанием системы классификаций механизмов управления ОС служит масштаб реальных систем, для использова- ния в которых в основном предназначен тот или иной механизм [3]
    (страна – регион – предприятие – структурное подразделение пред- приятия – первичный коллектив – индивидуум).

    50
    Седьмым основанием является отраслевая специфика (государ- ственное управление, муниципальное управление, промышленность, строительство, сфера услуг и т.д.).
    Отметим, что, с одной стороны, предложенные основания и значения признаков системы классификаций:
    1) предмет управления;
    2) основание расширения базовой модели;
    3) метод моделирования;
    4) функция управления;
    5) задача управления;
    6) масштаб реальных систем;
    7) отраслевая специфика, позволяют единообразно описывать как конкретные механизмы управления, так и их совокупности – комплексы механизмов управ- ления. С другой стороны, необходимо подчеркнуть, что каждый конкретный механизм не всегда может быть однозначно отнесен к тому или иному классу – во многих случаях одни и те же механизмы могут решать различные задачи управления, использоваться в раз- личных прикладных областях и т.д.
    В последующих главах настоящей работы мы с той или иной степенью детализации рассмотрим
    16
    механизмы мотивационного управления (главы 3 и 4), информационного управления (глава 5) и управления структурами организационных систем (глава 6).
    Задачи и упражнения к главе 1
    17
    1.1 («Фермеры на общем поле»). Имеются n игроков
    (
    }
    ,...,
    1
    {
    n
    N
    =
    ) с целевыми функциями
    )
    (
    )
    (
    å
    Î
    -
    =
    N
    j
    j
    i
    i
    x
    nX
    x
    x
    f
    ,
    )
    ,
    0
    [

    Î
    i
    x
    ,
    N
    i
    Î
    16
    Таким образом, вне содержания настоящей работы остались механиз-
    мы институционального управления и механизмы управления составом
    организационных систем. Ознакомиться с ними заинтересованный чита-
    тель может в работах, соответствующие ссылки на которые приведены
    выше.
    17
    Ссылки на литературу в тексте упражнения/задачи указывают рабо-
    ты, в которых можно найти ответ на соответствующий вопрос или
    решение соответствующей задач, или дополнительную информацию.
    Звездочкой помечены задачи повышенной трудности.

    51 1.1.1. Найдите все равновесия Нэша в чистых стратегиях для
    2
    =
    n
    1.1.2. Найдите все равновесия Нэша в чистых стратегиях при произвольном числе игроков.
    1.1.3. Найдите все оптимальные по Парето исходы для
    2
    =
    n
    Подсказка: множество оптимальных по Парето исходов сов-
    падает со множеством точек, на которых достигает максимума
    функция
    )
    ,
    (
    )
    1
    (
    )
    ,
    (
    2 1
    2 2
    1 1
    x
    x
    f
    x
    x
    f
    a
    -
    +
    a
    при различных
    ]
    1
    ;
    0
    [
    Î
    a
    .
    1.1.4. Найдите все оптимальные по Парето исходы для произ- вольного числа игроков.
    1.1.5. Сравните суммарный выигрыш игроков в равновесии Нэ- ша с суммарным их выигрышем в оптимальной по Парето точке.
    1.1.6
    *
    . Найдите предел равновесных стратегий игроков с ростом
    n, предел их выигрышей, суммарного выигрыша и суммарного оптимального по Парето выигрыша.
    На данном примере можно проиллюстрировать применение ги-
    потезы слабого влияния (см. ниже).
    1.1.7
    *
    . Докажите, что для произвольной игры множество опти- мальных по Парето исходов совпадает с множеством точек, на которых достигает максимума функция
    )
    (x
    f
    i
    N
    i
    i
    å
    Î
    a
    при различ- ных
    ]
    1
    ;
    0
    [
    Î
    a
    i
    таких, что
    1
    =
    å
    ÎN
    i
    i
    a
    Подсказка: воспользуйтесь определением оптимальности по
    Парето.
    1.1.8
    *
    . Есть ли в рассматриваемой игре равновесия Нэша в сме- шанных стратегиях для
    2
    =
    n
    ?
    Подсказка: воспользуйтесь линейностью целевой функции иг-
    рока по стратегиям противника и вогнутостью по своей страте-
    гии.
    1.2. Задана игра
    n лиц с целевыми функциями
    å
    Î
    -
    =
    N
    j
    j
    i
    i
    x
    x
    x
    f
    b
    a
    )
    (
    и стратегиями
    ]
    1
    ,
    0
    [
    Î
    i
    x
    1.2.1. Найдите все равновесия Нэша в чистых стратегиях.
    1.2.2. Найдите все равновесия в доминантных стратегиях.
    1.2.3. Найдите все оптимальные по Парето ситуации.
    1.2.4. При каких значениях параметров
    a
    и
    b
    равновесие Нэша оптимально по Парето?
    1.3. Задана игра двух лиц в нормальной форме с функциями выигрыша игроков

    52 8
    0
    при
    8 0
    при
    0
    ,
    2
    )
    ,
    (
    2 1
    2 1
    1 2
    1 1
    <
    +
    ³
    +
    î
    í
    ì -
    =
    x
    x
    x
    x
    x
    x
    x
    f
    ,
    ]
    1
    ;
    0
    [
    1
    Î
    x
    ;
    8 0
    при
    8 0
    при
    0
    ,
    2
    )
    ,
    (
    2 1
    2 1
    2 2
    1 2
    <
    +
    ³
    +
    î
    í
    ì -
    =
    x
    x
    x
    x
    x
    x
    x
    f
    ,
    ]
    1
    ;
    0
    [
    2
    Î
    x
    Удалите доминируемые стратегии. Постройте множество недоминируемых по Парето исходов. Найдите равновесие в доминантных стратегиях (или показать, что оно отсутствует).
    1.4 («Ящик Эджворта»). Два игрока могут обмениваться одним из двух видов ресурса. Начальное количество ресурсов у первого игрока
    1 0
    1
    =
    x
    ,
    0 0
    2
    =
    x
    , у второго:
    0 0
    1
    =
    y
    ,
    1 0
    2
    =
    y
    . Полезность перво- го игрока от обладания ресурсами:
    )
    1 0
    (
    )
    ,
    (
    2 1
    2 1
    1
    +
    =
    x
    x
    x
    x
    f
    , второго:
    2 1
    2 1
    2
    )
    1 0
    (
    )
    ,
    (
    y
    y
    y
    y
    f
    +
    =
    1.4.1. Найдите переговорное множество и контрактную кривую
    (множество оптимальных по Парето исходов обмена – см. раздел
    4.6).
    1.4.2. Найдите равновесие Вальраса данной игры (точка, в кото- рой прямая цен касается одновременно линий уровня функций полезностей обоих игроков).
    1.4.3. Найдите множество равновесий Нэша игры, в которой оба игрока одновременно называют объемы товаров для обмена, после чего сделка совершается при условии, что заявки совпали.
    1.4.4. Найдите равновесия Штакельберга для игры, в которой сначала первый игрок предлагает объемы товаров для обмена, а второй игрок может или согласиться, или не согласиться на это предложение (в случае отказа обмен не происходит).
    1.4.5. Найдите равновесия Штакельберга для игры, в которой сначала первый игрок заявляет цену, а второй игрок – объем первого товара для обмена по этой цене.
    1.4.6
    *
    . Придумайте для данной постановки задачи игру, равно- весие Нэша которой было бы единственно и совпадало бы с равно- весием Вальраса (см. задачу 1.4.2).
    1.5. Для игры в нормальной форме с матрицей
    (
    )
    ÷÷
    ø
    ö
    çç
    è
    æ
    ÷÷
    ø
    ö
    çç
    è
    æ
    )
    5
    ;
    1
    (
    )
    4
    ;
    4
    (
    )
    0
    ;
    0
    (
    )
    1
    ;
    7
    (
    )
    \
    (
    1 1
    2 2
    2 1
    y
    x
    y
    x
    найдите все равновесия Нэша в смешанных стратегиях.

    53
    1.6. Для игры в нормальной форме с функциями выигрыша
    2 2
    1 1
    )
    (
    x
    x
    f
    +
    =
    ,
    ]
    1
    ;
    1
    [
    1
    -
    Î
    x
    ,
    2 1
    2 2
    )
    (
    x
    x
    f
    -
    -
    =
    ,
    ]
    1
    ;
    1
    [
    2
    -
    Î
    x
    , найдите все равновесия Нэша в чистых стратегиях.
    1.7
    *
    . Для задачи 1.6 приведите пример равновесия Нэша в сме- шанных стратегиях (не совпадающего с ранее найденными).
    1.8
    *
    . Для игры типа Г
    2
    с
    )
    5
    )(
    5
    (
    2 1
    1
    -
    -
    -
    =
    x
    x
    f
    ,
    ]
    10
    ;
    0
    [
    0 1
    =
    X
    ,
    )
    5
    )(
    5
    (
    2 1
    2
    -
    -
    =
    x
    x
    f
    ,
    ]
    10
    ;
    0
    [
    0 2
    =
    X
    , постройте стратегию наказания
    )
    (
    2 1
    x
    x
    н
    , найдите L
    2
    и постройте множество D [11].
    1.9
    *
    . Для игры типа Г
    2
    с
    1 2
    1
    x
    x
    f
    -
    =
    ,
    ]
    10
    ;
    0
    [
    0 1
    =
    X
    ,
    )
    5
    )(
    5
    (
    2 1
    2
    -
    -
    =
    x
    x
    f
    ,
    ]
    10
    ;
    0
    [
    0 2
    =
    X
    , найдите значение K и множество стратегий
    )
    (
    2 1
    x
    x
    e
    , гарантирующих первому игроку выигрыш, не менее K –
    e [11].
    1.10
    *
    . Для игры типа Г
    2
    с
    1 2
    1
    x
    x
    f
    -
    =
    ,
    ]
    10
    ;
    0
    [
    0 1
    =
    X
    ,
    )
    5
    )(
    5
    (
    2 1
    2
    -
    -
    =
    x
    x
    f
    ,
    ]
    10
    ;
    0
    [
    0 2
    =
    X
    найдите значение М и постройте
    «стратегию наилучшего ответа»
    )
    (
    2 1
    x
    x
    a
    e
    [11].
    1.11
    *
    . Приведите определения следующих понятий и содержа- тельные примеры: организация, организационная система, механизм функционирования, механизм управления, моделирование, деятель- ность, мотив, цель, технология, управление, входо-выходная модель, эффективность управления, виды управления, типы управления, функции управления, методы управления, формы управления, тех- нология управления, гипотеза рационального поведения, гипотеза детерминизма, гипотеза благожелательности, игра, обстановка игры, принцип максимального гарантированного результата, равновесие в доминантных стратегиях, равновесие Нэша, эффективность по
    Парето, иерархическая игра, равновесие Штакельберга, динамиче- ская организационная система, многоэлементная организационная система, многоуровневая организационная система (см. также
    глоссарий в [27]).
    Литература к главе 1
    1.
    *
    Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. – М.: Синтег, 2001.

    54 2.
    *
    Бурков В.Н., Новиков Д.А. Как управлять проектами. – М.: Син- тег, 1997.
    3.
    *
    Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. – М.: Синтег, 1999. – 128 с.
    4. Вагнер Г. Основы исследования операций. – М.: Мир, 1972.
    5.
    *
    Васильев Д.К., Заложнев А.Ю., Новиков Д.А., Цветков А.В. Ти- повые решения в управлении проектами. – М.: ИПУ РАН, 2003.
    6. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. Изд. 2-е. – СПб.: СПб.ГТУ, 1999.
    7.
    *
    Воронин А.А., Губко М.В., Мишин С.П., Новиков Д.А. Матема- тические модели организаций. – М.: Ленанд, 2008.
    8.
    *
    Воронин А.А., Мишин С.П. Оптимальные иерархические струк- туры. – М.: ИПУ РАН, 2003.
    9.
    *
    Гермейер Ю.Б. Игры с непротивоположными интересами. – М.:
    Наука, 1976.
    10.
    *
    Губко М.В. Механизмы управления организационными систе- мами с коалиционным взаимодействием участников. – М.: ИПУ
    РАН, 2003.
    11.
    *
    Губко М.В., Новиков Д.А. Теория игр в управлении организаци- онными системами. – М.: Синтег, 2002.
    12.
    *
    Караваев А.П. Модели и методы управления составом активных систем. – М.: ИПУ РАН, 2003.
    13.
    *
    Коргин Н.А. Механизмы обмена в активных системах. – М.:
    ИПУ РАН, 2003.
    14.
    *
    Новиков А.М., Новиков Д.А. Методология. – М.: Синтег, 2007.
    15.
    *
    Новиков Д.А. Институциональное управление организационны- ми системами. – М.: ИПУ РАН, 2003.
    16.
    *
    Новиков Д.А. Механизмы функционирования многоуровневых организационных систем. – М.: Фонд «Проблемы управления»,
    1999.
    17.
    *
    Новиков Д.А. Обобщенные решения задач стимулирования в активных системах. – М.: ИПУ РАН, 1998.
    18.
    *
    Новиков Д.А. Сетевые структуры и организационные системы. –
    М.: ИПУ РАН, 2003.
    19.
    *
    Новиков Д.А. Стимулирование в организационных системах. –
    М.: Синтег, 2003.
    20.
    *
    Новиков Д.А. Стимулирование в социально-экономических системах (базовые математические модели). – М.: ИПУ РАН, 1998.
    21.
    *
    Новиков Д.А., Петраков С.Н. Курс теории активных систем. –
    М.: Синтег, 1999.

    55 22.
    *
    Новиков Д.А., Смирнов И.М., Шохина Т.Е. Механизмы управ- ления динамическими активными системами. – М.: ИПУ РАН, 2002.
    23.
    *
    Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. – М.: Апостроф, 2000.
    24.
    *
    Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. – М.: ИПУ
    РАН, 2001.
    25.
    *
    Новиков Д.А., Чхартишвили А.Г. Активный прогноз. – М.: ИПУ
    РАН, 2002.
    26.
    *
    Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. – М.:
    Синтег, 2003.
    27.
    *
    Новиков Д.А. Теория управления организационными системами.
    – М.: Физматлит, 2007.
    28.
    *
    Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. –
    М.: Высшая школа, 1989.
    29.
    *
    Петраков С.Н. Механизмы планирования в активных системах: неманипулируемость и множества диктаторства. – М.: ИПУ РАН,
    2001.
    30. Словарь иностранных слов. – М.: Русский язык, 1982.
    31. Словарь русского языка С.И. Ожегова. М.: Русский язык, 1988.
    32. Философский энциклопедический словарь. – М.: Сов. Энцикло- педия, 1983.
    33.
    *
    Цветков А.В. Стимулирование в управлении проектами. – М.:
    Апостроф, 2001.

    1   2   3   4   5   6   7   8   9   ...   23


    написать администратору сайта