Главная страница
Навигация по странице:

  • Смешивание стратегий в неантагонистических играх

  • Смешивание стратегий в деловых и других войнах

  • Поиск равновесия в смешанных стратегиях

  • Неожиданные последствия изменений в смешанных стратегиях

  • Учебный пример: джанкен на ступеньках 157

  • Анализ примера

  • Теория игр. Искусство стратегического мышления в бизнесе и жизни. Барри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство


    Скачать 3.58 Mb.
    НазваниеБарри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство
    Дата15.04.2022
    Размер3.58 Mb.
    Формат файлаpdf
    Имя файлаТеория игр. Искусство стратегического мышления в бизнесе и жизни.pdf
    ТипРеферат
    #476504
    страница14 из 38
    1   ...   10   11   12   13   14   15   16   17   ...   38
    Уникальные ситуации
    Эта логика имеет смысл в таких играх, как футбол, бейс- бол или теннис, в которых одна и та же ситуация складыва- ется много раз в течение одного матча, а в борьбу во многих матчах вступают одни и те же игроки. Кроме того, в этих иг-
    рах есть время и возможность обнаружить любые системные действия соперников и отреагировать на них. С другой сто- роны, важно избегать в игре таких схем, которые соперники могут использовать с выгодой для себя, и придерживаться оптимальной смешанной стратегии. Но как быть с играми,
    которые происходят только один раз?
    Рассмотрим в качестве примера выбор позиций для на- ступления и обороны во время сражения. Эта ситуация по- истине уникальна: противник не может вывести какую бы то ни было закономерность на основании ваших прошлых действий. Однако необходимость в случайном выборе воз- никает в связи с возможностью шпионажа. Если вы выберете определенный курс действий, а противник узнает, что вы со- бираетесь делать, он изменит свой план так, чтобы поставить вас в самое невыгодное положение. Вам необходимо застать противника врасплох, а самый верный способ сделать это сводится к тому, чтобы действовать неожиданно даже для са- мих себя. Вы должны как можно дольше воздерживаться от выбора и сделать его в самый последний момент, применив для этого непредсказуемый, а значит, защищенный от шпи- онажа, способ. При этом соотношение разных вариантов вы- бора в вашей стратегии должно быть таким, чтобы против- ник, узнав об этом, не смог воспользоваться данной инфор- мацией в своих целях. Это и есть оптимальное смешивание стратегий, о котором шла речь.
    И наконец, хотелось бы сделать одно предостережение.

    Даже если вы используете оптимальный вариант смешива- ния стратегий, все равно в некоторых случаях вы будете по- лучать плохой результат. Даже если игрок, выполняющий пенальти, действует непредсказуемо, вратарь может угадать направление удара и отразить его. В американском футбо- ле, когда после третьей попытки осталось пройти один ярд,
    разумно прорываться с мячом посередине, но важно также время от времени делать длинный пас, чтобы не дать защи- щающейся команде разгадать схему нападения. Если такой пас оказывается успешным, болельщики и спортивные ком- ментаторы восхищаются столь изобретательным выбором схемы игры и называют тренера гением. В случае неудачно- го паса тренера подвергают жесткой критике: как он мог де- лать ставку на длинный пас, вместо того чтобы выбрать бо- лее безопасную схему игры?
    Разъяснять стратегию тренера необходимо еще до ее при- менения в том или ином матче. Тренер должен донести до всеобщего сведения тот факт, что прорыв с мячом посереди- не поля остается элементом осторожной и методичной схе- мы игры именно благодаря отвлечению части игроков защи- щающейся команды на оборону от случайного длинного па- са, который может обойтись команде слишком дорого. Од- нако мы допускаем, что даже если накануне игры тренер во всеуслышание заявит об этом во всех газетах и на всех теле- каналах, а затем использует длинный пас, который окажет- ся неудачным, на него все равно обрушится лавина крити-
    ки, как если бы он и не пытался объяснить широкой публике элементы теории игр.
    Смешивание стратегий в
    неантагонистических играх
    До сих пор мы рассматривали в этой главе только антаго- нистические игры, в которых интересы игроков полностью противоположны: игры с нулевой суммой или игры с посто- янной суммой. Однако мы неизменно подчеркиваем, что в реальной жизни интересы людей могут совпадать, а могут и противоречить друг другу. Играет ли смешивание стратегий значимую роль в играх с ненулевой суммой? Да, но с неко- торыми условиями.
    В качестве иллюстрации еще раз рассмотрим охотничью версию игры «семейный спор», о которой шла речь в главе 4
    Вспомните наших отважных охотников Фреда и Барни, ко- торые решают (каждый в своей пещере), на какого зверя им охотиться – на оленя или на бизона. Удачная охота требует совместных усилий обоих охотников, поэтому, если они вы- берут противоположные варианты, никто из них не добудет мяса. И Фред, и Барни заинтересованы в том, чтобы предот- вратить такой итог. Однако помимо двух вариантов благо- получного исхода (при условии, что они охотятся на одном участке) нужно учесть, что Фред отдает предпочтение мя- су оленя и оценивает результат совместной охоты на этого
    зверя как четыре вместо трех единиц мяса, тогда как у Бар- ни противоположные предпочтения. Следовательно, табли- ца их выигрышей выглядит так:
    Как мы уже убедились, в этой игре есть два равновесия
    Нэша; в таблице они выделены серым цветом. Теперь мы на- звали бы их равновесиями в чистых стратегиях. Но возмож- но ли такое равновесие в игре со смешанной стратегией?
    По каким причинам Фред выбрал бы смешанную страте- гию? Возможно, он не уверен в том, что именно выберет Бар- ни. Если под влиянием этих субъективных сомнений Фред оценивает число случаев, когда Барни выберет охоту на оле- ня и на бизона, как y и (1 – у) соответственно, тогда он рас- считывает на выигрыш в размере 4y + 0(1 – y) = 4y, если он сам выберет охоту на оленя, и 0y + 3(1 – y), если он сам вы- берет охоту на бизона. Если y имеет значение, при котором

    4y = 3(1 – y), или 3 = 7y, или y =
    3
    /
    7
    , тогда Фред получит один и тот же выигрыш, выбрав стратегию охоты на оленя или на бизона, а также если он решит использовать обе стратегии в любой пропорции. Предположим, что Фред смешивает стра- тегию охоты на оленя и на бизона в таких пропорциях, что для Барни не имеет значения, какую из чистых стратегий вы- брать. (Эта игра симметрична, поэтому вы можете предпо- ложить – и подтвердить это предположение расчетами, – что
    Фред должен смешивать свои стратегии, выбирая охоту на оленя в x =
    4
    /
    7
    случая.) При этом Барни тоже мог бы смеши- вать свои стратегии по такому принципу, чтобы Фреду было все равно, какую стратегию выбрать, а значит, Барни сам мог бы выбрать оптимальную стратегию. Эти два варианта сме- шивания стратегий – x =
    4
    /
    7
    и y =
    3
    /
    7
    – образуют равновесие
    Нэша в смешанных стратегиях.
    Всегда ли такое равновесие обеспечивает удовлетвори- тельный результат? Нет. Проблема в том, что два охотника делают свой выбор независимо друг от друга. Следователь- но, Фред выберет охоту на оленя, тогда как Барни выберет охоту на бизона, в
    4
    /
    7
    ×
    4
    /
    7
    =
    16
    /
    49
    случаях, и наоборот – в
    3
    /
    7
    ×
    3
    /
    7
    =
    9
    /
    49
    случаях. Таким образом, в
    25
    /
    49
    или немногим более половины случаев два охотника окажутся на разных участ- ках и получат нулевой выигрыш. Воспользовавшись приве- денными формулами, мы увидим, что каждый из них полу-
    чит выигрыш в размере 4 ×
    3
    /
    7
    + 0 ×
    4
    /
    7
    =
    12
    /
    7
    ≈ 1,71, что меньше выигрыша 3 в случае неблагоприятного равновесия в чистых стратегиях.
    Для того чтобы избежать таких ошибок, Фреду и Барни необходимо согласовать свои действия в плане смешивания стратегий. Могут ли они сделать это, находясь в отдаленных пещерах и не имея никаких средств связи? Возможно, охот- ники могли бы заранее договориться о согласовании дей- ствий, опираясь на то, в каких условиях оба будут собирать- ся на охоту. Предположим, в их местности половину дней в году по утрам идет дождь. Фред и Барни могут договорить- ся, что оба отправятся охотиться на оленя, если в тот день пойдет дождь, и на бизона – если будет сухо. В таком случае каждый из них получит средний выигрыш в размере
    1
    /
    2
    × 3 +
    1
    /
    2
    × 4 = 3,5. Таким образом, скоординированная рандоми- зация обеспечивает охотникам изящный способ найти нечто среднее между благоприятным и неблагоприятным равнове- сием Нэша в чистых стратегиях, иными словами, воспользо- ваться таким инструментом, как переговоры.
    Нескоординированное равновесие Нэша в смешанных стратегиях не только обеспечивает игрокам низкий выиг- рыш, но и является хрупким и нестабильным. Если оценка
    Фредом вероятности того, что Барни выберет охоту на оленя,
    хотя бы немного превысит значение
    3
    /
    7
    ≈ 0,42857 и составит,
    скажем, 0,43, тогда выигрыш Фреда от выбора охоты на оле-
    ня, а именно 4 × 0,43 + 0 × 0,57 ≈ 1,72, превысит выигрыш от выбора охоты на бизона – 0 × 0,43 + 3 × 0,57 ≈ 1,71. Сле- довательно, Фреду нет смысла смешивать стратегии, а луч- ше выбрать чистую стратегию охоты на оленя. В таком слу- чае лучший ответный ход Барни – чистая стратегия охоты на оленя, а это значит, что равновесие в смешанных стратегиях нарушено.
    В заключение хотелось бы обратить ваше внимание на то,
    что у равновесия в смешанных стратегиях есть необычное свойство, не совсем понятное интуитивно. Предположим,
    выигрыш Барни изменится с 3 и 4 на 6 и 7 единиц соответ- ственно, а выигрыш Фреда останется неизменным. Как это повлияет на пропорции смешивания стратегий? Снова обо- значим символом y относительное число случаев, когда Бар- ни, по мнению Фреда, должен выбрать охоту на оленя. В дан- ной ситуации Фред все равно получит выигрыш в размере
    4y от выбора чистой стратегии охоты на оленя и 3(1 – y) –
    от выбора чистой стратегии охоты на бизона. В итоге при значении y =
    3
    /
    7
    для Фреда не будет иметь значения, какую стратегию выбрать, и он будет готов к смешиванию страте- гий. С другой стороны, присвоив значение х относительно- му числу случаев выбора охоты на оленя в смешанной стра- тегии Фреда, Барни получит выигрыш 6x + 0(1 – x) = 6x за счет чистой стратегии охоты на оленя и 0x + 7(1 – x) = 7(1 –
    x
    ) за счет чистой стратегии охоты на бизона. Приравняв эти
    два выражения, получим x =
    7
    /
    13
    . Таким образом, измене- ние выигрыша Барни никак не скажется на равновесии в его смешанной стратегии, но изменит пропорции в смешанной стратегии Фреда!
    Поразмышляв еще немного, вы поймете, что это не так уж и странно. Возможно, Барни готов смешивать свои страте- гии только потому, что он не уверен в действиях Фреда. Сле- довательно, в приведенных расчетах учтен выигрыш Барни и вероятность выбора, который сделает Фред. Если мы при- равняем два итоговых выражения и решим полученное урав- нение, то увидим, что вероятность того, какую именно про- порцию смешивания стратегий выберет Фред, зависит от вы- игрыша Барни, и наоборот.
    Однако это настолько тонкие и на первый взгляд непри- вычные рассуждения, что во время проведения эксперимен- тов большинство игроков не могут понять этого даже тогда,
    когда им предлагают рандомизировать выбор стратегий. Они меняют вероятность смешивания стратегий, когда меняется их собственный выигрыш, а не выигрыш другого игрока.
    Смешивание стратегий в
    деловых и других войнах
    Приведенные в этой книге примеры смешанных стратегий взяты из мира спорта. Почему так мало примеров случай-
    ного выбора в реальном мире бизнеса, политики или вой- ны? Во-первых, в этом мире большинство игр – это игры с ненулевой суммой, а мы считаем, что смешивание стратегий в подобных ситуациях имеет более ограниченную область применения, носит более нестабильный характер и не всегда приводит к положительным результатам. Однако существу- ют и другие причины.
    Достаточно трудно положиться на волю случая в корпора- тивной культуре, основной принцип которой – контроль над результатами. Это особенно относится к ситуациям, когда что-то идет не так, а это практически неизбежно, если дей- ствия выбираются случайным образом. Хотя некоторые лю- ди и способны понять, что футбольный тренер должен время от времени включать в игру своей команды ложный пант
    152
    ,
    чтобы ввести защищающуюся команду в заблуждение, в биз- несе такая рискованная стратегия может привести к увольне- нию, если закончится неудачей. Но дело не в том, что риско- ванная стратегия всегда обеспечивает ожидаемые результа- ты, а в том, что она позволяет избежать опасности, которую несут в себе сложившиеся стереотипы и предсказуемость.
    Купоны на скидки – это один из случаев, когда приме- нение смешанных стратегий повышает эффективность биз- неса. Компании используют этот метод для формирования
    152
    Пант – удар ногой по мячу, которым игрок нападающей команды выбивает мяч в сторону соперника. Ложный пант – ситуация, когда игрок становится в позицию для выполнения панта, но после этого не делает удар ногой по мячу, а продолжает бегущую или пасующую игру. Прим. пер.
    доли на рынке. Идея состоит в том, чтобы привлечь новых покупателей, не предоставляя такие же скидки имеющим- ся. Если конкуренты предложат купоны на скидки в тот же период, покупатели не будут заинтересованы в том, чтобы переходить на другой бренд. Вместо этого они останутся с прежним брендом и воспользуются предложенной скидкой.
    Потенциальные покупатели захотят попробовать новый про- дукт только в случае, если одна компания предлагает купоны на скидки, а другая – нет.
    Для таких конкурентов, как, например, Coca-Cola и PepsiCo, игра с купонами на скидки аналогична задаче на координацию действий, которую решали Фред и Барни. Каж- дой компании необходимо быть единственной компанией,
    предлагающей купоны на скидки, – точно так же, как каж- дый из наших охотников стремится выбрать именно тот уча- сток для охоты, которому отдает предпочтение. Однако если они попытаются сделать это одновременно, эффект от вы- пуска купонов на скидку будет сведен на нет и обе компа- нии понесут убытки. Одно из возможных решений состоит в том, чтобы придерживаться предсказуемой схемы предло- жения купонов на скидки (скажем, каждые шесть месяцев),
    а также чередовать эти периоды с конкурентом. Проблема в том, что, если в компании Coca-Cola знают, что в PepsiCo вот-вот выпустят купоны на скидки, они могут сделать это первыми и опередить конкурента. Единственный способ из- бежать таких упреждающих действий со стороны конкурен-
    та – сохранить элемент неожиданности, созданный посред- ством рандомизированной стратегии.
    Безусловно, если конкурирующие компании применяют такую рандомизацию независимо друг от друга, они могут допустить ту же ошибку, что и наши герои-охотники камен- ного века Фред и Барни. Однако конкуренты добьются гораз- до более весомых результатов, согласовав свои действия. Су- ществуют убедительные статистические доказательства то- го, что компании Coca-Cola и PepsiCo пришли именно к та- кому согласованному решению данной проблемы. На про- тяжении 52 недель они проводили кампании по продвиже- нию своей продукции за счет временного снижения цен –
    по 26 недель каждая, не пересекаясь друг с другом. Если бы каждая компания осуществляла такое продвижение на про- тяжении любой недели, выбранной произвольно с вероятно- стью 50 процентов, и обе компании делали бы это независи- мо друг от друга, вероятность нулевого совпадения состав- ляла бы
    1
    /
    495918532948104
    , или менее одного случая на квад- риллион (миллиард миллиардов)! Это был настолько порази- тельный вывод, что о нем заговорили даже в СМИ, в том чис- ле в программе 60 Minutes («60 минут») на канале CBS
    153
    Цель кампании по продвижению продукции посредством выпуска купонов на скидку состоит в том, чтобы увеличить
    153
    Информацию об этом и других подобных примерах можно найти здесь:
    Rajiv Lal, “Price Promotions: Limiting Competitive Encroachment,” Marketing
    Science 9, no. 3 (Summer 1990): 247–262.
    долю компании на рынке. Однако в каждой компании осо- знают: для того чтобы получить требуемый результат, необ- ходимо предлагать купоны на скидку только тогда, когда конкурент не делает этого. Стратегия случайного выбора недель для распространения купонов может быть рассчита- на на то, чтобы застать другую компанию врасплох. Но если обе компании применяют аналогичные стратегии, на протя- жении многих недель они будут предлагать купоны одновре- менно. В эти недели их мероприятия по продвижению про- дукции просто сведут друг друга на нет: ни одна из компаний не увеличит свою долю на рынке и они обе получат более низкую прибыль. В итоге применение таких стратегий со- здает дилемму заключенных. В компаниях, постоянно под- держивающих взаимодействие друг с другом, понимают, что они обе могут добиться большего, решив эту дилемму. Один из способов сделать это – предлагать свои товары по снижен- ным ценам поочередно, а после окончания кампаний по сти- мулированию сбыта возвращаться к своим обычным ценам.
    Именно это и сделали компании Coca-Cola и PepsiCo.
    Существуют и другие ситуации, в которых компании должны избегать шаблонов и предсказуемости действий.
    Некоторые авиакомпании предлагают билеты со скидками тем путешественникам, которые готовы приобрести билеты в последнюю минуту. Однако не сообщают, сколько свобод- ных мест осталось, для того чтобы можно было оценить шан- сы на успешную покупку билета. Если бы наличие билета,
    который можно купить в последнюю минуту, являлось более предсказуемым, тогда возникло бы гораздо больше возмож- ностей для эксплуатации этой системы и авиакомпании по- теряли бы больше своих клиентов из числа тех, кто в боль- шинстве случаев покупают билеты обычным способом.
    В бизнесе рандомизированные стратегии чаще всего при- меняются для мотивации соблюдения установленных правил при одновременном снижении затрат на мониторинг. Это ка- сается самых разных ситуаций – от налоговых проверок и тестов на наркотики до парковочных счетчиков. Кроме того,
    это объясняет, почему наказание не всегда должно соответ- ствовать преступлению.
    Как правило, штраф за нарушение правил парковки во много раз превышает плату за парковку. Если стоимость пар- ковки по счетчику составляет 1 доллар в час, достаточно ли штрафа в размере 1,01 доллара для того, чтобы люди придер- живались правил? Достаточно, но только при условии, что дорожная полиция обязательно поймает вас каждый раз, ко- гда вы не заплатите за парковку. Такая система контроля за соблюдением правил обходилась бы очень дорого. Заработ- ная плата инспекторов дорожного движения стала бы самой большой статьей расходов, но затраты на систему взыскания штрафов, необходимую для обеспечения эффективности та- кой политики, тоже были бы достаточно большими.
    Вместо этого органы власти используют столь же эффек- тивную, но менее затратную стратегию: ввести более круп-
    ные штрафы и ослабить контроль за соблюдением правил парковки. Если штраф составляет 25 долларов, риска быть пойманным с вероятностью
    1
    /
    25
    вполне достаточно, чтобы заставить вас соблюдать правила. В такой системе задейство- вано гораздо меньше полицейских, а собранных штрафов достаточно, чтобы покрыть административные расходы.
    Это еще один пример практической ценности смешанных стратегий. В чем-то он похож на пример из области футбола,
    а в чем-то отличается от него. Стоит подчеркнуть еще раз:
    органы власти выбирают рандомизированную стратегию по- тому, что она лучше любых системных действий – полное отсутствие контроля за соблюдением правил привело бы к неправильному использованию мест для стоянки автомоби- лей, которых всегда не хватает, а стопроцентный контроль обходился бы слишком дорого. Для того чтобы наладить эф- фективную работу автостоянок, органам власти необходимо обеспечить и достаточно строгий контроль, и достаточно вы- сокие штрафы.
    Принципы выборочного тестирования на предмет упо- требления наркотиков аналогичны системе контроля за со- блюдением правил парковки. Ежедневная проверка всех со- трудников на наркотики потребовала бы слишком больших затрат времени и денег. Выборочное тестирование позволя- ет обнаружить тех сотрудников, которые не способны рабо- тать без приема наркотиков, и отбивает у остальных жела- ние употреблять наркотики в свободное от работы время. В
    этом случае вероятность обнаружения тоже достаточно низ- кая, но наказание очень строгое. То же наблюдается в страте- гии проверок Налогового управления США: штрафы слиш- ком маленькие, учитывая вероятность быть пойманным за нарушение налогового законодательства. Когда контроль за соблюдением правил носит выборочный характер, наказание должно быть тяжелее преступления. Необходимо придержи- ваться такого правила: ожидаемое (в статистическом смыс- ле) наказание должно соответствовать преступлению с уче- том вероятности быть пойманным.
    Люди, которые стремятся обойти систему контроля за со- блюдением правил, используют стратегию выборочного кон- троля с выгодой для себя. Они могут замаскировать ис- тинное нарушение множеством фальшивых сигналов трево- ги и обманных маневров, из-за чего ресурсы контролиру- ющих органов становятся слишком разбросанными, а зна- чит, неэффективными. Например, система противовоздуш- ной обороны должна быть способной уничтожить все без исключения атакующие ракеты. Для атакующей стороны са- мый эффективный с точки зрения затрат способ преодолеть систему противовоздушной обороны сводится к тому, чтобы окружить настоящую ракету группой фальшивых. Создать фальшивую ракету гораздо дешевле, чем настоящую. До тех пор пока обороняющаяся сторона не распознает их совер- шенно точно, ей придется останавливать все атакующие ра- кеты – как реальные, так и фальшивые.

    Запуск невзрывающихся артиллерийских снарядов нача- ли практиковать еще в период Второй мировой войны, при- чем не по причине умышленного выпуска таких снарядов,
    а в качестве решения проблем с контролем качества. «От- бор бракованных снарядов в процессе их производства тре- бует больших затрат. У кого-то появилась идея выпускать невзрывающиеся снаряды и время от времени стрелять ими.
    Командиры военных подразделений не могли допустить,
    чтобы на их позициях лежали такие бомбы замедленного действия, поскольку им не дано было знать, какой снаряд на- стоящий, а какой бракованный. Такой блеф заставлял их по- трудиться над каждым невзорвавшимся снарядом, упавшим в расположении их подразделений»
    154
    Когда затраты на оборону пропорциональны числу ракет,
    которые должны быть сбиты, атакующая сторона может сде- лать эти затраты непомерно высокими. Это одна из самых сложных проблем создания системы противоракетной обо- роны, которая, возможно, вообще не имеет решения.
    Поиск равновесия в смешанных стратегиях
    Многим читателям вполне достаточно понять суть сме- шанных стратегий на качественном концептуальном уровне и затем возложить задачу вычисления фактических показа-
    154
    John McDonald, Strategy in Poker, Business, and War (New York: W W. Norton,
    1950), 126.
    телей на компьютерную программу, способную рассчитать смешанные стратегии, когда у каждого игрока есть любое число чистых стратегий (при этом некоторые из них могут даже не использоваться в равновесии)
    155
    . Эти читатели могут пропустить оставшуюся часть главы без ущерба для пони- мания изложенного материала. Но тем читателям, которые знают алгебру и геометрию хотя бы на уровне курса сред- ней школы, мы предлагаем более подробную информацию по этой теме
    156
    Сначала рассмотрим алгебраический метод. Число стра- тегий «слева» в смешанной стратегии игрока, выполняюще- го пенальти, – это неизвестное, которое нужно найти; назо- вем его х. Поскольку это относительная доля, число страте- гий «справа» составит (1 – х). Показатель эффективности такой смешанной стратегии в случае, если вратарь выберет стратегию «слева», составит 58x + 93(1 – x) = 93–35x про- центов, а если он выберет стратегию «справа» – 95x + 70(1 –
    x
    ) = 70 + 25x процентов. Эти два показателя будут равными,
    155
    Существует много программ подобного типа, в том числе Gambit (Свобод- ный доступ к одной из таких программ под названием Gambit можно получить здесь: http://gambit.sourceforge.net
    .) и ComLabGames. Вторая программа позво- ляет экспериментировать с играми и их результатами в интернете; ее можно ска- чать здесь: www.comlabgames.com
    156
    Более подробную информацию можно найти здесь: Dixit and Skeath, Games of Strategy, Сhapter 7. Поистине глубокий анализ этой темы содержится в главе 4
    и приложениях 2–6 книги R. Duncan Luce and Howard Raiffa, Games and Decisions
    (New York: Wiley, 1957).
    если 93–35x = 70 + 25x, или 23 = 60x, или x =
    23
    /
    60
    ≈ 0,383.
    Мы можем также найти решение графическим мето- дом, отобразив результаты различных вариантов смешива- ния стратегий на графике. Доля ударов слева в смешанной стратегии бьющего игрока, которую мы обозначили как х,
    отображается на горизонтальной оси от 0 до 1. По каждому варианту смешивания стратегий одна из двух линий отоб- ражает показатель эффективности стратегии бьющего игро- ка в случае, если вратарь выберет чистую стратегию «сле- ва» (обозначенную на графике буквой Л), а другая – показа- тель эффективности стратегии бьющего игрока, если он вы- берет чистую стратегию «справа» (буква П). Первая линия начинается в точке, соответствующей значению 93 (значение выражения 93–35x при х = 0), и опускается до значения 58
    (значение этого же выражения при х = 1). Вторая линия на- чинается в точке, соответствующей значению 70 (значение выражения 70 + 25x при х = 0), и повышается до значения
    95 (значение этого же выражения при х = 1).

    Вратарю необходимо удерживать показатель эффективно- сти стратегии бьющего игрока на как можно более низком уровне. Следовательно, если бы структура смешанной стра- тегии бьющего игрока была известна вратарю, он выбрал бы стратегию «слева» или «справа», отображенную одним из тех сегментов двух линий, которые расположены ниже точки пересечения. Эти сегменты, выделенные жирным и образу- ющие перевернутую букву V, отображают минимальный по- казатель эффективности стратегии игрока, выполняющего штрафной удар, если вратарь использует выбор бьющего иг- рока с наибольшей выгодой для себя. Бьющему игроку необ- ходимо выбрать из этих минимальных значений максималь- ный показатель эффективности своей смешанной стратегии.

    Это значение соответствует вершине перевернутой буквы V,
    то есть точке пересечения двух линий. Внимательно изучив график, получим те же координаты этой точки, которые дает алгебраическое решение: x = 0,383, а показатель эффектив- ности стратегии – 79,6 процента.
    Точно так же можно проанализировать смешанную стра- тегию вратаря. Обозначим число стратегий «слева» в сме- шанной стратегии вратаря как y. Тогда (1 – y) – это доля стра- тегий «справа» в его смешанной стратегии. Если бьющий иг- рок выберет стратегию «слева» против этой смешанной стра- тегии, средний показатель эффективности его стратегии со- ставит 58y + 95(1 – y) = 95–37y, а если стратегию «справа» –
    93y + 70(1 – y) = 70 + 23y. Эти два показателя будут равными,
    если 95–37y = 70 + 23y, или 25 = 60y, или y =
    25
    /
    60
    ≈ 0,417.
    Графический анализ смешанной стратегии вратаря пред- ставляет собой простую модификацию такого же анализа стратегии игрока, выполняющего пенальти. Для этого по- строим график, отображающий результаты различных вари- антов смешивания стратегий вратаря. Доля позиций «сле- ва» в смешанной стратегии вратаря, которую мы обозначи- ли как y, отображается на горизонтальной оси от 0 до 1.
    Одна из двух линий отображает показатель эффективности стратегии вратаря в случае, если бьющий игрок выберет чи- стую стратегию «слева», а другая – тот же показатель, ес- ли это будет чистая стратегия «справа». По каждому вари- анту смешивания стратегий, который выберет вратарь, бью-
    щий игрок должен выбрать тот вариант стратегии «слева»
    или «справа», который обеспечивает более высокий пока- затель эффективности. Этот максимум находится в верши- не буквы V, образованной теми сегментами двух линий, ко- торые выделены жирным. Вратарь должен удерживать пока- затель эффективности стратегии бьющего игрока на макси- мально низком уровне. Он может сделать это, выбрав стра- тегию, соответствующую нижней точке буквы V, то есть ми- нимум максимальных значений. Этой точке соответствуют координаты y = 0,417, а показатель эффективности страте- гии – 79,6 процента.

    Равенство максимума минимальных значений (максими- на) бьющего игрока и минимума максимальных значений
    (минимакса) вратаря – это и есть теорема фон Неймана –
    Моргенштерна о минимаксе в действии. Возможно, было бы правильнее назвать ее теоремой о равенстве максимина и минимакса, но общепринятое название короче и легче запо- минается.
    Неожиданные последствия
    изменений в смешанных стратегиях
    Даже в играх с нулевой суммой равенство смешанных стратегий обладает на первый взгляд необычными свойства- ми. Вернемся к примеру с футбольным пенальти и пред- положим, что вратарь усовершенствует навыки отражения штрафных ударов, сделанных с естественной для него сторо- ны (справа), что снизит показатель эффективности бьюще- го игрока с 70 до 60 процентов. Как это скажется на веро- ятности смешивания стратегий вратаря в разных пропорци- ях? Ответ на этот вопрос можно получить, сместив соответ- ствующую линию на графике. Число позиций «слева» в рав- новесной смешанной стратегии вратаря увеличится с 41,7
    до 50 процентов. Это означает, что, если вратарь усовершен- ствует навыки отражения штрафных ударов справа, он будет реже использовать эту сторону!
    Хотя на первый взгляд это кажется странным, причина
    вполне понятна. Когда вратарь улучшает свою способность отбивать пенальти справа, бьющий игрок начнет реже делать удары справа от вратаря. В ответ на увеличение числа уда- ров слева вратарь увеличит долю стратегий «слева» в своей смешанной стратегии. Смысл укрепления слабых навыков в том, что вам не придется пользоваться ими так часто.
    Вы можете проверить истинность этого утверждения, рас- считав долю ударов слева и справа в смешанной страте- гии бьющего игрока после такого изменения навыков вра- таря. Вы увидите, что доля ударов слева увеличится с 38,3
    до 47,1 процента.
    Работа вратаря над усилением навыка отражения ударов справа действительно принесет свои плоды: средний про- цент забитых мячей при равновесной смешанной стратегии снизится с 79,6 до 79,5.
    Если хорошо подумать, этот кажущийся парадокс подчи- няется обычной логике теории игр. То, что лучше всего для вас, зависит не только от вас самих, но и от действий дру- гих игроков. Именно к этому и сводится суть стратегической взаимозависимости.
    Учебный пример: джанкен на ступеньках
    157
    Действие происходит в суши-баре в деловой части Токио.
    Такаши и Уити сидят у стойки бара и пьют саке в ожида- нии своих заказов. Каждый из них заказал фирменное блю- до суши-бара – уни сашими (икра морского ежа). К сожале- нию, шеф-повар сообщает им, что у него осталась только од- на порция этого блюда. Кто из двух молодых людей уступит другому?
    В Америке эти двое могли бы подбросить монету. В Япо-
    157
    Описание этого примера впервые появилось в японском издании книги
    Thinking Strategically («Мыслить стратегически»). Пример был разработан в рамках исследовательского проекта, которым занимались Такаши Канно и Уити
    Шимазу во время учебы в Школе менеджмента Йельского университета. Они же перевели книгу на японский язык.
    нии они скорее сыграют в игру джанкен, на Западе более из- вестную как «камень, ножницы, бумага». Разумеется, к это- му моменту вы уже стали настоящими экспертами по этой игре, поэтому для того, чтобы несколько усложнить задачу,
    мы используем здесь один из ее вариантов, который называ- ется «джанкен на ступеньках».
    В этот вариант джанкена играют на ступеньках. Как и обычно, игроки одновременно выбрасывают знаки камня,
    ножниц и бумаги. Но теперь победитель очередного раунда поднимается вверх по лестнице: на пять ступенек, если он сыграл «бумагой» (раскрытая ладонь с пятью пальцами), на две ступеньки – в случае «ножниц» (два пальца) и на одну ступеньку – если выбросил «камень» (пальцы сложены в ку- лак). В случае ничьей игра повторяется. Как правило, побе- дителем становится тот, кто находится на верхней ступеньке лестницы. Мы немного упростим игру, приняв предположе- ние, что цель каждого игрока – как можно больше опередить соперника.
    Каким будет равновесное сочетание стратегий в этой вер- сии игры джанкен?
    Анализ примера
    Поскольку с каждой очередной ступенькой победитель продвигается вперед, а проигравший отстает, это игра с ну- левой суммой. Проанализировав все возможные пары ходов,
    получим матрицу игры. Выигрыши в этой таблице измеря- ются числом ступенек.
    Как найти равновесное сочетание выбрасывания «бума- ги», «ножниц» и «камня»? Мы уже рассказали о таких про- стых методах, как числовые расчеты и построение графика,
    которые применимы, когда у каждой стороны только одна альтернатива: удар справа и удар слева. Но в игре джанкен на ступеньках – три варианта выбора.
    Прежде всего необходимо выяснить, какие стратегии вой- дут в состав равновесной смешанной стратегии. В данном случае важны все три варианта. Для того чтобы убедиться в этом, представьте себе, что Уити никогда не будет выбрасы- вать камень. В таком случае Такаши не станет играть бума- гой; тогда Уити не будет выбрасывать ножницы. Если про- должить эту цепочку рассуждений, получится, что Такаши
    не будет использовать камень при условии, что Уити не ис- пользует бумагу. Если Уити никогда не будет выбрасывать камень, это сведет на нет все его стратегии, а значит, та- кое предположение было бы ложным. Аналогичные доводы подтверждают тот факт, что оставшиеся две стратегии тоже необходимо включить в смешанную стратегию Уити (и Та- каши).
    Теперь мы знаем, что в равновесной смешанной страте- гии должны присутствовать все три стратегии. Остается вы- яснить, когда именно они будут использоваться. Игроки за- интересованы в получении максимального выигрыша, а не в смешивании стратегий ради самого смешивания. Уити готов использовать камень, ножницы и бумагу методом случайно- го выбора только при условии, что все три стратегии в равной степени привлекательны. (Если бы камень обеспечивал Уити более высокий выигрыш, чем ножницы или бумага, то ему следовало бы играть только камнем, но такая стратегия не была бы равновесной.) Таким образом, особый случай, когда все три стратегии обеспечивают Уити один и тот же ожида- емый выигрыш, определяет структуру равновесной смешан- ной стратегии Такаши.
    Предположим, Такаши использует следующий принцип смешивания:
    p
    = вероятность того, что Такаши выбросит бумагу;
    q
    = вероятность того, что Такаши выбросит ножницы;

    1 – (p + q) = вероятность того, что Такаши выбросит камень.
    В таком случае, если Уити сыграет камнем, он будет от- ставать на пять ступенек, если Такаши сыграет бумагой (р),
    и выиграет одну ступеньку, если Такаши сыграет ножница- ми (q), а чистый выигрыш составит –5p + q. Точно так же
    Уити получит следующий выигрыш за счет каждой из своих стратегий:
    Камень: –5p + 1q + 0(1 – (p + q)) = –5p + q.
    Ножницы: 2p + 0q – 1(1 – (p + q)) = 3p + q – 1.
    Бумага: 0p – 2q + 5(1 – (p + q)) = –5p – 7q + 5.
    Эти три варианта могут быть в равной степени привле- кательными для Уити только при выполнении следующего условия:
    – 5p + q = 3p + q – 1 = –5p – 7q + 5.
    Решив эти уравнения, получим: p =
    1
    /
    8
    , q =
    5
    /
    8
    и (1 – p –
    q
    ) =
    2
    /
    8
    Это определяет структуру равновесной смешанной стра- тегии Такаши. Поскольку эта игра симметрична, Уити будет использовать свои стратегии по методу случайного выбора с такой же вероятностью.
    Обратите внимание на то, что, если и Уити, и Такаши ис- пользуют свое равновесное сочетание стратегий, их ожида- емый выигрыш за счет каждой стратегии будет равен нулю.
    К такому исходу игры приводят не все смешанные страте-
    гии, однако в симметричных играх с нулевой суммой возмо- жен только такой результат. Нет причин, почему Уити дол- жен находиться в более выгодном положении, чем Такаши,
    и наоборот.
    В главе 14 рассматривается еще один учебный пример,
    посвященный теме выбора и случая, –
    «Как обмануть всех:
    игровые автоматы Лас-Вегаса»

    1   ...   10   11   12   13   14   15   16   17   ...   38


    написать администратору сайта