Теория игр. Искусство стратегического мышления в бизнесе и жизни. Барри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство
Скачать 3.58 Mb.
|
Глава 3. Решение дилеммы заключенных Много контекстов – одна концепция Что общего между следующими ситуациями? • Две заправочные станции или два супермаркета, распо- ложенных в непосредственной близости друг от друга, время от времени начинают жесткие ценовые войны между собой. • Во время предвыборной кампании как Демократиче- ская, так и Республиканская партия США часто придержи- ваются центристской политики, пытаясь привлечь на свою сторону избирателей, не определившихся со своими предпо- чтениями; при этом они игнорируют основных сторонников, придерживающихся крайних левых и крайних правых взгля- дов. • «Разнообразие и продуктивность рыбного промысла в Новой Англии достигли беспрецедентного уровня. Однако сформировавшаяся за прошедшее столетие тенденция чрез- мерного промысла привела к вымиранию одного вида ры- бы за другим. Атлантический палтус, морской окунь, трес- ка, желтохвостая камбала… пополнили ряды тех видов, ко- торые считаются сейчас вымершими с точки зрения коммер- ческого промысла» 66 • В конце известного романа Джозефа Хеллера Catch-22 67 Вторая мировая война уже почти завершилась. Йоссариан не хочет быть среди тех, кто погибнет последним: это уже никак не повлияет на исход войны. Он объясняет это май- ору Денби, старшему по званию офицеру. Денби спрашива- ет его: «Но, Йоссариан, представь себе, что получится, если каждый американец станет рассуждать подобным образом?» Йоссариан отвечает ему: «Только круглый дурак рассуждает иначе. Разве я не прав?» 68 Ответ: все это примеры дилеммы заключенных 69 . Как и во 66 Цитата взята из статьи «Краткая история рыбного промысла в Новой Ан- глии» (Brief History of the Groundfishing Industry of New England), опубликован- ной на сайте правительства США: www.nefsc.noaa.gov/history/stories/groundfish/ grndfsh1.html 67 В переводе Андрея Кистяковского – «Поправка-22»; в других переводах – «Уловка-22». Прим. пер. 68 Хеллер Дж. Уловка-22. М.: Издательский концерн А-2, 1992; Хеллер Дж. Поправка-22. СПб.: Амфора, 2012. 69 Нет никаких призов за правильный ответ, ведь дилемма заключенных – те- ма данной главы. Однако мы решили воспользоваться этой возможностью, что- бы обратить ваше внимание (как мы это сделали и в главе 2) на то, что общая концептуальная модель теории игр поможет понять ряд разнообразных и на пер- вый взгляд несвязанных явлений. Мы должны также отметить, что расположен- ные по соседству магазины не ведут ценовые войны постоянно, а политические партии не всегда тяготеют к центристской позиции. Анализ и примеры того, как участники подобных игр могут избежать такой дилеммы или решить ее, – важ- время допроса Дика Хикока и Перри Смита (героев романа «Хладнокровное убийство», о которых шла речь в главе 1 ), у каждого участника игры есть свои причины сделать то, что повлечет за собой неблагоприятные последствия для обоих, поскольку каждый из них отслеживает только собственные интересы. Если один признается в совершении преступле- ния, другому тоже лучше признаться, чтобы избежать суро- вого приговора; если один решит воздержаться от призна- ния, другой сможет значительно облегчить свою участь, если признается. В действительности заключенные испытывают в подобной ситуации настолько сильное давление, что у них появляется желание признать свою вину независимо от того, виновны они (как в романе «Хладнокровный убийца») или невиновны, но полиция сфабриковала против них дело (как в фильме «Секреты Лос-Анджелеса»). То же самое происходит и с ценовыми войнами. Если ав- тозаправочная станция Nexon назначит низкую цену, Lunaco тоже лучше снизить цены, чтобы не потерять клиентов; ес- ли Nexon берет высокую цену за свой бензин, Lunaco может привлечь многих покупателей на свою сторону, снизив цену. Но если обе заправочные станции будут продавать бензин по низкой цене, ни одна из них ничего не заработает (хотя кли- ентам такая цена только на руку). Если демократы примут предвыборную платформу, ори- ентированную на сторонников центристской политики, рес- ная часть текущей главы. публиканцы рискуют потерять всех этих избирателей, а зна- чит, и проиграть выборы, если будут работать только со сво- ими основными сторонниками из числа борцов за экономи- ческие и социальные права; если демократы станут опекать только своих основных сторонников из числа представите- лей национальных меньшинств и профсоюзов, тогда респуб- ликанцы смогут привлечь на свою сторону умеренных изби- рателей, а значит, победить в выборах со значительным пе- ревесом голосов, придерживаясь более центристской пози- ции. Если все рыболовы будут ловить рыбу в умеренных коли- чествах, большой улов одного рыболова не истощит рыбные ресурсы; если же все остальные начнут активно увеличивать промысел, тогда любой отдельный рыболов поступил бы глу- по, пытаясь в одиночку охранять рыбные ресурсы 70 . В итоге происходит чрезмерный вылов рыбы и некоторые виды вы- мирают. В романе «Уловка-22» именно логика Йоссариана делает таким трудным дальнейшее участие в уже проигранной вой- не. 70 Биолог из Калифорнийского университета Гаррет Харлинг привлек всеоб- щее внимание к этой проблеме в своей знаменитой статье «Трагедия общин»: The Tragedy of the Commons, Science 162 (December 13, 1968): 1243–1248. Немного истории Как специалисты по теории игр изобрели и назвали эту игру, которая охватывает так много аспектов экономическо- го, политического и социального взаимодействия? Это про- изошло еще на начальном этапе истории развития дисципли- ны. Гарольд Кун, который и сам был одним из пионеров тео- рии игр, рассказал об этом на симпозиуме, который прово- дился в рамках церемоний вручения Нобелевской премии за 1994 год. Весной 1950 года Альберт Такер, будучи в отпуске, приехал в Стэнфорд, а поскольку там не хватало кабинетов, его разместили в кабинете кафедры психологии. Однажды кто-то из психологов постучал к нему в дверь и спросил, чем он занимается. Такер ответил: «Я работаю над теорией игр». Психолог спросил, не согласится ли он провести семинар по этой теме. Для этого семинара Такер и придумал дилемму заключенного в качестве примера, иллюстрирующего теорию игр, равновесие Нэша, а также парадоксы, сопутствующие равновесиям, нежелательным с точки зрения общества. Поскольку это был поистине фундаментальный пример, он стал темой десятков научных работ и ряда серьезных книг 71 71 The Work of John Nash in Game Theory, Nobel Seminar, December 8, 1994. Опубликовано на сайте http://nobelprize.org/nobel_prizes/economics/ Другие ученые рассказывают несколько иную историю. По их мнению, математическая структура игры была опи- сана еще до Такера двумя математиками – Меррилом Фла- дом и Мелвином Дрешером из Rand Corporation (исследова- тельский центр, который был в свое время оплотом холод- ной войны) 72 . Гениальность Такера заключалась в том, что он придумал историю, иллюстрирующую математические вы- кладки. И это действительно было гениально, поскольку по- дача идеи может решить ее судьбу: запоминающаяся презен- тация способствует быстрому распространению идеи среди мыслящих людей, тогда как скучная и сухая – может приве- сти к тому, что идея не получит должного внимания или во- обще будет забыта. Визуальное представление Мы проиллюстрируем метод решения этой игры приме- ром из бизнеса. Две конкурирующие компании посылочной торговли – Rainbow’s End и B. B. Lean – специализируются на торговле одеждой. Каждую осень они печатают и рассыла- ют зимние каталоги. Обе компании должны придерживать- ся тех цен, которые указаны в их каталогах, на протяжении всего зимнего сезона. Период подготовки каталогов гораздо laureates/1994/nash-lecture.pdf 72 William Poundstone, Prisoner’s Dilemma (New York: Doubleday, 1992), 8–9; Sylvia Nasar, A Beautiful Mind (New York: Simon & Schuster, 1998), 118–19. более продолжителен, чем окно для их рассылки, поэтому обе компании должны принимать решения о ценах одновре- менно, не имея никакой информации о решениях конкурен- та. В обеих компаниях знают, что их каталоги рассчитаны на общую аудиторию потенциальных покупателей, которые умеют делать покупки с умом и ищут низкие цены. Как правило, в обоих каталогах публикуется практически идентичный ассортимент товаров. Предположим, один из таких товаров – рубашка из высококачественной ткани шам- бре. Такая рубашка обходится каждой компании в 20 долла- ров 73 . По оценкам обеих компаний, если каждая из них на- значит за этот товар цену 80 долларов и продаст 1200 еди- ниц, это обеспечит прибыль в размере (80–20) × 1200 = 72 000 долларов. Кроме того, оказалось, что это наилучшая цена для обеих компаний: если они смогут договориться о том, чтобы назначить одинаковую цену, 80 долларов – это та цена, которая обеспечит обеим максимальную прибыль. В каждой из компаний подсчитали, что если одна из них снизит цену на 1 доллар, а другая оставит ее неизменной, то компания, снизившая цену, привлечет 100 покупателей: 80 покупателей, перешедших от другой компании, и 20 но- вых (например, тех, кто решил приобрести рубашку, кото- рую не стали бы покупать по более высокой цене, или поку- 73 Эта цена включает не только затраты на покупку рубашки и на китайского производителя, но и затраты на транспортировку в США, таможенные пошлины, а также на хранение товара до момента выполнения заказа. Иными словами, эта цена включает в себя все затраты, связанные с данным товаром. пателей, пожелавших заказать товар по каталогу, вместо того чтобы покупать его в местном торговом центре). Таким об- разом, у каждой компании есть соблазн назначить более низ- кую цену, чтобы привлечь больше покупателей. Цель всей этой истории – разобраться в том, чем может обернуться та- кое решение. Начнем с предположения о том, что обеим компаниям предстоит выбрать одну из двух цен: 80 и 70 долларов 74 . Ес- ли одна компания снизит цену до 70 долларов, а другая оста- вит цену 80, первая компания привлечет на свою сторону 1000 покупателей, тогда как вторая потеряет 800. Следова- тельно, компания, снизившая цену, продаст 2200 рубашек, а у другой компании объем продаж сократится до 400 еди- ниц; прибыль составит (70–20) × 2200 = 110 000 долларов у компании, снизившей цену, и (80–20) × 400 = 24 000 – у другой компании. Что произойдет, если обе компании одновременно сни- зят цену до 70 долларов? При снижении цены на 1 доллар у компаний останутся имеющиеся покупатели и появятся по 20 новых. Следовательно, если обе компании снизят цену на 10 долларов, каждая из них продаст на 10 × 20 = 200 еди- ниц товара больше предыдущих 1200 единиц. Таким обра- зом, каждая компания продаст по 1400 единиц товара и по- 74 Уточнение, касающееся наличия у компаний только двух вариантов цены, необходимо только для того, чтобы описать аналитический метод решения таких игр самым простым способом. В следующей главе мы предоставим компаниям большую свободу действий в отношении выбора цен. лучит прибыль в размере (70–20) × 1400 = 70 000 долларов. Представим возможную прибыль обеих конкурирующих компаний в наглядном виде. Мы не можем использовать для этого дерево игры наподобие тех деревьев, которые приведе- ны в главе 2 . В данном примере два игрока действуют одно- временно. Ни один из них не может сделать очередной ход, опираясь на информацию о том, что сделал другой игрок или какой ответный ход он может предпринять. Вместо этого каждый игрок должен анализировать, о чем в это же время думает другой игрок. Отправная точка для таких «рассужде- ний о рассуждениях» состоит в том, чтобы отобразить в на- глядном виде все последствия каждой комбинации возмож- ных вариантов выбора, который могут одновременно сделать обе компании. Поскольку у каждой из них только одна аль- тернатива: 80 или 70 долларов, это значит, что существует четыре возможные комбинации. Проще всего отобразить их в виде таблицы, состоящей из столбцов и строк, которую мы будем называть таблицей игры, или таблицей выигрышей. Выбор Rainbow’s End (сокращенно RE) будет отображен в строках этой таблицы, а выбор B. B. Lean (BB) – в столбцах. В каждой из четырех ячеек таблицы, соответствующих каж- дому выбору RE в строке и BB в столбце, содержатся две цифры, обозначающие прибыль каждой компании от прода- жи рубашки (в тысячах долларов). Цифра, расположенная в левом нижнем углу ячейки, соответствует тому игроку, для которого выделены строки; цифра в правом верхнем углу ячейки – игроку, для которого выделены столбцы 75 . На язы- ке теории игр эти цифры называются выигрышем 76 . Для того чтобы внести полную ясность в то, какие выигрыши соответ- ствуют каждому из игроков, в представленной таблице соот- ветствующие фрагменты ячеек выделены разными оттенка- ми серого цвета. 75 Этот способ представления выигрыша обоих игроков в одной таблице, поз- воляющий четко разграничить, какой выигрыш соответствует каждому игроку, изобрел Томас Шеллинг. Он с излишней скромностью написал по этому поводу следующее: «Если меня когда-либо спросят, внес ли я какой-нибудь вклад в тео- рию игр, я отвечу… да, это метод расположения всех выигрышей в шахматном порядке в одной матрице». На самом деле Шеллинг разработал много других важных концепций теории игр: фокальные точки, достоверность, обязательство, угрозы и обещания, перелом и многое другое. В следующих главах мы будем ча- сто ссылаться на Томаса Шеллинга и его работы. 76 Как правило, чем больше значение выигрыша, тем лучше для игрока. Однако в некоторых случаях (как, например, в случае заключенных, находящихся под следствием) выигрыш измеряется в числе лет, которые им предстоит провести в тюрьме, поэтому каждый заключенный стремится получить как можно меньше лет. То же самое происходит в случае, если выигрыш – это место в рейтинге, где первое место – самое лучшее. Анализируя таблицу игры, необходимо прежде всего определить, как интерпретируется выигрыш в этой игре. Прежде чем приступить к поиску решения этой игры, мы хотели бы обратить ваше внимание на один ее аспект. Срав- ните пары выигрышей в четырех ячейках. Лучший резуль- тат для RE не всегда означает худший результат для ВВ, и наоборот. В частности, для обеих компаний ситуация в ле- вой верхней ячейке лучше, чем в правой нижней. В конце этой игры не обязательно должен быть победитель и проиг- равший: это не игра с нулевой суммой. В главе 2 мы уже го- ворили о том, что инвестиционная игра Чарли Брауна тоже не относится к категории игр с нулевой суммой, как и боль- шинство игр, с которыми мы сталкиваемся в реальной жиз- ни. Во многих играх, таких как дилемма заключенных, глав- ный вопрос заключается в том, как избежать проигрыша или добиться выигрыша обеих сторон. Дилемма Проанализируем ход рассуждений менеджера компании RE. «Если ВВ выберет 80 долларов, я могу получить 110 ты- сяч долларов вместо 72 тысяч, снизив цену до 70 долларов. Если ВВ выберет 70 долларов, мой выигрыш составит 70 ты- сяч, если я тоже назначу эту цену, и только 24 тысячи долла- ров, если я оставлю цену 80. Для меня более выгодный вари- ант (в действительности самый выгодный, поскольку у меня только одна альтернатива) остается неизменным, что бы ни решили в ВВ. Следовательно, мне вообще не нужно думать о том, что думают они; мне просто нужно первым назначить цену 70 долларов». Если в игре с параллельными ходами есть такое свойство (а именно оптимальный выбор игрока не зависит от выбо- ра других игроков), это существенно упрощает рассуждения игроков, а также анализ, который делают специалисты по теории игр в подобных случаях. Следовательно, наличие та- кого свойства существенно упрощает решение игры. Специ- алисты по теории игр обозначают его термином «доминиру- ющая стратегия». Говорят, что у игрока есть доминирующая стратегия, если эта стратегия лучше всех остальных страте- гий независимо от того, какую стратегию или сочетание стра- тегий выберет другой игрок или игроки. Существует простое правило участия в играх с параллельными ходами 77 : ПРАВИЛО № 2: если у вас есть доминирующая стратегия, примените ее. Дилемма заключенных – еще более специфичная игра: в ней доминирующая стратегия есть не у одного, а у обоих игроков (или у всех игроков). Менеджер компании ВВ рас- суждает точно так же, как менеджер RE; для того чтобы хо- рошо усвоить эту идею, вы должны самостоятельно проана- лизировать ход рассуждений менеджера ВВ. Сделав это, вы увидите, что цена 70 долларов – это доминирующая страте- гия и для компании ВВ. Результат применения такой стратегии отображен в пра- вой нижней ячейке таблицы игры: обе компании назначают цену 70 долларов и получают прибыль по 70 тысяч долла- ров каждая. Необходимо обратить внимание на следующий аспект дилеммы заключенных, который делает ее настолько важной игрой. Когда каждый из игроков применяет свою до- минирующую стратегию, оба получают худший результат по 77 В главе 2 мы предложили вашему вниманию общий принцип разработки оп- тимальных стратегий для игр с последовательными ходами. Это было наше пра- вило № 1: смотрите вперед и рассуждайте в обратном порядке. В играх с парал- лельными ходами все не так просто. Тем не менее «рассуждения о рассуждени- ях», которые необходимы в играх с параллельными ходами, можно сформули- ровать в виде трех простых правил. Эти правила в свою очередь опираются на две простые концепции: доминирующие стратегии и равновесие. Правило № 2 представлено в данной главе; правила № 3 и 4 будут сформулированы в следую- щих главах. сравнению с тем, что они получили бы, если бы доверились друг другу и договорились о том, что каждый выберет дру- гую, доминируемую стратегию. В нашем примере это озна- чало бы, что каждая компания назначит на свой товар цену 80 долларов, для того чтобы получить результат, отображен- ный в верхней левой ячейке матрицы игры, а именно при- быль в размере 72 тысячи долларов 78 Для этого было бы недостаточно, чтобы только одна ком- пания назначила на свой товар цену 80 долларов: это повлек- ло бы за собой очень плохие последствия для этой компании. Так или иначе, обе компании должны назначить высокую це- ну, чего очень трудно добиться на практике, учитывая суще- ствующий у каждой из них соблазн назначить более низкую цену, чем у конкурента. Если обе компании будут преследо- вать свои эгоистические интересы, они не смогут получить наилучший результат для них обеих. Такой вывод противо- речит тому, чему учат нас классические экономические тео- рии, начиная с теории Адама Смита 79 78 В действительности 80 долларов – это та сумма, которая обеспечивает обеим компаниям максимальную прибыль. Они могли бы назначить эту цену, если бы объединились и создали картель в своей отрасли. Строгое доказательство этого утверждения требует математических расчетов, поэтому просто поверьте нам на слово. Читатели, которые захотят ознакомиться с этими расчетами, могут полу- чить доступ к ним на сайте книги. 79 Разумеется, такое снижение цен выгодно потребителям, которые не являют- ся активными участниками этой игры. Следовательно, в интересах общества в целом целесообразно сделать так, чтобы две компании не смогли решить дилем- му ценообразования. В США и в других странах эту функцию выполняет анти- Это вызывает ряд вопросов, часть которых связана с бо- лее общими аспектами теории игр. Что произойдет, если до- минирующая стратегия будет только у одного участника иг- ры? Что если ни у одного игрока не окажется доминирующей стратегии? Если оптимальный выбор каждого игрока зави- сит от того, что в это же время выбирает другой игрок, мо- гут ли они разгадать выбор друг друга и найти решение этой игры? Мы проанализируем ответы на эти вопросы в следую- щей главе, в которой рассматривается более общий подход к решению игр с параллельными ходами, а именно равновесие Нэша. В данной главе сосредоточимся на решении дилеммы заключенных. В обобщенном описании дилеммы заключенных две стра- тегии, имеющиеся в распоряжении каждого игрока, обозна- чаются так: «сотрудничать» и «предать» (или в некоторых случаях – «обмануть»); мы будем придерживаться именно этих терминов. Предательство – это доминирующая страте- гия для каждого игрока; если оба игрока выберут эту стра- тегию, их выигрыш будет меньше, чем в случае выбора стра- тегии сотрудничества. |