Теория игр. Искусство стратегического мышления в бизнесе и жизни. Барри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство
Скачать 3.58 Mb.
|
Предварительные соображения по поводу решения дилеммы заключенных У игроков, столкнувшихся с дилеммой заключенных, есть монопольная политика. веские основания для достижения договоренности о сов- местных действиях, которые позволили бы уйти от ее реше- ния. Например, в Новой Англии рыболовы могут согласить- ся на ограничение улова ради сохранения рыбных ресурсов на будущее. Проблема состоит только в том, как обеспечить выполнение таких договоренностей в условиях, когда каж- дая сторона испытывает соблазн обмануть другую (напри- мер, выловить рыбы больше, чем позволяет квота). Что го- ворит теория игр по этому поводу? И что происходит в таких случаях в реальной жизни? С тех пор как дилемму заключенных сформулировали впервые, прошло более пятидесяти лет. За это время бы- ли усовершенствованы теоретические основы этой дилем- мы, а также накоплен большой объем данных, полученных как в процессе наблюдений за тем, что происходит в реаль- ной жизни, так и в ходе лабораторных экспериментов. Давай- те проанализируем этот материал и посмотрим, какие уроки мы можем из него извлечь. У стратегии сотрудничества есть обратная сторона: стремление избежать предательства. Игрока можно заинте- ресовать в том, чтобы он выбрал стратегию сотрудничества вместо доминирующей стратегии предательства, пообещав ему достаточное вознаграждение. Кроме того, его можно удержать от применения стратегии предательства с помощью адекватного наказания. Метод вознаграждения проблематичен по нескольким причинам. Вознаграждение может носить внутренний ха- рактер: один игрок платит другому за выбор стратегии со- трудничества. В иных случаях вознаграждение может быть внешним: третья сторона, заинтересованная в сотрудниче- стве между двумя игроками, платит им за выбор этой стра- тегии. Как бы там ни было, вознаграждение нельзя предо- ставлять игроку, пока он не сделает свой выбор, в против- ном случае он просто положит его себе в карман, после че- го откажется выполнять договоренность. С другой стороны, если вознаграждение просто обещают, игрок может не пове- рить этому обещанию: когда он выберет стратегию сотруд- ничества, не исключено, что тот, кто дал это обещание, на- рушит его. Однако, несмотря на все эти трудности, вознаграждение бывает действенным и полезным. Проявив максимум кре- ативности и воображения, игроки могли бы одновременно дать друг другу обещания и сделать их заслуживающими до- верия, поместив обещанное вознаграждение на счете услов- ного депонирования, который контролирует третья сторо- на 80 . В реальной жизни чаще складывается иная ситуация: поскольку игроки взаимодействуют по нескольким направ- 80 На основании этой идеи Джеймс Андреони и Хэл Вэриан разработали экс- периментальную игру под названием Zenda. См. Preplay Communication in the Prisoners’ Dilemma, Proceedings of the National Academy of Sciences 96, no. 19 (September 14, 1999): 10933–10938. Мы проводили эту игру на занятиях и при- шли к выводу, что она обеспечивает сотрудничество между игроками. Однако в реальных условиях достичь этого гораздо труднее. лениям, сотрудничество в одном из них вознаграждается от- ветной услугой в чем-то другом. Так, самки шимпанзе делят- ся едой или присматривают за чужими детенышами в обмен на помощь в уходе за шерстью. В некоторых случаях третья сторона может быть заинтересована в обеспечении сотруд- ничества в игре. Например, ради того чтобы положить ко- нец конфликтам в разных странах мира, Соединенные Шта- ты Америки и Европейский союз иногда обещают участни- кам противостояния экономическую помощь в качестве воз- награждения за мирное решение конфликта. Именно таким способом Соединенные Штаты вознаградили Израиль и Еги- пет за сотрудничество в рамках подписания Кэмп-Дэвид- ских мирных соглашений в 1978 году. Более распространенный метод решения дилеммы заклю- ченных – наказание. Он имеет прямое действие. В фильме «Секреты Лос-Анджелеса» сержант Эд Эксли обещает Ле- рою Фонтейну, одному из подозреваемых, что если он согла- сится стать государственным свидетелем, то получит более мягкий приговор, чем два других подозреваемых, Рэй Коутс и Тайрон Джонс. Но Лерой знает, что, когда он выйдет из тюрьмы, его могут ждать на свободе друзья этих двоих! Наказание, которое в данном контексте выглядит бо- лее естественным, оказывается возможным в связи с тем, что большинство подобных игр представляют собой часть непрерывного взаимодействия. Обман может обеспечить од- ному игроку краткосрочное преимущество, но навредит его взаимоотношениям с другим игроком и в долгосрочной пер- спективе обойдется гораздо дороже. Если цена достаточно велика, именно это может удержать игрока от обмана 81 Наглядный пример такой ситуации предоставляет бейс- бол. В Американской бейсбольной лиге питчеры попадают мячом в бэттеров на 11–17 процентов чаще, чем в Наци- ональной бейсбольной лиге. По мнению профессоров Уни- верситета Юга в Суони Дага Драйнена и Джона-Чарльза Бр- эдбери, это обусловлено правилом о назначенном хиттере 82 В Американской бейсбольной лиге питчеры не бьющие иг- роки. Следовательно, питчер Американской лиги, который попадает мячом в бэттера, может не бояться ответных дей- ствий со стороны питчера команды-соперника. Вероятность того, что мяч попадет в питчера, совсем небольшая, но она повышается в четыре раза, если он попал в кого-то в преды- дущей половине иннинга. В таком случае страх получить от- ветный удар очевиден. Первоклассный питчер Курт Шил- линг объяснил это так: «Вы на самом деле готовы бросить в кого-то мяч, если играете против Рэнди Джонсона?» 8384 81 В 2005 году Роберт Ауман получил Нобелевскую премию по экономике за выдающийся вклад в разработку общей теории кооперации в повторяющихся иг- рах. 82 Об этом идет речь в их рабочем докладе Identifying Moral Hazard: A Natural Experiment in Major League Baseball, доступ к которому можно получить здесь: http://ddrinen.sewanee.edu/Plunk/dhpaper.pdf 83 Рэндалл Дэвид Рэнди Джонсон – американский профессиональный бейсбо- лист. Скорость его подач часто превышала 160 км/ч. – Прим. ред. В ситуации, когда один игрок наказывает другого за об- ман, действует стратегия «око за око, зуб за зуб». Эта страте- гия оказалась настоящим открытием, сделанным в ходе са- мого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках. Стратегия равноценных ответных действий В начале 1980-х годов политолог Мичиганского универ- ситета Роберт Аксельрод предложил специалистам по тео- рии игр со всего мира разработать стратегии решения ди- леммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгры- вала дилемму заключенных 150 раз. На основании набран- ных очков составили рейтинг программ, принимавших уча- стие в турнире. Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился боль- шой неожиданностью, поэтому он решил провести еще один 84 В то время Шиллинг был питчером команды Arizona Diamondbacks Нацио- нальной бейсбольной лиги, а обладатель приза Сая Янга Рэнди Джонсон – его товарищем по команде. Источник: Ken Rosenthal, “Mets Get Shot with Mighty Clemens at the Bat,” Sporting News, June 13, 2002. турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил. Стратегия равноценных ответных действий – один из ва- риантов правила поведения «поступайте с другими так, как они поступают с вами» 85 . Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял со- перник на предыдущем этапе. По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые 85 В книге «Исход» (21:22–25) сказано: «Когда дерутся люди, и ударят бере- менную женщину, и она выкинет, но не будет [другого] вреда, то взять с [винов- ного] пеню, какую наложит на него муж той женщины, и он должен заплатить оную при посредниках; а если будет вред, то отдай душу за душу, глаз за глаз, зуб за зуб, руку за руку, ногу за ногу, обожжение за обожжение, рану за рану, ушиб за ушиб». Новый Завет проповедует поведение, основанное на принципах сотрудничества. В Евангелии от Матфея (5:38–39) сказано: «Вы слышали, что сказано: око за око и зуб за зуб. А Я говорю вам: не противься злому. Но кто ударит тебя в правую щеку твою, обрати к нему и другую». Таким образом, мы перешли от правила «Поступайте с другими так, как они поступают с вами» к зо- лотому правилу: «И как хотите, чтобы с вами поступали люди, так и вы посту- пайте с ними» (Евангелие от Луки 6:31). Если бы люди всегда придерживались золотого правила, дилеммы заключенных просто не существовало бы. Если мыс- лить более широко, становится очевидным следующий вывод: хотя сотрудниче- ство может снизить ваш выигрыш в той или иной игре, возможное вознаграж- дение в жизни после смерти может сделать эту стратегию целесообразной даже для эгоиста. Вы считаете, что загробной жизни нет? Пари Блеза Паскаля гласит: если действовать, опираясь на это предположение, последствия могут оказаться катастрофическими, поэтому лучше выбрать другой вариант. должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, добро- желательность, возмездие и прощение. Стратегия равноцен- ных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следую- щим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует об- ман. В этой стратегии есть элемент возмездия: она не остав- ляет обман безнаказанным. Кроме того, эта стратегия сти- мулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество. Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она по- казала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем слу- чае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноцен- ных ответных действий имела бы на своем счету только про- игрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира 86 86 Поскольку на каждого проигравшего приходится один победитель, это неиз- бежно приводит к тому, что у одного из участников соревнования окажется в итоге больше побед, чем поражений, а у других – больше поражений, чем побед. (Единственное исключение составляет ситуация, когда каждый поединок закан- чивается вничью.) Однако Аксельрод оценивал парные игры между компью- терными программами не по принципу «победитель получа- ет все»: в его турнирах учитывался такой фактор, как готов- ность к сотрудничеству. Большое преимущество этой стра- тегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из- за одного предательства, но дальше – только ничья. Стратегия равноценных ответных действий стала победи- телем этих соревнований именно потому, что стимулирова- ла сотрудничество, не допуская при этом эксплуатации. Дру- гие стратегии были либо слишком ориентированными на до- верие и открытыми для эксплуатации, либо слишком агрес- сивными и побуждающими игроков выбивать друг друга из игры. И все-таки мы считаем, что стратегия равноценных ответ- ных действий – ошибочная. Малейший промах или непра- вильное толкование результатов приводят к полному про- валу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбеж- ны, а результат может оказаться катастрофическим. Проблема стратегии равноценных ответных действий со- стоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоя- нии может и не наступить момент, когда одна из сторон при- няла бы наказание без ответного удара. Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все скла- дывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавли- вается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад вы- берет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяют- ся ролями. Ситуация, когда один из игроков выберет сотруд- ничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство. Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и араба- ми на Ближнем Востоке, или между католиками и протестан- тами в Северной Ирландии, или между индусами и мусуль- манами в Индии. На границе между штатами Западная Вир- джиния и Кентукки шла памятная вражда между Хэтфилда- ми и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут при- вести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена. Да из-за чего же вышла ссора, Бак? Из-за земли? – Я не знаю. Может быть. – Ну а кто же первый стрелял? Грэнджерфорд или Шепердсон? – Господи, ну почем я знаю! Ведь это так давно было. – И никто не знает? – Нет, папа, я думаю, знает, и еще кое-кто из стариков знает; они только не знают, из-за чего в самый первый раз началась ссора 87 Стратегия равноценных ответных действий не предпо- лагает возможности остановить этот порочный круг. Она слишком ориентирована на возмездие и недостаточно сти- мулирует прощение. В следующих версиях соревнований, которые устраивал Роберт Аксельрод, предусматривалась возможность ошибок и заблуждений; в итоге другие, более бескорыстные, стратегии показали свое превосходство над стратегией равноценных ответных действий 88 87 Твен М. Приключения Тома Сойера и Гекльберри Финна / Пер. Нины Дарузес. – М.: НИГМА, 2013. 88 В 2004 году Грэм Кендалл из Ноттингемского университета организовал со- ревнование в честь двадцатилетия первого турнира, который провел Роберт Ак- сельрод. Победителем стала группа исследователей из Саутгемптонского универ- Здесь мы можем научиться чему-то даже у обезьян. В хо- де одного эксперимента с хохлатыми тамаринами одной из обезьян давали возможность потянуть рычаг, чтобы другая могла достать пищу. Однако для того, чтобы потянуть рычаг, следовало приложить усилие. Теоретически каждой обезья- не было бы выгоднее ничего не делать, пока партнер тянет рычаг. Но тамарины научились сотрудничать, чтобы избе- жать возмездия. Их сотрудничество сохранялось до тех пор, пока одна из обезьян два раза подряд не совершила преда- тельство. Эта стратегия представляет собой разновидность стратегии «зуб за зуб», а именно – «два зуба за зуб» 89 ситета. Группа из Саутгемптона предложила стратегию, состоящую из 60 эле- ментов: 59 «воинов» и одной «королевы». Все эти программы начинались с од- ной и той же комбинации символов, для того чтобы программы могли узнавать друг друга. Стратегия была разработана таким образом, что программы-воины приносили себя в жертву, давая королеве возможность добиться успеха. Кроме того, программы-воины отказывались сотрудничать с программами-соперника- ми, чтобы сократить их счет. Иметь в своем распоряжении армию воинов, гото- вых пожертвовать собой, – это действительно один из способов увеличить свой выигрыш, однако этот способ ничего не говорит нам о том, как решить дилемму заключенных. 89 Результаты эксперимента описаны в статье: M. Keith Chen and Marc Hauser, “Modeling Reciprocation and Cooperation in Primates: Evidence for a Punishing Strategy,” Journal of Theoretical Biology 235, no. 1 (May 2005): 5–12. Видеозапись эксперимента можно посмотреть здесь: www.som.yale.edu/faculty/ keith.chen/datafilm.htm Более поздние эксперименты Дилемма заключенных стала объектом тысяч экспери- ментов с участием разного числа игроков, с повторениями и с другой трактовкой условий игры. Вот некоторые важные выводы, сделанные в ходе этих экспериментов 90 Первый и самый важный вывод состоит в том, что игроки выбирают стратегию сотрудничества достаточно часто, да- же если два игрока попадают в одну пару только один раз. В среднем почти половина игроков отдают предпочтение сотрудничеству. Самое впечатляющее доказательство это- го факта было получено в ходе проведения телевиктори- ны Friend or Foe («Друг или враг») на канале Game Show Network. Командам из двух человек задавали достаточно простые вопросы. Деньги, полученные участниками за пра- вильные ответы, уходили в «трастовый фонд»; за 105 эпи- зодов в таком фонде накапливалось от 200 до 16 400 долла- ров. Для того чтобы разделить эти деньги, двум участникам предстояло решить следующую дилемму. Каждый игрок должен был написать на листе бумаги сло- во «друг» или «враг». Если оба написали «друг», деньги де- лились поровну. Если один игрок написал «враг», а другой – «друг», весь выигрыш получал тот, кто написал «враг». Но 90 См. Camerer, Behavioral Game Theory, 46–48. если оба игрока написали «враг», ни один из них не полу- чал ничего. Что бы ни сделала другая сторона, каждый иг- рок мог получить минимум столько же, сколько его соперник (или даже больше), если бы он написал «враг», а не «друг». Тем не менее почти половина участников шоу писали сло- во «друг». Даже когда призовой фонд увеличивался, вероят- ность того, что игроки выберут сотрудничество, оставалась прежней. Люди были в равной степени готовы сотрудничать, когда на кону стояло три и пять тысяч долларов. К таким же выводам пришли в ходе исследований Феликс Оберхоль- цер-Джи, Джоэль Вальдфогель, Мэтью Уайт и Джон Лист 91 Если вы сомневаетесь, можно ли считать телевизионное шоу научным исследованием, обратите внимание на следу- ющий факт: участникам телевикторины выплатили более 700 тысяч долларов. У этого эксперимента с дилеммой за- ключенных оказалось самое лучшее финансирование за всю историю экспериментов такого рода. Кроме того, по резуль- татам викторины было сделано много важных выводов. Ока- залось, что женщины в большей степени готовы идти на со- трудничество, чем мужчины: 53,7 процента (в первом се- зоне – 47,5 процента). В первом сезоне участники шоу не 91 См. Felix Oberholzer-Gee, Joel Waldfogel, and Matthew W. White, “Social Learning and Coordination in High-Stakes Games: Evidence from Friend or Foe,” NBER Working Paper No. W9805, June 2003. Available at SSRN: http://ssrn.com/ abstract=420319. См. также John A List, “Friend or Foe? A Natural Experiment of the Prisoner’s Dilemma,” Review of Economics and Statistics 88, no. 3 (2006): 463– 471. имели возможности увидеть результаты других состязаний перед тем, как принимать решение. А вот во втором се- зоне были оглашены результаты первых 40 эпизодов, что позволяло увидеть закономерность. Участники шоу учились на опыте своих предшественников. Если команда состояла из двух женщин, коэффициент сотрудничества повышался до 55 процентов, а когда в состав команды входили одна жен- щина и один мужчина, этот коэффициент падал до 34,2 про- цента. У мужчин в этом случае коэффициент сотрудниче- ства тоже снижался до 42,3 процента. В целом готовность участников шоу сотрудничать уменьшалась на десять пунк- тов. Когда группу участников эксперимента несколько раз раз- бивают по парам, каждый раз формируя новые пары, число людей, которые выбирают сотрудничество, со временем со- кращается. Тем не менее это число не сводится до нуля; вме- сто этого формируется небольшая группа участников экс- перимента, неизменно отдающих предпочтение сотрудниче- ству. Если одна и та же пара играет в базовую игру с дилем- мой заключенных много раз подряд, в большинстве случа- ев образуется весьма значительная последовательность вза- имного сотрудничества; это продолжается до тех пор, по- ка один из игроков уже в самом конце серии игр не выбе- рет стратегию предательства. Именно это произошло в ходе первого эксперимента с дилеммой заключенных. Как толь- ко Меррил Флад и Мелвин Дрешер придумали эту игру, они предложили двум своим коллегам сыграть в нее 100 раз 92 В 60 раундах игры оба участника выбрали стратегию сотруд- ничества. Длинный период взаимного сотрудничества про- должался с 83-го по 98-й раунд, пока в 99-м раунде один из игроков не выбрал стратегию предательства. Если следовать строгой логике теории игр, то в действи- тельности этого не должно было произойти. Если игра по- вторяется ровно 100 раз, она представляет собой серию игр с одновременными ходами, а значит, мы можем применить к ней логику обратных рассуждений. Определите, что про- изойдет в сотом раунде. Это последний раунд игры, поэто- му предательство не может быть наказано в следующих ра- ундах. В таком случае, согласно принципу доминирующей стратегии, оба игрока должны выбрать в последнем раунде стратегию предательства. Но как только принимается такое предположение, последним становится, по сути, 99-й раунд. Хотя игрокам предстоит еще один раунд, выбор стратегии предательства в 99-м раунде не может быть наказан в 100- м раунде, поскольку сделанный в этом раунде выбор пред- определен. Следовательно, логика доминирующей стратегии применима и к 99-му раунду. Эти рассуждения можно про- должить до первого раунда. Однако в реальной игре, будь то в лаборатории или в реальном мире, игроки склонны иг- 92 Подробное описание этого эксперимента можно найти здесь: Poundstone, Prisoner’s Dilemma, 8–9; and Sylvia Nasar, A Beautiful Mind, 118–119. норировать эту логику и пытаются извлечь выгоду из взаим- ного сотрудничества. Поведение, которое на первый взгляд может показаться иррациональным (отказ от доминирующей стратегии), оказывается правильным выбором при условии, что другие игроки ведут себя столь же иррационально. Специалисты по теории игр предлагают следующее объ- яснение этого феномена. В этом мире есть люди, которые всегда поступают с другими так, как поступают с ними; та- кие люди готовы сотрудничать до тех пор, пока другие дела- ют то же самое. Предположим, вы не принадлежите к чис- лу этих достаточно милых людей. Если бы в игре с конеч- ным числом повторений вы вели себя так, как того требует ваш тип личности, вы начали бы с обмана. Это раскрыло бы ваш характер другому игроку. Для того чтобы скрыть прав- ду (хотя бы на какое-то время), вам придется вести себя до- стойно. Зачем вам делать это? Предположим, вы начнете иг- ру, поступив порядочно. Если другой игрок не относится к тем, кто всегда платит той же монетой, он подумает, что вы, возможно, принадлежите к числу тех немногих людей, ко- торых можно назвать порядочными. Временное сотрудниче- ство может принести определенную выгоду, поэтому другой игрок, желая получить эту выгоду, попытается ответить на вашу порядочность тем же. Это пойдет на пользу и вам. Ра- зумеется, при этом вы (так же, как и другой игрок) планиру- ете перейти к стратегии предательства к концу игры. Тем не менее на начальном этапе игры вы оба можете поддерживать взаимовыгодное сотрудничество. Хотя каждый игрок ждет момента, когда удастся воспользоваться порядочностью дру- гого, этот взаимный обман приносит пользу им обоим. В ходе некоторых экспериментов вместо распределения испытуемых по парам и проведения серии игр с дилем- мой заключенных организуется большая игра с участием всей группы. Мы хотим привести здесь особенно интерес- ный и поучительный пример. Профессор Реймонд Батта- лио из Техасского сельскохозяйственно-машиностроитель- ного университета организовал следующую игру с участием 27 студентов 93 . Все студенты, якобы владельцы гипотетиче- ских компаний, должны были решить (одновременно и неза- висимо друг от друга, написав свое решение на листике бу- маги), какой объем продукции будет выпускать их компании: 1, который поможет сохранить совокупное предложение на низком уровне, а цены – на высоком, или 2, который позво- лит получить дополнительный доход за счет других. В зави- симости от числа студентов, которые выберут объем продук- ции 1, деньги будут выплачены им по следующей схеме: 93 Jerry E. Bishop, “All for One, One for All? Don’t Bet On It,” Wall Street Journal, December 4, 1986. На графике эта схема представлена в наглядном виде. Игра построена таким образом, чтобы студенты, выбрав- шие 2 («предать»), всегда получали на 50 центов больше, чем студенты, выбравшие 1 («сотрудничать»), но чем боль- ше студентов выбирают 2, тем меньше их совокупный выиг- рыш. Предположим, все 27 студентов начинают с выбора 1; в таком случае каждый из них получит по 1,08 доллара. А теперь представьте себе, что один из них переключается на вариант 2. В игре остается 26 студентов, выбравших 1; каж- дый из них получит по 1,04 доллара (на 4 цента меньше, чем по первоначальному плану), но студент, изменивший страте- гию, получит 1,54 доллара (на 46 центов больше). Такое рас- пределение выигрыша не зависит от первоначального числа студентов, намеревающихся выбрать 1, а не 2. В данном слу- чае вариант 2 – это доминирующая стратегия. Каждый сту- дент, который переключается со стратегии 1 на стратегию 2, увеличивает свой выигрыш на 46 центов, но в то же вре- мя сокращает выигрыш каждого из оставшихся 26 участни- ков игры на 4 цента. Когда все участники игры начнут дей- ствовать эгоистично, пытаясь получить максимальный выиг- рыш, каждый из них получит по 50 центов. Если бы они мог- ли успешно объединить свои усилия и выбрать такой образ действий, который свел бы их общий выигрыш к минимуму, каждый из них получил бы по 1,08 доллара. А как вы сыгра- ли бы в эту игру? Когда эта игра проводилась на практике (один раз без об- суждения в группе, другой раз с обсуждением, для того что- бы выработать согласованные действия), число студентов, которые были готовы сотрудничать и выбрали вариант 1, ко- лебалось от 3 до 14. В последней игре, в которой студенты объединили свои усилия, их было 4. Совокупный выигрыш составил 15,82 доллара, что было на 13,34 доллара меньше, чем в том раунде игры, в котором студентам удалось догово- риться. «Я больше никогда в жизни не стану никому дове- рять!» – недовольно пробормотал студент, который больше всех выступал за согласованные действия. Но каким был его выбор? «Ну, я выбрал 2», – сказал он. Йоссариан понял бы его. В современных экспериментах с играми в дилемму заклю- ченных с несколькими участниками используется вариант, получивший название «игра со взносами в общий фонд». Каждому игроку предоставляется некая начальная сумма, скажем, 10 долларов. После этого он решает, какую часть этой суммы оставит себе и какую отдаст в общий фонд. За- тем экспериментатор удваивает сумму, накопившуюся в об- щем фонде, и делит ее поровну между всеми участниками игры (как теми, которые сделали взнос в общий фонд, так и теми, которые оставили всю сумму себе). Предположим, в группу входят четыре игрока: А, Б, В и Г. Независимо от действий других игроков, если А решит вне- сти 1 доллар в общий фонд, после удваивания сумма в об- щем фонде увеличится на 2 доллара. Но 1,5 доллара доста- нется при этом игрокам Б, В и Г; сам игрок А получит всего 50 центов. Следовательно, игрок А потеряет еще больше де- нег, если увеличит взнос в общий фонд; напротив, он будет в выигрыше, если сократит размер этого взноса. И такая си- туация складывается независимо от того, какой взнос в об- щий фонд делают другие игроки (и делают ли они его вооб- ще). Иными словами, для игрока А доминирующая страте- гия состоит в том, чтобы не вносить в общий фонд ничего. То же самое верно и для игроков Б, В и Г. Согласно этой логике, каждый участник игры должен рассчитывать на то, что он сможет стать «безбилетником» – получить выгоду от действий других игроков, не делая никакого взноса в общий фонд. Если все четыре игрока будут придерживаться своей доминирующей стратегии, общий фонд останется пустым, а каждый участник игры просто сохранит свою первоначаль- ную сумму 10 долларов. Если каждый попытается проехать- ся «зайцем», автобус так и не сдвинется с места. С другой стороны, если бы каждый игрок внес в общий фонд всю име- ющуюся у него сумму – 10 долларов, после удваивания в фонде оказалось бы 80 долларов, а доля каждого игрока со- ставила бы 20 долларов. Но у каждого из них свои мотивы в такой игре. В этом и состоит их дилемма. Игра со взносами в общий фонд – это не только объект лабораторных экспериментов или теоретических изысканий; она разыгрывается в реальном мире в тех случаях социаль- ного взаимодействия, когда некое общее благо можно со- здать только благодаря добровольному вкладу членов груп- пы, но доступ к нему нельзя запретить тем членам группы, которые не внесли свой вклад в общее дело. Такая ситуа- ция складывается, например, в случаях борьбы с наводнени- ями или рационального использования природных ресурсов: дамбы или плотины невозможно построить так, чтобы па- водковые воды затопляли поля только тех обитателей дерев- ни, которые не принимали участия в строительстве проти- вопаводковых сооружений. Что касается рационального ис- пользования газа и рыбных ресурсов, на практике просто невозможно в будущем не допускать к этим ресурсам тех, кто сверх меры потреблял их в прошлом. Именно это и со- здает дилемму в игре с участием нескольких игроков: каж- дый игрок испытывает соблазн уклониться от работы или не делать взнос в общий фонд, рассчитывая на получение вы- годы от вклада других участников группы. Когда так рассуж- дают все игроки, результат совместных действий оказывает- ся совсем небольшим или вообще отсутствует, что негатив- но сказывается на всей группе. Эта ситуация встречается на- столько часто, что во всех областях социальной теории и со- циальной политики возникла потребность в глубоком пони- мании методов решения данной дилеммы. Возможно, самый интересный вариант этой игры – когда игрокам предоставляется возможность наказывать тех, кто нарушает принятое по умолчанию социальное соглашение о сотрудничестве. Однако связанные с этим издержки должны взять на себя все участники. После того как игра со взноса- ми в общий фонд завершена, информация о взносе каждого игрока доводится до сведения всех остальных. Затем прово- дится второй этап игры, в ходе которого каждый игрок может предпринять действия, направленные на сокращение выиг- рыша других игроков, но это обойдется ему в какую-то сум- му (как правило, около 33 центов) на каждый доллар того со- кращения, которое он выбрал. Иными словами, если игрок А решает сократить выигрыш игрока Б на три доллара, вы- игрыш игрока А сократится на один доллар. Деньги, высво- бодившиеся в результате такого сокращения, не передаются никому другому, а возвращаются в фонд экспериментатора. Результаты этого эксперимента говорят о том, что его участники склонны наказывать нарушителей социальных договоренностей (так называемых социальных обманщи- ков), взыскивая с них значительную сумму денег. Перспек- тива наказания существенно увеличивает размер взносов в общий фонд на первом этапе игры. По всей вероятности, наказание – это эффективный способ достижения сотрудни- чества, который приносит пользу всей группе. Однако тот факт, что люди действительно прибегают к этому методу, кажется неожиданным только на первый взгляд. Наказание других за свой счет – это уже вклад в общее благо. Это до- минируемая стратегия, но если она стимулирует обманщи- ка вести себя лучше в будущем, это приносит пользу всей группе, а наказавший получает только малую долю от этой выгоды. Следовательно, наказание должно быть следствием чего-то большего, чем сугубо эгоистический расчет. И это действительно так. В ходе ряда экспериментов проводилась позитронно-эмиссионная томография мозга игроков 94 . Ока- залось, что применение наказания активизирует дорсаль- ный стриатум – участок головного мозга, который отвеча- ет за удовольствие и удовлетворенность. Иными словами, люди действительно получают психологическую выгоду или удовольствие, наказывая нарушителей коллективных дого- воренностей. По всей вероятности, этот инстинкт имеет глу- бокие биологические корни и прошел процесс отбора пото- му, что обеспечивает эволюционное преимущество 95 94 Об этом идет речь в статье Thomas Hayden, “Why We Need Nosy Parkers,” U.S. News and World Report, June 13, 2005. Более подробную информацию можно найти здесь: D. J. de Quervain, U. Fischbacher, V. Treyer, M. Schellhammer, U. Schnyder, and E. Fehr, “The Neural Basis of Altruistic Punishment,” Science 305, no. 5688 (August 27, 2004): 1254–1258. 95 В своей книге «Страсти в пределах разумного» (Passions Within Reason. New York: W W. Norton, 1988) экономист Корнелльского университета Роберт Фр- энк утверждает, что эмоции, в частности чувство вины и любовь, тоже эволюци- онировали, а социальные ценности, такие как доверие и честность, были сфор- мированы и закреплены в качестве противовеса преходящей склонности чело- века к обману себе подобных, а также для того, чтобы обеспечить долгосрочные преимущества сотрудничества. А Роберт Райт в книге «Игра с ненулевой сум- мой» (Nonzero. New York: Pantheon, 2000) развивает идею о том, что механиз- мы, обеспечивающие взаимовыгодные результаты в игре с ненулевой суммой, во многом объясняют культурную и социальную эволюцию человека. |