Хаим ШапираГладиаторы, пираты иигры на доверии. Какнами правят теория игр
Скачать 1.08 Mb.
|
Проблема стабильного брака (О любящих парах, изменах и Нобелевских премиях) Проблема свахи У свахи Зои есть список из 200 клиентов – 100 мужчин и 100 женщин. Каждая женщина дает ей свой перечень там выписаны имена всех ста мужчин в порядке предпочтений. На самом верху листа – Прекрасный Принц, ниже – не столь привлекательные варианты, итак до самого конца. Сто мужчин в списке Зои сделали тоже самое – и предоставили свахе списки женщин, выстроив их имена по предпочтениям. Теперь, как предполагают, Зоя должна подобрать каждому спутника иного пола и убедиться в том, что все они сочетаются браком, построят дома и будут относительно счастливо жить-поживать да добра наживать. Ясно, что некоторые клиенты не успокоятся на первом же варианте выбора. Если одного мужчину из списка выбрали две женщины или несколько женщин, – кому-то придется довольствоваться меньшим. Но даже если каждого из мужчин предпочитает всем не более чем одна женщина, а каждая женщина становится фавориткой не более чем для одного мужчины, это еще не гарантия блаженства. Рассмотрим такой пример (для ясности и наглядности я сократил список в нем осталось лишь трое мужчин и три женщины). Предпочтения мужчин: Рон : Нина, Джина, Йоко Джон : Джина, Йоко, Нина Пол : Йоко, Нина, Джина Предпочтения женщин: Нина : Джон, Пол, Рон Джина : Пол, Рон, Джон Йоко : Рон, Джон, Пол В моем примере каждый мужчина предпочел свою женщину, а каждая женщина – своего мужчину, и ничьи интересы не пересекаются – но здесь не только нет брака на небесах, здесь еще и есть повод для беспокойства. Будущие супруги будут пребывать в счастье и блаженстве только в том случае, когда фаворит каждой женщины сочтет именно ее своей мечтой – например, если Пол любит Джину, а она в ответ любит его если Нина сума сходит по Рону а он ее боготворит и если Джон – это Прекрасный Принц для Йоко, за которую он готов умереть. В таком случае мы можем получить вот такую табличку предпочтений. Предпочтения мужчин: Рон: Нина, Джина, Йоко Джон: Йоко, Нина, Джина Пол: Джина, Йоко, Нина Предпочтения женщин: Нина: Рон, Джон, Пол Джина: Пол, Рон, Джон Йоко: Джон, Рон, Пол А что, если трое мужчин поставят на первое место одну и туже женщину? Предпочтения мужчин: Рон: Нина, Джина, Йоко Джон: Нина, Джина, Йоко Пол: Нина, Йоко, Джина Что в таком случае делать Зое? А если три женщины предоставят идентичные списки? Предпочтения женщин Нина Рон, Джон, Пол Джина : Рон, Джон, Пол Йоко : Рон, Джон, Пол Да, видимо, Зою ждет немало проблем… Теперь предположим, что у нас 10 мужчин и 10 женщин. Что лучше свести как можно больше людей сих фаворитами или по крайней мере с теми, кто занял в их списках второе место Или свести как можно меньше людей с теми, кому они отвели последние места»? На этот вопрос нет однозначных ответов. Впрочем, Зоя – женщина практичная. Она знает блаженства всем никто не обещали ставит себе гораздо более скромную цель. Ее задача – создать стабильные пары, в которых супруги не будут изменять друг другу. Что это значит в практическом смысле Итак, для того чтобы предотвратить измены, Зоя должна убедиться в том, что в ее парах никого не влечет сверх меры к кому-либо помимо супруга или супруги. Рассмотрим такие пары Пол и Нина, Рон и Джина. Итак, Пол женат на Нине, но, предположим, Джина нравится ему больше и при этом Пол нравится Джине больше, чем ее старый добрый Рон. При таком сочетании измены неизбежны. Заметьте, проблемы не будет, если Джина нравится Полу больше жены, но сама при этом любит мужа она просто отвергнет любые поползновения Пола. Кстати, если Пола больше влечет к Джине и это взаимно а Рон при этом предпочитает Нину, что тоже взаимно, все решается очень легко. Нужно только разорвать старые пары (Пол и Нина, Рон и Джина) и создать две новые и намного более счастливые Рон и Нина, Пол и Джина. Алгоритм Гейла – Шепли для стабильного брака В 1962 г. Ллойд Шепли – признанный американский математики обладатель Нобелевской премии 2012 г. по экономике и покойный американский математики экономист Дэвид Гейл (мыс ним встречались в главе про игру «Хрум!») продемонстрировали, как можно сочетать парами любые равные группы мужчин и женщин и избежать измен. Очень важно понять этот алгоритм не гарантирует счастья, только стабильность. Очень возможно, что Нина, выйдя замуж за Пола, будет мечтать о Джоне, но алгоритм гарантирует, что Джон любит свою жену больше, чем Нину. Это не значит, что Джон счастлив в браке, и, может быть, он даже грезит о другой женщине – но, если так, алгоритм убеждает в том, что эта женщина предпочитает Джону своего мужа. Итак далее… Алгоритм Гейла – Шепли довольно прости состоит из конечного числа итераций (раундов. Посмотрим, как он работает, на примере четверки мужчин (Брэд Питт, Джордж Клу- ни, Рассел Кроу и Дэнни де Вито) и четырех женщин (Скар- летт Йоханссон, Рианна, Кира Найтли и Адриана Лима. Алгоритм будет работать точно также при любом равном количестве мужчин и женщин. В таблице, приведенной ниже, представлены предпочтения мужчин: А предпочтения женщин таковы: Вместо того чтобы объяснять алгоритм, позвольте показать, как он работает на практике. В первом раунде каждый мужчина делает предложение своей фаворитке. Так, Брэд и Рассел претендуют на внимание Скарлетт, Дэнни выбирает Рианну, а Джордж взывает к Адриане. После этого каждая женщина выбирает мужчину, занявшего более высокое место в ее списке, – в том случае, если кавалеров больше одного. Если к ней обращается только один кавалер, они становится ее спутником, даже если стоит на низком месте в ее перечне желаний. А если к ней никто не подходит, она в этом раунде остается одна. Именно поэтому Скарлетт выбирает Брэда, которого поставила выше Рассела. Посмотрим на пары, которые у нас уже сформировались. Помните, это временно – они только помолвлены, но еще не женаты. Брэд – Скарлетт, Джордж – Адриана, Дэнни – Рианна В следующем раунде мужчины, у которых еще нет спутницы, делают предложение той женщине, которая еще их не отвергла и занимает самое высокое место в их списках. Единственным, кто не нашел себе спутницу, сейчас остается Рас- сел (кстати, именно он играл Джона Форбса Нэша, нобелевского лауреата, в фильме Рона Ховарда), ион предлагает Адриане принять его в спутники. Желание Адрианы быть с Расселом сильнее, нежели ее влечение к Джорджу, и потому она отзывает помолвку с Джорджем и объявляет о помолвке с Расселом. Теперь наши пары выглядят так: Брэд – Скарлетт, Рассел – Адриана, Дэнни – Рианна Единственным одиноким мужчиной теперь остается Джордж (Sic transit gloria mundi). Ион делает предложение Рианне, которая с радостью соглашается, ведь в ее списке Джордж стоял выше Дэнни (и ростом он повыше. Итак, наши пары: Брэд – Скарлетт, Рассел – Адриана, Джордж – Рианна Теперь одинок легендарный де Вито. Он обращается к Скарлетт, нота предпочитает Брэда. Еще один раунд – и ничего не меняется. Дэнни делает ставку на Адриану – но она счастлива с Расселом. В глубокой депрессии и на грани кризиса Дэнни испытывает удачу с Кирой – и та раскрывает ему объятия. Она так долго была одинока, что ее устраивает даже такой вариант. Алгоритм завершается, когда все мужчины нашли себе спутниц (и, поскольку обе группы численно равны, все женщины на этой стадии тоже помолвлены. А значит, нашими финалистами становятся: Брэд – Скарлетт, Рассел – Адриана, Джордж – Рианна, Дэнни – Кира И жили они счастливо (по крайней мере в чудесной стабильности) с тех самых пор. Довольно легко принять то, что пары, сформированные по алгоритму Гейла – Шепли, останутся стабильными но, чтобы устранить все сомнения, давайте это докажем. Если вам, мои читатели, не слишком по душе логический анализ и доказательства и если выверите в то, что алгоритм Гейла – Шепли работает безупречно, приглашаю вас перейти сразу к следующей части. Рад видеть, что вы решили остаться. Итак. Ясно, что алгоритм не может продолжаться до бесконечности. В самом неблагоприятном варианте все мужчины сделают предложение всем женщинам. Ясно, что число помолвленных мужчин всегда будет равняться числу помолвленных женщин. Также ясно и то, что, как только женщина помолвлена, она остается помолвленной (даже если меняется спутник. Кроме того, никто из группы по завершении процесса не может остаться вне помолвки. Достаточно сказать вот что если Рон напишет Нина в своем списке предпочтений (пускай и на последнем месте, а никто другой с ней быть не захочет, она в конце концов Рону и достанется. И потому алгоритм гарантирует, что никто не останется без пары. Но гарантирует ли он стабильность пар Да – и мы это докажем. Представьте, что Йоко замужем за Джорджем, а Нина – за Полом. Возможно ли, что Йоко предпочтет Пола своему нынешнему супругу – и при этом понравится ему больше его жены, что поставит пары на грань предательства? Ниже мы предположим, что это возможно, а потом коса найдет на камень – и логическое противоречие докажет, что это на самом деле невозможно. Итак, предположим, у насесть нестабильность – иными словами, две пары, Пол – Нина и Джон – Йоко, где Пола влечет к Йоко, а ее – к нему и оба желают быть друг с другом сильнее, чем со своими нынешними супругами. Согласно алгоритму, Полу следовало сделать Йоко предложение еще до того, как он отправился повидаться с Ниной (поскольку Йо- ко, по нашей предпосылке, получила более высокую оценку в его списке предпочтений. Теперь могут произойти два со- бытия: А. Йоко соглашается на предложение Пола. Б. Йоко отвечает отказом. Если произошло событие А, то почему Йоко не живет с Полом? А потому, что выбрала того, кому поставила более высокую оценку, – Джона или кого-либо еще. В любом случае, если она сейчас с Джоном, значит, она оценила его выше, нежели Пола. Вот и обещанное логическое противоречие. Если случилось событие Б, тогда, выходит, Йоко отвергает Пола, поскольку у нее есть лучший спутник (Джон или кто другой, – и при этом тот факт, что сейчас она с Джоном, доказывает, что Джон получил более высокую оценку, нежели Пол, и наша исходная предпосылка вновь оказывается противоречивой. В двух словах алгоритм завершается, у каждого есть супруги пары стабильны. А что, если женщины будут выбирать себе фаворитов? Наш пример с актерами даст те же самые пары здесь у настолько одно стабильное сочетание. Впрочем, так будет не всегда. Когда стабильных сочетаний несколько, а выбор совершают женщины, формирование пар проходит иначе. Неверно говорить о неверном выборе в любви как только выбор есть, верным он быть уже не может. Марсель Пруст Война полов следующий раунд Время вернуться к примеру, с которого началась эта глава, и напомнить себе о предпочтениях мужчин и женщин. Предпочтения мужчин: Рон : Нина, Джина, Йоко Джон : Джина, Йоко, Нина Пол : Йоко, Нина, Джина Предпочтения женщин: Нина : Джон, Пол, Рон Джина : Пол, Рон, Джон Йоко : Рон, Джон, Пол С первого же взгляда понятно, что на этот раз потребуется только один раунд. Мужчины делают предложение фаворитками пары выглядят так Рон – Нина, Джон – Джина и Пол – Йоко. Вот и все. Они определенно стабильны, ведь все мужчины нашли женщин своей мечты. Для мужчин это оптимальное решение. Впрочем, каждой женщине выпал спутник, которого она в своем списке определила в аутсайдеры, и вряд ли можно сказать, что женщины счастливы. Если предложение будут делать женщины, единственный раунд даст следующие пары Йоко – Рон, Джина – Пол и Нина Джон. Здесь каждая получает своего фаворита, а мужчинам предстоит провести всю жизнь с теми, кого они в своих списках оценили ниже всех. Итак, можно увидеть, что игра дает преимущество тем, кто делает предложение в первом раунде. (Кстати, здесь у насесть еще один стабильный вариант формирования пар Нина – Пол, Джина – Рон и Йоко – Джон. Прошу, проверьте эту стабильность – иными словами, убедитесь, что в этом случае не будет измен.) Футболисты без моделей Алгоритм Гейла – Шепли несложен, но и не тривиален. Если мы оставим в стороне предпосылку о двух полах и предположим, что четверо футболистов должны провести ночь перед важным матчем в номерах для двоих, возможно, у нас не получится найти стабильное решение в выборе подходящего соседа по комнате Проверьте – и увидите здесь не получится никаких стабильных пар. И Нобелевскую премию получает… Есть много сфер, где можно применить алгоритм Гейла – Шепли. Самая знаменитая – это назначение выпускников медицинских школ в больницы для прохождения интернатуры. Готов биться об заклад вы уже догадались, что больницы получили право предлагать первыми (и поэтому вопросу еще и сейчас ведутся судебные тяжбы. Другое важное применение стабильного брака – приписывание пользователей к серверам в интернете. В 2012 г. Рот и Шепли получили Нобелевскую премию за теорию стабильных распределений и практические наработки в сфере устройства рынков. Их работа была основана на алгоритме Гейла – Шепли. Гейл покинул наш мир в 2008 г, таки не получив премии, а Элвин Рот завоевал награду после того, как обнаружил другие важные области применения алгоритма Гейла – Шепли… и учредил в Новой Англии программу по обмену почками Интермедия. Игра в гладиаторов «Гладиаторы» – одна из моих любимых игр. На уроках, посвященных вероятностям или теории игр, я всегда привожу ее в пример. Это трудное упражнение в высшей степени рекомендовано истинным энтузиастам математики. Игра проходит так. Есть две группы гладиаторов – А (афиняне) и В (варвары. Предположим, что в группе А 20 гладиаторов, а в группе В – 30. У каждого гладиатора есть опознавательный номер, положительное целое число, обозначающее его силу (скажем, число килограммов, которые он может поднять. Гладиаторы сражаются друг с другом на дуэлях. Их шансы на победу соотносятся так когда гладиатор с силой 100 сражается с гладиатором с силой 150, для расчета его шансов на победу 100 делится на (100+150), ведь чем сильнее гладиатор, тем больше вероятность того, что он победит. Если силы двух гладиаторов, вышедших на дуэль, равны, шансы каждого конечно же составляют 50 %, и чем больше разрыв между ними, тем выше шансы более сильного гладиатора. У каждой группы есть тренер, который решает, каких гладиаторов выпустить на ринг, но решение он принимает только один раз. Он волен выслать самого сильного бойца первым или последним, нов любом случае победитель дуэли отправляется вконец очереди и ждет своего хода – у вас не получится сделать так, чтобы ваш самый сильный гладиатор сражался непрестанно. Тот, кто проиграл поединок, выбывает из состязания, а выигравший присваивает себе всю его силу иными словами, если Гладиатор 130» побеждает Гладиатора, последний выбывает из игры, а первый получает новое имя – Гладиатор 275». Игра кончается, когда водной из групп заканчиваются бойцы-гладиаторы, что, естественно, приводит к ее поражению. Какая стратегия будет здесь лучшей В каком порядке выпускать бойцов на ринг (Уделите себе минутку и подумайте об этом, прежде чем читать дальше.) Ответ довольно удивителен вам ненужен тренер. Порядок выхода бойцов никак не влияет на вероятность победы. Шансы на нее равны сумме сил всей команды гладиаторов, разделенной на общую сумму сил обеих команд. Докажите это (Подсказка не начинайте с общих случаев Это будет сложно. Начните с одного афинского гладиатора и двоих варваров потом проверьте, что случится с двумя афинянами и двумя варварами Надеюсь, вы сумеете найти паттерн. А еще можете попытаться прийти к решению методом индукции.) Не стану утверждать, будто это упражнение способно принести какие-то особые прозрения спортивным тренерам. Несомненно, тренеры важны, хотя иногда их важность слегка переоценивают 6. Крестный отец и «Дилемма заключенного» Эту главу я посвящаю самой популярной игре во всем репертуаре теории игр – Дилемме заключенного. Мы рассмотрим каждый аспект игры, включая и итеративную версию дилеммы, и узнаем кое-что действительно важное: эгоистическое поведение не только влечет проблемы с моралью, но и во многих случаях стратегически неразумно. Самая знаменитая и популярная игра в теории игр – это «Дилемма заключенного. Она развилась из эксперимента, который Мелвин Дрешер и Меррил Флад проводили в 1950- х гг. для корпорации RAND. А название ей дала одна история, которую в 1950 г, на лекции, посвященной данному эксперименту на факультете психологии в Стэнфорде, рассказал Альберт Такер. На эту тему написаны бесчисленные статьи, книги и докторские диссертации, и, верю, даже вне университетских стен о ней много кто хоть краем уха да слы- шал. Рассмотрим популярную версию игры. В ней участвуют двое с выразительными именами Аи Б. Они под арестом, в тюрьме, полиция подозревает их в совершении ужасного преступления, но материальных доказательств нет. Итак, полицейским необходимо их разговорить, и предпочтительнее всего, чтобы говорили они друг о друге. И вот задержанных ставят в известность если оба решат молчать, обоих на год упекут за решетку поболее легкой статье – припишут квартирную кражу со взломом или иной проступок. Прокуроры предлагают им сделку если один предаст другого, предателя тут же отпустят на свободу а вот другой за доказанное преступление будет приговорен к двадцати годам тюрьмы. Если каждый обвинит в преступлении другого, оба получат полет тюрьмы (скидка 10 % за помощь следствию. Заключенных сажают в разные камеры, и каждый должен принять решение, не видя другого, – иными словами, узнать, какое решение принял другой, ни один из них не может, пока окончательно не примет свое. В таблице, приведенной ниже, кратко представлены правила игры (числа обозначают годы тюремного заключения): Математики называют такой вид диаграмм платежной матрицей они не любят терминов вроде таблица или «схема» – а то еще, не дай бог, обычные люди поймут. Если честно, пока что история довольно скучна и трудно понять, почему столь многие о ней писали. Она становится интересной, когда мы начинаем раздумывать над тем, как нам играть. На первый взгляд ответ ясен обоим нужно молчать, провести год в тюрьме за счет налогоплательщиков и выйти на свободу даже раньше, чем в том случае, если бы оба стали примерными заключенными. Конец истории. И все же, будь все так просто, никто бы и не тревожился ни о какой «дилемме заключенного. А правда такова произойти здесь может что угодно. Чтобы на самом деле понять дилемму, встанем на минутку на место А: «Не знаю, что может сказать Били что он уже сказал, но знаю, что у него только два варианта молчать или предать. Если он будет молчать, а я тоже откажусь говорить – есть же, в конце концов, Пятая поправка – я проведу год в тюрьме. Но если я его предам, то могу выйти В смысле если он будет держать рот на замке, я выйду Что тут думать Толкнуть его под поезди дело с концом! С другой стороны, если он меня выдаст, а я буду молчать, я сгнию в тюрьме. Двадцать лет в аду – это долго. И если он начнет болтать, так надо бы и мне заговорить. Тогда я буду сидеть только 18 лет. Лучше, чем 20, правда? Есть! Я понял Лучше всего предать Ведь тогда я либо не пойду в тюрьму, либо просижу на два года меньше, а два года – это 730 дней на свободе Какой я умный Как сказано выше, это симметричная игра иными словами, оба игрока в равных условиях. Конечно же это означает, что Б в своей камере проводит такие же расчеты и приходит к тому же выводу, понимая, что предательство – это его лучший выбор. И что это нам дает Оба игрока рационально оценили друг друга, и итог оказался плохим для каждого. Я даже могу представить, как годом позже Аи Б прогуливаются по тюремному дворику, посматривают друг на друга, чешут затылки и гадают Как же так получилось Так странно! Если бы мы только лучше понимали Дилемму заключенного и суть этой игры, уже бы вышли на свободу!» В чем ошиблись Аи Б Да и ошиблись ли они В конце концов, если мы последуем их логике, то покажется, что оба, вероятно, поступили правильно решили сперва позаботиться о себе, и каждый понял, что ему лучше всего предать – вне зависимости оттого, что выбирал другой. И потому каждый предали ни один из них ничего от этого шага не получил. По сути, оба проиграли. Должно быть, мои умные читатели уже поняли, что этот итог – случай, когда игроки следуют стратегии предательства и платят ее цену (18, 18), – тоже является равновесием Нэша. Равновесие Нэша – это набор стратегий, в соответствии с которыми ни один игрок не сожалеет о выбранной стратегии и ее результатах – постфактум. (Не забывайте, что игроки контролируют только свои собственные решения.) Иными словами, логика такова если другой выбрал предательство, значит, я, тоже предав, поступил верно. Исход, 18) – это равновесие Нэша, ведь как только игроки выбрали стратегию предательства, один из них, решив в последнюю минуту хранить молчание, проведет 20 лет в тюрьме вместо 18, то есть проиграет и всю жизнь будет сожалеть о своем шаге. В тоже время он не будет сожалеть, если выберет стратегию предательства – стратегию Нэша. Так что здесь вопрос не о победе или поражении, а о том, будут ли игроки сожалеть о сделанном выборе, узнав о решении другого игрока. А вот молчание – это не стратегия Нэша. Ведь если вызнаете, что другой будет молчать, то вам лучше его предать. Так вы полностью избавите себя от опасности тюрьмы, и награда будет больше, чем за ваше молчание. Этот пример показывает, что, наряду с прочим, стратегия Нэша может быть неразумной вас приговаривают к 18 годам тюрьмы, когда вы могли отсидеть всего год. По сути, в Дилемме заключенного скрыт конфликт двух логических обоснований – личного и группового. Каждый заключенный делает лучший выбор для себя самого, но как группа страдают оба. Когда каждый игрок совершает лучший для себя выбор и не думает о том, какими последствиями обернутся его действия для других игроков, исходом может стать всеобщая катастрофа. Во многих ситуациях эгоистичное поведение не только влечет проблемы с моралью, но и стратегически нера- зумно. Так как нам решить эту головоломку? Вот один вариант предположим, что Аи Б – не рядовые преступники, а члены серьезной криминальной группировки. Вдень, когда они давали клятву, крестный отец предупредил их Возможно, вы слышали кое-что о Дилемме заключенного или даже читали о ней научные статьи. И вот что я вам скажу мы нетерпим предателей. Если вы предадите кого-то из своих, – почти прошептал он, – вы умолкнете очень надолго навечно. И не только вы мои люди заставят навеки умолкнуть каждого, кто вам дорог. Вы ведь знаете, мне по душе тишина». Теперь, когда мы знаем о таком, от дилеммы почти ничего не остается. Оба пленника прибегнут к Пятой поправке, откажутся говорить и даже выиграют на этом, ведь они отправятся в тюрьму только на год. Суть такова если сократить число вариантов выбора, итог оказывается лучше – вопреки расхожему мнению о том, что все иначе. И, когда крестный отец велит своим арестованным приспешникам быть тише воды и ниже травы, итог хорош для обоих преступников… хотя вот о полиции и законопослушных гражданах этого не скажешь. Еще один (юридический) пример возможного соглашения, способного разрешить Дилемму заключенного, – это переводной вексель, орудие делового мира. Торговец А выписывает вексель, по которому приказывает банку заплатить торговцу Б указанную сумму, но только если товары, которые доставляет последний, в точности соответствуют коносаменту, который подписали Аи Б. Так, торговец А позволяет банку осуществлять надзор и над собой, и над торговцем Б . Как только А отдает деньги на хранение в банк, он уже не может обмануть (предать) Б, поскольку только банк может решать, соответствуют ли товары Б коносаменту, и А уже не может это определять. Впрочем, если Б решит обмануть (предаст), он не получит ни гроша а если Б останется верным соглашению (промолчит) и если его товары будут такими, о каких договорились Аи Б, ему заплатят в полной мере. В реальной жизни (если вообще существует реальная жизнь) таких дилемм немало, и оказывается, что ив делах, ив имитационных играх люди часто склонны предавать друг друга. Даже в Тоске Джакомо Пуччини встречается классический случай Дилеммы заключенного, который оканчивается двойным предательством. Скарпиа, злой шеф полиции, дает Тоске обещание если та отдаст ему себя, он не убьет ее возлюбленного, приговоренного к расстрелу, и патроны будут холостыми. Тоска соглашается провести с ним ночь. Но оба друг друга обманывают Тоска закалывает шефа полиции кинжалом, позже солдаты расстреливают ее любимого настоящими пулями – и сама она совершает самоубийство. Какой классический оперный финал А какая музыка! В Дилемме заключенного, а может быть, ив «Тоске» несомненно одно даже если игроки согласятся не предавать друг друга (ибо знакомы с дилеммой, возможно, им будет трудно исполнить обещанное. Предположим, что, перед тем как арестованных разводят по камерам, они соглашаются в том, что их случай – это как раз Дилемма заключенного», и решают, что в жизни не станут свидетелями обвинения, даже если им предоставят шанс они будут немы как могила и отбудут в тюрьме свой год. Впрочем, когда их разводят по разным камерам, оба не могут унять сомнений а сдержит ли другой свое обещание Итог здесь будет таким же они снова решат, что лучше всего предать. Если А предаст Б, то получит свободу но, если оба предадут друг друга, они сядут в тюрьму не на 20, а только налет. И даже если прежде они заключили сделку, теперь оба нарушают ее условия. Может быть, это решение покажется абсолютно иррациональным, а его последствия – гибельными. И возможно, рационально мыслящий заключенный придет к иному выводу: если другой тоже понимает, что 18 лет в тюрьме – это намного хуже, чем год, то и ему лучше хранить молчание, и именно так они поступит. Некоторые эксперты в теории игр истинно верят в то, что оба рационально мыслящих игрока будут молчать. Сам я не понимаю, в чем истоки этой уверенности. В конце концов, если бы я сам был в такой ситуации я бы не стал делать небезопасных предположений о мыслях другого игрока, а еще я бы понял, что предательство – это мой лучший выбор. Да, я ненавижу это признавать, ноя бы предал другого парня. А он бы предал меня, и мы бы на годы оказались за решеткой, пытаясь понять, что пошло не так. Не означает ли Дилемма заключенного, что люди вообще неспособны к сотрудничеству – по крайней мере, не под угрозой тюрьмы В чем смысл этой дилеммы Может показаться, что этот вывод неизбежен. Ив этой игре, ив сходных условиях люди склонны предавать друг друга. С другой стороны, мы знаем, что люди сотрудничают, причем не только после задушевной беседы с главным мафиози. Как сгладить это явное противоречие? Когда я впервые об этом задумался, я не мог найти ответа до тех пор, пока не вспомнил, как служил в армии и как впервые сел за руль. В армейские годы я всегда мог попросить кого-нибудь о серьезном одолжении, и люди часто проявляли отзывчивость. Я мог попросить сослуживцев по роте подменить меня на заданиях, мог даже пойти в увольнительную взамен кого-то, кому подходил черед. Потом я отслужили получил водительские права – довольно поздно, но как уж вышло. Помню, как я отправился в свою первую поездку и остановился на стоп-линии, стояли ждал, пока хоть кто- то пропустит меня и даст влиться в поток транспорта, а потом ничего не произошло Ровным счетом ничего Машины текли мимо, их проехал, наверное, миллион, и никто даже не сбавил скорость, чтобы пустить меня на дорогу. Как такое могло случиться Почему люди с охотой помогали мне в серьезных, очень важных делах, но никто не мог всего лишь на пару мгновений сбавить скорость, чтобы я поехал дальше Это же такая мелочь Яне мог ответить на этот вопрос, пока не прочел о различиях дилемм заключенного водно- кратной игре ив ее итеративных версиях – и все встало на свои места. Мы должны провести различие между теми игроками, которые играют в Дилемму заключенного один рази больше никогда не встретятся, и теми, кто играет в нее не единожды. Первая версия неизбежно закончится обоюдным предательством. Но итеративная версия Дилеммы заключенного (то есть игра с повторами) отличается по самой своей сути. Когда я просил армейских друзей об одолжении, они понимали или подсознательно чувствовали, что мы сыграем в эту игру снова – и что я отвечу взаимностью на всю проявленную ко мне благосклонность. В повторяющихся играх игроки ожидают награды зато, что позволяют другим время от времени победить. Когда кто-то уступает мне дорогу, у меня нет времени остановиться и записать номер его машины, чтобы вернуть должок в следующий раз, когда мы пере- сечемся на дороге. Это будет иррационально. Впрочем, люди склонны к сотрудничеству, когда сталкиваются с тенью грядущего, как говорил Роберт Аксельрод, – иными словами, когда будущие встречи ожидаются как реальная возможность, мы мыслим по-другому. На Дилемме заключенного основан популярный эксперимент, проведенный на многих мастер-классах для руководителей. Участники разбиваются попарно, каждому дают, скажем, пои по несколько карточек, на которых написано Ми П (молчание и предательство, и говорят, что им предстоит сыграть в игру друг с другом 50 раз. Суть игры в том, чтобы потерять как можно меньше долларов, и ее правила скрывают тот факт, что сама она представляет собой Дилемму заключенного, так сказать, под карнавальной маской. Если оба игрока в паре выбирают карту Ми соглашаются молчать, у каждого из его $500 вычитается как один год в тюрьме если оба выбирают Пи предают друг друга, они теряют по $18; а если один выбирает карту «М», а другой – карту П, то последнему позволяют сохранить все $500, а от денег первого отнимают $20. Позвольте мне еще раз привлечь ваше внимание каждая пара играет в игру 50 раз. Большинство игроков очень быстро понимают правила игры – в конце концов, они ведь руководители, – но это редко им помогает. Они не видят подвоха, производят те же расчеты, как и те, кто играет однократно, и приходят к выводу о том, что, независимо от действий другого игрока, их лучший выбор – карта П. Они играют, теряют $18, потом еще потом еще $18 итак далее – и понимают, что эта стратегия в корне неправильна Ведь если они 50 раз потеряют по $18, они не только лишатся всех своих карманных денег исходных, но и останутся должны $400 устроителю эксперимента Именно на этой стадии, чаще всего после третьего раунда, мы впервые замечаем попытки сотрудничества. Игроки стратегически выбирают карту Ми надеются на то, что их партнер поймет намеки поступит также, что позволит им сохранить большую часть из их Видимо, Абба Эвен, государственный деятель Израиля, ныне покойный, был прав, когда сказал История учит нас тому, что и люди, и народы поступают разумно, лишь когда исчерпают все остальные альтернативы». В итеративной версии Дилеммы заключенного есть подвох, когда мы близимся к последнему, 50-му, раунду. На этом этапе я мог бы сказать себе так зачем сигналить о том, будто мне нужно содействие Уже нет никаких причин Чтобы ни выбрал другой, если я предам, то потеряю меньше. Но, как только вы начнете так думать, вы рискуете попасть в «бесконечную петлю я уверен, что итог го раунда неизбежен, значит, незачем сотрудничать ив ми, видимо, в нем мы и предадим друг друга, а потому предам-ка я первым По такой логике тоже соображение теперь применимо и к 48-му раунду И у нас новый парадокс если оба игрока столь рациональны, возможно, им следует предать друг друга с самого начала! Видите? Обратный расчет может не принести должной выгоды. Он только все осложняет. Это парадокс неожиданного экзамена или парадокс висельника, и вот в чем его суть. В пятницу, на последнем уроке, учитель объявляет, что наследующей неделе состоится неожиданный экзамен. Все ученики бледнеют от страха, но Джо просит слова. Сэр говорит он. – Так не получится У нас не может быть неожиданного экзамена наследующей неделе Почему – спрашивает учитель. Так ясно же, – отвечает Джо. – В пятницу его быть не может. Ведь если его не будет в четверг, тогда мы будем знать, что он пройдет в пятницу, и это уже небу- дет сюрприз. Тоже самое ив четверг – ведь если его небу- дет в понедельник, во вторники в среду, а пятницу мы уже вычеркнули, то он должен пройти в четверги теперь мы о нем знаем, так что вы нас не удивите, сэр!» Хотя не очень понятно, что такое неожиданный экзамен, да и Джо был весьма убедителен, учитель все же удивил учеников, слишком поверивших в логику Джо, и устроил экзамен во вторник. Та же логика применима к Дилемме заключенного с определенным числом раундов (на мастер-классах я обычно не разглашаю заранее их число, поскольку игроки начинают думать также, как Джо о своем экзамене. Но этот перебор с возвратами только заводит в тупик. Вышеупомянутый Роберт Аксельрод – профессор государственной политики в Мичиганском университете. Но он изучали математику и прославился тем, что принял участие в разработке компьютеризованных вариантов Дилеммы заключенного о них можно прочесть в его книге Эволюция сотрудничества, вышедшей в 1984 г. Он просил многих людей, умных и мудрых, выслать ему искусные стратегии для итеративной версии Дилеммы заключенного, определив правила игры так если оба игрока хранят молчание, каждый получает 3 очка если оба выбирают роль предателей, каждый получает 1 очко если они совершают разный выбор, предатель получает 5 очков, а стойкий и молчаливый – 0. Аксельрод объявил, что для каждой игры отведено 200 раундов, и попросил предложить стратегию. Но что он имел ввиду, говоря о «стратегии»? В итеративной версии игр, основанных на Дилемме заключенного, есть множество стратегических возможностей. Всегда молчать – одна из простейших стратегий, но она, несомненно, неразумна предательство остается безнаказанными второй игрок может легко сколотить капитал. «Всегда предавать – гораздо более крутая стратегия. Можно выбирать всевозможные, даже самые странные стратегии чередовать предательство с молчанием, подбрасывать монетку, выбирать случайным образом… Вам, мой искушенный читатель, уже, наверное, ясно, что лучшая стратегия – отвечать на действия противника. И правда, на первых олимпиадах, где играли в компьютерные версии игр, основанных на Дилемме заключенного, стратегия, приводящая к победе, была описана как око за око». Кроме того, она была самой короткой четыре строки набей- сике. Создателем этой стратегии стал Анатолий Рапопорт (1911–2007), уроженец России, работавший в США. Его шаблон таков в первом раунде вы храните молчание – иными словами, играете красиво. Потоми далее, начиная со второго раунда, вы просто повторяете предыдущий ход противника если в первом раунде он промолчал, вы молчите во втором. Спрашивайте не о том, что вы можете сделать с противником, но о том, что он прежде сделал с вами, и поступайте также. Стратегия око за око позволяла заработать в среднем 500 очков, а это довольно много. Не забывайте: если оба игрока решают молчать, они получают по 3 очка за раунда значит, 600 очков за игру – это и правда очень хороший результат. Эта стратегия получила высшие оценки. Что интересно, самая сложная стратегия, с самым длинным описанием, получила низший балл. На второй олимпиаде появился подход око за два если другой предает, выдаете ему возможность искупить грехи, и только если он снова выбирает предательство, вы отвечаете на это своим предательством. Эта стратегия еще красивее, чем исходная око за око, но ее красота может вам слишком дорого обойтись: стратегия заняла не слишком высокое место. Услышав о стратегии око за око, люди, незнающие ничего о теории игр, обычно протестуют И это великое открытие Естественно так все и делают В конце концов, стратегия око за око – это не какая-нибудь поразительная математическая находка, претендующая на Нобелевскую премию, а просто наблюдение затем, как обычно ведут себя люди ты ко мне с добром, и як тебе с добром; ты ко мне со злом, и я тебе той же монетой око за око, зуб за зуб, и все такое… В дальнейшем Аксельрод выяснил, что для успеха стратегии око за око игроки должны следовать четырем правилам. Будьте джентльменом. Никогда не предавайте первым. Всегда отвечайте на предательства. Слепой оптимизм плохая идея. Умейте прощать. Как только соперник перестает предавать, прекращайте ивы. Не завидуйте. В тех или иных раундах вам не выиграть, но в общем итоге вы одержите победу. Еще в одну интересную версию Дилеммы заключенного» играют несколько игроков зараз. Один из многих примеров такого варианта – охота на китов. Все страны, чья экономика широко полагается на китобойный промысел, мечтают возложить строгие ограничения на любую другую страну (стратегия молчания, а своим китобоям позволить бить китов сколько душа пожелает (стратегия предательства. Проблема здесь очевидна если все китобойные страны будут предателями, итог будет губительным для всех этих стран (не говоря уже о китах, которые так могут просто вымереть). Это случай игры, основанной на Дилемме заключенного», только для многих игроков. Тоже можно сказать и о лесоразведении, и о климатических соглашениях (здесь есть искушение разорвать договор, загрязнить все что можно и получить прибыльно каждому лучше, если все согласятся не вредить окружающей среде, и о более прозаических вопросах, той же ежемесячной плате на содержание кондоминиу- ма (дома-совладения): платить иль не платить Вот в чем вопрос! Конечно, каждый жилец был бы только рад, если бы все платили свои взносы – то есть все, кроме него. Тогда все было бы прекрасно цвели бы сады, в фойе бы неизменного- рел яркий свет, лифты работали бы без перебоев, а он бы не платил ничего Проблемы начинаются тогда, когда все больше и больше жильцов (и наконец – все) начинают думать, что, возможно, им тоже не стоит платить взносы, – и прекращают это делать. Представьте себе, какие будут лифты и сады в таком кондоминиуме. Кстати, если бы немецкий философ Иммануил Кант) мог сегодня сказать нам несколько слов, он бы предложил разрешить дилемму следующим категорическим императивом (который я адаптировал из слов самого Канта): Прежде чем действовать, подумайте вот над чем желаете ли вы, чтобы ваше действие стало вселенским законом Кант, видимо, ожидал бы от жильцов кондоминиума такого ответа Конечно, мы не хотим, чтобы все-все уклонялись от ежемесячной оплаты. Да, это может оказаться весьма неприятным, так что нам, скорее всего, стоит заплатить. Все это очень хорошо, но, вместо того чтобы ждать, пока все жильцы прочтут Канта, лучше бы ввести уставные нормы насчет таких оплат. В делах оплати налогов люди, как правило, не платят добровольно даже если они читали Канта. О сходной проблеме испанский философ Хосе Ортега-и- Гассет (1883–1955) сказал Закон рожден отчаянием в природе человека». Какой была бы лучшая стратегия для итеративной Дилеммы заключенного, рассчитанной на нескольких игроков Что же, здесь все сложнее. Например, стратегию око за око здесь не применить. Когда я играю против одного соперника, я знаю его ходи отвечаю соответственно но, если играть против 20 жителей, восемь из которых не внесли оплату за месяца двенадцать внесли, – во что превратится такая стратегия Как мне играть Последовать за большинством Платить лишь после того, как заплатили все остальные А если заплатит только один, убедит ли это меня тоже внести свою плату И математически, и интуитивно все это очень сложно, и пока что мы просто оставим этот вопрос в стороне |