институциональная экономика коллоквиум 1 бизнес-информатика 4 курс 2018 год. Институциональная экономика вопросы к коллоквиуму
Скачать 1.78 Mb.
|
для А доллар завтра эквивалентен a долл сегодня, а для В - b долл.), т.е. один из них менее терпелив. Дополнительно предполагается, что будучи безразличным между двумя предложениями, каждый из игроков выберет вариант, более предпочтительный для партнера. Определите, какую часть доллара должен предложить первый игрок второму в первый день, с тем, чтобы он принял это предложение сразу же. Мы можем решить эту игру при помощи обратной индукции: 1. Последним ходит А. Он знает, что если он предложит B раздел 1/0, то B по введенной нам предпосылке примет его. 2. B знает, что А предложит ему этот раздел на своем ходу, поэтому на втором ходу он пред- лагает ему a долларов, которые будут эквивалентны 1 доллару на следующем ходу. Себе он, таким образом, оставит 1 − a. 3. А знает, что B в следующем ходу предложит ему a долларов, оставив себе 1 − a, поэтому на первом ходу он предложит ему b(1 − a), что эквивалентно 1 − a на втором ходу. Себе А оставит 1 − b(1 − a). 4. B, который проводит то же рассуждение, соглашается на такой раздел. 21 Повторяемые игры. Дилемма заключенных с определен- ным числом повторений. Кроме динамических игр с полной информацией, есть несколько видов динамических игр с непол- ной. В частности, нас интересуют игры с почти полной информацией - в них последний ход является статичной игрой, но все предыдущие ходы обозреваемы участниками. Очевидно, что к таким играм относятся "повторяющиеся игры" - статичные игры, играемые в несколько раун- дов. 21.1 Chainstore paradox Для примера мы можем рассмотреть так называемый "парадокс сетевого магазина" (chainstore paradox): В нем крупный сетевой магазин-монополист играет в следующую игру с несколькими более мел- кими магазинами, желающими войти на рынок: 28 Рис. 8: Обратите внимание, что профиль {войти, сотрудничать} является SPNE (см. пункт 18). Данная игра является парадоксом, потому что играть SPNE в ней менее выгодно, чем играть слабо доминируемую "стратегию отпугивания". Рассмотрим сначала получаемую обратной индукцией SPNE: 1. Конкурент 20 решит войти на рынок, потому что он знает, что монополисту больше некого запугивать при помощи конкурентной борьбы. Монополист выберет сотрудничество, т.к. оно для него более оптимально, если конкурент решил войти. 2. Конкурент 19 знает, что монополисту нет смысла запугивать конкурента 20 путем борьбы с конкурентом 19, т.к. результат игры с 20 предрешен. Поэтому конкурент 19 решает войти на рынок. 3. Эта индукция работает вплоть до конкурента 1. 4. Во всех играх играется профиль {войти, сотрудничать} При игре SPNE монополист получит 50 ∗ 20 = 1000. Рассмотрим теперь стратегию отпугивания. В большинстве случаев, если конкуренты увидят до- статочно игр, где монополист борется со входом, то они решат не входить, чтобы не нести потери в -10. Если половина игроков решит протестировать монополиста и войдет на рынок, а он будет с ни- ми бороться, его выигрыш составит те же 100 ∗ 10 = 1000. На практике же достаточно рискофобные конкуренты остановятся после 3-4 попыток. 21.2 Повторяющаяся дилемма заключенного Мы можем рассмотреть, как поменяется дилемма заключенного, если она будет повторяться огра- ниченное количество раз. В полученном обратной индукцией равновесии игроки продолжает друг друга предавать - мы можем вывести это из простого рассуждения: 1. В последнем ходу игроки предадут друг друга, т.к. у другого игрока больше не будет воз- можности отомстить за предательство в следующем раунде. 2. На предпоследнем ходу игроки знают, что предадут друг друга на следующем ходу, поэтому у другого игрока больше не будет возможности отомстить за предательство, поэтому оба игрока решают предавать. 3. Эта индукция продолжается до 1 хода При этом на практике реальные играющие люди часто ведут себя кооперативно, и в целом более кооперативные стратегии (например, tit-for-tat) позволяют достичь лучших результатов суммарно по всем играм. 29 22 Дилемма заключенных с бесконечным числом повторений Если число повторений в игре бесконечно, то для ее анализа нам полезно использовать ставку дисконтирования, т.к. с каждым ходом при большом их количестве деньги дешевеют. Это до- полнительно позволяет ограничить максимальную сумму, которую могут получить игроки, сверху. Если число повторений в дилемме заключенного бесконечно, или неизвестно (один случай можно привести к другому за счет поправки на ставку дисконтирования, если нам известна вероятность того, что игра прекратится на следующем ходу), то SPNE с предательством на всех ходах перестает иметь смысл, т.к. обратная индукция невозможна. Поэтому для бесконечно повторяющейся дилеммы заключенного необходимо использовать более сложные стратегии, оценивая ожидаемую полезность от них. В частности, такими стратегиями являются trigger strategy и tit-for-tat. 23 Стратегии в повторяемых играх. Стратегия наказания. Стра- тегия «tit for tat». По сути, кооперативные стратегии, применяемые в бесконечных играх, отличаются друг от друга отношением к предательству. Наиболее известными и эффективными стратегиями являются trigger strategy (стратегия курка, или наказания) и tit-for-tat - первая стратегия является более жесткой, вторая - более прощающей. 23.1 Trigger strategy Стратегия курка формулируется достаточно просто: игрок с этой стратегией кооперируется до тех пор, пока другой игрок его не предаст, посли чего его не прощает ни при каких обстоятельствах, предавая сам на каждом ходу. Мы можем показать, что при определенных значениях ставки дисконтирования данная стратегия образует равновесие по Нэшу. Пусть игрок получает a за кооперацию, b за одностороннее преда- тельство и c за двустороннее предательство. Рассмотрим выигрыш индивида после хода, в который он решает, предавать другого игрока, или нет. Если он решает не предавать другого игрока, то его выигрыш составит: a + a 1 + r + a (1 + r) 2 ... = a + a r Если же он решит предать, то в будущем его выигрыш будет стремиться к: b + c r Найдем, при каких r строго доминирующей стратегией игрока будет кооперация (то есть выигрыш от нее будет больше): a + a r > b + c r =⇒ r < a − c b − a Если ставка дисконтирования не является очень большой (то есть будущее достаточно значимо), кооперация будет доминирующей стратегией индивида, а пара стратегий курка будет равновесием Нэша. 30 Более того, пара стратегий курка будет и SPNE. В бесконечной дилемме заключенного есть толь- ко две подыгры - получаемая из кооперации и получаемая из предательства. Если игрок решает кооперироваться, то, как мы показали выше, ему выгодно кооперироваться дальше. Если же он решил предать, то ему не остается ничего, кроме как продолжать предавать, иначе он окажется в проигрыше. 23.2 Tit-for-tat Стратегия tit-for-tat заключается в том, чтобы кооперироваться до того, как другой игрок впервые предаст, после чего копировать его действия в предыдушем ходу. В отличие от более жесткой trigger strategy, tit-for-tat не образует стабильного равновесия Нэша. Из- за ставки дисконтирования выигрыш сегодня от предательства может быть больше, чем проигрыш через некоторое время, поэтому один игрок может периодически предавать другого, и ждать, пока потери станут достаточно малы, чтобы снова начать играть честно. С другой стороны, данная стратегия более устойчива к ошибкам, чем trigger strategy. Если один из игроков может сыграть ход, который он не хотил и случайно предать, то tit-for-tat позволит игрокам снова вернуться к кооперации, в то время как trigger strategy обречет их всегда предавать. 24 Факторы, обусловливающие достижение кооперации при повторяемых взаимодействиях. В реальном мире возникают различные факторы, которые склоняют игроков к кооперации, даже когда стратегия, оптимальная в теоретико-игровом смысле - некооперативная: 1. Если в реальном мире два человека играют в дилемму заключенного, они фактически считают игру повторяющейся, так как на их результат влияет не только непосредственная полезность, полученная от игры, но и будущие отношения с человеком, которые могут быть испорчены, а также уже существующее доверие (можно интерпретировать это как некоторое априорное знание индивида о стратегиях другого игрока). 2. При повторных взаимодействиях формируются регуляторные акты, склоняющие участников игры к кооперативному взаимодействию. 3. Результаты предыдущих взаимодействий позволяют выстроить распределение ходов, выби- раемых другим игроком, и удостовериться в его желании делать кооперативные ходы. 25 Рынки с асимметричной информацией Участвуя в игре, игроки не всегда знают, какие ходы совершили другие игроки 2 - такие игры называются играми с неполной информацией. Соответственно, если для одного игрока игра имеет полную информацию, а для другого - неполную, то говорят об асимметрии информации. Можно в общем виде смоделировать рынок с асимметричной информацией при помощи игры: 2 Игрок может не знать как ходы других игроков, так и ходы "природы" , отвечающие за состояние мира. 31 Штрихованный овал обозначает информационное множество - набор ходов, которые принципал не может различить между собой. Сначала природа делает ход, в результате которого с некоторой вероятностью принципалу (бене- фициару контракта, имеющему неполную информацию) попадается качественный или некачествен- ный агент (исполнитель контракта с полной информацией). После этого принципал предлагает ему некоторый контракт, а агент выбирает, принимать его или отклонять. Чаще всего при моделиро- вании рынка с ассимметричной информацией выигрыши агента и принципала зависят от качества агента и денежной ценности контракта принципала. Асимметрия информации очень часто присутствует в реальной жизни: • Качество многих товаров нельзя оценить до покупки (см. пункт 1). • Банк может не иметь возможности абсолютно точно оценить качество заемщика и вероятность того, что он отдаст кредит. • Наниматель не может все узнать о работоспособности сотрудника до найма на работу. • Предприниматель может утаить часть информации о бизнесе от инвестора, чтобы получить более высокую оценку о компании и более высокие инвестиции. • Инсайдер, участвующий в сделках на финансовом рынке, имеет более точный прогноз буду- щей цены актива, чем его контрагенты. Асимметрия информации важна по той, причине, что агент может воспользоваться ей, чтобы полу- чить нечестное преимущество в сделке с принципалом. Асимметрия информации на рынке в целом может вести к неблагоприятному отбору и ухудшению качества агентов на рынке в целом. 26 Последствия неблагоприятного отбора. "Рынок лимонов". В своей статье 1970 года "Рынок лимонов: неопределенность качества и рыночный механизм" Джордж Акерлоф объяснил, каким образом асимметрия информации может привести к вырожде- нию целого рынка. Возьмем рынок подержанных автомобилей. Предположим, что на нем в одинаковой пропорции есть продавцы плохих и хороших автомобилей. Покупатель знает об этом, но при покупке он не знает, плохой автомобиль ему продают, или хороший. Возьмем следующие функции полезности для продавцов и покупателей 3 : U B = θ − P, U S = P − θ, 3 Такие функции называются квази-линейными и часто используются в теории игр. 32 где P - цена, которую покупатель платит за автомобиль, θ - оценка ценности автомобиля. Предпо- ложим при этом, что и покупатели и продавцы имеют показатель резервной полезности, равный 0, то есть если они оказываются проигравшей стороной сделки (значение их функции полезности отрицательно), то они предпочтут скорее в ней не участвовать. Пусть ценность хорошего автомобиля на этом рынке равна 6000, а ценность плохого 2000. Тогда покупатель, который не знает точной ценности автомобиля, но знает ожидаемую, не заплатит за неизвестный автомобиль более 4000: E[U B ] = 0.5(2000 − P ) + 0.5(6000 − P ) ≥ 0 =⇒ P ≤ 4000 Хороших продавцов такая цена не устроит (мы помним, что их минимальная допустимая полез- ность тоже равна 0), и они предпочтут вообще не участвовать в рынке, где их машины недооцени- вают. Поэтому на рынке остаются только плохие продавцы, и равновесная цена, как и равновесное качество, будет равна 2000. Мы расширить этот пример, показав, как рынок будет деградировать постепенно - пусть теперь у нас есть не два вида продавцов, а большое количество продавцов, продающих автомобили, качество которых распределено равномерно от 2000 до 6000: 1. Сначала индивид будет готов максимально заплатить 2000+6000 2 = 4000, и с рынка уйдут все производители с автомобилями ценностью больше 4000. 2. На следующем шаге индивид будет готов заплатить 2000+4000 2 = 3000, и с рынка уйдут все производители с автомобилями ценностью больше 3000. 3. Легко увидеть, что на i-ом шаге индивид будет готов заплатить максимум 2000 + 4000 2 i , и в пределе рынок придет к равновесной цене в 2000. Финальное равновесие может быть хуже или лучше в зависимости от того, каким образом поку- патели или продавцы оценивают полезность от ценности автомобиля: в общем случае их функции полезности могут выглядеть как U B = f (θ) − P и U S = P − g(θ), потому что, например, поку- патель видит машину не только как товар с какой-то ценой, но и как объект хобби или символ статуса, а продавец закладывает некоторую маржу в ценность автомобиля, поэтому будет запра- шивать за него более высокую цену. К примеру, если функция полезности покупателей выглядит как U B = 1.2θ − P , то равновесие (где θ max = P ) установится на цене в 3000. 27 Иные примеры неблагоприятного отбора. Кроме рынка подержанных автомобилей, в реальном мире есть несколько примеров неблагопри- ятного отбора. 27.1 Рынок медицинского страхования Известным фактом является то, что в странах с частным медицинским страхованием людям стар- ше 65 лет бывает сложно получить страховку. С одной стороны, у пожилых людей больше рисков, связанных со здоровьем, и поэтому вероятность страхового события больше. С другой, страхов- щик может просто поднять цену страховки, чтобы покрыть дополнительный риск. Тем не менее, страховщики этого не делают. Это случается из-за того, что пенсионеры чаще всего достаточно стеснены в средствах, и при этом они гораздо лучше, чем страховая компания, могут оценить состояние своего здоровья. Из-за этого более дорогую страховку будут покупать только те пенсионеры, у которых большие проблемы со здоровьем, и поэтому вероятности страхового случая будут больше, чем оценки стра- ховщика. Данная страховая программа будет приносить убытки и страховщик ее закроет. 33 В данном случае основной проблемой является то, что страховщик не может оценить вероятность для каждого клиента индивидуально и присвоить ему свою цену - он может только получить неко- торое примерное значение, но тогда всегда найдутся клиенты, у которых вероятность страхового случая больше, чем это значение, и которые будут эксплуатировать такой страховой план. 27.2 Дискриминация национальных меньшинств при найме на работу Другим примером является то, что работодатели чаще всего с неохотой нанимают на работу пред- ставителей национальных меньшинств, а если и нанимают, то на низкие зарплаты. Это происходит, потому что работодатели не могут полностью оценить ценность работника - да- же если могут при помощи тестирования оценить его навыки, до приема на работу оценить его надежность и ответственность можно только по очень авторитетным рекомендациям. При этом принадлежность к национальному меньшинству увеличивает неопределенность работо- дателя по сравнению с соискателем, принадлежащим к основному этносу стра ы. Соискатель из национального меньшинства может оказаться нелегалом и создать юридические проблемы работо- дателю, или работодатель может знать, что качество образования в стране соискателя хуже, чем в стране работодателя. Из-за сопряженных рисков работодатель предлагает представителю национального меньшинства меньшую зарплату. Если соискатель является квалифицированным, он не примет предложение, где ему недоплачивают, и попытается найти работу в другом месте или даже стране, а соискатель, который, например, действительно является нелегалом, примет предложение. Таким образом, с рынка труда будут уходить качественные работники, и будут оставаться только проблемные. 28 Противодействие неблагоприятному отбору со стороны «ка- чественных» агентов. Сигналы. Очевидно, что ситуация, когда хороших агентов выдавливают с рынка, не может их устраивать. Они захотят каким-то образом дать принципалу понять, что они являются качественными агента- ми. Просто заявить о своем качестве - неэффективно, так как некачественный агент может сделать то же самое. Чтобы качественный агент смог по-настоящему убедить принципала, действие, которое он совершает, должно быть таким, что некачественный агент не сможет, или не захочет, его повто- рять - потому что оно является для него слишком дорогим, или обеспечивает ему низкий уровень полезности. Действие, совершаемое качественным агентом, чтобы заявить о своем качестве, и при этом нера- циональное для некачественного агента, называется сигналом. Сигналы нужны, для того, чтобы привести рынок с асимметричной информацией к так называ- емому разделяющему равновесию - ситуации, при которой некачественным агентам выгоднее довольствоваться своей более низкой оплатой, чем пытаться выдать себя за качественного агента. Мы можем рассмотреть сигналирование при помощи следующей игры: 34 В данной игре сначала природа делает ход, в результате которого играющий работник либо плохой, либо хороший (вероятности ходов природы нам в данном случае не принципиальны, так как нам нужно найти стратегию для любого типа работника, но будем считать, что они равны). После этого работник решает, проходить или нет дополнительное образование. Работодатель при приеме на работу не знает тип работника, но считает, что среди прошедших ДПО 90% хороших работников, а среди не прошедших - только 50%. Т.к. работодатель не может различать хорошего и плохого работника, он будет действовать, ориен- тируясь на ДПО. Для определения оптимального хода в зависимости от ДПО, он вычисляет свою ожидаемую полезность. Учитывая, что при найме плохого сотрудника он получает −5, при найме хорошего 3, а не нанимая никого - 0: |