В этой главе мы познакомимся с теорией игр и основными понятиями, которые в неё входят. Теория игр — важный раздел экономики, в котором рассматриваются принятия решений в ситуациях, когда результат действия человека зависит от действий других людей. Иными словами, игры, которые изучают экономисты, есть не что иное, как стратегическое взаимодействие между агентами (игроками). К агентам в экономике относят отдельных лиц, группу лиц или организации, которые могут принимать экономические решения, например, в качестве агентов могут выступать потребители, фирмы или даже государства.
Для начала важно осознать, что есть стратегия и когда приходится быть стратегами. Например, когда вы играете в шахматы, то вы ждёте следующего хода партнёра, и ваш ход основан на действиях другого игра. Это стратегия. Если вы идёте на рынок покупать клубнику и торгуетесь с бабушкой за цену килограмма, то вы думаете, как заплатить поменьше, а она думает, как сделать так, чтобы вы заплатили побольше. Бабушке нужно понимать, что если она изначально назначит слишком высокую цену, то вы вряд ли согласитесь купить товар. Вы тоже осознаете, что, если предложите забрать клубнику бесплатно, сделка не состоится. Это тоже стратегии.
В жизни мы встречаемся с огромным количеством взаимодействий. Чтобы описать каждое из них хотя бы примерно, игры делятся на несколько категорий. Один из способов такой классификации основан на возможностях к кооперации между игроками. Различают бескоалиционные игры и кооперативные. Бескоалиционными называются игры, в которых игроки действуют независимо друг от друга и не работают вместе, то есть являются отдельными экономическими агентами. Примером такой игры может послужить вокальный конкурс, к выступлению на котором каждый участник готовится отдельно от своих конкурентов. В кооперативных играх агенты объединяются в группы и работают вместе для достижения каких-то общих целей. Важным вопросом в кооперативных взаимодействиях является справедливое разделение выигрыша между всеми участниками группы (коалиции). Например, как Бременским музыкантам разделить гонорар за свой концерт? Также с помощью кооперативных игр можно изучать, как формируются коалиции и как они взаимодействуют друг с другом.
Можно разделить игры с полной и неполной информацией. В игре с полной информацией все участники имеют доступ к одной и той же информации, являющейся так называемым общим знанием. Другими словами, в игре нет скрытых или неизвестных элементов, все участники знают все возможные ходы и выигрыши своих контрагентов. Игры с неполной информацией – это такие взаимодействия, в которых некоторые агенты обладают личной информацией, связанной с игрой, к которой другие не имеют доступа. Это создает неопределенность и затрудняет игрокам прогнозирование исходов их действий. Например, муж может не знать, в каком настроении проснётся жена, следовательно, ему будет сложнее оценить, как она отнесётся к предложению поужинать дома вместо похода в ресторан. Предположим, что в хорошем настроении она с энтузиазмом воспринимает подобного рода предложения, а в плохом может обидеться на несколько дней. В экономических моделях мы почти всегда будем встречать игры с полной информацией. Это менее реалистичная ситуация, зато предпосылка об общем знании позволяет более точно определить равновесие.
Рассмотрим подробнее концепцию общего знания. Так называется вся информация, которую знают все участники, а также знают, что она доступна всем остальным. Концепцию предложил Роберт Ауманн – лауреат Нобелевской премии по экономике 2005. Для понимания этого понятия можно привести в пример игру «Лица в саже». Давайте представим, что в вагоне поезда едут три дамы. Дамы решили вспомнить прошлое, потому предпочли для своего путешествия паровоз (то есть поезд, который приводит в движение паровая машина, из трубы его локомотива идёт дым вперемешку с сажей). Дамы едут в купе с открытым окном. В какой-то момент поезд въезжает в туннель, а на выезде из него оказывается, что сажа влетела через окно и испачкала всем трём дамам лица. Зеркал в вагоне нет, а говорить о внешности других людей дамы считают неприличным, ни одна из них не скажет другой, что у неё грязное лицо. Также они не будут вытирать своё лицо, если на 100% не уверены в том, что испачкались. Таким образом, несмотря на то, что все трое запачкались, ни одна не будет вытирать своё лицо. Предположим, после этого в купе заходит проводник, чтобы проверить билеты. Он делает замечание, что хотя бы у одной из дам лицо грязное, после чего выходит из купе. Поменяет ли замечание проводника поведение дам? Казалось бы, каждая из них и так видит перед собой два грязных лица, то есть это замечание не дало никакой новой информации. Однако это не совсем так. Ведь до этого замечания каждая из дам обладала частным знанием (то есть она не знала, что видят две её попутчицы), а теперь каждая из них знает, что другие женщины также знают, что хотя бы у одной из них лицо в саже. Наши дамы рассуждают как рациональные агенты. Давайте для простоты предположим, что раунд их мыслей занимает одну секунду. Назовём дам А, В и С. Как может рассуждать дама А? «Предположим, у меня чистое лицо. Но тогда дама В видит перед собой одно чистое и одно грязное лицо. Дама В также может предположить, что её лицо чистое. Но тогда дама С видит перед собой два чистых лица, а значит, в первую же секунду после замечания проводника она начнёт вытирать своё лицо. Однако дама С в первую секунду лицо не вытерла, а значит, дама В должна была понять, что её лицо тоже грязное. И на вторую секунду дамы В и С одновременно начали бы вытирать свои лица. Но дама В так не делает. Значит, она видит перед собой два грязных лица, а не грязное и чистое. Следовательно, моё лицо тоже грязное». И на третьей секунде все три дамы вытрут свои лица.
#Какие ещё типы игр знают экономисты?
Ещё один способ классификации игр основан последовательности принятия решений. Различают статические и динамические игры. Статические игры — это такие взаимодействия, в которых игроки принимают решения одновременно, а динамические игры — ситуации, в которых игроки принимают решения последовательно. В динамические игры играют работодатели со своими потенциальными сотрудниками каждый раз, когда размещают вакансию на сайтах для поиска работы. Работодателю нужно описать вакансию так, чтобы на неё откликнулись люди с нужными навыками, но при этом установить не слишком разорительную для компании зарплату. После того, как вакансию опубликовали, потенциальные сотрудники принимают решение, откликнуться на неё или нет.
Игры можно разделить по времени на однопериодные и повторяющиеся. Как можно понять из названия, в однопериодных играх агенты принимают решение только один раз (в один период времени), а в повторяющихся играх взаимодействие происходит несколько раз в течение какого-то периода времени, длящегося от двух периодов и дольше.
Помимо прочего, игры можно классифицировать по характеру игры. Разделяют игры с нулевой суммой (антагонистические) и беспроигрышные (win-to-win). Игрой с нулевой суммой называется такое взаимодействие между игроками, при котором суммарный выигрыш части игроков равен суммарному проигрышу остальных игроков. Например, покер. Выиграть можно лишь величину ставок соперников, не больше. В беспроигрышных же играх возможны исходы, при которых каждый из игроков получает положительные выигрыши. В подобного рода взаимодействиях у игроков зачастую нет конфликтующих интересов. Например, если друзья примут решение вместе пойти в кино, то все они получат удовольствие.
И, наконец, последняя классификация, о которой стоит упомянуть – это разделение на игры с совершенной и несовершенной информацией. В первом случае предполагается, что каждый из агентов точно знает возможные действия других игроков, выигрыши, которые они могут получить при каждом из исходов, а также в любой момент времени каждый из агентов осведомлен о совершённых или совершаемых сейчас действиях других. Если же действия других игроков в какой-то момент времени неизвестны, то такие игры называются играми с несовершенной информацией. Из этого определения становится ясно, что никакая статическая игра не может быть игрой с совершенной информацией, поскольку действия соперника неизвестны.
Для удобства, представим все упомянутые классификации в виде схемы:
Как правило, при взаимодействии игроков между собой интересны в первую очередь не их ходы, а результат взаимодействия. Хочется понимать, является ли он стабильным и справедливым. Для изучения этих вопросов используют два важнейших понятия теории игр: равновесие по Нэшу и эффективность по Парето. Разберём каждое из них более подробно.
Равновесие Нэша — это ситуация, в которой стратегия каждого экономического агента является наилучшей реакцией на стратегии других агентов. Другими словами, ни один из игроков не может улучшить свой выигрыш, изменив свою стратегию при заданных стратегиях других игроков. Это понятие было введено экономистом Джоном Нэшем, который в 1994 году получил Нобелевскую премию по экономике.
Ещё одним важным понятием в теории игр является эффективность (оптимальность) по Парето. Это ситуация, в которой ни один из игроков не может улучшить своё положение, не ухудшив положения другого. Эффективность по Парето представляет собой ситуацию, в которой ресурсы распределяются наилучшим образом.
Например, два человека делят пиццу. Если один человек предпочитает корочку, а другой — начинку, результат, эффективный по Парето, может состоять в том, что первый человек съест корку, а второй — начинку. Этот результат подходит под определение. Но если ситуация будет обратная и второму достанется корка, ситуацию можно улучшить для обоих агентов, изменив распределение кусочков пиццы.
Равновесие по Нэшу и эффективность по Парето принципиально различаются тем, что равновесие по Нэшу представляет собой стабильный результат игры, а эффективность по Парето - лишь эффективное распределение ресурсов. В некоторых случаях равновесие по Нэшу может быть неэффективным по Парето, что означает, что для всех экономических агентов возможен лучший результат.
Дилемма заключенных
Дилемма заключенных – это классический пример статической игры, который иллюстрирует, как индивидуальные решения могут привести к неэффективному исходу для всех игроков. Предположим, что двух воров поймали во время ограбления и привезли в полицейский участок, а после посадили в разные камеры и начали допрос. У каждого из заключенных есть два варианта действий: сотрудничать с полицией или молчать. Если оба игрока будут молчать, то они получат небольшой тюремный срок, так как до конца не ясно, насколько крупным планировалось ограбление. Если оба будут сотрудничать с полицией, то каждый сядет на более долгий срок, так как у правоохранительных органов теперь будет вся необходимая им информация. Однако если кто-то один будет молчать, а второй решит сотрудничать с полицией, то того, кто сотрудничал, отпустят на свободу как важного свидетеля, а вот того, кто с полицией разговаривать отказался, посадят на самый большой срок из возможных. Наилучшей ситуацией для обоих игроков было бы молчать. Однако равновесием это не является. Предположим, первый игрок точно знает, что второй будет молчать. Но в такой ситуации, если первый будет сотрудничать с органами власти, его отпустят на свободу, что является для него, безусловно, выигрышной стратегией. Более того, если первый игрок думает, что второй захочет рассказать всё полиции, то первому игроку становится необходимо тоже сотрудничать, чтобы не получить самый большой срок. Таким образом, какое бы действие не предпринял другой игрок, первому всегда будет выгодно сотрудничать с полицией. Для второго игрока ситуация будет аналогичной. В результате они оба получат больший срок, чем могли бы.
Рассмотрим, как работать с введёнными нами концепциями на примере статических и динамических игр. Для простейших моделей теории игр предполагается набор некоторых предпосылок, а именно:
- Каждый игрок является рациональным, то есть может анализировать всю имеющуюся у него информацию и принимать наилучшее из возможных решений для достижения максимума своего выигрыша;
- Возможные стратегии и выигрыши каждого из игроков являются общим знанием;
- В выигрышах уже заключены все возможные моральные дилеммы игроков, а, следовательно, для игроков важен только их собственный выигрыш и совсем не важен выигрыш других.
Начнём со статической игры. В ней игроки принимают решения одновременно. Исход игры определяется, когда все игроки выбрали свои действия. Для того, чтобы задать статическую игру, следует определить следующее:
- Набор игроков, участвующие в игре;
- Стратегии: набор (план) действий, доступных каждому игроку;
- Выигрыши: выплаты, которые получает каждый игрок за каждую возможную комбинацию стратегий. Иногда говорят, что определяют функцию выигрыша, ставящую в соответствие любому набору стратегий некое действительное число.
Если у каждого из игроков конечный набор возможных действий, то их взаимодействие удобно представлять в виде таблицы, где по строкам и столбцам идут перечисления стратегий, а на пересечении указывается выигрыш каждого из игроков.
Для удобства, рассмотрим конкретный пример. Пусть две авиакомпании А и В выбирают, сколько денег выделить на строительство взлётной полосы. Компании владеют разными моделями самолетов, поэтому их требования к длине взлётной полосы различны. Компании А требуется более коротка полоса (хотя длинная тоже подойдёт), стоимость такой полосы составляет 1 млн. руб. Компании В нужна более длинная полоса, строительство которой обойдётся в 2 млн. руб. Если суммарный объём средств будет достаточен для строительства соответствующей полосы, то будет построена наиболее длинная полоса из доступных. Выгоды от возможности пользоваться взлетной полосой каждая компания оценивает в 5 млн. руб. Каждая из авиакомпаний имеет возможность выбрать вложить 0, 1 или 2 млн рублей, другие суммы вкладывать нельзя. Сколько средств вложит каждая авиакомпания? Какое распределение средств будет эффективным?
Для ответа на этот вопрос давайте зададим нашу игру:
-
Множество игроков: фирмы А и В. Формально это можно записать как: \(I = \ \left\{ A,\ B \right\}\);
-
Стратегии, доступные каждой из компаний: вложить 0, 1 или 2 млн. рублей. Формально это записывается как: \(S_{i} = \{ 0;1;2\}\). Здесь \(i \in I\) обозначает идентификатор каждого из игроков (фирм);
-
Выигрыши удобно представлять в матричной (табличной) форме:
B | ||||
---|---|---|---|---|
Ничего | 1 млн.руб. | 2 млн.руб. | ||
A | Ничего | (0;0) | (5;-1) | (5;3) |
1 млн.руб. | (4;0) | (4;4) | (4;3) | |
2 млн.руб. | (3;5) | (3;4) | (3;3) |
Здесь в ячейках отображены выигрыши каждой из компаний в зависимости от выбранных стратегий (первая координата – выигрыш компании А, вторая координата – выигрыш компании В).
Теперь можно анализировать игру. Для начала определим эффективные по Парето профили стратегий. Например, профиль {Ничего; Ничего} (сначала указываем действие фирмы А, потом действие фирмы В) не является оптимальным, поскольку, если фирмы решат вкладываться по 1 млн рублей, их выигрыши составят по 4 млн, что явно больше, чем 0. А вот профиль {2 млн. руб.; Ничего} является оптимальным по Парето, поскольку не найдётся больше ни одного профиля стратегий, при котором вторая компания получит 5 млн. рублей, то есть невозможно улучшить положение компании А, не ухудшив при этом положение В. Придерживаясь этого определения, выделим выигрыши, соответствующие всем профилям, эффективным по Парето:
Ничего | 1 млн.руб. | 2 млн.руб. | |
Ничего | (0;0) | (5;-1) | (5;3) |
1 млн.руб. | (4;0) | (4;4) | (4;3) |
2 млн.руб. | (3;5) | (3;4) | (3;3) |
Таким образом, оптимальные по Парето профили стратегий, следующие: {2 млн. руб.; Ничего}, {1 млн. руб.;1 млн. руб.}, {Ничего; 2 млн. руб.}. Значит, именно такое распределение вложений является наиболее эффективным.
Следует обратить внимание, что когда речь идёт об оптимальности по Парето или о равновесии по Нэшу, в качестве ответов необходимо указывать именно профиль стратегий, то есть действия, которые приведут к тем или иным выигрышам. Если выписать только выигрыши, эта информация не даст нам представления о том, как к этим цифрам прийти. Интересно не то, что кто-то является призёром олимпиады по экономике, а что он для этого сделал.
Ответим теперь на вопрос, сколько средств вложит каждая авиакомпания на самом деле. Ответом на этот вопрос будет служить ситуация, при которой каждая из фирм не захочет в одиночку отклоняться от выбранной стратегии. То есть нам следует найти равновесие по Нэшу.
Чтобы понять, какое действие в каждом из случаев является оптимальным, каждый игрок должен задуматься о том, какую стратегию сыграет его партнер, и затем выбрать наилучший ответ на действия партнера. Наилучшим ответом мы будем называть стратегию, максимизирующую выигрыш игрока при заданных стратегиях других игроков. Пересечение наилучших ответов характеризует равновесие по Нэшу.
Давайте рассмотрим авиакомпанию А. Если она думает, что компания В решит ничего не вкладывать, то наилучшим решением для неё станет вложить 1 млн. рублей. Если А считает, что В выберет в качестве действия вложение в размере 1 млн, то оптимальным для А решением будет не вкладывать ничего, так как в таком случае она получит максимальный для себя выигрыш. Если же предположить, что В вложит 2 млн, то наилучшим решением для А также будет ничего не вкладывать. Это можно формально записать следующим образом (\(BR_{A}\left( S_{B} \right) -\)наилучший ответ фирмы А на стратегию фирмы В):
\(BR_{A}(Ничего) = 1\ млн.руб.BR_{A}(1\ млн.руб.) = НичегоBR_{A}(2\ млн.руб.) = Ничего\)
Мы могли найти наилучшие ответы фирмы А в табличке выше, сравнивая выигрыши «по столбцам». Будем отмечать наибольший выигрыш А при каждой фиксированной стратегии В символом \(\widehat{}\):
Ничего | 1 млн.руб. | 2 млн.руб. | |
---|---|---|---|
Ничего | (0;0) | (\(\widehat{5}\);-1) | (\(\widehat{5}\);3) |
1 млн.руб. | (\(\widehat{4}\);0) | (4;4) | (4;3) |
2 млн.руб. | (3;5) | (3;4) | (3;3) |
Теперь проделаем то же самое для фирмы В. Для этого нужно сравнить выигрыши «по строкам» в таблице. Например, первая строка соответствует стратегии фирмы А ничего не вкладывать, и наилучшим ответом фирмы В будет вложить 2 млн, чтобы получить выигрыш 3, который больше, чем 0 или -1. Отметим выигрыши, соответствующие наилучшим ответам фирмы В, символом \(\check{}\). Получим:
Ничего | 1 млн.руб. | 2 млн.руб. | |
---|---|---|---|
Ничего | (0;0) | (\(\widehat{5}\);-1) | (\(\widehat{5}\);\(3\check{}\)) |
1 млн.руб. | (\(\widehat{4}\);0) | (4;\(4\check{}\)) | (4;3) |
2 млн.руб. | (3;\(5\check{}\)) | (3;4) | (3;3) |
Единственная ситуация, при которой наилучшие ответы пересекаются – это профиль стратегий {Ничего; 2 млн. руб.}. В такой ситуации ни фирме А, ни фирме В отклоняться невыгодно, а значит, это является равновесием по Нэшу.
Конечно, в игре может быть больше, чем одно равновесие по Нэшу. В таком случае нельзя точно сказать, чем закончится взаимодействие игроков. Однако если игра придёт в одно из равновесий, то останется в нём пока игроки не начнут кооперироваться. В этом плане равновесия по Нэшу чем-то напоминают ямы: если их несколько, то можно свалиться в любую, но после падения в одиночку выбраться из неё не получится, только совместные усилия смогут как-то поменять ситуацию.
Теперь давайте посмотрим, как можно прийти к равновесию, если речь идёт о динамической игре.
Напомним, динамические игры – это те, в которых игроки ходят последовательно. В такой ситуации наиболее удобным представлением игры является дерево решений. Для такой игры необходимо определить:
-
Множество игроков ???? = {1, ... , ????};
-
Порядок ходов игроков;
-
Множество возможных ходов для каждого игрока в любой ситуации, когда он должен сделать ход;
-
Информацию, которую имеет каждый игрок в любой ситуации, когда он должен сделать ход;
-
Выигрыши игроков в зависимости от сделанных в игре ходов.
Давайте попробуем разобраться, как устроено дерево игры и каким образом можно прийти к равновесию на примере следующей игры.
Пусть законодательная система страны устроена таким образом, что сначала решение принимается законодательным органом, а затем президент может наложить вето на решение законодателей. Пусть у членов законодательного органа одинаковые предпочтения, что позволит нам моделировать их поведение, как поведение одного индивида. На повестке дня находятся всего две законодательные нормы – А и В, каждая из которых может войти в состав закона или нет.
Чтобы норма была принята, её сначала должно включить в закон законодательное собрание, а затем президент не должен наложить на неё вето. Предпочтения законодательного собрания и президента представлены в следующей таблице (4 – наилучшая ситуация, 1 – наихудшая):
Альтернатива | Полезность законодательного органа | Полезность президента |
---|---|---|
Приняты обе нормы A и B | 3 | 3 |
Принята только норма A | 4 | 1 |
Принята только норма B | 1 | 4 |
Не принята ни одна из норм | 2 | 2 |
Какая из норм в результате будет принята?
Давайте для начала изобразим дерево игры.
Первым ходит законодательный орган, предлагающий одну из четырех альтернатив. После чего ход переходит президенту, который закон либо одобряет, либо нет. Значит, начинать изображение игры следует с хода законодательного органа. Любое состояние игры, описывающее, кому в данный момент принадлежит ход, называется вершиной или узлом дерева и изображается в виде точки. Из вершин выходят «веточки»-рёбра, демонстрирующие все возможные действия игрока в этот ход. В конце каждой ветки записываются выигрыши каждого из игроков. Как правило, запись делается таким же образом, как и в статических играх, а именно координатами, где первая координата показывает выигрыш первого игрока, который начинал игру, вторая – выигрыш второго и так далее.
Важно подчеркнуть, что в динамических играх стратегиями игроков являются не действия в какой-то одной вершине, а набор действий во всех вершинах, где чисто теоретически может оказаться игрок. Дело в том, что стратегия определяется до начала игры, и каждому игроку уже во время взаимодействия необходимо понимать, как действовать во всех возможных ситуациях. Это чем-то похоже на инструкцию, которую жена может написать мужу перед походом в магазин. Она, конечно, может ограничиться фразой «пройди прямо до конца, возьми молоко, поверни налево, возьми хлеб, иди на кассу», но тогда если муж внезапно окажется в отделе видеоигр, исход будет неясен. Что ему делать: остаться и накупить много игр или пройти мимо? Полная инструкция в случае наличия в магазине отдела видеоигр должна содержать также фразу «если окажешься в отделе видеоигр, пройди мимо». Да, если всё пойдёт по плану, муж там и не пройдёт, мы обязаны предусмотреть все возможные варианты событий.
Наиболее удобно решать такие игры методом обратной индукции. Идея метода состоит в том, чтобы начать с конца каждый ветки и двигаться в обратном направлении, предполагая, что каждый игрок будет выбирать действие, которое максимизирует его выигрыш в каждой точке. Делая это, мы сможем определить оптимальную стратегию для каждого игрока в каждый момент игры.
В нашем примере последним делает ход президент. Если ему предложат одобрить норму А, он её отклонит, так как в этом случае его выигрыш будет равен двум вместо одного. Если предложат норму В, то примет. Предложение о двух нормах вместе также будет одобрено президентом. Таким образом, законодательный орган понимает, что ни при каких обстоятельствах он не получит выигрыш 4. И более того, он осознает, что вместо 8 исходов, для него доступны только 4 (доступные выигрыши изображены на рисунке зелёным), а значит именно из них и стоит выбирать:
Наибольший выигрыш законодательный орган получит, если предложит закон, в который будут включены обе нормы А и В. Следовательно, именно этим и закончится игра: будут приняты обе нормы.
Умение работать со статическими и динамическими играми полезны для разных разделов экономики, но особенно хороши для моделирования олигополистических рынков, где доминируют несколько фирм и их действия влияют друг на друга. А вот концепция равновесия по Нэшу будет встречаться нам практически в каждой главе, так как является основным способом определения равновесий в экономике.
Глоссарий:
теория игр, равновесие по Нэшу, равновесие по Парето, эффективность по Парето, статическая игра, динамическая игра, игра с полной информацией.