Почему нам достаточно синицы в руках? | Равновесие Нэша
В 2005 году крупный японский производитель электроники (Maspro Denkoh Corporation) не мог определить, какому аукционному дому передать право продажи коллекции картин со стартовой ценой в 20 миллионов долларов.
Конкурентам (Sotheby“s и Christie”s) было предложено сыграть в камень-ножницы-бумагу. Соперники написали выбранный ими объект на листочке и отдали организатору. Подумайте, если бы от победы в этой игре зависел ваш карьерный успех и премия в сотни тысяч долларов , что бы вы выбрали – камень, ножницы или бумагу?
Подскажу вам, что чаще всего люди выбирают камень (37,8%), бумагу ставят 32,6% игроков, а ножницы — 29,6% (рис. 1).
Тогда кажется, что надо ставить бумагу, ведь большинство выбирает камень. Но если соперник знает об этой тактике, надо ставить ножницы, ведь он поставит бумагу.
Christie”s полагали, что соперники в курсе этой статистики, и действовали по плану. Sotheby's, с другой стороны, решили, что игра будет зависеть от случая. В результате ножницы кристис разрезали бумагу сотбис. Почему же Сотбис в такой важной игре решили не заморачиваться?
Ответ дает теория игр. В «камень ножницы бумага» вам неизвестна компетенция соперника, так что лучшим выбором будет случайный предмет, т.е. использование смешанной стратегии.
Нежелание следовать смешанной стратегии привело футбольный клуб Челси к поражению в финале лиги чемпионов в 2008 году. Вот как это вышло. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта просмотрел тысячи записей пенальти, и дал рекомендации тренеру Челси по поводу поведения вратаря соперника – Эдвина Ван дер Сара. По статистике тот чаще прыгал в естественный от бьющего угол, т.е. в левый для правши и в правый для левши.
В финальной серии футболисты Челси, следуя указаниям тренера, забили 4 из 5 пенальти в неестественный для себя угол. И вот кульминация - 6:5 по голам в пользу Манчестера, и Челси надо сравнивать счет, чтобы остаться в игре. К мячу подходит Николя Анелька, он правша и по рекомендации должен бить в правый от себя угол. Вероятно, к этому времени Ван дер Сар уже разгадал тактику соперников и перед ударом показал рукой именно правый для пенальтиста угол. Это не могло не смутить Анелька, и он принял решение бить в другой. В итоге Ван дер Сар своим сейвом принес победу Манчестеру.
Очевидно, что в спорте почти не бывает вариантов, когда оба участника довольны – всегда есть победитель и проигравший, какую бы стратегию они не применяли. Но в жизни ситуации, такие ситуации встречаются сплошь и рядом.
Начнем с известной задачки. Двух подозреваемых поймали и заперли в разные камеры. Есть доказательства что они проникли ночью в жилой дом и украли телевизор. Хозяин заявляет, что также пропала крупная сумма денег, но прямых доказательств их вины в этом нет.
Следователь общается с подозреваемыми и говорит, что, если они оба сознаются в краже денег, то каждый получит по 5 лет тюрьмы. Если сознается один, а другой будет молчать, то сознавшийся получит 2 года, а второй – десять лет. Если же не сознается никто, оба сядут лишь на один год за кражу телевизора. Поговорить между собой у подозреваемых возможности нет.
Как бы поступили вы, попав в такую ситуацию?
Стратегия-то будет смешанной, потому что неизвестно, как поступит сообщник.
Очевидно, что логичное рассуждение выглядит так: «Допустим, мой товарищ признается. Если я тоже признаюсь, то получу 5 лет. А если буду молчать, то и все 10. Значит, если он сознается, мне тоже лучше признаться.А если он будет молчать? Признаюсь – получу всего 2 года. А если не расколюсь, то и вообще один. Это, конечно идеальный вариант, но слабо в него верится. Поэтому лучше сознаться и отсидеть 5 лет вместо 10» (рис. 4).
Ход рассуждений сообщника аналогичный. В итоге каждый заключенный гарантированно получает 5 лет тюрьмы вместо 1 года. Такой исход называется равновесием Нэша по имени известного американского математика. Кстати, у него довольно занятная биография, о которой был снят фильм «Игры разума», получивший 4 Оскара. Как-нибудь посмотрите.
Итак, равновесие Нэша – это комбинация стратегий, при которой никто не может улучшить свое положение, если другие участники не меняют свое поведение.
Такое равновесие хорошо иллюстрируют доктрина взаимного уничтожения, когда ни одна из стран не может безнаказанно применить ядерное оружие, но и разоружаться тоже никто не спешит. В итоге, государства тратят миллиарды долларов на военные разработки, которые, надеюсь, никогда не будут применены. А ведь эти деньги могли пойти на образование, строительство жилья и прочие важные цели.
В повседневной жизни с равновесием Нэша сталкивается каждый из нас. Вот вы с утра думаете, поехать на работу-учебу на машине или на автобусе. Ход рассуждений такой – хорошо, чтобы все поехали на автобусе, тогда пробок не будет, но ведь все рассядутся по машинам, а я буду толкаться в пробке в душном автобусе. Так уж лучше провести время в пробке с комфортом – сидя в машине. В итоге, так думает каждый и едет на машине, действительно создавая затор (рис. 5).
Еще один яркий пример – выборы. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого достойного. Или поступить, как делают многие - прийти на участок и проголосовать за того, кто у вас на слуху. Вы, конечно, хотите, чтобы были выбраны лучшие кандидаты, но также знаете, что кроме вас никто больше не будет изучать их программы. Поэтому даже не тратите время и поступаете как обычно (рис. 6).
Довольно примеров, расскажу, как выйти из этого равновесия. Ведь очевидно, что есть лучший вариант во всех перечисленных ситуациях. Раз люди сами договориться не могут, давайте наймем арбитра, как китайские доставщики в 19 веке. Тогда большинство грузов доставлялось ручным трудом – люди тащили тележку и получали деньги за своевременную доставку. Понятно, что если все будут стараться, то груз доедет вовремя. Да и даже если кто-то сфилонит, можно успеть. И что думает каждый: «Если все остальные тянут, то можно расслабиться, а если они еле работают, то от меня одного толку нет». В итоге грузы сильно задерживались, и доставщики, чтобы не терять деньги, сами нашли выход (рис. 7).
Они нанимали еще одного человека в команду, чтобы он подгонял лентяев. Перспектива получить плетью по спине сразу сместила равновесие, и все начали усердно работать.
В современном мире роль арбитра выполняет государство, конечно, не стегая никого плетью, а используя более мягкую политику. Так, достаточно ограничить въезд в центр города, сделать платными многие парковки и повысить налоги, и вот многие водители спешат с утра на остановку, а не за руль.
Правда, есть случаи, когда даже государство не может повлиять на это равновесие. Наверняка вы знаете, что раскладка QWERTY была создана, чтобы исключить сцепление рычагов пищущей машинки друг с другом и повысить скорость печати. Сегодня эта проблема ушла, а вот неэффективная qwerty осталась. И несмотря на то что уже изобретены раскладки, которые позволяют набирать текст быстрее и проще (Dvorak, Colemak), мало кто готов переучиваться, потому что qwerty используется повсеместно (рисунок 8).
Но если бы люди могли договориться друг с другом и одновременно перейти на другую раскладку, то всем стало бы лучше и равновесие Нэша сместилось в более эффективную точку.
Также и сообщники в задачке про кражу телевизора могли бы договориться вдвоём хранить молчание, и получить всего по 1 году (рисунок 9).
Есть конечно, еще один способ выхода из этого равновесия – непредвиденные ситуации, когда форс-мажор вмешивается в игру, но это уже совсем другая история.
Этот, а также мой материал по другим темам в видеоформате можно посмотреть в Telegram, YouTube, VK