Это можно трактовать одновременно и как символ неизбежного краха такой системы, и как возможность появления на её обломках чего-то лучшего

11 декабря родился Альберт Уильям Таккер — канадский математик, внесший важный вклад в развитие топологии, теории игр и нелинейного программирования

Известен как один из авторов условий Куна–Таккера, играющих важную роль в нелинейном программировании

В 1950 году Таккер дал название и формулировку для одного из самых известных теоретико-игровых парадоксов — «дилеммы заключенного», сформулированного в рамках модели сотрудничества и конфликта, а уже к 1975 на эту тему было написано более двух тысяч научных работ

В классической формулировке дилемма заключённого звучит так: двух человек арестовали по подозрению в совершении преступления и каждому из них предложили дать на другого показания

При этом:

если один из них сдаёт подельника, а тот – молчит, то первый выходит на свободу, а второй садится на 10 лет;

если молчат оба, то каждый получает по полгода заключения;

если подельники сдают друг друга, то каждый из них садится на 2 года

Очевидно, что оптимальная для преступников стратегия — молчать, так они получили бы минимальный срок

Но если один из преступников молчит, у второго появляется стимул сдать другого — так он получит меньше

А если один сдаёт другого, то и у второго есть стимул расколоться, потому что молчанием он только ухудшит своё положение

В итоге оба заключенных чаще всего стучат друг на друга

И делают они это не из-за испорченности, трусости или подлости, а руководствуясь абсолютно рациональными соображениями

Ситуация, в которой участники дилеммы не могут улучшить своё положение, если другие участники своих стратегий не меняют, называется в теории игр равновесием Нэша

И в случае дилеммы заключённого равновесие Нэша просто не совпадает с оптимумом, в котором преступники получили бы минимальный срок

Игра «Дилемма заключённого» является моделью для многих ситуаций реального мира, связанных с совместным поведением — и в социальных науках (экономике, политике, социологии), и в биологии.

Например, ядерные державы не могут выйти из гонки вооружений, опасаясь, что противник получит преимущество, и впустую тратят миллиарды на подержание арсенала атомного оружия, которое не может быть использовано без риска уничтожения обеих сторон

Из страха остаться без работы или оказаться за решёткой, люди, если они будут протестовать (а другие – нет), не выходят на улицы, чтобы свергнуть диктаторов, за что расплачиваются десятилетиями экономической стагнации, нищетой, бесправием, и в итоге всё равно садятся за картинку, анекдот или репост в соцсетях

Особый интерес представляет повторяющаяся дилемма заключённого, когда игроки могут оценивать возможность предательства со стороны других игроков, т.е. на их поведение влияет опыт

Лучшая стратегия была определена в результате компьютерных соревнований, проведённых в 1984 году

Правила турнира были очень просты: состязаться могли алгоритмы любой сложности, присылать свои алгоритмы на турнир мог любой желающий

Алгоритмы соревновались парами, состав которых менялся после каждого раунда так, чтобы каждый мог сыграть с каждым

Алгоритм-победитель под названием «Око за око» (или, в англоязычном варианте «Tit for Tat»), написанный американцем Анатолием Рапопортом, состоял всего из четырех строк на BASIC’е и делал буквально следующее: первым ходом всегда ставил своему визави плюс, а затем просто повторял его ходы

Эта детерминистская стратегия обладает следующими качествами

Она:

• добрая – не предаёт, пока этого не сделал противник

• мстительная – наказывает за предательство

• прощающая – возвращается после наказания к сотрудничеству

• независтливая – не пытается набрать очков больше, чем оппонент

Здесь интересно, что наличие сотрудничества в группах позволяет укреплять доверие

Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит индивидов на дальнейшее сотрудничество

Этим объясняется, что в долгосрочном периоде капитализм смог организоваться вокруг ядра квакеров, которые всегда работали честно со своими партнёрами (вместо того, чтобы обманывать и нарушать обещания — явление, которое останавливало более ранние заключения долгосрочных добровольных международных контактов); сделки с надёжными купцами позволили культуре честного поведения (сотрудничества) распространиться среди других торговцев, которые распространяли её дальше, пока не стало выгодно вообще быть честным

Однако, спустя 20 лет с момента изобретения алгоритма «Око за Око», в 2004 г., стало ясно, что в жизни бывают ситуации, в которых даже идеальный алгоритм даёт сбой

Одна из таких ситуаций — взаимное недопонимание

Оказалось, что если иногда, с определённой вероятностью менять знак, который выдаёт алгоритм, на противоположный, то «Око за Око» перестаёт быть самой успешной стратегией

Когда случайных ошибок немного, а если точнее – от 1 % до 9 %, то самым успешным оказывается алгоритм, который очень сильно похож на «Око за Око» за одним исключением: получив минус, он даёт своему визави шанс исправиться и начинает минусовать его в ответ только после второго минуса

Получается, что в условиях неопределённости, неоднозначности трактовок и мотивов, прощение оказывается ещё более важным фактором успеха, а слова «если тебя ударили по правой щеке, подставь левую» обретают вполне понятный и конкретный смысл

Получив пощёчину, имеет смысл разобраться, в чём дело, прежде чем начинать войну до победного конца

Однако щёк всего две, и после удара по второй обязательно должно следовать воздаяние

А самое главное, оказалось, что если неопределённость возрастает до 10 % и выше, то среди алгоритмов появляется новый лидер – Предатель, который в любой ситуации и вне зависимости от действий других ставит другим только минусы

При переходе тонкой грани между 9 и 10 % всё переворачивается с ног на голову

Благородные и великодушные внезапно оказываются в глубокой заднице

Точнее, по итогу там оказываются все, но наверх при этом выбираются самые эгоистичные, беспринципные и скользкие мрази

(А в реальной жизни, в отличие от компьютерной симуляции, они могут менять правила игры)

В компьютерной симуляции всё заканчивается, когда неопределённость возрастает до 50 %, то есть наступает полный произвол

Ни одна стратегия, ни один алгоритм в таких условиях не могут выиграть

Наступает хаос

Это можно трактовать одновременно и как символ неизбежного краха такой системы, и как возможность появления на её обломках чего-то лучшего