Статьи
April 13, 2020

Футбол и математика. Часть 1

Я хочу предложить Вам цикл статей на тему математики и футбола как их объединить как можно моделировать будущее и предсказывать исходы матчей все это будет в данном цикле статей, причем состоять они будут в большинстве из кусков труда одного академика прикладной математики, в которых я буду делать некоторые свои вставки и объяснять о чем речь, потом в чает можем обсудить если что непонятно.

Материал очень большой поэтому будет много отдельных частей чтобы сильно не перегружать мозг, постараюсь отбирать самое интересное. Начнем рассказ и объяснение идут от первого лица (академика прикладной математики, большого поклонника английской АПЛ в частности и футбола в целом)

Поехали:

Мое увлечение закономерностями берет начало с огромной оранжевой книги в твердом переплете, в которой было полным-полно статистических данных по футболу. Эту книгу я получил на Рождество, когда мне было восемь. Я мог часами сидеть, изучая страницы с цифрами. Я обожал таблицы, в которых названия команд шли сверху и в колонке слева, а в ячейках указывались результаты матчей между ними. Я изучал таблицу, подсчитывая все голы и отыскивая необычные результаты. 4:3 был моим любимым, 5:2 тоже был неплохим.

В настоящее время у меня нет столько времени, чтобы читать футбольные альманахи. К счастью, поиск нужных результатов и таблиц в Интернете занимает считаные секунды. Если вы это сделаете, то почувствуете непредсказуемость, о которой говорил Гаскойн. Сезон Премьер-лиги-2012/13 был очень хорош – в нем хватало захватывающих матчей и неожиданных результатов. «Ливерпуль» дважды выиграл со счетом 5:0 и еще один раз 6:0, но не смог квалифицироваться в еврокубки. Закончился же он выходом на пенсию Алекса Фергюсона, короля неожиданных поворотов судьбы на последних минутах. Его последняя игра у руля «Манчестер Юнайтед» не стала исключением: ничья 5:5, в которой «Вест Бромвич Альбион» забил три гола в последние 10 минут. «Футбол, черт возьми!» – как сказал однажды Ферги.

Эти результаты – захватывающие исключения, самые запоминающиеся матчи сезона. Было также довольно много скучных нулевых ничьих, о которых забыли фанаты, но не статистика. Если мы хотим понять основную закономерность, мы должны включить и эти матчи в наш анализ. Рисунок 1.1 – гистограмма количества голов во всех матчах Премьер-лиги в сезоне-2012/13. Среднее количество забитых мячей составило чуть меньше трех за матч – точнее, 2,79.

Гистограмма показывает, как часто встречаются те или иные результаты матчей. Всего было тридцать пять безголевых ничьих, что можно увидеть на первом столбце нашей гистограммы. Последний матч Фергюсона в том сезоне был одним из двух, которые закончились с десятью забитыми голами, – это можно увидеть справа. Наиболее популярным количеством забитых голов в матче было три, и в большинстве этих игр финальный счет был 2:1. Закономерность начинает проявляться. Следующий шаг – посмотреть, можем ли мы понять, откуда эта закономерность появилась. Для этого нам нужна математическая модель.

Я интересовался математическим моделированием почти так же долго, как и статистикой. Еще одним важным хобби во времена, когда я читал большой оранжевый футбольный альманах, была игра в настольный футбол Subbuteo. Вместе с другом Дэвидом Патерсоном я основал лигу Subbuteo. Мы играли каждый день после школы, успевая сыграть пять или шесть матчей перед ужином. Результат каждой игры мы записывали. Но у нас никогда не было времени на то, чтобы сыграть все 380 игр, составляющих турнир (20 команд, каждая из которых играет 19 домашних игр; 20 × 19 = 380 матчей). В сутках просто не хватало часов для этого.

Ограниченные родителями, которые думали, что мы должны спать и есть, Пэтци и я были вынуждены найти другой способ завершить лигу. Решением стали игральные кубики. Пэтци бросал кубик для одной команды, а я – для другой. После этого мы отнимали по единице от результата и получали итоговый счет. Если «Арсенал» играл с «Манчестер Сити», он бросал красный кубик, а я голубой. Если красный показывал пять, а голубой три, это означало победу «Арсенала» со счетом 4:2. Эта модель может генерировать игры с диапазоном забитых голов от нуля до десяти, в точности как гистограмма Премьер-лиги.

После множества бросков кубиков и небольших корректировок в пользу наших любимых клубов мы получили все результаты. Мы составили таблицу, статистику и аккуратно все это записали на линованной бумаге. Я думаю, мне суждено было стать математиком (Дэвид же теперь успешный бухгалтер).

Бросание костей – очень простой пример математической модели, но с ним есть несколько проблем. Незадолго до Рождества 2012 года «Челси» обыграл «Астон Виллу» со счетом 8:0, чего просто не могло произойти в нашей модели. Еще одной проблемой стало то, что нулевые ничьи в футболе происходят очень часто. Если же брать кубики, то 0:0 встречается столько же раз, как и 5:5. Однако в гистограмме ноль голов в одной игре почти в двадцать раз вероятнее, чем десять. Эта модель не работает. Футбольные игры – не случайный бросок кубиков.

Но матчи в футболе случайны в том или ином отношении. Непредсказуемость делает футбол и другие командные виды спорта интересными. Если во время просмотра матча вы отвлеклись на несколько секунд, вы можете пропустить важную атаку и внезапный гол. Мне, как моделисту, это сообщает кое-что важное. Гол может случиться в любую минуту матча. Несмотря на всевозможные факторы, определяющие количество голов, голевые моменты более или менее случайны.

Мы можем превратить это утверждение в симуляцию. Представим футбольную игру как девяносто одноминутных отрезков, в каждом из которых гол в равной степени возможен. При среднем 2,79 гола за игру вероятность забитого мяча в любом из этих отрезков равна 2,79/90 = 0,031. Это означает, что наш шанс увидеть гол в любую случайно выбранную минуту составляет примерно 1 к 32. Не такой уж и большой, но достаточный для того, чтобы вы продолжали смотреть.

Используя эту модель, мы можем запустить компьютерное моделирование на 90 минут, где в каждой имитируемой минуте гол будет забит с вероятностью 0,031.

_____________________________________________________________________________

Отступление: именно так сейчас работают мои модели, я моделирую каждую минуту из 90 минут матча используя для это метод Монте Карло, более простой вариант это распределение Пуассона и делаю только я это не с голами а с показателями xG

_____________________________________________________________________________

Если мы проведем симуляцию множества матчей, мы сможем узнать, как выглядит типичный сезон. Такой симулированный сезон показан на рисунке 1.2 как сплошная линия, наложенная на гистограмму реального сезона Премьер-лиги-2012/13.

Модель показала хорошее соответствие с реальностью. Не забывайте всю сложность игры. Тренер, который кричит у кромки поля. Фанаты, пытающиеся подбодрить команду или (чаще всего) доказывающие, насколько она никчемна. Мысли в головах игроков, когда они говорят себе, что вот он, шанс забить. Кажется, будто ни один из этих факторов не влияет на распределение забитых голов. Однако на самом деле все эти факторы вместе и порождают тип случайности, допущенный в модели.

Сплошная линия на рисунке 1.2, созданная моей симуляцией, известна как распределение Пуассона. Такое распределение возникает, когда время предыдущих событий не влияет на будущие события. Это именно то,

что я предположил в своей симуляции, и это то, что на самом деле происходит в футболе: ни количество забитых голов, ни количество времени не влияют на вероятность того, что будет забит еще один мяч. Полученное распределение Пуассона отражает общую форму гистограммы количества голов. События делают каждую минуту футбольного матча непредсказуемой, отсюда и появляется такое распределение. Это закономерность, которая возникает из абсолютной случайности.

Я не хотел рассматривать Премьер-лигу, потому что заранее знал о ее соответствии распределению Пуассона. Так получилось, что я все-таки остановился на футболе. Я мог бы выбрать любой вид спорта, в котором голы забивают в любое время. Чтобы убедиться в этом, я просмотрел все результаты игр НХЛ в сезоне-2012/13.

За 60 минут основного времени в среднем были забиты 5,2 шайбы. Рисунок 1.3 показывает гистограмму количества голов в 720 сыгранных играх сезона. Сплошная линия – соответствующее распределение Пуассона. Более высокое среднее число голов смещает пик в гистограмме вправо, но симуляция снова соответствует данным. Данные и модель практически не отличаются, и небольшое расхождение в матчах с четырьмя забитыми шайбами может объясняться колебаниями от одного сезона к другому. В хоккее голы забиваются чаще, но ровно так же случайно, как и в футболе.

продолжение следует.....