February 4, 2020

Теорема Байеса и метод распределения Пуассона Применение в спорте


• Теорема Байса:

Выглядит так:

P(A|B) = P(B|A)*P(A)/P(B)

P(A) – априорная вероятность гипотезы А

P(A|B) – вероятность гипотезы А при наступлении события В (апостериорная вероятность)

P(B|A) – вероятность наступления события В при истинности гипотезы А

P(B) – Полная вероятность события В


В случае расчета исхода спортивного события по этой теореме, мы просчитываем индивидуальный тотал голов для каждой из команд. С учетом статистики каждой из команд за весь сезон и за последние матчи, при этом учитывается мотивация команд и спортивная форма. На каждый из этих критериев в формулу расчета подставляется коэффицент, который вытекает из статистики команд которая рассчитывается путем построения матриц забитых и пропущенных голов, мотиваций и спортивной формы за весь сезон и за последнии игры.
К этому всему накладываются личные встречи команд и наложение расчетов через метод распределения Пуассона. После всех расчетов мы подставляем полученные данные в Теорему Бейса, в которую, к слову добавляется порядка 10 вводных.

• Метод Распределения Пуассона:

Выглядит так:

P(x; μ) = (e-μ) (μx) / x


В нашем случае по формуле вытекающей из данного метода мы рассчитываем: силу атаки и силу обороны каждой из команд за весь сезон и за последние матчи, далее рассчитываем индивидуальный тотал каждой команды в зависимости друг от друга (формула: Голы1 = Атака1 x Оборона2 x Средний индивиуальный тотал1). Далее мы рассчитываем вероятности забитых голов от 0 до 5 подставляя значения в формулу: P(x; μ) = (e-μ) (μx) / x где Х это число голов. Получаем матрицу со значениями 2х5 и вероятностью каждого исхода. После этого такие таблицы За сезон и последнии матчи накладываем друг на друга получаем средние значения вероятности в процентах на каждый исход.

• Объединение методик Пуассона и Баеса:
По Пуассону мы получили Значения, Из статистики команд мы тоже получили средние значения, эти все значения представляют из себя матрицы, выходит 15 матриц с вероятностями голов забитых/пропущеных, по этим матрицам мы строим функции и находим точки пересечения которые и являются исходом матча на 100% по теории вероятности, но на практике мы можем просчитать исход только на 80% .

• Программное Обеспечение для нашей методики:
Поскольку расчет каждого события вручную у человека с хорошим уровнем знания теории вероятности занимает порядка 5 часов, наша команда разработала Нейросеть которая сама высчитывает эти все значения исходя из нашей базы данных спортивных событий и календаря ближайших событий.

• Аналитика:
Умное ПО это конечно круто, но после полученных результатов расчета нейросети, мы анализируем прогнозы на каждое событие от всевозможных каперов и обозревателей, На выходе получая из 1000 футбольных матчей, которые проходят каждый день 10-20 шт и ставим на только на ТБ имея проходимость прогнозов в 80%.