Портрет юношеского футбола России - промежуточный итог 1-3 туры
Приветствую тебя, дорогой читатель. Как и обещал, этот пост будет суммарно по итогам 3-х туров. В этой аналитической заметке мы посмотрим, как менялись показатели в динамике, от тура к туру. Проведём параллели, посмотрим на распределения и оценим средние показатели в разбивке по ЮФЛ-1 и ЮФЛ-2.
Пара слов про данные, напомню, что здесь мы анализируем информацию, которые собираются из заполненных протоколов к матчам.
График 1
Начнём с привычных, общих показателей юношеского футбола, с той разницей, что теперь они разбиты по столбцам, где каждый столбец это отдельный тур. То есть цифры 1,2,3 - это туры, таким образом, мы можем оценивать, как менялись метрики со временем, а именно по турам. Так, мы видим, что в 1-м туре было забито 58 голов, во 2-м уже 54, а в 3-м туре совсем мало 45. Так же, мы видим, что и снижается кол-во игроков принимавших участие в матчах. А, вот кол-во жёлтых карточек наоборот растёт, интересная закономерность. Обращаю Ваше внимание на красную линиию, которая "пронизывает" каждый график. Какое слово выбрал, пронизывает, придаю важности своим отчётам :) Так вот, эта пресловутая красная линия отражает среднее по каждой метрики. Среднее кол-во голов 52 за тур. 463 игрока в среднем принимают участие в одном туре ЮФЛ. 49 жёлтых карточек в среднем, показывается за один тур. Интересно, не правда ли? :)
График 2
Как Вы могли заметить, этот отчёт немного отличается от предыдущих, как минимум потому, что пока нет шариков :) Это хороший сигнал, а значит автор подготовил для Вас, что-то новенькое и особенное. Но, не всё сразу, пока остановимся на привычных графиках, а именно кол-во забитых голов на человека, но, уже суммарно по 3-м турам, и как кажется наконец-то по амплуа всё стабилизировалось, Нападающие эффективнее Полузащитников в этом компоненте игры.
График 3
Потихонечку начинаем "разгоняться", как раз время просыпаться, потому, что впереди нас ждёт много новой визуализации. На графике 3 анализируем предыдущую метрику, но уже в разрезе команд. Как видно, 3 наиболее эффективные команды: Зенит, Динамо, Краснодар.
График 4
Метрика старая, но разрез новый, смотрим, кто же по сумме 3-х туров наиболее эффективнее по месяцам рождения. Как я отмечал в предыдущих отчётах: майские делают разницу, вот теперь находим этому подтверждение здесь, по крайней мере в самом начале турнира это было именно так. Порадовали июльские ребята, уверенное третье место с показателем 0,31 гола на человека.
График 5
Та-дам, встречайте новый график. Что за дичь ты нам показываешь автор, скажете Вы, и будете наверно правы. График сложноват для первоначального восприятия, но когда вы разберётесь, как правильно его читать, поверьте, Вы будете приятно удивлены. На всякий случай оставлю ссылочку на википедию с описанием: ссылка. Итак, в простонародии эта штука называется "ящик с усами", серая и темно-серая часть это "ящик", а линии выходящие из него вверх и вниз это "усы". Обратите внимание, что слева у нас находится шкала, она же ось, по которой располагаются значения кол-ва забитых голов на человека. От 0 и до 0,34. Теперь, обращаю Ваше внимание на ящики, их 3 штуки, каждый отражает картину по турам, цифры по ящиками 1,2,3 означают номер тура. Итак, давайте рассмотрим ящик 1 тура, самый левый. Его серая и тёмно-серая часть включают в себя ряд шариков, это наши команды: Локо, Чертаново, Ростов, полностью пападают туда, это те команды, которые отражают средние значения. Вообще, главная фишка ящиков с усами - это оценка средних показателей и насколько далеко от них выбиваются выбросы, те значения, которые сильно далеко от среднего. Среднее, точнее медиана, но не будем забивать голову, считайте, что среднее это черта между серой и темно-серой областями. Получается, что среднее кол-во забитых голов на человека в 1 туре было 0,10 - аккурат по Чертаново :) Все остальные команды, которые находятся выше или ниже отклоняются от этого среднего. Таким образом, Зенит находится далеко за пределами 4 квартиля (верхнего усика), а значит он выброс, а значит супер эффектино играл в 1-м туре. Академия Коноплева, СШОР Зенит и все остальные находящиеся ниже тёмно-серой зоны даже не додягивают до второго квартиля (дна ящика), а значит супер не эффектиные. Оценивая все три ящика вместе отмечаем, что Зенит в каждом туре был очень эффективен, так же и Динамо в 1 и 2 туре, Мастер-Сатурн во 2 туре. Красная линия по середине, показывается среднее суммарно по 3-м турам. Надеюсь понятно объяснил. Двигаемся дальше.....
График 6
Анализируя данные в разрезе выступлений дома и в гостях, отмечаем, что в ЮФЛ-1 хозяева одержали 73% побед. В то время, как в ЮФЛ-2 показатели практически 50/50, интересный расклад, правда? Как просто можно понять, насколько разные, эти два турнира. В сети был комментарий под постом, мол, зачем вообще нужна такая аналитика бла бла бла....Вот вы знали, чем отличаются ЮФЛ-1 и ЮФЛ-2 на цифрах? Или сколько в среднем забивают команды в туре? Или возможно Вы знали сколько игроков играют в ЮФЛ? Эти вопросы можно продолжать.... Собственно, для ответов на них нам и нужна подобная описательная аналитика, чтобы проводить сравнения и понимать эффективность различных показателей.
График 7
Ну, что, думали я не умею делать таблички? :) Конечно умею, да ещё какие! Представляю Вашему вниманию ТОП игроков. Слева, по кол-ву забитых голов - бомбардиры. Справа, в разрезе амплуа, по голам за матч, относительный показатель, который поможет нам оценить эффектиность, как говорится по фамильно. Итак, несмотря на то, что Белохонов забил мячей меньше Родионова и Гладышева, его эффективность выше, за счёт того, что он на 1 матч сыграл меньше. Так же, отмечаем, что по итогам 3-х туров лучшие бомбардиры Полузащитники! Помните, мы это неоднократно видели в предыдущих отчётах, что везде по эффективности Полузащитники вылазили, вот, теперь мы знаем виновников торжества в лицо! :)
График 8
Вот и добрались мы до корреляции, корреляции не простой, корреляции золотой. Перед Вами находится scatter plot (точечный график). Левая (вертикальная) ось показывает кол-во человек, нижняя (горизонтальная) ось кол-во голов. Точки на графике - это команды. Линия по середине показывает есть корреляция или нет. В качестве примера я вставлю картинку, на которой изображена полная корреляция двух переменных, луч направлен из левого нижнего угла в верхний правый, и точки расположенны в соответствующем порядке:
Таким образом, корреляция отражает увеличивается ли одна переменная при увеличении другой. Помните, у нас была гипотеза, что кол-во игроков в команде может оказывать влияние на кол-во забитых голов, вот мы и пытаемся оценить, так ли это. И, как мы видим от увеличения игроков, увеличения кол-ва голов не наблюдается. У Рубина самое большое кол-во игроков - 49 или 48 по левой оси, а по нижней оси они 3-4 с конца. И Зенит, находясь по нижней оси в самом авангарде около 30 забитых голов, по левой оси находится примерно по середине, на равне с Краснодаром, Локомотивом и СШОР Зенит, таким образом не о какой корреляции между этими двумя метриками не идёт и речи.
PS. Для особо продвинутых, R2 = 0,0002, а коэффициент Пирсона здесь стремится к нулю, что говорит о том, что да, корреляции нет :)
График 9
Но на этом автор не успокоился и решил посмотреть, тот же график с корреляцией, но уже в разрезе Старт/Запас, может всё-таки есть, какая-то корреляция в части запасных игроков, ну должны же они, как-то влиять на ход матчей. И, если в части игроков принимавших участие в матчах с первых минут такая же ж*па :) То, в части запасных игроков, кажется, что наметился луч похожий на скриншот, который я прикладывал выше, вроде из левого нижнего угла направлен в правый верхний, но нет, есть численные показатели охарактеризовывающие корреляцию, в частности R2 либо коэффициент Пирсона, на графике они не видны, но поверьте, они ниже плинтуса, а значит взаимосвязи нет. Да и понятно это из расположения точек на графиках. Ну, что, вот Вы и познакомились с корреляцией Пирсона, круто, правда? :)
График 10
Последний график на сегодня с комментариями. Закончим сегодня полным разрывом мозга, а именно ящиками с усами. Думали, я просто так Вас отпущу? :) Не буду подробно останавливаться на объяснении логики, надеюсь Вы смогли разобраться, отмечу лишь, что здесь изображенно. Левый ящик - голы забитые хозяевами, правый ящик - голы забитые гостями. Суммарно за 3 тура. Итак, мы видим, что дома самая забивная команда Зенит - 21 гол, а вот в гостях больше всех голов у ЦСКА - 13 голов, так же отметим результативность Динамовцев в гостях - 12 голов. Сильную игру Спартака дома - 14 голов и слабую на выезде - 2 гола, ниже медианы. Вы можете справедливо заметить, что прошло всего 3 тура, и например ЦСКА вообще все три матча сыграли на выезде, поэтому, такой и результат, но мы же не остановимся на этом, впереди будут и другие отчеты, и мы будем смотреть цифры за 6, 9 туров и тд. А, пока, просто учимся читать графики и анализировать. Ну, что интересно получилось?
Вот и подошёл к концу очередной отчёт по юношескому футболу России. Надеюсь, Вы чуть лучше стали представлять себе турнир ЮФЛ с точки зрения цифр, а ведь именно цифры, весьма точно, могут описать многие вещи, даже такие разношёрстные, как юношеский футбол. Ниже, я оставлю пару слайдов для собственного изучения, думаю проблем с понимаем возникнуть не должно. Эти графики, должны Вам показать разницу между турнирами ЮФЛ-1 и ЮФЛ-2, в цифрах. Отмечу, что данные представлены по турам, цифры 1,2,3 снизу каждого графика означают номер тура. Дорогой читатель, спасибо тебе за потраченное время, хорошего дня!