November 6, 2020

Портрет юношеского футбола России - 1 тур

Всем привет! Вас приветствует автор проекта "Футбол в цифрах". Мы начинаем серию аналитических заметок "Портрет юношеского футбола". В рамках этой аналитики мы попытаемся дать пользователю возможность взглянуть на юношеский футбол в России под новым углом, оценить общие показатели, лучше понять разницу между турнирами ЮФЛ-1 и ЮФЛ-2, проанализировать результаты команд, а также углубить анализ до игроков. За основу этого отчёта взяты данные и цифры из протоколов матчей, вся эта информация находится в интернете, в свободном доступе, а значит является достоянием общества. :)

Итак, аналитика будет выкладываться по итогам каждого тура, а так же после каждых 3-х туров будем подводить итоги, анализировать, как данные меняются в динамике.

Я постарался сделать аналитику таким образом, чтобы визуализация и мои комментарии были понятны читателю с любым уровнем подготовки в анализе данных. Если, что-то будет не понятно, то, пожалуйста, пишите, будем разбираться. И ещё, Ваши комментарии очень важны для развития проекта, если у Вас будут предложения по метрикам или показателям, которые по Вашему мнению было бы не плохо добавить, то милости просим :)

Итак, поехали......


График 1

На данном графике представлены основные метрики, которые будут фигурировать далее в отчёте. Думаю здесь всё понятно и сложностей возникнуть не должно. Не забывайте, что этот отчёт изолировано по итогам 1 тура, поэтому и цифры в соответствии с этим. В 1 туре суммарно по ЮФЛ-1 и ЮФЛ-2 было забито 58 голов, кол-во уникальных игроков попавших в заявки на матчи 506 человек и тд. Дальше, мы попытаемся проанализировать каждую из этих метрик в различных разрезах и сопоставить друг с другом.

График 2

В рамках этого графика мы анализируем две метрики: кол-во игроков и кол-во забитых голов. Визуально график делится на две части: в левой части игроки, в правой голы. График построен в разрезе амплуа игроков. Как мы видим в юношеском футболе России полузащитников больше всего 179 человек и 35% от общего кол-ва, защитники 166 человек и 33%, и тд. Тут всё понятно, и вряд ли мы этому удивляемся, потому, что чаще команды играют по схемам типа: 4-4-2, 3-5-2, 4-1-4-1 и просто исходя из этого, кол-во защитников и полузащитников должно быть больше. Но, в правой части графика, как мне кажется, есть интересное и не очевидное наблюдение, полузащитники всего на 1 гол, но всё же более результативнее нападающих по итогам 1 тура. Как сказал классик "Покажи мне свою полузащиту, и я скажу, что у тебя за команда". На точность цитаты не претендую, но смысл думаю Вы поняли. :)

График 3

Здесь мы посмотрим на те же метрики, но только в разрезе команд. Как мы видим из левой части графика, самая многочисленная команда это Строгино 43 человека и 8% (тёмно-серый шарик) от общего кол-ва футболистов юношеского футбола России, а вот справа у Строгино далеко не самый большой шарик. Пожалуйста, обратите Ваше внимание, что размер шарика указывает на размер значения относительно остальных. Так мы видим на правой части, что Зенит является лидером по кол-ву забитых голов 12 голов, 21% от общего кол-ва. Как возможно Вы могли догадаться, в данном сравнении мы пытаемся понять, есть ли корреляция между количеством игроков и забитыми голами. И возможно, как вы уже догадались, здесь мы её не видим, потому, что, например, Зенит не самая многочисленная команда 36 человек, больше у Строгино, Динамо и Рубина, но голов Питерцы на забивали больше всех. И по другим командам прослеживается та же не пропорциональность. Опытные аналитики, наверно, закидают меня помидорами и скажут, что корреляцию между двумя переменными правильнее визуализировать, например, на точечном графике, но это же только первая презентация и не хотелось бы усложнять, поэтому начнём знакомиться друг с другом с чего-то простого.

График 4

На данном графике уже привычные нам метрики, но теперь в новом для нас разрезе, а именно игроков, которые вышли с первых минут - Старт, и игроки выходившие на замену - Запас. Тут нас ничего не шокирует, всё логично, игроков в страте всегда больше, за исключением, если у Вас в команде нет 2 составов на скамейке запасных, что согласитесь встречается не часто :) Ну и по количеству голов пропорция сохраняется и мы можем спокойно листать дальше.

График 5

Теперь по интереснее, смотрим данные в разрезе турниров, отдельно ЮФЛ-1 и ЮФЛ-2. По кол-ву футболистов ничего удивительно, турниры примерно похожи, а вот по кол-ву забитых голов уже интересный инсайт, в ЮФЛ-2 забивается голов больше. Да, не сильно, всего на 2 гола. Но, мы же смотрим только 1 тур, а что будет дальше? Предлагаю запомнить эту деталь, ведь автор имеет полные данные за 8 туров на момент написания этой статьи, и конечно же уже проанализировал данные, поэтому могу сказать, что дальше эти пропорции будут отличаться ещё сильнее.

График 6

Движемся дальше, теперь анализируем в разрезе месяцев рождения футболистов. Возможно, кто-то из Вас сталкивался с подобной статистикой и уже отмечал, что игроков рождённых в первые 4 месяца года больше, и правда если обратить внимание на левую часть графика и сложить доли января, февраля, марта и апреля, то получится аж 54%, получается, что больше половины всех игроков, рождаются именно в "1 квартале" года. У автора есть гипотеза на этот счёт, она касается месяца зачатия, ведь зная месяц рождения, не сложно понять когда произошло зачатие. Почему автор говорит об этом, что за бред ты несёшь, скажете Вы и возможно будете правы, но мы анализируем футбол, как элемент спорта, и конечно здесь помимо таланта ещё важно физическое развитие, как составляющая успеха. Кто-то считает, что в футбол играют головой, и будут правы, но здесь без физического, а именно костно-мышечного развития никуда, мы знаем какими были Фигу, Криштиану, Горетцка и тд, и какими они стали сейчас. И гипотеза автора основывается именно на этом тезисе: костно-мышечное развитие. Мало кто знает, что ключевую роль в данном развитии играет витамин D, который не возможно получить из пищи. Он доступен только в синтезированном виде либо от солнца, да-да от солнечных лучей. Соответственно, если мы берём рождённых в первой части года, то зачатие и нахождении в утробе матери у этих детей было в максимально солнечные месяцы, они с полна захватили май, июнь, июль, август. Возможно эта гипотеза покажется Вам безумной, но тем и интересен анализ данных, что мы можем генерить подобных гипотез, сколько нам вздумается, поэтому присоединяйтесь ;)

Так увлёкся, что забыл сказать пару слов про правую часть графика, отметим здесь выделяющуюся результативных майских игроков, их кол-во не велико относительно остальных, всего 38 человек, а вот голов наколотили знатно аж 9 мячей!

График 7

Ещё не устали от бесконечных шариков и цифр? :) Тогда движемся дальше.......Обещаю, скоро шарики разбавим другой визуализацией для разнообразия. Итак, смотрим кол-во игроков и голы в разрезе имён. Я разделил ФИО на имя и фамилия отдельно, и таким образом имеется возможность корректно посчитать, игроков с каким именем больше всего в ЮФЛ. Интересно, не правда ли? И оказывается, что Никит больше, чем остальных, 33 человека и 7%, теперь Вы знаете, как надо назвать своего сына, если хотите, чтобы он заиграл в ЮФЛ. Шутка - 1 :) Когда я готовил этот отчёт, и ещё не видел цифр, мне почему-то казалось, что больше всего Александров, но нет, Никиты, Артёмы, Ильи, Даниилы и Егоры, вот топ по частоте встречаемости. А, что же по забитым голам, здесь мы уже видим другие имена, поэтому если вы ещё хотите, чтобы помимо фактического попадания в ЮФЛ, Ваш ребёнок ещё был и лучшим бомбардиром, то, теперь вы знаете, как поменять тактику и каким именем его назвать. Шутка - 2. :)

График 8

Помните, я обещал Вам, что шарики скоро кончатся, и мы немного сменим визуализацию, чтобы Вам было интересно? Сказано, сделано. Теперь с Вас точно лайк и подписка :) На этом графике мы вводим новую метрику, это относительный показатель кол-во забитых голов, хотел сказать на душу населения, но не в этот раз :) Кол-во голов на одного игрока, рассчитывается очень примитивно голы / игроков. И дальше анализируем в разрезе амплуа. Обращаю Ваше внимание на красную пунктирную линию, которая показывает нам референсное значение, то есть среднее. Как мне кажется, такая деталь позволяет смотреть относительно чего-то, чтобы понимать где мы находимся, выше или ниже. Напомню, что абсолютное значение забитых голов было у полузащитников (28 голов ) выше, чем у нападающих (27 голов), но в пересчёте, тьфу ты, опять хотел сказать на душу населения. В пересчёте на одного игрока у нападающих выше, потому как их кол-во меньше. В будущем, эта метрика позволит нам ранжировать игроков пофамильно, чтобы понимать, кто находится выше заветной красной линии, а кто ниже.

График 9

Следующий график аналогичен предыдущему, но теперь в разрезе команд. Пока анализируем в разрезе одного тура, возможно не совсем показательно, но мы запоминаем значение 0,11, и когда будем смотреть аналитику за следующие туры и ретроспективно за определённый период, эта цифра может о многом сказать.

График 10

Ну, что, ещё не устали от бесконечных цифр? Ничего, потерпите, скоро этот "ад" закончится, и вы будете единственным носителем сакральных знаний о юношеском футболе России :) На предыдущих графиках мы отмечали результативность майских игроков, вот теперь в сравнении со средним. Майские сделали погоду в 1 туре ЮФЛ.

Дорогой и уважаемый читатель, вот и закончилось моё повествование и твоё "мучение" по итогам 1 тура ЮФЛ, ты "дожил" до конца, вынес все трудности и лишения аналитика данных, стал более осведомлённым о юношеском футболе нашей замечательно страны. Я хочу искренне поблагодарить тебя за этот подвиг, возьми с полки пирожок. :) Шутка-3, если не сбился со счёта. В подобном ключе я планирую выложить отчёты по каждому туру, и каждые три тура будем подводить промежуточные итоги, чтобы понимать, как показатели меняются со временем. Я надеюсь, что ты смог найти для себя, что-то интересное и надеюсь на твоё возвращение. Для совсем хардкорных любителей цифр, ниже я оставлю ещё пару графиков по жёлтым и красным карточкам, но уже без моих комментариев, там будет всё до боли знакомо и понятно, а именно "шарики" :)

До новых встреч!