March 26, 2019

Занимательная статистика ШЧУЧГК-2019

Завершился школьный чемпионат Украины по "Что? Где? Когда?" и вот что в нём происходило.

Из 6 туров по 15 вопросов самым сложным оказался тур Константина Науменко, в нём старшие школьники брали в среднем по 3,57 вопроса, а младшие — по 2,4. Самый простой — тур Артёма Матухно, средний результат старших школьников — 10,38, младших — 8,73.


В туре Матухно было 4 детских для старшей категории, а в туре Науменко — 6 гробов для младшей.

За всю игру трижды вопрос спасали от гроба, при этом дважды это были команды из младшей категории (Сапсан и Вингардиум левиоса). Команды Сапсан, Матрица и HTL 173 дважды спасали вопрос от гроба в своей категории.


Командой, с наибольшим рейтингом* в старшей категории стала Американская котика, в то время как победители лишь на второй строчке. В младшей категории чемпионы набрали наибольший рейтинг, Гимназия №1 и Вингардиум левиоса отвечали на сложные вопросы.

*рейтинг команды считался как сумма рейтингов** взятых ею вопросов

**за рейтинг вопросов бралась разница между количеством команд и количеством команд, ответивших на вопрос


Среднее количество команд, взявших вопрос — 16,5, среднее количество вопросов, взятых командой — 34,6.

Индекс Джини по командам — 0,16, а по вопросам — 0,43 — то есть, вопросы различаются по уровню почти втрое сильнее, чем команды.

Самым неровным туром оказался тур Константина Науменко, индекс Джини для него — 0,64. Самым ровным — тур Артёма Матухно, для которого индекс Джини — 0,42, что тоже немало.

Самые похожие вопросы:

50 и 89

40 и 55

32 и 86

60 и 63

Вингардиум левиоса — самая невероятная команда - то есть, команда, которая брала много вопросов, которые никто не брал, но не брала простые. На втором месте по этому показателю — Циклон Глюзмана.

Вопросы 40, 7, 6, 59, 55 — были самыми важными для первой десятки. Каждый из них 4 раза был взят командой, которая на одно место впереди, и не взят предыдущей.


На изображении ниже можно увидеть кластеризации команд по близости их ответов. В этой визуализации важна только близость точек, то есть команды HTL 173 и Виктория-11 — наиболее далёкие команды, а Пингвины и Всё наоборот — близкие. Однако тут есть несколько нюансов, подробнее про стохастическое вложение соседей с t-распределением можно почитать на Википедии.