Статистика и котики
Чуть больше недели назад у меня была прикольная возможность выступать перед студентами Московского Городского Педагогического Университета. Мне задавали на встрече толковые вопросы, которые можно (и нужно) превратить в будущем в отдельные посты.
Встреча у нас была про статистику и один из вопросов был про книжку «Статистка и котики» [1], про которую я, разумеется, знал, но не читал, как-то она проходила все мимо меня. Поскольку на вопросы надо отвечать, пусть и не сразу - прочитал ее на минувшей неделе, о чем и пишу обзор:)
Я сразу скажу, что восторгов, я не разделяю, несмотря на то, сама идея рассказать просто о сложном верная и я полностью поддерживаю такое. Но к практике перейти от этой книжки довольно сложно, максимум, что вы получите - это представление о предмете.
Но с представлением тоже стоит быть аккуратнее. К примеру, я не встретил никакого упоминания ошибок первого и второго рода. Запутывающее объяснение p-значения и не совсем верное определение доверительного интервала. Устаревшие представления о требуемой мощности критериев.
Самый существенный недостаток, на мой взгляд - это практически полное игнорирование вопроса величины эффекта. После чего мы и наблюдаем множество статистически значимых открытий, экономическая (любая другая) польза которых стремится к нулю.
Из плюсов - довольно неплохо уделено внимание проблеме множественной проверки гипотез.
Если вы прочитали эту книгу, то для перехода к практике вам этого будет недостаточно. Кроме того, есть риск, что некоторые вещи вы поймёте неправильно. Поэтому я всё также рекомендую начинать с методологии исследований (к примеру, Шпигельхалтер [2]), а потом переходить к какой-либо несложной, но практической книжке по статистике. К примеру, вот это (https://t.me/h0h1_hr_analytics/13) [3], а если в контексте задач HR-аналитики, то рекомендую читать Линдона Сандмарка [4].
1. Савельев В. Статистика и котики.
2. Шпигельхалтер Д. Искусство статистики
3. https://handbook.mathpsy.com/
4. Lyndon Sundmark. Doing HR Analytics - A Practitioner's Handbook with R Examples