Что такое p-значение?
Все ученые и научные журналы указывают и зачастую безоговорочно требуют указания в исследованиях p-значений, но что это такое и что с ними не так?
Кратко на словах – это возможное отличие от первоначальные результатов исследований, если бы вы в будущем вновь провели такое же исследование с использованием той же модели.
Таким образом, чем ниже значение p, тем ниже шанс получить другой результат. Отсюда, низкое p – залог «научности». Но что с этим показателем не так? А не так всё.
Сейчас все свелось к тому, что любой вшивый ученый рисует это бесполезное p-значение, [по-научному] обычно равное < 0,05, и просто вписывает его в работу, когда эти p не значат практически ничего.
Весь их смысл – это требование ее наличия со стороны научного журнала, когда по факту она не отражает реальность и имеет столько же смысла, сколько пользовательское соглашение в каких-нибудь программах.
Я немного порылась в турнетах и нашла идеальное сориалстори-объяснение «для чайников», что это вообще такое! Немного перепечатала, но сохранила суть диалога.
Так что вам рождественские сказки на ночь!
Это новогодняя история о вас, решивших сходить к врачу:
Вы заходите к вашему личному врачу в кабинет. Он держит вашу карту с серьезным выражением лица.
- «Мистерс Обитатель, боюсь, у меня для вас плохие новости.»
- «Скажите прямо, доктор, я справлюсь.»
- «У вас...» - Произнес он, сделав паузу, чтобы еще раз грустно посмотреть в карту, надеясь, что он ошибся. - «У вас ужасный случай метастазирующей паранеопластической пузырчатки.»
- «Боюсь, что да.» - Ответил врач. - «Грибковый ветвистый вид. Такие невозможно вылечить хирургическим путем. Но это не так ужасно, как кажется. Есть лекарства, с которыми появится некоторая надежда.»
- «Ну, есть старый добрый аспирин.»
- «Да, есть кое-что новое. Прибылин[Скотинобинул™️] от Лакшери Фармасьютикалс.»
- «Да, вы должны были видеть рекламу. Ту, в которой счастливые люди идут в замедленной съемке с широкой улыбкой на лице? Там еще писалось: «Спросите своего врача, подходит ли вам Прибылин?»
- «Ну, я имею в виду, он лучше, чем аспирин?»
- «Если я приму его, у меня будет больше шансов на выздоровление, чем у аспирина, верно?»
- «Честно, я не знаю. Что я могу сказать, так это то, что в Лакшери провели научный эксперимент, сравнив Аспирин с Прибылином. Они дали одной группе людей аспирин, а другой – прибылин, а затем измерили улучшение метастазирующей паранеопластической пузырчатки».
- «Затем они провели сложный статистический анализ и получили p-значение 0,0412.»
- «Так что это значит? Что Прибылин лучше?»
- «Ну, мы не можем это сказать. Но мы можем сказать, что p = 0,0412 является статистически значимым.»
- «И эта статистическая значимость означает, что Прибылин лучше?»
- «Не совсем. Это означает, что результат не был случайным.»
- «Значит, неслучайность означает, что Прибылин лучше аспирина?»
- «В каком смысле? Что тогда означает «статистически значимый»?
- «Это означает, что в ходе анализа было обнаружено значение p меньше 0,05.»
- «Подождите. Так, значение p меньше 0,05 означает, что Прибылин лучше, чем аспирин, верно?»
- «Опять же, все немного сложнее...»
- «Тогда объясните мне. Скажите точно, что это за p-значение. Я слышал о них раньше, когда читал статьи, которые всегда начинаются со слов «Исследования показывают». Расскажите мне, что оно означает в контексте нового препарата? В конце концов, мне нужно решить, стоит ли его брать.»
- «Хорошо. В этом статистическом анализе, о котором я вам рассказывал, они рассчитали нечто, называемое статистикой. Технически, это математическая функция данных, которые они собрали о пациентах, и некоторых других вещей, связанных с конкретным типом анализа, который они проводили. Вы слушаете?»
- «Нужно ли мне понимать эту математическую часть?»
- «Нет, вам не обязательно понимать.»
- «Далее они спрашивают, что произойдет, если они повторят тот же эксперимент, который только что провели, предполагая, что они сделают это совершенно так же: то же количество пациентов в обеих группах, одинаковые дозировки, одни и те же дни недели, в которые давались лекарства, одинаковое количество мужчин и женщин, одинаковый вес пациентов и так далее. Точно так же.»
- «За исключением того, что это повторение отличается в какой-нибудь случайной величине.»
- «Это значит, что все точно так же, но что-то изменилось так, что это никто не может предсказать.»
- «Значит, не совсем то же самое. Могут быть разные вещи, о которых никто не знает, да?»
- «Скорее всего. Но это не так уж и важно, потому что этот эксперимент никогда не проводился. Это только «воображается», что это сделано.»
- «И в этом воображаемом эксперименте они воображают, что проводят тот же анализ. И в этом воображаемом повторном анализе они снова вычисляют ту же статистику. Вы понимаете?»
- «Не совсем, но продолжайте.»
- «Тогда они воображают, что проводят третий эксперимент, такой же, как второй. А затем четвертый, пятый и так далее. Фактически, они воображают бесконечность будущих экспериментов.»
- «И значение p – это вероятность того, что одна из этих воображаемых статистических данных по абсолютной величение больше, чем та, которую они вычислили в первом, реальном эксперименте. Вот, это вам помогло?»
- «Нет. Какое это вообще имеет отношение к тому, что новый препарат будет лучше?»
- «Тогда почему бы им просто не подсчитать шанс того, что новый препарат будет лучше, и не сказать мне об этом? Это то, что мне действительно нужно, чтобы принять обоснованное решение.»
- «Никто не знает. Когда вы спрашиваете, они всегда отвечают: «p-значения имеют какое-то применение.»