Наука
January 25, 2021

Парадокс Симпсона

Возьмём какую-то гипотетическую болезнь и два лекарства от неё. Предположим, у нас есть статистика выздоровления больных, которых лечили обоими лекарствами:

Очевидно, нужно всем прописывать лекарство А — вероятность выздоровления существенно выше.

Затем, к нам приходят более подробные результаты того же исследования:

Ага, у мужчин лекарство Б оказывается более действенно, прописываем им Б.

Что там с женщинами? Простым вычитанием получаем следующую таблицу:

И у женщин тоже лекарство Б более действенно. Приехали.

Если сложить цифры в таблицах 2 и 3, то получатся цифры, которые указаны в таблице 1.

Ставим себя на место врача из начала поста. Нужно прописать пациенту лекарство — какое?

При этом всегда можно построить таблицы 2 и 3 по другому уточняющему критерию (например, брюнет / блондин), которые точно так же будут указывать на лекарство А. Более того, можно построить вообще все возможные варианты «самых точных» таблиц (одновременно пол и цвет волос), которые будут совместимы с таблицами 1–3.