Парадокс Симпсона
Возьмём какую-то гипотетическую болезнь и два лекарства от неё. Предположим, у нас есть статистика выздоровления больных, которых лечили обоими лекарствами:
Очевидно, нужно всем прописывать лекарство А — вероятность выздоровления существенно выше.
Затем, к нам приходят более подробные результаты того же исследования:
Ага, у мужчин лекарство Б оказывается более действенно, прописываем им Б.
Что там с женщинами? Простым вычитанием получаем следующую таблицу:
И у женщин тоже лекарство Б более действенно. Приехали.
Если сложить цифры в таблицах 2 и 3, то получатся цифры, которые указаны в таблице 1.
Ставим себя на место врача из начала поста. Нужно прописать пациенту лекарство — какое?
При этом всегда можно построить таблицы 2 и 3 по другому уточняющему критерию (например, брюнет / блондин), которые точно так же будут указывать на лекарство А. Более того, можно построить вообще все возможные варианты «самых точных» таблиц (одновременно пол и цвет волос), которые будут совместимы с таблицами 1–3.