Как не быть обманутым вирусными графиками
Перевод статьи от Noah Smith.
Больше переводов в моём телеграмм-канале:
https://t.me/holyfinance
“Искусство всякого пропагандиста и всякого агитатора в том и состоит, чтобы наилучшим образом повлиять на данную аудиторию, делая для нее известную истину возможно более убедительной, возможно легче усвояемой, возможно нагляднее и тверже запечатлеваемой.”.
— Ленин
Когда я начал писать этот блог в конце 2020 года, одна из моих первых идей для поста называлась “Как не быть обманутым вирусными графиками”. У меня был готов список известных графиков. Но по какой-то причине я отложил этот пост, и с годами список графиков становился все длиннее, и я продолжал откладывать его.
Ну, теперь всё. Наконец-то меня так разозлил вирусный график, что я больше не могу откладывать этот пост. Но список стал настолько длинным, что мне придется разделить пост на две части. Итак, сегодня мы узнаем, как идентифицировать графики, содержащие дезинформацию — намеренный обман, неосторожные ошибки или просто в целом бессмысленные данные. В части 2 мы узнаем, как интерпретировать диаграммы, которые используют хорошие данные, но которые рассказывают историю с большим количеством нюансов, чем понимает большинство людей.
Очень плохой график соотношения арендной платы и дохода
Активист и крикун в социальных сетях Джошуа Поташ недавно опубликовал видео, в котором утверждается, что арендная плата растет намного быстрее, чем доходы домохозяйств с 1985 года:
Это враньё. Хотя внизу экрана написано “Примечание: Арендная плата и доход скорректированы с учетом инфляции”, это либо ошибка, либо ложь. Только доход корректируется с учетом инфляции. Красная линия арендной платы - нет. С тех пор была добавлена заметка сообщества, указывающая на ошибку, но не раньше, чем твит Поташа смог набрать невероятные 77 000 лайков и 17 000 репостов.
Сравнение скорректированного на инфляцию (или “реального”) экономического показателя с нескорректированным (“номинальным”) - один из самых простых способов составить график, который привлекает внимание и вызывает клики, но который является пустышкой. Если вы сравниваете скорректированный на инфляцию показатель с некорректированным, со временем между ними возникнет большой разрыв. Вместо этого, чтобы провести сравнение яблок с яблоками, вы всегда должны сравнивать либо два скорректированных числа, либо два нескорректированных числа.
Давайте перейдем на FRED, странице с данными, которую ведет Федеральная резервная система, и посмотрим, каковы истинные цифры. Давайте сравним средний доход домохозяйства с показателем индекса потребительских цен для “арендной платы за основное жилье”, который является стандартным показателем для средней арендной платы по стране. И давайте установим их оба равными 100 в 1985 году (именно с этого начинается график Поташа), чтобы мы могли посмотреть на процентное увеличение. Вот что мы получаем:
Здесь вообще нет большого расхождения; эти два числа очень точно отслеживают друг друга. Примерно в 2007 году наблюдается небольшое расхождение, и доход немного отстает от арендной платы, но к 2021 году они все еще довольно близки, на чем данные заканчиваются.
Но, по крайней мере, арендная плата выросла немного больше, чем доход, верно? Ну... Нет. На самом деле доход домохозяйства зависит от количества людей в домохозяйстве. Если мы посмотрим на средний личный доход, то обнаружим, что с 1985 года он фактически вырос больше, чем арендная плата.
В любом случае, это не первый случай, когда эта ошибка становится вирусной. Еще в 2019 году в статье Wall Street Journal приводились некоторые данные из книги профессора права Джорджтаунского университета Адама Левитина, которые оказались просто старой ошибкой “номинальное против реального”.:
Аналогично диаграмме Поташа, и доход, и цены на жилье помечены как “реальные”, в то время как на самом деле “реальным” является только показатель дохода, а показатель цены на жилье на самом деле номинальный. WSJ составила свою собственную таблицу данных и опубликовала ее в Твиттере, и, как и у Поташа, они стали вирусными. Однако у них хватило порядочности удалить свои твиты после того, как им указали на ошибку — хотя и не раньше, чем многие влиятельные фигуры были случайно дезинформированы.
Так или иначе, арендная плата и доход в Америке в основном идут в ногу друг с другом (хотя это не значит, что вы всегда можете позволить себе жить в том месте, где вам хотелось бы жить). Это полезно знать, но это не дает ответа на более глубокий вопрос: как мы можем избежать подобных графиков? В приложении, ранее известном как Twitter, теперь есть функция “заметки сообщества”, которая в конечном итоге улавливает большинство ошибок и недостоверной информации в вирусных твитах, но у TikTok нет такой функции, и нет простого способа определить графики, вводящие в заблуждение. Вы, по сути, предоставлены сами себе, и только ваш ум может защитить вас, в мире людей, которые хотят заполучить ваши клики и взгляды.
Ваш ум, а также ваш дружелюбный блогер по экономике Noah Smith. Итак, вот несколько приемов, которые помогут вам обнаружить неверные данные.
Относитесь скептически к впечатляющим графикам; проверьте, не были ли они опровергнуты
В общем, первое правило вирусных графиков заключается в том, что чем более сногсшибательными и поразительными они являются, тем больше вероятность того, что происходит что-то подозрительное. Как говорится, “экстраординарные заявления требуют экстраординарных доказательств”. График соотношения дохода от продажи калия и арендной платы от Поташа - очень хороший пример. В среднем по Америке арендаторы тратят на аренду около 30% своего дохода, так что, если бы арендная плата действительно удвоилась по отношению к доходу с 1985 года, американцы сейчас тратили бы на аренду 60% своего дохода. Похоже ли это на то, что происходит на самом деле? Нет. Таким образом, его график должен был сразу вызвать подозрения, основываясь на размере заявленных цифр.
Это не означает, что каждый сногсшибательный график, который вы видите, является обманом. Например, вот график ВВП с 1000 года, который, вероятно, в принципе верен:
Теперь существует множество потенциальных проблем с этими данными (которые получены в рамках проекта Maddison в Университете Гронингена). На самом деле мы не знаем исторического населения этих регионов, потому что они не вели тщательных записей; мы просто строим предположения, основываясь на том, сколько людей, по нашему мнению, могла бы прокормить доступная земля. Мы также не знаем фактической величины экономического производства за этот период; мы просто строим предположения, основываясь на том, какой, по нашему мнению, была структура промышленности в тот исторический период и насколько, по нашему мнению, продуктивной была каждая отрасль. Это очень приблизительное предположение. Но даже если цифры на этом графике отличаются в 2 раза, это будет выглядеть в основном так же — экспонента, показывающая, что человечество стало намного богаче, когда произошла промышленная революция.
Но в целом, такие драматичные графики, скорее всего, будут каким-то образом приукрашены или смягчены. Нечто столь драматичное, как Промышленная революция, встречается очень редко! Большинство событий в мире вполне нормальны. Таким образом, чем более сногсшибателен график, тем больше вы должны быть склонны ознакомиться с ним, прежде чем верить в историю, которую он рассказывает.
Самое простое, что вы можете сделать, чтобы проверить вирусный график, - это посмотреть, не критиковал ли его кто-то другой. Приложение, ранее известное как Twitter, на самом деле сейчас действительно хорошо справляется с этим, поскольку в нем есть функция под названием “Заметки сообщества”, в которой под публикацией появляются краудсорсинговые исправления. Комментарии сообщества не всегда верны, но обычно так оно и есть. Politifact и другие сайты, занимающиеся проверкой фактов, также хороши в этом, хотя они тоже не всегда все делают правильно. В качестве третьего варианта вы можете проверить Reddit, чтобы узнать, не опроверг ли кто-нибудь уже этот график; Обратный поиск изображений в Google очень полезен для этого.
Иногда вы действительно можете использовать старый вирусный график в качестве проверки работоспособности нового вирусного графика. Например, возможно, вы уже видели этот график раньше, поскольку он был очень вирусным:
Теперь у меня есть некоторые незначительные проблемы с тем, как обычно интерпретируется этот график (о которых мы поговорим во 2 части 2). Но данные хорошие. И если вы видели это раньше, то, возможно, помните, что “средняя почасовая заработная плата” поднимается выше, чем “жилье”. Средняя почасовая заработная плата - это не совсем то же самое, что средний доход, но это хороший приблизительный показатель. И цены на жилье - это нечто большее, чем просто арендная плата, но опять же это хороший приблизительный показатель. Итак, если вы знакомы с этим графиком, вы должны сразу же с подозрением отнестись к любому графику, который показывает, что арендная плата или цены на жилье растут намного, намного быстрее, чем доход.
Еще одна хорошая проверка на здравомыслие - это продумать последствия графика. С помощью графика соотношения жилья и дохода, быстрая мысленная математика показала, что он утверждает, что арендная плата удвоилась в процентном отношении к доходу. Многие графики имеют довольно очевидные следствия, и это помогает их осмыслить. Даже если окажется, что график не является бредом, размышления над радикальными последствиями помогут понять, почему этот график важен.
Последняя быстрая проверка заключается в просмотре источника данных. Если у диаграммы нет источника данных, это красный флаг. Если же источник указан, то иногда можно получить некоторую информацию о том, насколько надежными могут быть данные. Правительственные источники данных, как правило, очень хороши — в правительственных данных, безусловно, есть допущения и двусмысленности, но, как правило, в правительстве работает много умных людей, которые делают все, что в их силах. Есть также некоторые известные плохие источники, такие как Shadowstats, чьи данные полностью сфабрикованы и которые были опровергнуты много-много раз. Многие данные не подпадают ни под одну из этих категорий, но
“Стандартный контрольный список” критических замечаний не очень полезен
Одна вещь, которую я нахожу не очень полезной, - это иметь стандартный список вещей, к которым нужно немедленно относиться критически. Неспособность сделать поправку на инфляцию действительно является очень распространенным источником вводящих в заблуждение графиков, поэтому всегда полезно проверять. Но поскольку это уже широко известно, многие люди кричат: “А что, если сделать поправку на инфляцию?” на графиках, скорректированных с учетом инфляции. И вы получаете неаккуратных или недобросовестных людей, наклеивающих ярлык “с поправкой на инфляцию” на данные, которые не скорректированы с учетом инфляции, как в случае с графиками жилья и доходов выше.
Два других эмпирических правила, которые часто подводят людей, - это 1) медиана против среднего и 2) на душу населения. Многие люди знают, что средние значения подвержены отклонениям, например, когда Илон Маск заходит в бар, и сразу же среднее благосостояние бара увеличивается в 100 раз. Поэтому многие люди, обеспокоенные неравенством, стали требовать, чтобы все использовали медианы вместо средних значений для всего. Но средние показатели часто являются совершенно точными показателями — если вы смотрите на среднее потребление калорий или среднее время, проведенное за видеоиграми, на самом деле нет необходимости использовать медиану. В сутках всего 24 часа, поэтому не существует "Илона Маска среди людей, которые играют в видеоигры" (нет, даже не тот ваш друг). Между тем медианы, как правило, трудно и медленно поддаются измерению, поэтому они часто недоступны.
Что касается “на душу населения”, да, есть графики, которые следует скорректировать с учетом численности населения, но не являются таковыми. Это особенно характерно для карт; карта США, на которой показано общее потребление молока или общее количество владельцев собак и т.д. это будет просто карта больших городов Америки. Чтобы сделать эту карту полезной, вам следует обратить внимание на потребление молока или владение собаками на душу населения. Но есть некоторые графики, где показатель на душу населения на самом деле не имеет значения. Например, многие люди, взглянув на график суммарных выбросов углекислого газа по странам, сразу же воскликнут: “А как же показатель на душу населения?!”. Но климату безразличны выбросы на душу населения, только общие; в Кувейте выбросы на душу населения более чем в три раза выше, чем в Китае, но политика Кувейта практически не имеет значения для будущего планеты, в то время как политика Китая имеет огромное значение.
Наконец, я считаю, что плохой способ проверить график - это просмотреть ответы или комментарии в блоге. Всегда найдется кто-то, кто поспешит назвать график ложным, но эти быстрые отклики не являются надлежащим краудсорсингом - они не проверяются, как заметки сообщества, и не поддерживаются голосованием, как сообщения на Reddit, а люди, делающие их, часто неинформированы и/или предвзяты.
Например, если вы опубликуете график выбросов углекислого газа по странам, кто-нибудь всегда поспешит заявить, что выбросы в Китае намного больше, чем в Америке, потому что США передали свои загрязняющие отрасли в Китай. Это просто миф; США потребляют примерно столько же выбросов, сколько производят, как и Китай, и небольшие разрывы между выбросами, основанными на потреблении и производстве, со временем не изменились. Но люди продолжают выступать с этой фальшивой критикой. Так что остерегайтесь фальшивых разоблачений.
В любом случае, несмотря на все сказанное, есть несколько хороших эмпирических правил, которые вы можете использовать, чтобы избежать обмана с помощью вирусных графиков. Но это не перечень стандартных критических замечаний, которые можно просто выпалить, не задумываясь; это эмпирические правила о том, как самостоятельно оценивать графики, которые вы видите.
Поймите, на что вы смотрите
Первое, что вы должны знать о любом графике, - это то, что он измеряет. Если ось не помечена, это большой красный флаг. На самом деле, некоторые графики на самом деле вовсе не графики, а просто визуальные изображения расплывчатых идей, составленные так, чтобы они выглядели как графики.
Далее, убедитесь, что вы действительно понимаете обозначение оси — если это какая-то расплывчатая вещь вроде “Национального индекса крутости” или какое-то неразборчивое название переменной, убедитесь, что вы знаете, что это означает, прежде чем делать выводы.
Например, вот очень известный график от Oxfam, который якобы показывает, что богатые люди ответственны за большую часть выбросов в мире:
Этот график регулярно становится вирусным, поэтому важно понимать, почему он в принципе бессмысленен. С графиком много проблем, но самая большая проблема заключается в том, что, несмотря на название, на самом деле он вообще не показывает выбросы CO2. Вместо этого то, что он показывает, - это "выбросы в результате образа жизни", которые придумал Oxfam. Видите, что график представляет собой идеально гладкую кривую вместо неровной полосы или линии с зазубринами? Это всегда очень сильный намек на то, что то, на что вы смотрите, - это не фактические данные, а выходные данные модели.
Насколько я могу собрать воедино, вот что сделали Oxfam. Сначала они сделали целую кучу неверных предположений о том, откуда берутся выбросы углекислого газа, например, предположили, что доход равен потреблению (неверно!), что бедные люди потребляют те же продукты, что и богатые (неверно!), что количество выбросов на доллар потребления подчиняется какой-то определенной функции, которую они придумали, и так далее. Затем они полностью проигнорировали государственные расходы, полностью проигнорировали землепользование, ввели в модель старые данные о доходах за 2007 год, чтобы проигнорировать рост развивающихся стран с тех пор, и получили бессмысленный, бесполезный, но безумно вирусный график, который вы видите здесь.
Можно было бы покопаться в методологии, найти все эти неверные предположения и отправиться на поиски тех, кто уже опроверг график. Но если вы просто взглянете на ось и скажете: “Подождите... Я не знаю, что, черт возьми, означает "выбросы в результате образа жизни", это звучит как нестандартный показатель, и это не то же самое, что общая метка на графике, поэтому я дважды подумаю, прежде чем нажимать кнопку ретвита на этом графике", то у вас все будет в порядке. Мораль этой истории: посмотрите, что измеряет график, и посмотрите, имеет ли это смысл для вас.
В качестве отступления, еще одной основной проверкой здравомыслия на графике Oxfam является тот факт, что левые, как правило, выступают против налогов на выбросы углерода на том основании, что эти налоги ударили бы по бедным американцам сильнее, чем по богатым американцам. Если бы богатые люди действительно потребляли намного больше углерода, чем бедные, налоги на выбросы углерода были бы прогрессивными, по крайней мере, в США.
Большинство примеров сбивающих с толку ярлыков не столь вопиющи, как этот, но все равно могут вызвать широко распространенное непонимание. Например, США по неясным политическим причинам разделяют свои федеральные расходы на “обязательные” и “дискреционные”, а оборону относят к “дискреционным”. Таким образом, люди будут делиться графиками только дискреционных расходов и использовать их, чтобы утверждать, что оборона составляет основную часть от общей суммы, в то время как на самом деле это всего лишь около 12%.
Иногда проблемы с тем, что измеряет график, могут быть более тонкими, чем просто осознание того, что вы не знаете, что означает метка. Например, может быть легко перепутать процентное увеличение с увеличением на процентный пункт. Если безработица составляет 5%, а затем она повышается до 6%, то это означает увеличение безработицы на 20%, но всего на 1 процентный пункт. Поэтому полезно понимать, что означают эти величины.
Проверьте оси, проверьте точки данных
В любом случае, даже если данные графика четко определены, существует множество вводящих в заблуждение способов их представления. Хороший способ избежать введения в заблуждение — всегда проверять оси, особенно ось y, которая обычно является ключевым параметром, который на самом деле измеряется графиком, и которой, как правило, часто манипулируют.
Единственное, на что следует обратить внимание, - это на ужасную двухосевую диаграмму. Иногда это неизбежно — если вы пытаетесь сравнить два показателя, которые находятся в разных единицах измерения на одном графике, у вас действительно нет особого выбора. Но это почти всегда затрудняет чтение диаграммы, потому что заставляет вас вычислять две оси y, и потому что вторую ось легко пропустить, потому что она находится справа. Этим также довольно легко злоупотреблять, потому что вы можете растягивать и сжимать свою ось до тех пор, пока не создадите впечатление, что объекты выстраиваются в линию больше, чем это есть на самом деле. Например, Ларри Саммерсу по праву пришлось немало потрудиться, чтобы составить двухосевую диаграмму, которая сопоставила инфляцию 1970-х годов с инфляцией 2020-х годов, хотя инфляция 70-х годов была намного выше:
Позже Саммерс написал статью для Washington Post с графиком, на котором две инфляции были нанесены на одну и ту же ось y. В нем содержалась аналогичная мысль, но гораздо менее поразительная. 1960-е годы на самом деле не совпадают с 2010-ми годами с точки зрения инфляции, а пик 2020-х годов намного ниже:
Двухосевой график также позволяет сдвинуть две линии ближе друг к другу, как это сделали Financial Times здесь:
Это создает впечатление, что юань вот-вот догонит доллар в доле мировых резервов, хотя на самом деле она составляет 60% и 3%. Позже линии были разделены на две панели, когда группу людей разозлили двойные оси на исходном графике, но это ненамного лучше, чем раньше. Примеры такого рода зрительной иллюзии, к сожалению, довольно распространены.
Еще одна вещь, на которую вам следует обратить внимание, - это то, где начинается ось y. Вопреки тому, что говорят некоторые люди, это нормально - иметь диаграммы, где ось y не начинается с нуля. Например, если вы строите график температуры тела человека, нет необходимости начинать с нуля, потому что кто-то был бы мертв, если бы температура его тела поднялась до 85 градусов. Колебания всего на один-два градуса сильно влияют на температуру человеческого тела, поэтому вы хотите иметь возможность увеличить изображение и увидеть эти колебания.
Тем не менее, вам следует обратить внимание на то, где начинается ось y. Не думайте, что все начинается с нуля! Например, комбинируя двойную ось с одной усеченной осью y, Тайлер Виген придумал свою знаменитую шутку об утоплениях в бассейне, коррелирующих с выходом фильмов Николаса Кейджа:
(Опять же, мы говорим о Николасе Кейдже, так что никогда не знаешь наверняка...)
Кроме того, убедитесь, что вы понимаете, что происходит с единицами измерения по оси y (и оси x). Вот график из Fox News, который появился в апреле 2020 года:
Как вы можете видеть, интервалы на оси y имеют произвольный размер, что делает этот график практически нечитаемым. Иногда графики делают это и ставят небольшую закорючку на оси y, чтобы вы знали, что они это сделали, но это все равно трудно увидеть, если не обратить пристального внимания.
Некоторые графики также имеют нелинейный масштаб. Часто это нормально, но когда вы накладываете два элемента друг на друга на графике, где масштаб не линейный, результаты могут быть забавными. Поэтому обратите пристальное внимание на масштаб оси y.
И есть этот знаменитый пример, когда создатели графика просто... перевернули его с ног на голову…
Сейчас я в основном сосредоточился на оси y, но иногда оси x также могут быть обманчивыми. Всегда стоит взглянуть, не пытается ли кто-нибудь аргументировать 2023 год графиком, который заканчивается в 2009 году.
Наконец, в дополнение к осям, еще одна вещь, на которую следует обратить внимание, - это отсутствие на диаграмме каких-либо данных. Например, иногда люди создают графики с разными конечными точками, и это может быть трудно заметить. Я собираюсь придираться к моему другу Джону Берн-Мердоку из Financial Times, который обычно является одним из самых выдающихся создателей вирусных графиков в экономической блогосфере и чьи графики я часто перепечатываю. На мой взгляд, в этом он слегка облажался:
Обратите внимание, что серия данных о доходах в США заканчивается на год раньше, чем в других странах; в ней не указан 2020 год, год, когда многие страны раздавали огромные суммы денег своим гражданам во время пандемии. США дали больше, чем почти кто-либо другой, и располагаемый доход подскочил на значительную величину. Но на этой диаграмме показан только 2020 год для европейских стран, поскольку данные по США за 2020 год еще не были доступны. Поэтому, если вы не очень внимательно посмотрите на этот график, то в итоге получится, что средний доход в США к 2020 году отставал от таких стран, как Норвегия, хотя на самом деле это было не так.
Теперь поймите, что график Берна-Мердока, в отличие от графика соотношения доходов и жилья в начале этого поста, не является дезинформацией. И это не бессмысленные выдуманные данные, подобные графику Oxfam. Оси также не вводят в заблуждение. Насколько я могу судить, в программе записи данных, которую использует Мердок, нет ошибок или двусмысленностей; отсутствует только одна ключевая точка данных, которая меняет визуальную историю, представленную на графике. (Я также хотел бы, чтобы диаграмма включала больше процентилей из середины распределения, вместо 5-го и 95-го процентилей, по которым данные по США даже не были доступны.)
В любом случае, мораль этой истории заключается в том, что часто бывает полезно проверить мелкие детали.
Собирая все это воедино
В июле 2018 года энергичный молодой автор Bloomberg по имени Noah Smith опубликовал следующую диаграмму в колонке о налоговой реформе Трампа, показывающую падение реальной заработной платы почти на 2% во втором квартале 2018 года:
Да, этот график — чушь собачья - пожалуй, худший график, который я когда-либо публиковал. И это стало вирусным, им поделились видные политики-демократы, такие как Нэнси Пелоси, прежде чем его раскритиковали. Да, друзья мои, я был переносчиком вирусной дезинформации. (Я написал последующий пост, в котором извинялся за плохой график и объяснял, почему я включил его - правительственные данные за второй квартал еще не были опубликованы, а куча людей в Твиттере публиковали цифры по зарплате, поэтому я просто последовал за толпой и включил эти данные в свою колонку, не занимаясь независимым осмыслением. Плохо!)
Итак, давайте посмотрим, как мы могли бы использовать методы, описанные в этом посте, чтобы увидеть, что моя диаграмма выше была чушью.
Сначала давайте проведем несколько проверок на вменяемость. Утверждается, что мой график показывает снижение реальной заработной платы на 1,8% от квартала к кварталу. Это примерно на 7% меньше в годовом исчислении, что, если вы посмотрите на правительственные данные, практически неслыханно:
Итак, сразу скажу, что это число слишком много, чтобы быть реальным.
Далее, давайте посмотрим на то, что, как утверждается, измеряет график. Ось y - это не уровень реальной заработной платы, а процентное изменение реальной заработной платы с 2006 года. Это сбивает с толку, потому что это означает, что когда мы смотрим на падение на четверть, мы смотрим на изменение в процентах по сравнению с годом, которого даже нет на самом графике. Вам нужно некоторое время посмотреть на график, чтобы понять, что значительное падение в конце примерно соответствует падению реальной заработной платы на 1,8% по сравнению с предыдущим кварталом. Сложность выяснения того, что вообще означает этот график, должна быть еще одним тревожным сигналом.
Третий красный флажок заключается в том, что числа на оси y отрицательные. Это означает, что данные PayScale о заработной плате показали, что реальная заработная плата в 2018 году была ниже, чем в 2006 году! Но любой, кто хотя бы поверхностно знаком с правительственными данными, знал бы, что реальная заработная плата в 2018 году на самом деле была выше по сравнению с 2006 годом (на самом деле примерно на 7%). Так что это еще одна причина, по которой данные о заработной плате PayScale должны были сразу вызвать подозрения.
Оказывается, данные о заработной плате PayScale были просто бредом — они регулярно демонстрировали резкие колебания, не имевшие никакого отношения к фактическим данным, и представляли картину заработной платы в стране, которая была гораздо более негативной, чем реальность. PayScale пытались защитить свои данные, но это было безнадежно. С тех пор они пересмотрели свою методологию, чтобы она была гораздо менее волатильной, но я бы все равно не стал использовать ее — или какие-либо данные о заработной плате с частного веб-сайта.
Но суть здесь в том, что плохие графики на самом деле довольно легко обнаружить, если вы просто обратите внимание и проявите немного независимого мышления — чего я определенно не делал в 2018 году. Мне хотелось бы думать, что с тех пор я усвоил свой урок.
Распознать плохие графики легко; распознать вводящие в заблуждение повествования сложно
В любом случае, это было забавное упражнение по выявлению вопиюще плохих графиков. Такие вещи, как ложные заявления о корректировке инфляции, неправильно помеченные данные, сфабрикованные измерения, дурацкие оси y и сомнительные источники данных, на самом деле довольно легко обнаружить, если уделить минутку и удержаться от первоначального желания нажать кнопку "Поделиться". Не позволять себя одурачить - хороший способ ощутить теплое чувство гордости.
Но на самом деле диаграммы, которые являются абсолютным бредом, гораздо менее опасны, чем диаграммы, данные которых в основном верны, но которые привязаны к вводящим в заблуждение повествованиям. Откровенно неверные графики быстро развенчиваются, будь то в заметках сообщества, Politifact или Reddit, или просто в блогах, подобных этому. Но вводящие в заблуждение рассказы, которые привязываются ко многим другим вирусным графикам, могут сохраняться годами, внедряясь в умы общественности до тех пор, пока они не станут неотличимы от общепринятой реальности. Обнаружить и отделить друг от друга эти повествования - гораздо более сложная задача, чем отлов простой дезинформации.
В части 2 этого руководства будет рассказано о том, как не поддаться на эти вводящие в заблуждение рассказы, тщательно обдумав истории, которые, по-видимому, рассказывают вирусные графики. И да, мы собираемся сделать это: