June 12

9 ошибок при построении визуализаций

В этом материале от Центра непрерывного образования ФКН систематизируем основные требования к достоверной визуализации данных и рассказываем, какие ошибки чаще всего искажают аналитические выводы. Разбираем 9 типовых примеров и показываем, как устранить каждую из проблем. Подборка основана на классических работах Эдварда Тафти о целостном представлении информации и рекомендациях из книги «Storytelling with Data».


1. Радужная палитра без необходимости

Использование большого количества различных цветов для разных категорий не предоставляет никакую дополнительную и значимую информацию и отвлекает внимание от анализа значений на распознавание палитры. Более того, если цвет не связан напрямую с категорией или иерархией, он превращается в бесполезный элемент декора. При наличии проблем с восприятием отдельных цветов, график становится недоступным для анализа и интерпретации.
Как исправить
Используйте единую нейтральную гамму (монохромную или 2-3 групповые гаммы), используйте ее последовательно во всех отчетах и применяйте акцентные цвета только для ключевых категорий или пороховых / значимых значений.

Ошибочное построение
Верный подход построению с акцентом на необходимую категорию

2. Обрезанная нулевая точка оси Y в столбчатых диаграммах

Если столбчатая диаграмма не начинается с нуля, то разница между столбцами визуально преувеличивается. Сдвиг нижней границы создает иллюзию резких скачков, а визуальная шкала не соответствует действительным пропорциям.

Как исправить
При построении столбчатых графиков всегда начинайте количественную ось с нуля (кроме узкопрофильных случаев, в которых необходимо построить серию похожих графиков или диаграмм, использующих одинаковый масштаб).

Ошибочное построение с обрезанными значениями
Верное включение значений на ось Y

3. Избыточное использование 3D-элементов

Объемные трехмерные визуализации зачастую не предоставляют никаких необходимых данных. Дополнительное измерение, не содержащее информации, затрудняет интепретируемость и искажает геометрию, а подписи могут перекрываться.

Как исправить
Не прибегайте к построению сложных диаграмм и графиков в 3D без необходимости и старайтесь преподнести информацию с использованием классического двумерного пространства. Если требуется показать дополнительное измерение, вводите его явно (цвет, размер маркера), а не с помощью геометрической глубины.

Необоснованный выбор 3D-графика
Двумерный линейный график

4. Круговая диаграмма для большого количества категорий

В случаях, когда число долей превышает 5, визуальное сравнение площадей становится достаточно трудным, подписи могут наслаиваться.

Как исправить
Для задач, которые требуют анализа значительного количества различных сегментов, используйте горизонтальную столбчатую диаграмму.

Круговая диаграмма при большом количестве категорий
Горизонтальная столбчатая диаграмма

5. Отсутствие контекстных подписей (единиц измерения, источника)

Без указания единиц измерения и источника происхождения данных визуализации могут лишиться смысла, а их использование в отчетах станет бесполезным. Необходимо тратить время на попытки понять, что какая информация представлена на графике.

Как исправить

В обязательном порядке добавлять заголовки, подписи осей с единицами измерения, примечания об источниках.

Корректные подписи

6. Наложение различных показателей с различными единицами измерения без явного разделения шкал

Совмещение на одном графике показателей с различными масштабами и единицами измерения может вводить в заблуждение и предоставлять неверную информацию: тренды могут визуально совпасть, не будучи количественно связанными. Например, при попытке одновременно показать выручку (миллионы рублей) и число пользователей (тысячи человек) на одной общей плоскости может показаться, что метрики сопоставимы по величине, а форму их траекторий можно сравнивать напрямую. На самом же деле, единицы измерения различны, поэтому выводы будут искажены.

Как исправить

Прибегнуть к нормировке одной из серий данных, разнести визуализации на разные панели или воспользоваться созданием дополнительной правой оси с предварительным уточнением об различиях шкал.

Одна ось для двух метрик
Две независимые оси в собственных единицах
Два отдельных графика в одной строке

7. Визуализация «сырых» временных данных без агрегации

Временной ряд с точностью до секунд или минут, вероятнее всего, наполнен шумом: точки будут накладываться, тренд — теряться. Такой объем данных будет избыточным для восприятия. Увидеть сезонность или локальные пики будет трудно, распределение будет казаться хаотичным, закономерности невозможно отследить.

Как исправить

Предварительно агрегировать данные, выбирая релевантный временной шаг (час, день, неделя), перед построением визуализации.

Визуализация временного ряда без агрегации
Почасовой временной ряд

8. Нечитаемые подписи на оси X

Без уделения должного внимания подписям на осях длинные русские названия категорий могут быть размещены горизонтально, перекрывать друг друга, метки будет невозможно читать без увеличения, возрастет риск неверной интерпретации категорий.

Как исправить

Прибегнуть к повороту меток или изменить расположение графика, разместив подписи горизонтально.

Непонятные и сливающие подписи
Поворот меток на 45 градусов
Размешение графика в горизонтальном формате

9. Цветовая палитра, не учитывающая возможные зрительные проблемы аудитории

Выбор красно-зеленой цветовой палитры может привести к недоступности информации для пользователей, имеющих проблемы с восприятием оттенков. Категории станут неразличимы.

Как исправить

Выбирать готовые цветовые наборы, позволяющие учитывать потенциальные проблемы со зрительными особенностями: Plotly Safe, Vivid, Cividis или ColorBrew.

Палитра, не являющаяся универсальной
Безопасная цветовая палитра, подходящая для восприятия любым человеком

Для тех, кто хочет системно освоить визуализацию данных и построение дашбордов, Центр непрерывного образования ФКН предлагает онлайн-курс «Аналитика в Business Intelligence»: за месяц вы пройдете полный путь от подготовки данных до создания интерактивных дашбордов.