Диаграммы. Какую и для чего выбирать. Советы по использованию

Что вы узнаете из материала

Как выбирать тип диаграммы, как сделать их понятными, простыми и привлекательными.

Кому будет полезно

Всем, кто делает презентации и или дашборды.

Предыстория

Однажды я захотел, чтобы все диаграммы, с которыми я сталкиваюсь, были понятными без необходимости их объяснять или читать к ним сопроводительные тексты. Мне нравится мысль Авинаша Кошика о том, что статистика и аналитика должны быть простыми и ясными, иначе они говно. Он конечно не так писал и не про диаграммы, но я прочитал именно так. Поколение PowerPoint менеджеров, считает, что график — это просто.

Я прочитал несколько (список всех материалов в конце) хороших книг и статей о том, как делать крутые диаграммы, собрав для вас все в краткой шпаргалке.

Таблицы или диаграммы?

Используйте диаграмму, если:

  • вам нужно передать идею, демонстрировать которую вы будете с помощью всего нескольких значений;
  • вам необходимо показать связь или связи между множеством значений.

Используйте таблицу, если:

  • вам нужно сравнить множество конкретных значений;
  • вам необходимо оперировать максимально точными числами;
  • значения содержат множество типов единиц измерения.

Какие цели помогает достичь диаграмма

  • Быстро и однозначно передать вашу идею.
  • Никто не любит вникать в цифры. Диаграммы упрощают и помогают вникнуть в цифры.

4 типа диаграмм по их функции

Диаграмма делятся на 4 группы в зависимости от их функции.

  • Показывают отношения между разными числами (например корреляцию).
  • Сравнивают числа.
  • Показывают состав\структуру чисел.
  • Показывают распределение\отношение чисел.

Если вы не профессиональный аналитики, то скорее всего в своей работе вам потребуются только два — сравнивающие числа, показывающие состав\структуру числе.

Алгоритм выбора диаграммы

Отправной точкой при выборе типа диаграммы всегда идет идея (message), которую вы хотите донести. Данные не являются определяющим фактором. Более того, даже не имея данных, но определившись с идеей, можно выбрать тип будущей диаграммы.

  • Порядок выбора диаграммы —
  • определите идею, которую вы хотите донести;
  • определить подходящую функцию диаграммы;
  • выберите подходящий тип диаграммы;
  • отформатируйте диаграмму.

Полезные вопрос для выбора типа диаграммы

  • Какая цель вашей диаграммы?
  • Как много типов значений вы хотите использовать и показать?
  • Как много значений для каждого типа вы будете показывать?
  • Хотите ли вы показать изменения значений во времени?

Матрица выбора типа диаграммы Andrew Abela

Самый простой и наглядный способ выбора диаграммы — использовать матрицу выбора Andrew Abela. Скачать ее в большом разрешение можно тут.

Матрица выбора типа диаграммы Andrew Abela

Название диаграммы

Хорошее название диаграммы содержит вашу идею, мысль, а не данные или их тип.

Плохое название

  • Распределение прибыли по регионам
  • Количество контрактов в январе-августе

Хорошое название

  • В совокупных доходах компании Северный регион имеет наименьшую долю
  • Количество контрактов в январе-августе выросло на 30%

Общие рекомендации использования диаграмм

  • Шкала времени всегда должна быть горизонтальной. Время должно идти слева направо.
  • Размеры элементов диаграммы (столбцы, пироги тд.) должны быть всегда пропорциональные значениям, которые они отображают. Столбец числа 100 и столбец числа 200 должны отличаться ровно в 2 раза.
  • Удалите всю информацию со шкал, все лишние цвета и обозначения, если они не помогают вашей идеи.
  • Колонки, части пирога и тд. всегда должны сортироваться по их значению. Не сортируйте в алфавитном порядке.
  • Если у вас только один тип значений, вам не нужна легенда.
  • Ярлыки (labels) ваших данных всегда должны быть максимально близко к значениям, чтобы избежать путаницы.
  • Не используйте больше 6 цветов в вашей диаграмме. Если вам нужно больше 6 — вы ошибаетесь.
  • Для сравнения одного и того же значения в разные периоды времени используйте один и тот же цвет в различной интенсивности (например, от светлого к темному).
  • Самая универсальная палитра цветов — черный, белый, красный, зеленый, синий и желтый.
  • Если у вас несколько диаграмм (такое называется “серия”), используйте единый стиль оформления.
  • Проверяйте, как ваша диаграмма будет смотреться, если ее распечатают.
  • Не добавляйте слишком много информации на одну диаграмму, лучше разбейте ее на две.

Популярные виды диаграмм и рекомендации по их использованию

Столбчатая диаграмма (Column Chart)

Столбчатая диаграмма самая популярная. Она лучше всего подходит для сравнения значений, когда важно дать возможность сравнить каждое значение с каждым.

Советы для столбчатой диаграммы

  • Не сравнивайте не более 7 значений.
  • Если вы показываете изменения во времени, всегда указывайте типа периода на горизонтальной оси и значение периода. (Например, к какому году или месяцу относится конкретное значение).
  • Начало точки отсчета для значений всегда начинается с нуля.
  • Не используйте обводку для столбцов.
  • Использовать столбчатую диаграмму для отображения тенденции изменения значения во времени можно, если значений не больше 20 и каждая точка имеет четкое, видимое значение.

Столбчатая гистограмма (Column Histograms)

Столбчатая гистограмма — это один из вариантов столбчатой диаграммы. Этот тип диаграмм хорошо подходит для визуализации распределения значений по группам. Например, разделение тыкв по их весу на фестивале тыкв.

Диаграмма с составными столбцами (Stacked Column Charts)

Этот тип диаграмм помогает показать структуру значения и дает возможность их сравнить. Важно, чтобы отображение частей значения и самих значений были пропорциональны. Часть столбца со значением 100 должна быть в два раза больше части со значением 50. Каждый столбец не должен делиться больше чем на 3–4 части.

Горизонтальная столбчатая диаграмма (Bar Charts)

В этом типе диаграмм категории располагают вертикально, это дает больше места для названия категорий (вы сможете уместить их все). Используется в двух случаях —

  • у вас длинный список категорий (больше 7);
  • у вас есть отрицательные значения.

Хорошим примером использованием этого типа диаграмм — график источников посещения сайта. Источников посещения обычно больше 5–7, а названия сайтов-источников часто длинные, и горизонтальное расположение подходит лучше всего.

Горизонтальная диаграмма с составными столбцами (Stacked Bar Charts)

Я не нашел ни одного примера хорошего использования этого типа диаграмм. Фактически это означает, что если вы решили использовать этот тип, то вы совершили ошибку. Главная проблема — диаграмма не дает удобно сравнивать значения.

Линейная диаграмма (Line Charts)

Впервые с линейной диаграммой мы знакомимся с в школе, когда чертим график функции в системе координат. Линейная диаграмма отлично подходит , если —

  • набор ваших данных непрерывен;
  • количество значений больше 20;
  • вы хотите показать тренд изменений значений.

В этом типе диаграмм возможность сравнивать значения уходит на второй план, но все еще остается возможной, с помощью маркеров на графике, которые ставятся через одинаковые промежутки.

Советы для линейной диаграммы

  • Линейные диаграммы хорошо подходят, чтобы показать непрерывные данные, разбитые на равные по размеру интервалы.
  • Начинайте ось значений всегда с нуля. Если у вас появилась крутая идея начать не с нуля, скорее всего вы не правы.
  • Время в линейной диаграмме всегда идет слева направо.
  • Не пропускайте значения в интервалах данных, если они равны нулю или выбиваются из общих значениях. Например, определенные дни с нулевыми значениями, если во все остальные дни значения не нулевые.
  • Если вам нужно подчеркнуть тренд, удалите все подписи к значениям диаграммы.
  • Для подписей интервалов на диаграмме используйте наклон в 45 градусов слева направо.

Линейная диаграмма с временной шкалой (Timeline Charts)

Этот подтип линейной диаграммы нужно использовать, если вы хотите показать тренд изменений значений за временной период. Хорошая линейная диаграмма с временной шкалой позволяет увеличивать и уменьшать масштаб, сжимать и растягивать ось времени, чтобы увидеть больше деталей или тенденций.

Хорошие примеры —

  • изменение цен на фондовом рынке с течением времени;
  • количество посетителей сайта в течение последних 30 дней;
  • объемы продаж в день за предыдущий квартал.

Диаграмма областей (Area Chart)

Заполнение области под линией помогает нагляднее показать изменение количества накопленных единиц (например, автомобилей, количество сотрудников, хлеба, билетов) и плохо подходит для отображения флуктуирующих (случайно отклоняющихся) значений (например, изменение цены акций).

Диаграмма областей с накоплением (Stacked Area Chart)

Этот тип диаграмм лучше всего подходит для отображения изменений в составе комплексной величины с течением времени. Хорошим примером может быть изменение долей рынка с течением времени.

  • Если у вас больше 3–5 категорий, то диаграмма областей плохой выбор, все смешается и плохо покажет вашу идею.
  • Не используйте этот тип диаграмм, если вам нужно точное сравнение величин.

Круговая диаграмма и “Пончиковая” диаграмма (Pie Chart and Donut Chart)

Круговая диаграмма представляет числа в процентах, используемые для визуализации отношения к целому или композицию. Круговые диаграммы не предназначены для сравнения отдельных разделов друг с другом или для представления точных значений (для этого лучше использовать гистограмму).

По возможности избегайте круговые диаграммы. Человеческий разум мыслит линейно, но, когда дело доходит до углов и областей, нам становится тяжело воспринимать и сравнивать.

Советы для линейной диаграммы

  • Избегайте ситуации, когда части пирога почти равны, и трудно проследить отличие в значениях.
  • Не делайте больше 5 частей пирога.
  • Выбирайте легко отличимые цвета пирога.
  • Если вам важно выделить какую-то часть пирога, хорошим приемом будет — “вынуть кусок из пирога”.
  • Для круговых диаграммы используйте не более 6 компонентов. Если у вас больше, выбираете 5 самых важных, остальные сгруппируйте и поместите в “прочие”.
  • Взгляд движется по часовой стрелке, наиболее важный элемент должен быть на 12 часов.

Редкие виды диаграмм и рекомендации по их использованию

Калибровочная диаграмма (Gauge Chart)

Этот тип диаграмм отлично подходит для отображения прогресса достижения заданной величины (например KPI). Плохая сторона калибровочных диаграмм заключается в том, что они занимают много места и обычно показывают только одно значение.

Обычно, зеленый цвет используют, когда значение имеет нужную динамику или почти достигло цели, а красную, когда все плохо.

Если имеется множество калибровочных диаграмм, сравниваемых с одной шкалой производительности, столбчатая диаграмма будет более эффективной и компактной.

Составная “пончиковая” диаграмма (Stacked Donut Chart)

Для этого типа диаграмм есть очень простое правило. Никогда не используйте этот тип диаграмм.

Точечная диаграмма\Диаграмма рассеяния (Scatter Plot Chart)

Диаграммы рассеяния в основном используются для анализа корреляции и распределения. Хорошо показывает связь между двумя разными переменными, где одна коррелирует с другой (или не коррелирует). Также могут показывать тенденции распространения данных или кластеризации и помогают выявлять аномалии или выбросы.

Хорошим примером диаграмм рассеяния будет диаграмма, показывающая расходы на маркетинг и доходы.

Советы для линейной диаграммы

  • Используйте логарифмическую шкалу (а не линейную) для горизонтальной оси. Это упростит восприятие большого количества значений при чтении диаграммы.
  • Если у вас мало данных, то вы не сможете увидеть корреляцию, аномалии и тд. Наберите как можно больше данных.

Пузырьковая диаграмма (Bubbles Chart)

Пузырьковая диаграмма — это диаграмма рассеяния к которой добавляет еще одно измерение. Это позволяет сравнивать значения между собой. Если пузырьки очень похожи по размеру, используйте метки.

Фактически мы могли бы добавить четвертую переменную путем цветокоррекции этих пузырьков или отображения их в виде круговых диаграмм, но это плохая идея и делать так не надо.

Хорошим примером пузырьковой диаграммы будет график, показывающий маркетинговые расходы по сравнению с прибылью. Стандартный график рассеяния может показать положительную корреляцию маркетинговых затрат и прибыли. Пузырьковая диаграмма покажет, что увеличение маркетинговых издержек съедает получаемую прибыль.

Столбчатая горизонтальная гистограмма (Bar Histogram Charts)

Самым ярким и удачным примером использования этого типа диаграммы является распределение населения по возрасту. Часто, этот тип диаграммы называются “рождественской елкой”.

Литература и другие источники

Книги

  • Storytelling with Data: A Data Visualization Guide for Business Professionals, John Wiley & Sons
  • Говори на языке диаграмм. Пособие по визуальным коммуникациям. Джин Желязны

Статьи в Интернете