Книга: Данные: визуализируй, расскажи, используй
Назад: глава 5. думайте как дизайнер
Дальше: глава 7. уроки сторителлинга

глава 6

анализ образцов визуализации данных 

Мы обсудили несколько методов улучшения способности выстраивать коммуникацию на основе данных. Теперь, когда вы понимаете основы того, за счет чего визуализация становится эффективной, рассмотрим несколько дополнительных примеров грамотных визуализаций. До того как перейти к последнему уроку, мы проанализируем несколько образцов, обсудим мыслительный процесс и дизайнерские решения, которые привели к их созданию, опираясь на уже изученные материалы.

Вы заметите схожие комментарии к разным образцам. При создании каждого примера я думала о том, как аудитория будет воспринимать информацию, и выбирала, какие элементы выделить для привлечения внимания, а какие — оставить в тени. Поэтому вы встретите похожие объяснения по поводу выбора цвета и размера элементов. В ряде примеров также схожим образом обсуждаются выбор средства визуализации, относительный порядок данных, выравнивание и расположение элементов, использование текста.

Такое повторение поможет вам лучше понять концепцию, которую я применяю для итоговых дизайнерских решений в разных примерах.

Каждая из предложенных визуализаций создавалась для решения определенных задач в конкретной ситуации. Я опишу эти сценарии кратко, поэтому не зацикливайтесь на деталях. Лучше потратьте время на изучение каждого образца. Подумайте, есть ли у вас проблемы с визуализацией, к которым вы можете применить какой-то из предложенных подходов (полностью или частично).

Организация Х проводит ежегодную кампанию по сбору средств на благотворительность. График на рис. 6.1 отражает результат на текущий момент. Проанализируем, чем хорош этот пример и какие дизайнерские решения лежат в его основе.

c06f001

Рис. 6.1 Линейный график

Пример 1: линейный график

Текст использован правильно. Указаны все названия и значения, у пользователя не возникает вопросов, что он изучает. Есть названия графика, вертикальной и горизонтальной осей. Названия кривых приводятся рядом с ними, не приходится переводить взгляд между легендой и графиком для расшифровки данных. Правильное использование текста делает визуализацию доступной.

Если применить тест , описанный в главе 4, то я быстро скольжу взглядом по названию графика, а затем сосредоточиваюсь на кривой «Результат на текущий момент» (я хочу привлечь внимание аудитории к этой информации). Для названий диаграмм я почти всегда использую темно-серый цвет. Благодаря этому текст выделяется, но без резкого контраста, как при использовании черного цвета на белом фоне (я применяю черный для выделения элементов, когда не использую другие цвета). Для привлечения внимания к кривой «Результат на текущий момент» использованы несколько атрибутов: цвет, толщина линии, наличие маркера данных и указание численного значения на графике, а также размер сопроводительной подписи.

Для более широкого контекста на графике приводятся несколько элементов для сравнения и оценки, но они не привлекают к себе внимания, чтобы график не казался перегруженным. Цель «50 000 долл.» приведена для справки, она находится на заднем плане благодаря использованию тонкой линии. И эта линия, и сопроводительный текст — светло-серого цвета, как и остальные детали. На графике также отражен результат прошлого года, но он не фокусирует внимание на себе благодаря более тонкой линии и светло-синему цвету (это помогает визуально создать связь с результатом этого года, но не конкурировать при этом за внимание).

Относительно подписей осей я приняла несколько решений. По оси Y можно было указать значения от 0 до 60 и назвать ее «Собрано средств (тыс. долл.)». Если бы речь шла о миллионах, возможно, я бы так и сделала, но для тысяч я предпочла сохранить нули и избежать ненужной путаницы.

По горизонтальной оси я не стала выделять каждый день месяца, поскольку нас больше интересует общая тенденция. На графике приводятся данные за 10-й день из 30, и я решила сделать обозначения по оси Х с шагом 5 дней (можно было бы обозначать каждый 7-й день и/или добавить суперкатегории «неделя 1», «неделя 2» и т. д.). Это как раз тот случай, когда единственного верного ответа нет: нужно учесть контекст, данные, потребности аудитории — и принять осознанные решения в свете этой информации.

Пример 2: аннотированный линейный график с прогнозом

На рис. 6.2 показан аннотированный линейный график объема продаж: фактического и прогнозного. Мне часто встречаются графики, на которых эти данные представлены одной кривой без разграничения. Это ошибка. Чтобы привлечь внимание аудитории к разнице между фактическими данными и прогнозными, а также облегчить процесс интерпретации, можно воспользоваться визуальными средствами. Так, на рис. 6.2 фактические данные отображены сплошной линией, а прогнозные — более тонкой пунктирной (которая несет дополнительное значение: меньшая уверенность). Усилить этот эффект помогают подписи «ФАКТ» и «ПРОГНОЗ» по оси Х (заглавными буквами), а также визуальное выделение прогнозных данных путем добавления фонового цвета.

c06f002

Рис. 6.2 Аннотированный линейный график с прогнозом

В данной визуализации все вынесено на задний план за счет использования серого цвета шрифта и остальных элементов, за исключением названия графика, указания годов в текстовых блоках, кривых, отдельных маркеров данных и численных значений начиная с 2014 г. При анализе визуальной иерархии взгляд сначала падает на название графика в левом верхнем углу (за счет расположения этого элемента и использования темно-серого цвета и увеличенного размера шрифта). Затем я перехожу к датам, выделенным синим в текстовых блоках, и читаю контекст, прежде чем начать изучать кривую графика и маркеры данных. Последние приводятся только для пунктов, упомянутых в аннотации; благодаря этому легко понять, какие данные к чему относятся. (Изначально маркеры данных были обозначены сплошным синим, но я решила сделать белые кружки с синей границей: так они больше выделяются. Маркеры прогнозных данных — тоже кружки, но меньшего диаметра и полностью синие, поскольку на фоне пунктирной линии белые кружки с синей границей выделялись бы меньше.)

Значение «$108» выделено полужирным намеренно: это последнее фактическое значение, за ним уже следуют прогноз­ные. Численные значения по более ранним данным не указаны. Вместо этого я привела значения по оси Y, чтобы создать общее представление о контексте: аудитория должна сосредоточиться на относительных тенденциях, а не точных значениях. Численные значения по прогнозным данным указаны, чтобы дать аудитории четкое понимание будущих ожиданий.

Для всего текста на графике использован шрифт одного размера, за исключением случаев, когда было принято целенаправленное решение его изменить. Шрифт в названии графика чуть крупнее. Сноска сделана шрифтом меньшего размера и помещена в самом низу; она поможет в интерпретации данных, но не привлекает к себе излишнего внимания.

Пример 3: гистограмма с накоплением

Гистограмма с накоплением на рис. 6.3 — пример визуализации данных из сферы консалтинга. У каждого проекта в этой области есть конкретные цели. Динамика их достижения оценивается ежеквартально и обозначена как «Не выполнена», «Выполнена», «Перевыполнена». Гистограмма отражает процентное соотношение совокупного числа проектов в каждой категории на протяжении времени. Как и в предыдущих примерах, не зацикливайтесь на деталях, а подумайте, что полезного вы можете извлечь из дизайнерских решений, на основе которых создана эта визуализация.

c06f003

Рис. 6.3 Гистограмма с накоплением

Для начала проанализируем выравнивание элементов. Название гистограммы, легенда, название оси Y выровнены по верхнему левому углу. А значит, аудитория поймет, как читать ее, до того, как перейдет к изучению данных. Название гистограммы, легенда, название оси Y, сноска формируют четкую вертикальную линию слева. Справа текст сверху выровнен по последнему столбцу и содержит данные, относящиеся к нему (по принципу близости в теории гештальта). Этот же текст выровнен по вертикали с легендой.

Для привлечения внимания аудитории используется один цвет — красный (обычный красный кажется мне слишком «кричащим», поэтому я часто использую темный оттенок, как здесь). Все остальные элементы — серые. Численные значения указаны там, где я хочу привлечь внимание аудитории: увеличение числа проектов с недостигнутыми целями. Дополнительные атрибуты, привлекающие внимание, — увеличенный размер шрифта и резкий контраст белого и темно-красного. Остальные данные приведены для контекста, но вынесены на задний план, чтобы не конкурировать за внимание. Разные оттенки серого использованы, чтобы аудитория могла сосредоточиться на той или иной категории данных, но при этом сохраняется четкий акцент на категории, выделенной темно-красным.

С точки зрения достижения поставленной цели проекты организованы по оси Y снизу вверх по шкале «Не выполнена», «Выполнена», «Перевыполнена». Поскольку столбцы в категории «Не выполнена» выровнены по одной базовой линии (оси Х), проследить их динамику во времени относительно просто. Так же легко увидеть динамику по столбцам «Перевыполнена», поскольку они условно выровнены по верхней границе гистограммы. Сравнить число проектов с достигнутой целью сложнее: они не выровнены по одной базовой линии снизу или сверху; однако, поскольку данное сравнение для нас не приоритетное, с этим можно смириться.

Текстовые пояснения обеспечивают доступность. Есть название гистограммы, название оси Y, а по оси Х использованы супер­категории (годы), чтобы избавиться от лишних подписей и данные было легче прочесть. Текст вверху справа указывает, на что следует обратить внимание (мы подробнее поговорим о словах в контексте сторителлинга в главе 7). В сноске дана информация о совокупном числе проектов за все время. Это полезная информация, которая не отражена на гистограмме, где визуально показано только процентное соотношение.

Пример 4: гистограмма с накоплением с положительной и отрицательной шкалами значений

На рис. 6.4 приведен пример гистограммы из области управления персоналом. Иногда полезно понять ожидаемую потребность в руководителях высшего звена и определить возможное несоответствие между ней и реальностью, чтобы оперативно на нее отреагировать. Здесь наблюдается растущая нереализованная потребность в директорах, учитывая как потенциальное расширение штата руководителей за счет приема новых директоров или продвижения перспективных сотрудников, так и потенциальное уменьшение руководящего состава за счет ухода людей из компании.

c06f004

Рис. 6.4 Гистограмма с накоплением с положительной и отрицательной шкалами значений

При изучении этой гистограммы я в первую очередь замечаю ее название. Затем взгляд перемещается на значения, выделенные черным цветом и крупным шрифтом, и достигает подписи «Нереализованная потребность (нехватка)». После этого он движется вниз по вертикали, я читаю подписи к категориям и сразу смотрю на данные слева, а потом перехожу к категории «Увольнения». К этому моменту взгляд перемещается между категориями в столбцах «Нереализованная потребность (нехватка)» и «Увольнения». Я вижу, что со временем общее число директоров увеличилось (вероятно, потому что в результате роста компании усилилась потребность в руководителях высшего звена). При этом значительная доля нереализованной потребности объясняется уходом из компании действующих директоров.

Цветовые решения на этой диаграмме очень важны. Число действующих директоров показано стандартным синим цветом. Число директоров, покинувших компанию («Увольнения»), показано тем же цветом, но менее интенсивным оттенком; это визуально объединяет категории. Можно видеть, как со временем пропорционально снижается число директоров, оставшихся в компании (синий выше оси Х), и растет число покинувших ее (светло-синий ниже оси Х). Отрицательные значения в категории «Увольнения» усиливают тот факт, что эта категория представляет уменьшение пула руководителей. Число директоров, которые пришли в компанию или получили повышение, показано зеленым (что имеет положительную коннотацию). Область, отражающая нереализованную потребность, в столбцах оставлена без заливки цветом, что должно усилить ощущение «нехватки» и пустоты. Текстовые подписи справа того же цвета, что и категории данных, которые они описывают, за исключением «Нереализованная потребность (нехватка)», которая выделена черным и крупным шрифтом, как и численные значения в этой категории данных.

Последовательность рядов данных в столбцах с накоплением выбрана целенаправленно. Категория «Действующие директора» — основа, и она идет первой по горизонтальной оси. Как уже было сказано ранее, категория «Увольнения» представлена отрицательными значениями. Над категорией «Действующие директора» идут еще две: продвижение и набор. Наконец, в самом верху столбцов, куда взгляд перемещается быстрее, чем зритель успевает изучить предыдущие данные, расположена категория «Нереализованная потребность (нехватка)».

Значения по оси Y сохранены, чтобы показать масштаб динамики (как положительной, так и отрицательной), но вынесены на задний план за счет использования серого цвета. Цифры указаны только для тех данных, которые должны привлечь внимание аудитории.

Все текстовые элементы гистограммы одного размера, за исключением тех, которые намеренно выделены или, наоборот, должны не привлекать внимания. Размер шрифта в названии гистограммы увеличен. Размер шрифта в названии оси Y «Число директоров» тоже крупнее основного, чтобы было легче читать текст, расположенный вертикально. Название категории «Нереализованная потребность (нехватка)» и численные значения данных в ней выделяются на фоне остальных элементов, поскольку именно на них аудитория должна обратить внимание в первую очередь. Размер шрифта сноски меньше основного, чтобы при необходимости пользователь мог получить дополнительную информацию, но чтобы она не конкурировала за внимание. Сделав сноску серым цветом и поместив ее внизу гистограммы, мы показали, что это не главный элемент.

Пример 5: линейчатая диаграмма с накоплением

Диаграмма на рис. 6.5 представляет результаты опроса на тему относительных приоритетов в области развития общества. При обилии информации и данных диаграмма не выглядит перегруженной благодаря стратегическому выделению одних элементов и вынесению на задний план других.

c06f005

Рис. 6.5 Линейчатая диаграмма с накоплением

Выбор формата диаграммы — с накоплением — обусловлен характером отображаемых данных: первый приоритет (первая часть горизонтального столбца, выделенная самым темным оттенком), второй приоритет (вторая часть, более светлым оттенком того же цвета), третий приоритет (третья часть, выделенная самым светлым тоном). Горизонтальный формат позволяет легко и удобно читать названия категорий слева, расположенные также горизонтально.

Категории данных организованы вертикально от большего (в самом верху) к меньшему (в самом низу), и аудитория сразу понимает, как интерпретировать информацию. Категории с самыми высокими значениями наверху, их люди видят в первую очередь. Три приоритета, набравшие в ходе опроса больше всего голосов, выделены цветом (это отдельно подчеркивалось в описании к первому варианту этой визуализации). Этот цвет используется для выделения названия категории, численного значения и столбца, что визуально объединяет эти элементы.

Нужно было принять решение, сохранить ли вертикальную ось, указывать ли все значения (или некоторые из них) рядом с точками данных или применить оба варианта. В данном случае числа внутри столбцов сохранены, однако, чтобы не привлекать к ним внимание, использован шрифт меньшего размера. Значения выровнены по левому краю, формируя четкую вер­тикальную линию по значениям «Самое важное», которую легко проследить взглядом. Так диаграмма выглядит более упорядоченной, чем с выравниванием по правому краю или центру. Для численных значений использованы светлые оттенки голубого и серого, что не создает такого резкого контраста, как белый на цветном фоне. Ось Х удалена. Здесь конкретные значения достаточно важны, чтобы указать их отдельно. Другой сценарий может потребовать иного подхода.

Как я отмечала выше, в этой визуализации правильно использованы текстовые элементы. Есть названия и подписи. Слова «ПРИОРИТЕТ» и «ВСЕГО%» написаны заглавными буквами, чтобы их было легче читать. Легенда расположена над верхним столбцом, а ключевые слова «Самое», «2-е» и «3-е» выделены полужирным. Дополнительные детали приведены в сноске.

Выводы

Анализ эффективных визуализаций и выбранных для их создания дизайнерских решений может многому научить. На примерах, приведенных в этой главе, мы закрепили ряд уже усвоенных уроков. Мы коснулись выбора типа диаграммы и организации данных. Мы проанализировали, какие элементы и в каком порядке привлекают внимание благодаря стратегическому выделению с помощью цвета, толщины линий и размера. Мы обсудили выравнивание и расположение элементов. Мы рассмотрели правильное использование текстовых элементов (названия, подписи к данным, аннотации), которое делает визуализацию доступной.

Любая диаграмма или график могут стать примером — хорошим или плохим. Когда вы видите то, что вам нравится, остановитесь и задумайтесь почему. Читатели моего блога (), вероятно, знают, что я очень люблю готовить и часто использую метафору из области кулинарии в сфере аналитики данных: в визуализации данных редко бывает один «верный» рецепт, скорее может быть по-разному вкусно. Примеры из этой главы — «высокая кухня» среди диаграмм.

Итак, одну и ту же задачу визуализации данных разные люди решат по-разному. Вполне естественно и неизбежно, что мой выбор дизайнерских решений может отличаться от вашего. Это нормально. Надеюсь, благодаря тому, что я описала свой мыслительный процесс, вы поняли, почему я остановилась на том или ином варианте. Опирайтесь на эти выводы, принимая свои дизайнерские решения. Главное, чтобы выбор был осознанным.

Теперь вы готовы к заключительному уроку по сторителлингу на основе данных. Он о том, как рассказать историю.

Назад: глава 5. думайте как дизайнер
Дальше: глава 7. уроки сторителлинга