Pentaho BI


Своевременные и качественные управленческие решения


Прогнозная аналитика и моделирование поведения пользователей

Pentaho BI

Главная / 15 примеров визуализации данных


10.07.2018 г., перевод статьи VisualHierarchy


Визуализация данных становится все более востребованной из-за быстрого роста количества данных и их широкого применения в различных сферах жизнедеятельности. Информация должна быть представлена в структурированном виде, чтобы пользователи могли использовать ее для выявления трендов, анализа и принятия решений.

Data Visualization

Сейчас широко применяются 2 различных метода визуализации данных: исследование, которое позволяет понять смысл и цель ваших данных, и объяснение, которое пересказывает историю данных пользователям. Для того, чтобы удовлетворить большинство ожиданий вашей аудитории, вы должны рассмотреть оба метода. К счастью, существует множество практических и интересных способов наглядного представления данных.



Путь к качественной визуализации данных – о чем нужно помнить?

Вайфреймы – ваши лучшие союзники! Многие дизайнеры отказываются от использования бумаги для набросков эскизов неожиданно пришедших в голову мыслей, из-за чего порой теряются отличные идеи. В конце концов, современные технологии позволяют без труда перевести бумажные наброски в цифровые для дальнейшей работы с ними.



Важный совет: всегда будьте в курсе эстетических предпочтений пользователей – используемых цветов, типов диаграмм и связанных с ними отсылок, чтобы максимально использовать возможности встраивания различных объектов. Лучший способ это сделать – привлечь профессионалов и приложить все свои творческие способности, чтобы отобразить данные максимально красиво и понятно.

Учитывайте предпочтения пользователей

Всегда следуйте «правилу простоты». Для создания хорошей визуализации данных нужно использовать широко известные и понятные пользователям элементы, а не следовать собственным представлениям о том, как для них будет лучше.



Используйте интерактивные виджеты

Управление данными онлайн – это не только аналитическая задача, но и возможность взаимодействия с пользователями, получения ссылок и расширения функциональных возможностей. Даже когда статической инфографики достаточно для создания интересной визуализации данных, не стоит отказываться от анализа комментариев пользователей – это лучший способ определения верного направления в работе.

Интерактивные виджеты



Одинаково важны как креативность, так и практичность


При огромном количестве размещенной в различных местах интернета информации, наиболее интересной ее подачей можно считать интернет-мемы. Информация, размещенная в таком виде, воспринимается лучше необработанного набора фактов. Убедительные изображения и связанные с ними сравнения интригуют пользователей и мотивируют их лайкать, делиться и комментировать ваш контент, но что более важно – запомнить свои впечатления.

Элементы инфографики


Почему визуализация данных является таким убедительным методом?

Потому что она показывает то, чего действительно хотят пользователи.

Для того, чтобы считаться успешной, визуализация данных должна основываться на пожеланиях и ожиданиях пользователей, отвечая на три основных вопроса:

  1. На какую аудиторию вы ориентируетесь, и как эта аудитория будет воспринимать предоставленную информацию? Знакомы ли эти люди с концепциями и терминологией, которые вы используете, и будет ли им легко ориентироваться в вашем интерфейсе? В большинстве случаев вам придется нацеливаться на определенную группу, на которую направлен контент, а не следовать обобщенным практикам, которые могут не работать в вашем случае.
  2. Что пользователи ожидают от вас и какая информация для них является наиболее ценной?
  3. Какова цель представленных вами данных, являются ли они общедоступными и могут ли пользователи взаимодействовать с ними? В случае, если последний ответ положительный, рассмотрите исследовательскую технику визуализации, где в случае необходимости, пользователи могут получить больше информации.


Как только вы найдете ответы на все эти вопросы – основа будет готова.


Tumblr Snapshot

Вашей задачей с этого момента будет обеспечение соответствия между целями и методами визуализации, а также контроль за положительной реакцией пользователей. Разъяснение синтаксиса и семантики структуры поможет правильно интерпретировать информацию как по структуре, так и по смыслу.

Обратите внимание, что это относится не только к текстовому контенту, но и к графике, и значкам. Они также должны соответствовать одному стилю (размер, форма, цвет и положение). Помните: все, что появляется на вашем веб-сайте, является средством обратной связи, и вы не должны ничего упускать из виду.

Для создания хорошей визуализации данных лучше всего использовать простые линии и несложные геометрические фигуры. Элементы можно объединять между собой, но при этом они не должны создавать путаницу.

Все элементы должны быть в одном стиле

Было проведено множество исследований для того, чтобы проверить, как аудитория воспринимает немаркированные графики и бары. Почти все они подтвердили вывод, что люди понимают визуальную связь между ними, даже если базовые данные не соответствуют их ожиданиям.



В рассказе истории важно всё

Как мы уже говорили, визуализация может иметь подтверждающий или обучающий характер, побуждая людей просматривать контент. Другие формы обратной связи гораздо менее эффективны. Именно поэтому визуализация данных является ценным способом донесения информации до пользователя.

Инфографика


Опытные дизайнеры знают, что донесение информации – это чистый организационный процесс, где структура и «упаковка» так же важны, как и его качество. Не меньшее значение имеют и источники, используемые для обмена этой информацией.

Отличный способ заставить людей запомнить данные – это представить их в интерактивном режиме, а именно составить последовательный сценарий, в котором решения принимаются не аналитиками, а на основе опросов, раскрывающих предпочтения пользователей. Важность визуализации данных, как коммуникативной среды, еще больше раскрывается на крупных веб-сайтах с большим количеством размещенной, доступной для расшаривания информации.



Методы визуализации данных


Способы визуализации

Независимо от их возможностей, методы визуализации данных – это легкий и понятный способ для того, чтобы в кратчайшие сроки четко сформулировать и выразить сложные идеи в доступном виде.

На рисунке представлены несколько примеров влияния результатов визуализации данных на удовлетворенность клиентов.

Влияние визуализации данных

Как правило, самые простые для чтения и наименее трудоемкие ресурсы – это панели мониторинга, где вы можете управлять своими информационными системами без каких-либо ограничений. Основные индикаторы отображаются с помощью графических элементов, чтобы сделать представления данных как можно более глобальными, но в то же время выявлять проблемные вопросы таким образом, чтобы их было легко решать и исправлять. Диаграммы и графики взаимосвязаны, что означает, что один клик может перенаправить вас на соответствующий фильтр диаграммы другой таблицы.

Данные, представленные в виде карт, матриц и диаграмм гораздо более наглядны, чем описанные словами, поскольку слова не могут объяснить частоту повторения и обнаружить негативные тенденции. Для компаний это означает, что визуализация позволяет отслеживать популярные концепции, а также открывать новые, которые связаны с ожиданиями пользователей и общим поведением.

В то же время вы можете использовать корреляционную матрицу (Correlation Matrix) для обнаружения слов, которые связаны с вашим контентом положительным или отрицательным образом, даже если корреляция неясна и запутанна. Именно в таких ситуациях владельцы веб-сайтов обнаруживают наиболее критичные ошибки и возможности.

Зеркальные диаграммы (Mirror Charts), с другой стороны, являются самым быстрым и эффективным инструментом для определения уровня настроений клиентов и соотнесения его со средним базовым значением для выявления наиболее характерных слабых и сильных сторон.

Цель звездных диаграмм (Star Charts) – рассчитать среднюю важность элементов веб-сайта в их категориях, чтобы вы могли сосредоточиться на тех, которые действительно могут повлиять на общее мнение.

Тепловые карты (Heat Maps) – это еще один компонент оценки, который классифицирует элементы на 4 категории: положительный, отрицательный, очень положительный и очень отрицательный.

Тепловая карта

Облака слов (Word Clouds) – это инструменты для графической визуализации, которые измеряют частоту слов, чтобы понять их влияние, но не позволяют обнаруживать взаимосвязь между ними.


Данные временного ряда

Временные ряды – это общее название для наборов данных, значение которых изменяется со временем. Обычно они используются для записи и сохранения данных в нескольких сферах.

Временные ряды широко применяются для отображения статистических и научных данных (уровни загрязнения, электрический потенциал, температура и т. д.). Часто их можно увидеть в финансах (валюта и обменные курсы, цены на акции и т. д.), в качестве индикаторов успеха государственной политики и во многих других областях. Идеальным сценарием использования является наличие огромного количества сложных временных рядов, которые необходимо сравнить, и которые требуют наилучшего отображения различных визуализаций.

Индексные диаграммы (Index Charts) на самом деле являются простыми интерактивными диаграммами, в которых можно сравнить изменения в конкретных временных рядах с использованием выбранных индексных точек.

Индексная диаграмма

Stacked Graphs – это стековая диаграмма, в которой можно увидеть и сравнить значения всех временных рядов. Некоторые дизайнеры называют ее потоковым графиком потому, что они используют ее для идентификации агрегированных шаблонов и выявления подробных сведений о подмножествах и отдельных сериях.

Small Multiples, напротив, использует стек для построения выбранных временных рядов на одной оси и сравнения их в одних и тех же индексных диаграммах. Тем не менее, мы рекомендуем использовать их постепенно и с осторожностью, так как некоторые из их кривых могут перекрываться и поставить под угрозу читаемость. Вместо этого можно просмотреть каждый ряд на отдельной диаграмме, даже если это занимает больше времени.

Графики горизонтов – это не совсем графики, а методы, которые вы можете использовать для повышения плотности данных в каждом временном ряду.



15 выдающихся примеров визуализации данных


Инфографика с траекторией спутников

График был составлен по данным Union of Concerned Scientists. На нем можно увидеть траектории каждого из 1200 активных спутников, вращающихся вокруг нашей планеты. Для каждого из них есть отдельный круглый значок, закодированный цветами, представляющими их размер, страну и стартовую массу.

Прокручивая график вниз, вы сможете наблюдать траекторию каждого спутника, как по отдельности, так и в совокупности с остальными. В то же время график показывает, какие типы спутников позволяют использовать GPS, широкополосный доступ в Интернет и Sirius XM.



Инфографика по дискриминации в 1973

На картинке выше представлена визуализация на основе данных, полученным университетом Беркли (VUDlab). Проведенные в 1973 году исследования показали, что от дискриминации по половому признаку страдают не только женщины, но и мужчины. 44% процента заявителей были мужчинами по сравнению только с 35% женщин, однако визуализация позволила увидеть, что данные не были должным образом объединены и что процентная доля женщин была проигнорирована.



The Joy of Stats

Здесь вы можете посмотреть известный документальный фильм Ханса Рослинга под названием The Joy of Stats, представленный шесть лет назад на BBC, но все еще чрезвычайно популярный. Интересный факт заключается в том, что Рослинг исследовал общедоступные данные о состоянии здоровья, включавшие в себя свыше 120 000 показателей более чем в 200 странах за период в 200 лет.

«Вау-эффект» вызывает то, что эксперту удалось сделать сравнение всего за 4 минуты! Его основное внимание было уделено взаимосвязи между ожидаемой продолжительностью жизни и средним доходом, начиная с 1810 года, а основным открытием стал разрыв, который он определил между западными и незападными государствами.



Деревья в Нью-Йорке

Визуализация, выпущенная NYC Open Data, отображает количество и разнообразие посаженных деревьев в пяти основных районах Нью-Йорка. Институт использовал цветовые коды, чтобы указать виды и перекрестные ссылки для сравнения районов. Результаты были неожиданными, поскольку было установлено, что в Queen было высажено наибольшее количество деревьев (в два раза больше, чем Бруклине).



Миграционные схемы в США

Это график Нью-Йорк Таймс, который отображает миграционные схемы в Штатах с 1900 года по сегодняшний день. Диаграмма выглядит не так интересно, как ее данные: с помощью графика вы можете получить полную информацию о человеке, включая его место рождения и место назначения (цветные регионы). Также можно наблюдать изменения в схемах год за годом. Информация берется из результатов переписи населения США.



Размещение ядерного оружия в мире

Эта необычная карта мира военных игр из 1980-х стала уникальным открытием картографов Аллана Уокера и Ани А'Хирн. Диаграмма содержит данные из открытых источников, касающиеся местонахождения ядерного оружия в нескольких странах.



Взаимосвязь между персонажами пьесы «Троил и Крессида»

Когда два персонажа повторяются в одном и том же окружении, они, скорее всего, взаимосвязаны. На схеме отражена частота упоминаний и взаимосвязь героев произведения Уильяма Шекспира «Троил и Крессида». Размер объектов и интенсивность цвета пропорциональны степени связи.



Развитие человека: от эмбриона до рождения

Элеонора Лутц опубликовала мини-визуализацию с названием «Как создается человек». Все этапы развития плода отражены на схеме, начиная с оплодотворения и заканчивая рождением ребенка. При создании визуализации было анимировано более 40 объектов, для каждого из которых использовалось 9 кадров.



Возрастная пирамида США

Давайте посмотрим на американскую возрастную пирамиду. Визуализация, выполненная Pew Research Center, иллюстрирует наиболее заметные изменения в возрасте американской нации на протяжении многих лет. Каждая полоска данных – это пятилетняя возрастная группа, начиная от самой младшей (0 – 4 года), расположенной внизу графика, и заканчивая самой старшей (85 лет и больше) на вершине.

Хотя визуализация и напоминает по своей форме пирамиду, ее авторы утверждают, что такая форма появилась сама собой во время внесения данных о численности населения. Более того, они считают, что к 2060 году пирамида превратится в прямоугольник, так как американцев в возрасте 85 лет и старше будет столько же, сколько и американцев в возрасте до 5 лет. Их вывод основан на том, что снижение рождаемости и увеличение продолжительности жизни не могут привести к другому результату.



Теракт в Сан-Бернардино

Рассматривая эту визуализацию, нам ничего не остается, кроме как похвалить работу Чарльза Сейфа и Питера Олхоуза (редакторов Buzzfeed News), которые были награждены за нее в 2016 году престижной премией Data Journalism Award. Их отчеты касались Sky Spies и основывались на внутренних наблюдениях FFA и записях движения. Для этого аналитики получили специальное разрешение правительства США.

Казалось, бы, что это тупик, но Сейф и Олхоуз были настойчивы. Используя язык R для создания своих визуализаций, они применили его широкие возможности для анализа результатов и отображения их в приятном для глаз виде. Хоть язык R и не является распространенным выбором для сложной аналитики, награда, которую они получили, доказывает, насколько они опытны в своем деле.

Использование времени в разные периоды дня

FlowingData порадовала нас еще одной великолепной визуализацией, которая отображает информацию, чем занимаются американцы в разное время дня.

Привычки великих людей

Сложно что-то сделать с информацией о ваших утренних привычках, но Podio отлично удалось визуализировать распорядок дня великих людей. График интересно рассматривать, в нем используются несколько нестандартных подходов к визуализации, и, в конце-концов, всегда интересно сравнить свой режим с режимом признанных политиков, музыкантов, ученых.



The Ultimate Data-dog

Еще одна красивая визуализация, на которой отражены основные характеристики нескольких пород собак. Основная цель заключалась в построении графика на основе данных, представленных Американским Кинологическим Клубом.



Альбомы The Beatles

Здесь Майк Мур отобразил примерный вклад каждого из музыкантов Beatles в запись различных альбомов. С помощью этой диаграммы он пытался определить, кто из группы сильнее повлиял на её популярность.