Диаграммы рассеяния широко используются в различных дисциплинах и областях за пределами науки для визуального представления взаимосвязей между двумя переменными данных. Тем не менее, очень немногие пользователи осознают влияние визуального дизайна диаграмм рассеяния на человеческое восприятие и понимание.
Более того, стандартные схемы диаграмм рассеяния часто плохо представляют данные, и ручная точная настройка схемы затруднительна.Исследователи недавно нашли алгоритмический подход для автоматического улучшения дизайна диаграмм рассеяния за счет использования моделей и показателей человеческого восприятия.«Диаграмма рассеяния разрабатывается успешно, когда люди могут эффективно декодировать сообщение, которое изначально было графически закодировано в диаграмму рассеяния. Напротив, плохой дизайн может неверно передать предполагаемое сообщение», — говорит доктор-исследователь Луана Микаллеф.
Автоматические и оптимизированные конструкции диаграмм рассеянияОптимизатор, разработанный исследователями, может предсказать, как пользователи отреагируют на конкретный дизайн. Человеческое восприятие имеет ряд возможностей и ограничений, которые визуализация должна соответственно использовать и смягчать для эффективной передачи сообщения читателю.
"Как владелец набора данных вы не обязательно знаете, как другие будут воспринимать диаграмму рассеяния, и большие наборы данных также трудно визуализировать. С помощью нашего нового алгоритмического метода мы можем оптимизировать дизайн диаграммы рассеяния для любых данных и задач анализа, которые пользователь требует ", — поясняет профессор Антти Уласвирта.Каждый аспект дизайна диаграммы рассеяния, будь то размер, непрозрачность и цвет маркеров или соотношение сторон графика, имеет значение. Эти аспекты имеют большое влияние на корреляцию, выбросы и классы, обнаруженные на диаграмме рассеяния человеческим восприятием.
«Даже если вы являетесь экспертом по визуализации, автоматизированное проектирование помогает сэкономить время, особенно для очень больших наборов данных. На этот раз лучше потратить на интерпретацию визуализаций, а не возиться с утомительными настройками параметров», — говорит недавно получивший докторскую степень исследователь Грегорио Пальмас. .«Это только начало.
Мы находимся в середине смены, когда мы автоматизируем, по крайней мере, часть нашего анализа данных, что необходимо только из-за огромного размера данных. Интерактивные методы анализа данных, такие как диаграммы рассеяния, будут продолжать служить нам ну, но тем более, если к ним добавить некоторый уровень машинного интеллекта », — объясняет профессор Тино Вайнкауф.
Новый алгоритмический подход оказался наиболее успешным с точки зрения времени выполнения задачи. По словам исследователей, Луаны Микаллеф, Грегорио Пальмас, Антти Оуласвирта и Тино Вайнкауф, даже пользователи, не являющиеся экспертами в области визуализации, могут использовать оптимизатор для создания эффективных схем рассеяния.
С такими алгоритмическими методами непреднамеренное недопонимание может быть уменьшено в будущем.