Тема 4 (2). Лекции Концепции и возможности научной визуализации. Виды визуализации
Скачать 2.6 Mb.
|
Многомерные визуализации – это сложные способы представления информации в виде многомерных объектов и нескольких измерений. Геометрическиепреобразования– служат для отображения многомерных данных в пространствах меньшей размерности. Пример – матричный график, параллельные координаты. а.Матричныйграфик(Matrix Plot) – представляет форму отображения многомерного массива данных в виде матрицы графиков: по строкам и столбцам строятся комбинации попарных диаграмм рассеивания соответствующих признаков, а на главной диагонали строятся иные графики (в классическом виде – гистограммы). 18 Gapminder. [Электронный ресурс] URL: www.gapminder.org Например, на рисунке 4.11 изображено распределение субъектов РФ в 2018 г. по объему ВРП на душу населения (тыс. руб.), числу преступлений (ед.), среднедушевым денежным доходам (руб.), заболеваемости (чел.) Рисунок 4.11 – Распределение субъектов РФ по четырем социально- экономическим параметрам в 2018 г. б.Параллельныекоординаты(Parallel Coordinates) – это распространенный способ визуализации многомерных данных, при котором вводятся несколько вертикальных осей, а каждая линия представляет собой отдельный объект. В качестве примера можно привести диаграмму с параллельными координатами, построенную по тем же данным, что и рисунок 4.11. 1,2 1 0,8 0,6 0,4 0,2 0 ВРП на душу населения Число зарегистрированных преступлений на 100 000 человек населения Среднедушевые денежные доходы Заболеваемость на 1000 человек населения Рисунок 4.12 – Распределение субъектов РФ по четырем социально- экономическим параметрам в 2018 г. в.Лепестковаядиаграмма(радиальная диаграмма, диаграмма-радар) – это способ визуализации многомерных наборов данных, где каждый признак представляет собой луч (радиус), а единица совокупности – замкнутая линия, соединяющая соответствующие координаты по лучам. Например, по данным предыдущих рисунков (4.11, 4.12) можно изобразить лепестковую диаграмму (для наглядности выбрано три субъекта РФ). ВРП на душу населения Заболеваемость на 1000 человек населения Число зарегистрированных преступлений на 100 000 человек населения Среднедушевые денежные доходы г. Москва Новосибирская область г. Санкт-Петербург Рисунок 4.13 – Положение субъектов РФ в координатах четырех социально- экономических параметров в 2018 г. Отображение иконок и пиктографики – отображение многомерных данных в виде иконок, сложных геометрических фигур, где каждая пиктограмма символизирует отдельный объект, а элемент пиктограммы отображает определённый признак из массива данных. Такие образы могут представлять собой звезды, человеческие лица, другие более просты виды графиков. а. ЛицаЧернова– это отображение многомерных данных в виде человеческих лиц, где каждая черта лица (длина и ширина, угол наклона и т.д. овала лица, носа, глаз, рта, ушей) представляет собой параметр – признак массива данных. Например, в таблице 4.7 перечислены показатели для характеристики экологической ситуации регионов Приволжского федерального округа в 2017 г. и советующие им параметры лица. Полученные лица Чернова по этим данным представлены на рисунке 4.14. Таблица 4.7 – Параметры лиц Чернова для характеристики экологической ситуации субъектов ПФО в 2017 г.
Рисунок 4.14 - Пиктографик «Лица Чернова» для отображения экологической ситуации в субъектах ПФО в 2017 г. Лицо субъекта с хорошей экологической ситуацией должно выглядеть следующим образом: широкое лицо с вытянутым лбом и подбородком, длинным носом, с улыбающимся, широким ртом, с низким расположением рта и глаз, а также с маленьким расстоянием между глазами. б. Звезды, солнечные лучи, пироги и др. – это комбинации диаграммы рассеивания (два измерения) с другими видами графиков: лепестковыми и круговыми диаграммами и проч. Отображениепикселов– основная суть методов заключается в представлении каждого отдельного наблюдения в виде пиксела определенного цвета, а затем все пикселы группируются. Данные методы позволяют визуализировать огромное количество наблюдений. Пример – тепловая карта. Тепловаякарта(HeatMap)– это тип визуализации данных, в котором отдельные значения, содержащиеся в матрице, варьируются в цвете. Термин «тепловая карта» был первоначально введен Кормаком Кинни в 1991 году для описания двухмерного дисплея, отображающего информацию финансового рынка. Рисунок 4.15 – Доля кликов рекламных объявлений в месяц от всех кликов за год по разным категориями товарам по данным Яндекс.Директ в 2015-2018 г., %19 Например, на рисунке 4.15 изображена доля кликов рекламных объявлений в месяц от всех кликов за год по разным категориями товарам по данным Яндекс. Иерархические образы – применяются для отображения иерархических связей между объектами и идеями. Визуализация идей. а.Древовиднаядиаграмма(Организационнаядиаграмма,деревосвязей,TreeChart)–позволяет отобразить иерархические связи между объектами. 19 Как меняется спрос на товары и услуги в течение года/ Яндекс [Электронный ресурс] URL: https://yandex.ru/company/researches/2019/ads-seasons Рисунок 4.16 – Организационная структура НГУЭУ б.Ментальнаякарта(mindmap)–это способ структурирования информации, при котором, главная идея находится в центре, а связанные с ней идеи, понятия и др. вокруг в виде древовидных диаграмм. Рисунок 4.17 – Ментальная карта Data Science Визуализация данных а.Деревьярешений–это представление в виде дерева процесса принятия решений. Каждая вершина дерева – ключевое состояние, в которых возникает необходимость осуществлять выбор, а ветви – условия, действия и др. Деревья решений применяются в искусственном интеллекте, где является очень мощным методом анализа, основанным на сложном математическом аппарате. Условный пример дерева решений можно увидеть на рисунке 4.18. Рисунок 4.18 – Дерево решений «Определение уровня зарплаты» б.Древовиднаякарта-на древовидных картах отображаются иерархические (древовидные) данные в виде набора вложенных прямоугольников, площадь которых пропорциональна какой-то числовой характеристике. Рисунок 4.19 – Объем финансирования национальных проектов в РФ за 2019- 2024 гг. 20 На рисунке 4.19 представлена древовидная карта, построенная по данным о финансировании федеральных и национальных проектов в 2019- 2024 гг.. в. Облако тегов – это визуализация ключевых слов, категорий в виде слов с разной величиной шрифта: чем чаще встречается ключевое слово, тем больше его шрифт. 20 Россия в данных. URL: https://ourcountryindata.ru/naczionalnye-proekty-byudzhet-opisanie-infografika/ Рисунок 4.20 – Пример облака тегов Графы и сетевые графики – применяются для отображения взаимосвязей между объектами. Хронологическая шкала (таймлайн) – это способ отображения хронологический последовательности возникновения событий. Рисунок 4.21 – Хронология проведения всеобщих переписей населения в России в 1897 – 2020 гг. Статистические карты – это отображение данных, привязанных к определенной территории, на географической карте. Картограммы – это форма одномерного представления данных с привязкой к географическим координатам, схематическая карта, где различными цветами, оттенками и штриховками изображается интенсивность изучаемого процесса или явления. Рисунок 4.22 – Распределение стран мир по величине Индекса человеческого развития в 2017 г. Картодиаграмма – это форма многомерного представления данных с географической привязкой, представляет собой сочетание карты и различных диаграмм. Рисунок 4.23 – Картодиаграмма распространения Covid-19 в некоторых странах. По цели представления данных визуализация делится на презентационную и исследовательскую. Кроме того, существуют статический и интерактивный подходы визуализации данных. При статическом подходе автор строит визуализацию, а конечный пользователь получает неизменяемое изображение. При интерактивной визуализации, пользователь может вносить изменения: ставить фильтры, комбинировать разные типы графиков, выбирать временной срез и т.д. Перечисленные классификации графиков и диаграмм не являются полными. Существует огромное количество инструментов и подходов визуализации данных, видов графиков для специальных целей (например, японские свечи для отображения биржевых котировок, блочная диаграмма (ящик с усами) для отображения структуры и распределения совокупности и т.д. Более подробно дополнительно можно ознакомиться на различных ресурсах, например: Data Viz Project, URL: https://datavizproject.com/ Каталог визуализации данных, URL: https://datavizcatalogue.com/RU/index.html A Periodic Table of Visualization Methods. https://www.visual- literacy.org/periodic_table/periodic_table.html# Milestones in the history of thematic cartography, statistical graphics, and data visualization. URL: http://www.datavis.ca/milestones/ |