Практическое_задание_2. Визуализация многомерных данных. Введение в Matplotlib
Скачать 1.05 Mb.
|
Е.С. Новикова Визуализация многомерных данных. Введение в Matplotlib. Практическое задание № 2 СПбГЭТУ «ЛЭТИ», 2023 г. 1. Цель и задачи практической работыЦель: изучить и научиться использовать стандартные модели визуализации для исследования данных и научиться применять визуализацию для представле- ния результатов анализа. Кроме того, целью работы является освоение основных приемов работы с библиотекой визуализации данных Matplotlib. Для достижение поставленной цели требуется решить следующие задачи: загрузить набор данных, описанный в разделе 3; выполнить анализ данных, руководствуясь следующими рекомендаци- ями. РекомендацииЧетко сформулируйте задачу анализа. Обычно аналитическая задача фор- мулируется в результате общения с заказчиком. При выполнении этой практической работы она сформулирована в разделе 3 «Исходные данные для выполнения практической работы» в виде перечня вопросов. Определите тип набора данных и типы атрибутов, представленных в нем. Для каждого параметра в зависимости его типа вычислите различные опи- сательные статистики (среднее, мода, медиана, среднеквадратичное от- клонение и т.д.). Для их визуализации используйте стандартные графики: линейные и столбчатые графики для визуализации параметров, а также некоторые специализированные, такие как violin plot, box plot и гисто- грамма для представления статистических данных. Выполните двумерный анализ данных: оцените корреляцию параметров. Используйте корреляционную матрицу для визуализации данных, также графики рассеивания для визуализации корреляции между выбранными параметрами. Обратите внимание, что вы можете оценить корреляцию как между атрибутами, так и целевым атрибутом. Подумайте, требуется ли выполнить преобразование данных для постав- ленной аналитической задачи. На основе выполненного анализа данных сформулируйте и обоснуйте от- веты на поставленные вопросы к набору данных (см. раздел 3 «Исходные данные для выполнения практической работы»). В качестве отчета по практической работы должны быть представлены: Блокнот Python с выполненным анализом данных. Отчет с результатами анализа, структурированный по форме. В разделе 4 приведен краткий конспект по теме «Анализ данных методами визуализации», в котором рассмотрены различные методики визуализации для выполнения анализа данных. Для представления результатов в отчете необходимо использовать таблицу 3, представленную в разделе 6. Ее шаблон также приведен в Приложении 1. |