Практическое_задание_2. Визуализация многомерных данных. Введение в Matplotlib
Скачать 1.05 Mb.
|
Краткие выводы по темеВизуальный анализ данных необходим : для определения логичности признака, его типовых значений, и возмож- ных преобразований надо ним. для сравнения значений признаков на обучающей и тестовой выборке. для выявления зависимостей между атрибутами, определения «хоро- ших» для анализа атрибутов, выявления и выбросов, формирования но- вых признаков для сравнения результатов анализа данных разными алгоритмами. Визуализировать можно: признаки (как исходно заданные, так и сгенериро- ванные), целевой атрибут, ответы алгоритмов, служебные признаки (номер строки, категория данных: обучение, валидация или тест и т.п.), объекты, ста- тистики признаков. Используйте стандартные и простые методы визуализации, необходимо пони- мать, как строится модель визуализации, чтобы объяснить результаты визуа- лизации! Гистограмма крайне полезна при оценке распределения значений признаков, можно сравнивать их распределение на разных наборах данных (тестовой и обучающей, норме/ненорме). График рассеяния полезен при визуализации зависимостей между призна- ками. Меняйте параметры моделей визуализации: не используйте параметры по умолчанию. Применяйте масштабирование значений признаков (логарифмирование) Введение в MatplotlibДля выполнения практической работы рекомендуется использовать графи- ческую библиотеку Matplotlib. Matplotlib – это библиотека на языке Python для визуализации данных. Данная библиотека лежит в основе других библиотек, например, Seaborn, которая по сути представляет высокоуровневый интерфейс над Matplotlib. В некоторых случаях использование Seaborn позволяет быстро по- строить графики, но если требуется большая детализация и разработка каких- либо новых графических представлений данных, то рекомендуется использовать Matplotlib. Рисунок11–ОсновныеэлементыграфикавбиблиотекеMatplotlib Другим достоинством данной библиотеки является ее хорошая документи- рованность. Для ее изучения рекомендуется просмотреть учебные материалы, ко- торые представлены на самом сайте библиотеки: учебные примеры: https://matplotlib.org/stable/tutorials/index.html; шпаргалки: https://matplotlib.org/cheatsheets/. учебник Matplotlib: Научная графика в Python с примерами кода (дублирует во много учебные примеры с сайте библиотеки): https://pythonworld.ru/novosti-mira-python/scientific-graphics-in-python.html Краткая версия учебника, описаны базовые функции по работе: https://cpp- python-nsu.inp.nsk.su/textbook/sec4/ch8; Библиотека Matplotlib реализует объектно-ориентированный интерфейс, то есть пользователь напрямую взаимодействует с каждым объектом. С помощью кода можно задавать любой элемент диаграммы, в том числе ярлыки и отметки на осях. На рисунке 12 представлена подсказка по работе с функциями с базовыми элементами графиков. |