Главная страница

Практическое_задание_2. Визуализация многомерных данных. Введение в Matplotlib


Скачать 1.05 Mb.
НазваниеВизуализация многомерных данных. Введение в Matplotlib
Дата08.03.2023
Размер1.05 Mb.
Формат файлаdocx
Имя файлаПрактическое_задание_2.docx
ТипДокументы
#974604
страница7 из 9
1   2   3   4   5   6   7   8   9

Краткие выводы по теме


  1. Визуальный анализ данных необходим :

    1. для определения логичности признака, его типовых значений, и возмож- ных преобразований надо ним.

    2. для сравнения значений признаков на обучающей и тестовой выборке.

    3. для выявления зависимостей между атрибутами, определения «хоро- ших» для анализа атрибутов, выявления и выбросов, формирования но- вых признаков

    4. для сравнения результатов анализа данных разными алгоритмами.

  2. Визуализировать можно: признаки (как исходно заданные, так и сгенериро- ванные), целевой атрибут, ответы алгоритмов, служебные признаки (номер строки, категория данных: обучение, валидация или тест и т.п.), объекты, ста- тистики признаков.

  3. Используйте стандартные и простые методы визуализации, необходимо пони- мать, как строится модель визуализации, чтобы объяснить результаты визуа- лизации!

  4. Гистограмма крайне полезна при оценке распределения значений признаков, можно сравнивать их распределение на разных наборах данных (тестовой и обучающей, норме/ненорме).

  5. График рассеяния полезен при визуализации зависимостей между призна- ками.

  6. Меняйте параметры моделей визуализации: не используйте параметры по умолчанию.

  7. Применяйте масштабирование значений признаков (логарифмирование)


    1. Введение в Matplotlib


Для выполнения практической работы рекомендуется использовать графи- ческую библиотеку Matplotlib. Matplotlib – это библиотека на языке Python для визуализации данных. Данная библиотека лежит в основе других библиотек, например, Seaborn, которая по сути представляет высокоуровневый интерфейс

над Matplotlib. В некоторых случаях использование Seaborn позволяет быстро по- строить графики, но если требуется большая детализация и разработка каких- либо новых графических представлений данных, то рекомендуется использовать Matplotlib.



Рисунок11ОсновныеэлементыграфикавбиблиотекеMatplotlib
Другим достоинством данной библиотеки является ее хорошая документи- рованность. Для ее изучения рекомендуется просмотреть учебные материалы, ко- торые представлены на самом сайте библиотеки:

  • учебные примеры: https://matplotlib.org/stable/tutorials/index.html;

  • шпаргалки: https://matplotlib.org/cheatsheets/.

  • учебник Matplotlib: Научная графика в Python с примерами кода (дублирует во много учебные примеры с сайте библиотеки): https://pythonworld.ru/novosti-mira-python/scientific-graphics-in-python.html

  • Краткая версия учебника, описаны базовые функции по работе: https://cpp- python-nsu.inp.nsk.su/textbook/sec4/ch8;

Библиотека Matplotlib реализует объектно-ориентированный интерфейс, то есть пользователь напрямую взаимодействует с каждым объектом. С помощью кода можно задавать любой элемент диаграммы, в том числе ярлыки и отметки на осях. На рисунке 12 представлена подсказка по работе с функциями с базовыми элементами графиков.
    1. 1   2   3   4   5   6   7   8   9


написать администратору сайта