03 пандас. Библиотеки Python. Pandas. Библиотеки в python Библиотеки для анализа данных
Скачать 1.84 Mb.
|
Библиотеки Python. Pandas.Библиотеки в python Библиотеки для анализа данных
Структуры данныхSeries - это структура данных, которая сочетает свойства одномерного массива NumPy и словаря Python, т.е. доступ к каждому элементу может быть получен, либо с помощью индекса, либо с помощью идентификатора (ключа). DataFrame - это объект, который сочетает свойства структурированных массивов NumPy и словарей Python. Самая простая аналогия для DataFrame - это таблица, столбцами которой являются объекты Series.Основными рабочими структурами данных в Pandas являются объекты Series и DataFrame. SeriesСоздание s = pd.Series([1, 3, 5, np.nan, 6, 8]) Подключение import numpy as np import pandas as pd Использование series.values series.index DataFrameСоздание Подключение import numpy as np import pandas as pd PandasPandas поддерживает операции чтения и записи для: CSV, Excel 2007+, SQL, HTML, JSON и т.д.Например:CSV. Используется функция read_csv(). Аргумент file является строкой, в которой записан путь до файла с датасетом. Для записи данных из DataFrame в CSV-файл используется метод to_csv(file).Excel. Используется функция read_excel(). Для записи данных из DataFrame в Excel-файл используется метод to_excel().Работа с даннымиОбработка дынных Обработка DataFrame и series Чтение данных Чтение данных в машиночитаемом формате Результаты Построение графиков, сохранение данных Спасибо за внимание! |