1.2. Основы анализа БД. pptx. Основы анализа больших данных Задачи Основная задача
Скачать 1.17 Mb.
|
Основы анализа больших данных Задачи Основная задача нахождение полезных закономерностей в массиве данных Задачи Data Mining по виду искомых закономерностей
Кластеризация Прогнозирование Ассоциация Визуализация др. Единого мнения относительно того, какие задачи следует относить к Data Mining, нет Классификация и кластеризация Ассоциация (Association) поиск ассоциативных правил нахождение закономерностей между связанными одновременными событиями в наборе данных без учета свойств самих объектов Пример
нахождение закономерностей между связанными неодновременными событиями в наборе данных без учета свойств самих объектов Ищется наибольшая вероятность цепочки связанных во времени событий Пример
Прогнозирование (от греческого Prognosis), в широком понимании этого слова, определяется как опережающее отражение будущего. Целью прогнозирования является предсказание будущих событий. Прогнозирование направлено на определение тенденций динамики конкретного объекта или события на основе ретроспективных данных, т.е. анализа его состояния в прошлом и настоящем. Визуализация Позволяет перейти от символов к образам
Может ввести в заблуждение Хорошая визуализация Плохая визуализация Международные стандарты ИСО/МЭК ISO/IEC 20546:2019 Information technology – Big data – Overview and vocabulary ISO/IEC TR 20547-1:2020 Information technology – Big data reference architecture – Part 1: Framework and application process ISO/IEC WD 5259-1 Data quality for analytics and ML – Part 1: Overview, terminology, and examples Национальные стандарты Публичное обсуждение стандарта о направлениях стандартизации больших данных Межотраслевые / корпоративные стандарты CRISP-DM (Cross-Industry Standard Process for Data Mining) — наиболее распространённая методология по исследованию данных. STEP 1: Choose A Programming Language (Python / R) STEP 2. Statistics STEP 3: Learn SQL STEP 4. Data Cleaning STEP 5: Exploratory Data Analysis STEP 6: Learn Machine Learning Algorithms |