Курс Data science. Что такое Data Science
Скачать 23.04 Kb.
|
Что такое Data Science Наука о данных – раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных. Кто такой data scientist Основная практическая цель профессиональной деятельности в науке о данных – обнаружение закономерностей в данных, извлечение занний из данных в обобщенной форме. Навыки требуемые специалисту, находятся на пересечении сфер общепредметного(жизненного) опыта и здравого смысла, практического опыта в информационных технологиях и знания математической статистики. Особенностью дисциплины является приоритет практической применимости результатов, то есть, успешности предсказаний, перед их причинностью, тогда как в традиционных исследовательских областях существенно объяснение природы явления В сравнении с классической математической статистикой, на методах которой во многом основывается и наука о данных, в ней подразумевается исследование сверхбольших разнородных массивов цифровой информации и неразрывная связь с информационными технологиями, обеспечивающими их обработку. Человечество за последние 2-4 года накопило столько же данных, сколько за всю предыдущую известную историю существования В 2020году ожидается, что каждый человек будет генерировать 1.7 мегабайта данных в секунду Количество накопленных данных в цифровой вселенной вырастет с 4.4 зетабайт до 44 зетабайт (44 триллиона гигабайт) Данные – это новая нефть. (Герман Греф, СЕО Сбербанк)
Бизнес-кейсы Клиент Производитель взрывчатых веществ Контекст Клиент не может продемонстрировать и оцифровать эффект на качество фракции при использовании их высоко маржинального продукта Цели Разработка симуляционной модели взрывных работ на основе аналитики и ИИ с целью оценить влияние взрывчатых в-в на качество фракции Подход Разработана симуляционная модель на основе исторических данных и аналитики для оценки влияние выбранных параметров на качетство фракции: Тип взрывного в-ва Буровая сетка Диаметр бурения Твердость породы Протестированы несколько аналитических алгоритмов. Наиболее точные способны смоделировать результаты бурения с высокой степенью точности Разработан новый подход к процессу бурения для получения оптимальной фрагментации Клиент (2% Увеличение КИО автосамосвалов) Крупная российская горнодобывающая компания Контекст Автоматическая диспетчеризация пилотировалась клиентом 2 раза, оба раза пилотирование прошло неудачно из-за отсутствия экспертной системы отслеживания показателей Цели Разработка экспертной системы отслеживания на основе продвинутой аналитики данных и дэшбордов, что позволит снизить простои горной техники Подход Для оперативного отслеживания показателей эффективности горного передела в течение смены настроена экспертная система Выбраны показатели для отслеживания; Проведена аналитика данных Внедрены инструменты визуализации данных(дэшборды) Для оптимизации простоев повременной техники сформирован оптимизатор на основе геоданных, позволяющий ежеминутно отслеживать простои техники по динамике потребления топлива. Задача кластеризации/поиска аномалий для улучшения качества процесса |