Главная страница
Навигация по странице:

  • Кто такой data scientist

  • Данные – это новая нефть. (

  • Информационная безопасность / поиск мошенничества

  • Медицина

  • Транспорт

  • Область Используемые методы МО / МИ Распространение / Реальное применение

  • Бизнес-кейсы Клиент Производитель взрывчатых веществКонтекст

  • Клиент (2% Увеличение КИО автосамосвалов) Крупная российская горнодобывающая компанияКонтекст

  • Курс Data science. Что такое Data Science


    Скачать 23.04 Kb.
    НазваниеЧто такое Data Science
    АнкорКурс Data science
    Дата20.03.2021
    Размер23.04 Kb.
    Формат файлаdocx
    Имя файлаDS.docx
    ТипДокументы
    #186561


    Что такое Data Science
    Наука о данных – раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных.

    Кто такой data scientist




    • Основная практическая цель профессиональной деятельности в науке о данных – обнаружение закономерностей в данных, извлечение занний из данных в обобщенной форме.

    • Навыки требуемые специалисту, находятся на пересечении сфер общепредметного(жизненного) опыта и здравого смысла, практического опыта в информационных технологиях и знания математической статистики.

    • Особенностью дисциплины является приоритет практической применимости результатов, то есть, успешности предсказаний, перед их причинностью, тогда как в традиционных исследовательских областях существенно объяснение природы явления

    • В сравнении с классической математической статистикой, на методах которой во многом основывается и наука о данных, в ней подразумевается исследование сверхбольших разнородных массивов цифровой информации и неразрывная связь с информационными технологиями, обеспечивающими их обработку.

    1. Человечество за последние 2-4 года накопило столько же данных, сколько за всю предыдущую известную историю существования

    2. В 2020году ожидается, что каждый человек будет генерировать 1.7 мегабайта данных в секунду

    3. Количество накопленных данных в цифровой вселенной вырастет с 4.4 зетабайт до 44 зетабайт (44 триллиона гигабайт)

    Данные – это новая нефть. (Герман Греф, СЕО Сбербанк)



    Область

    Вариант использования МО/ИИ

    Банки/Финансы


    - принятие решений о выдаче кредита

    - гибкое ценообразование

    - торговля финансовыми активами

    Телеком

    - прогнозирование/управление оттоком клиентов

    - улучшение уровня клиентского сервиса

    Промышленность

    - смарт-управление инфраструктурой

    - прогнозирование поломок оборудования/оптимизация прогресса ремонтов

    Информационная безопасность/поиск мошенничества

    - обнаружение хакерских атак

    - обнаружение мошеннических транзакций

    - продвинутые системы аутентификации на основе анализа изображений, видео, текстов и иных аспектов пользовательского поведения

    Маркетинг

    - сегментация клиентов

    - персонализация предложений

    - оценка эффективности маркетинговых кампаний

    Медицина

    - автоматическая диагностика

    - персонализированная медицина, ранее предупреждение болезней



    Транспорт


    - оптимизация нагруок транспортной сети

    - автоматическое управление транспортными средствами



    Область

    Используемые методы МО/МИ

    Распространение/Реальное применение

    Системы скоринга/рейтинга

    Обучение с учителем

    Обучение без учителя

    Повсеместно, в т.ч. в России

    Системы ценообразования

    Обучение с учителем

    Европейские/американские банки, пилоты в России

    Автоматические торговые системы

    Глубинное обучение

    Обучение с подкреплением

    Европейские/американские хедж-фонды (Citadel, Medallion, Renaissance)

    Прогнозирование/управление оттоком клиентов

    Обучение с учителем

    Обучение без учителя

    Практически повсеместно, американские и европейские телекомы

    Поиск оптимальной пары клиент-оператор

    Обучение с учителем

    Европейские телекомы

    Бизнес-кейсы

    Клиент

    Производитель взрывчатых веществ

    Контекст

    Клиент не может продемонстрировать и оцифровать эффект на качество фракции при использовании их высоко маржинального продукта

    Цели

    Разработка симуляционной модели взрывных работ на основе аналитики и ИИ с целью оценить влияние взрывчатых в-в на качество фракции

    Подход

    1. Разработана симуляционная модель на основе исторических данных и аналитики для оценки влияние выбранных параметров на качетство фракции:
      Тип взрывного в-ва

    Буровая сетка

    Диаметр бурения

    Твердость породы

    1. Протестированы несколько аналитических алгоритмов. Наиболее точные способны смоделировать результаты бурения с высокой степенью точности

    2. Разработан новый подход к процессу бурения для получения оптимальной фрагментации

    Клиент (2% Увеличение КИО автосамосвалов)

    Крупная российская горнодобывающая компания

    Контекст

    Автоматическая диспетчеризация пилотировалась клиентом 2 раза, оба раза пилотирование прошло неудачно из-за отсутствия экспертной системы отслеживания показателей

    Цели

    Разработка экспертной системы отслеживания на основе продвинутой аналитики данных и дэшбордов, что позволит снизить простои горной техники

    Подход

    Для оперативного отслеживания показателей эффективности горного передела в течение смены настроена экспертная система

    • Выбраны показатели для отслеживания;

    • Проведена аналитика данных

    • Внедрены инструменты визуализации данных(дэшборды)

    Для оптимизации простоев повременной техники сформирован оптимизатор на основе геоданных, позволяющий ежеминутно отслеживать простои техники по динамике потребления топлива.

    Задача кластеризации/поиска аномалий для улучшения качества процесса


    написать администратору сайта