Главная страница
Навигация по странице:

  • Классификация

  • Кластеризация

  • Уменьшение размерности

  • Тема 6 (2). Лекции Технологии машинного обучения Технологии Nosql data Mining Глубокое обучение


    Скачать 31.09 Kb.
    НазваниеЛекции Технологии машинного обучения Технологии Nosql data Mining Глубокое обучение
    Дата01.03.2023
    Размер31.09 Kb.
    Формат файлаdocx
    Имя файлаТема 6 (2).docx
    ТипЛекции
    #962965
    страница1 из 5
      1   2   3   4   5

    Тема 6. Программные средства и системы хранения и обработки данных



    План лекции:

      1. Технологии машинного обучения

      2. Технологии NoSQL

      3. Data Mining

      4. Глубокое обучение

    6.5. Сервисы и программное обеспечение для обработки данных


      1. Технологии машинного обучения


    Важную роль при обработке больших данных играют технологии машинного обучения (англ. machine learning), основной особенностью которых является то, что они не решают задачу напрямую, а обучаются на ранее известных примерах (дата-сетах) или каким-либо другим способом с целью формирования способности распознавать такие случаи в дальнейшем. Машинное обучение лежит на стыке многих других наук, в том числе, теории вероятностей, математической статистики, численных методов, методов оптимизации, дискретного анализа и ряда других.

    Среди основных задач, которые решают технологии машинного обучения, следующие.

    1. Классификация отнесение заданного объекта к одному из нескольких заранее определенным классам (категориям) на основе набора признаков, извлекаемых из этого объекта. Ответы, как правило, представлены в виде номера класса, к которому программа относит данный объект. В самом простом случае, когда имеется только два класса, ответы могут быть следующими: болен ли человек, токсично ли химическое вещество, является ли деталь бракованной и т.д. Задачи классификации важны для распознавания лиц, биометрических параметров, клеток крови, а также космических и аэрофотоснимков.

    1. Кластеризация – разбиение множества объектов на подмножества (кластеры) группы согласно некоторым признакам. Цель кластеризации добиться того, чтобы в каждом из подмножеств оказались объекты с похожими свойствами. Примерами такого вида задач могут служить разделение клиентов банка по уровню платежеспособности, распределение химических веществ на классы токсичности, разбиение клиентов компании по их предпочтениям и пр. Группировка объектов в кластеры позволяет сократить их число, выявить скрытые закономерности между ними и облегчить анализ.

    2. Регрессия выявление влияния одних объектов на другие. Например, как характер человека влияет на его потенциальные покупки или семейный статус на ожидаемый доход. С использованием методов регрессионного анализа можно строить прогнозы поведения людей и развития событий.

    3. Уменьшение размерности – сокращение числа признаков объекта для удобства их последующей обработки.

    4. Выявление аномалий распознавание нестандартных случаем. Примерами таких задач являются: обнаружение сетевых атак или выявление мошеннических действий с банковскими картами. Задачи, связанные с выявлением аномалий, принципиально отличаются от задач классификации тем, что аномалии являются крайне редкими и, следовательно, обучающих примеров может быть недостаточно для эффективного обучения системы их распознавания.



      1.   1   2   3   4   5


    написать администратору сайта