Главная страница

Кафедра математических и компьютерных методов курсовая работа методология интеллектуального анализа данных


Скачать 0.51 Mb.
НазваниеКафедра математических и компьютерных методов курсовая работа методология интеллектуального анализа данных
Дата23.01.2020
Размер0.51 Mb.
Формат файлаdocx
Имя файлаintellektualny_analiz_dannykh (3).docx
ТипКурсовая
#105468
страница2 из 6
1   2   3   4   5   6

Деревья решений как вариант решения проблемы устранения недостатков скоринговой системы.





Рисунок 2.1 – Пример дерева решений
Сущность этого метода заключается в следующем:

На основе данных за прошлые периоды строится дерево. При этом класс каждой из ситуаций, на основе которых строится дерево, заранее известен. В нашем случае должно быть известно, была ли возвращена основная сумма долга и проценты и не было ли просрочек в платежах. При построении дерева все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам, которые в свою очередь также могут быть разбиты на дочерние узлы. Критерий разбиения – это различные значения какого-либо входного фактора. Для определения поля, по которому будет происходить разбиение, используется показатель, называемый энтропия – мера неопределенности. Выбирается то поле, при разбиении по которому устраняется больше неопределенности. Неопределенность тем выше, чем больше примесей (объектов, относящихся к различным классам) находятся в одном узле. Энтропия равна нулю, если в узле будут находиться объекты, относящиеся к одному классу.

Полученную модель используют при определении класса (Давать/Не давать кредит) вновь возникших ситуаций (поступила заявка на получение кредита).

При существенном изменении текущей ситуации на рынке, дерево можно перестроить, т.е. адаптировать к существующей обстановке.
2.2 Метод опорных векторов

Задача классификации состоит в определении к какому классу двух изначально известных областей относится объект. Обычно таким объектом является вектор n-мерном вещественном пространстве Rn. Данный метод так же является бинарным.

Простым примером является точки на плоскости, разбитые на два класса. Красная линия на рисунке 2.2 является разделяющей.

Рисунок 2.2 – Разделение на классы.

После, у нас появляются еще две несколько прямых, разделяющих представленные классы на рисунке 2.3

Рисунок 2.3 — Обучающая выборка

Опираясь на точность классификации лучше выбрать прямую, расстояние от которой до каждого класса минимально. То есть, выберем ту прямую, которая делит классы лучшим образом. Она будет иметь название оптимальной разделяющей гиперплоксостью.

Если обратиться к математическому обоснованию, то обучающая выборка будет иметь вид

(x1,y1),...,(Xn,Ym), x
1   2   3   4   5   6


написать администратору сайта