кредитный скоринг. Кредитный скоринг. Кредитный скоринг
Скачать 303.87 Kb.
|
Методы, используемые в кредитном скоринге.Для разработки алгоритмов кредитного скоринга применяются самые различные методы: классические, основанные на статистическом дискриминантном и регрессионном анализах.( линейная регрессия, логистическая регрессия); различные варианты линейного программирования; дерево классификации или рекурсионно-партиционный алгоритм (РПА); нейронные сети; генетический алгоритм; метод ближайших соседей; Первые модели кредитного скоринга были разработаны Fair Isaac Corporation более полувека назад. Скоринговые баллы, являющиеся результатом работы этих моделей, названы в честь компании ‒ FICO. Сейчас FICO широко известен и повсеместно применяется в США и Канаде при принятии решений о выдаче кредитов. Рассчитывается FICO исходя из информации трех крупнейших национальных кредитных бюро: Experian, Equifax и TransUnion. Кредитный балл в зависимости от того, по чьим данным считается, незначительно различается. Точная формула расчёта является коммерческой тайной, однако известно, какая информация и в какой мере используется при формировании кредитного балла FICO[ CITATION Dem \l 1049 ]: 35%: кредитная история (в т. ч. история платежей по счетам); 30%: бремя задолженности (в т. ч. количество счетов с остатками, сумма задолженности по различным видам счетов, доля используемых средств от возможного кредита и др.); 15%: продолжительность кредитных историй (например, средний возраст аккаунта, возраст самого продолжительного аккаунта); 10%: типы использованных кредитов (например, возобновляемый кредит, ипотечное кредитование и др.); 10%: недавние заявки на получение кредита. FICO изменяется в диапазоне от 300 до 850 баллов. Более высокий балл, как и в большинстве других моделей, соответствует более низким рискам. Следует отметить, что определение порога, по которому отсеиваются заявки, которые не будут удовлетворены, требует дополнительных усилий. Нет строго определенной процедуры и выбор этой черты зависит от стратегии банка: какие риски готов принимать банк, насколько он стремится расширять свой кредитный портфель и т.д. Ситуация осложняется еще и тем, что в случае FICO сравнение значений скоринговых баллов во времени невозможно: если у заемщика в текущий период балл выше, чем был в предыдущий, это вовсе не значит, что кредитная операция с его участием стала менее рискованной, поскольку балл FICO зависит не только от характеристик конкретного заемщика, но и от поведенческих паттернов больших групп населения, целой страны или отдельных регионов[ CITATION Dem \l 1049 ]. Поскольку FICO не учитывает факторы, относящиеся, например, к демографическим характеристикам потенциального заемщика, решения по удовлетворению или отклонению заявки на кредит не всегда принимаются исключительно на скоринговом балле, полученном от агентств кредитной отчетности. Этот балл может быть использован как один входных признаков для используемого в банке алгоритма или рассматриваться в совокупности с результатами проверки отделом внутренней безопасности банка и оценкой других рисков, производимых кредитором. В том случае, когда компания еще достаточно мала, принципиальной разницы между кредитованием юридического лица (компании) и физического лица (заявителя) не существует. На практике часто для оценки кредитных рисков достаточно использовать данные о собственнике этого бизнеса, потому что его паттерны поведения хорошо описывают возможное поведение компании. Безусловно, характеристики организации и особенности ее функционирования, такие как финансовые показатели и характер деятельности, приносящей прибыль, важны и с определенного этапа тоже учитываются. Регрессии, как линейные, так и логистические, достаточно распространены в кредитном скоринге. Поскольку перед банком стоит задача отобрать лучших заемщиков, не обязательно действовать в рамках задачи классификации: вместо нее может быть реализована задача ранжирования, для которой подходят и линейная, и логистическая регрессии (так как могут предсказывать вероятность принадлежности к одному из бинарных классов, по которой и будут упорядочены потенциальные заемщики). Стоит заметить, что регрессионный анализ может быть использован не только непосредственно для кредитного скоринга, но и для предшествующего ему отбора признаков для построения моделей. Хотя логистическая регрессия и не является самым эффективным методом для классификации, она значительно менее чувствительна к размеру выборки и соотношению плохих и хороших рисков в ней по сравнению со многими другими методами, применяемыми для классификации вообще и кредитного скоринга в частности. Дискриминантный анализ. Используя линейные скоринговые функции, можно оценить вероятность принадлежности клиента тому или иному классу, определив Далее необходимо просто выбрать тот класс, которому соответствует больший счёт. В случае двух классов это даёт тот же самый результат, что и линейная регрессия. Наряду с упомянутыми выше методами для классификации плохих и хороших кредитных рисков используются деревья решений. Вне зависимости от алгоритма построения дерева (ID3, C4.5, C5.0, CART) метод имеет некоторые достоинства, среди которых простота в интерпретации и понимании, менышая необходимость в предобработке данных (может работать одновременно с переменными, измеряемыми по разным шкалам, не требует шкалирования, нормирования или заполнения пропусков в данных). Между тем, задача построения оптимального дерева вычислительно затратная, а сами деревья склонны к переобучению. Проблема переобучения в частности может быть решена подбором гиперпараметров, таких как критерии останова (прекращение построения дерева, при выполнении некоторого условия, например, достижение определенной глубины), «стрижкой» деревьев, а также композицией нескольких алгоритмов или созданием комитета решающих деревьев, усредняющего ошибку и улучшающего обобщающую способность модели. На рис. 2 изображён пример дерева классификации Рис. 2: Дерево классификации Для нахождения нелинейных зависимостей в данных часто используют нейронные сети. Применимы они и в задачах кредитного скоринга, и зачастую показывают лучшие результаты, чем традиционные статистические модели. Однако у них имеются некоторые ограничения, связанные с тем, что они долго обучаются, работают значительно хуже, если в данных имеются нерелевантные атрибуты или если сеть обучена на недостаточно большой выборке данных. Хотя полученная модель сложна для интерпретации, алгоритмы кредитного скоринга, работающие на базе нейронных сетей, реализованы во многих коммерческих решениях для банков. Исследования показывают, что метод опорных векторов (Support Vector Machine, далее SVM), основная идея которого заключается в переходе от исходного пространства признаков в пространство более высокой размерности (или даже бесконечномерное) и поиск в нем гиперплоскости максимально разделяющей классы, зарекомендовал себя как весьма эффективный метод классификации. В частности, в задачах кредитного скоринга SVM достигает примерно такую же долю правильных ответов, как и нейронные сети[ CITATION Hua \l 1049 ]. Одним из главных недостатков этого метода является то, что он, как и нейронные сети, работает по принципу «черного ящика» и не поддается объяснению или интерпретации доступным человеку образом. Требования к интерпретируемости не являются случайными: на практике кредитные организации не всегда могут необоснованно отвергнуть заявку на кредит, что, например, в США закреплено законодательно. Отказываться от преимуществ весьма точной классификации, которую могут обеспечить нейронный сети или SVM, никто, разумеется, не готов, поэтому к построенным моделям применяют технику извлечения правил. Её ключевое предположение заключается в том, что обученная модель лучше представляет датасет, чем исходные данные. В зависимости от специфики метода, используемого для извлечения правил из обученной модели, получаемые правила могут иметь вид простых выражений «если …, то…», M-из-N-правил («Если как минимум M из N условий (У1, У2, … УN), … то…»), нечетких правил, обеспечивающих большую гибкость, деревьев решения и проч. Методы, позволяющие извлекать правила из нейронных сетей и SVM, могут как являться декомпозирующими, так и воспринимать обученные модели как «черный ящик» и аппроксимировать их работу на сгенерированных (иногда и части исходных) данных. Исследованиями подтверждено, что извлеченные правила несильно уступают исходным моделям в качестве предсказаний, но значительно более понятны для человека. По крайней мере на академическом уровне были совершены попытки применения генетического программирования для решения проблемы кредитного скоринга. Группа исследователей из Тайваня сравнила частоту ошибок, достигаемую при использовании генетического программирования, с полученными при работе логистической регрессии, нейронной сети, решающих деревьев, а также аппроксимации при помощи грубых множеств (rough sets). В результате применения вышеперечисленных моделей к так называемым Австралийскому и Немецкому дата сетам генетическое программирование в среднем показало самую низкую долю ошибочно классифицируемых объектов, что дает основания для более детального рассмотрения идей по его применению к реальным задачам. С развитием различных интеллектуальных методов все больше из них находят свое приложение в деятельности банков. Например, анализ профилей заемщика в социальных сетях при помощи интеллектуального анализа текстов (text mining). Для принятия решений кредитным учреждениям необходимы знания как о возможных потерях при выдаче кредита, так и о прибыли, которую возможно получить. Важно также понимать, какие убытки понесет банк при ошибочной классификации рисков. Убытком может являться упущенная выгода, если в кредите отказано клиенту с хорошими кредитными рисками (ошибка первого рода), или, в случае одобрения плохой кредитной операции (ошибка второго рода), потеря невыплаченных заёмщиком средств (сама сумма и процент, на которые рассчитывал банк). Конечно, фактические убытки от ошибок второго рода значительно выше. Единого определения плохого кредитного риска не существует, потому что оно зависит от характеристик кредита, его целевой аудитории и самого кредитора. Кредитный скоринг позволяет упростить работу кредитных специалистов и сделать оценку кредитных рисков менее затратной, хотя не исключает некоторый контроль со стороны экспертов. В некоторых банках производится дополнительная работа с заявками, которые оказались близко к зоне отказа. Однако стоит относиться к этому с осторожностью: злоупотребление внешней корректировкой модели может либо приводить к более субъективной оценке рисков, либо свидетельствовать о недостаточной эффективности модели и необходимости ее доработки. Выбор и построение модели, внедрение кредитного скоринга и его применение, безусловно, сложная и трудоемкая задача. В условиях существования кредитных бюро задача несколько упрощается в отношении заемщиков, которые еще не были клиентами конкретного банка, однако существуют заявители, не обращавшиеся к услугам кредиторов прежде. Поэтому вполне естественно существует практика раздельно оценивать заявителей, имеющих и не имеющих кредитную историю. Особое внимание стоит обратить на данные, по которым обучается и оценивается модель. С одной стороны, выборки должна быть репрезентативны, поэтому в них отражены как хорошие, так и плохие кредитные риски. С другой стороны, генеральная совокупность кредитных операций, для которых известно, к какому риску они принадлежат, не является беспристрастной: эти операции когда-то были отобраны кредитными специалистами или были оценены другими алгоритмами, а информация о неудовлетворённых кредитных заявлениях отсутствует вовсе. В общем случае решают либо считать, что ранее отсеянные кредитные риски настолько велики, что и построенная модель их выявит, либо применять более радикально настроенный алгоритм и использовать в обучении заявки, по которым было отказано, как операции с плохими рисками. Последнее чревато сохранением субъективности, унаследованной от экспертного оценивания рисков до внедрения кредитного скоринга. Работа с данными сложна еще и потому, что характеристики заявителей и заемщиков описаны как при помощи количественных, так и при помощи качественных признаков. Из-за этого, например, возникает проблема классификации заемщиков в пространстве разнотипных признаков. В таких условиях, например, могут нарушаться некоторые существенные предположения о характере распределения случайных величин, что делает заведомо невозможным применение ряда алгоритмов классификации. Разработка, внедрение и поддержание кредитного скоринга могут быть реализованы и самим банком, но из-за описанных выше и других сложностей банки обращаются к аутсорсингу. Существуют не только готовые решения под определенный вид скоринга, но и возможность заказать разработку этих моделей под конкретные нужды банка, кроме того, на рынке представлено специальное программное обеспечение для самостоятельного создания скоринговых моделей. Например, Scorto, поставщик решений и услуг для управленческих решений и снижения рисков, предлагает весь диапазон соответствующих продуктов и услуг, среди которых[ CITATION Сис \l 1049 ]: – комплексное решение для оценки заемщика и поддержки принятия решений в розничном кредитовании ‒ Scorto™ Loan Desicion; – решение для анализа и управления кредитным портфелем (поведенческий скоринг) ‒ Scorto™ Behavia; – решение для планирования и управления коллекторской деятельностью ‒ Scorto™ Ample Collection; – решение для выявления мошенничества как со стороны заемщиков (с момента подачи заявления и на всех последующих этапах жизненного цикла кредита), так и внутри кредитной организации ‒ Scorto™ Fraud Barrier; – инструмент для разработки собственных скоринговых моделей ‒ Scorto™ Loan Manager SME. Существую также продукты для оценки кредитных рисков компаний, среди которых RiskCalc Plus™, использующий базы данных кредитных исследований Moody’s Analytics[ CITATION Ris \l 1049 ]. Кредитный скоринг может обеспечить банку значительные конкурентные преимущества, сократить операционные расходы и увеличить прибыль, в том числе за счет снижения рисков[ CITATION Can \l 1049 ]. Для его эффективного использования необходимо помнить о преимуществах и ограничениях моделей и алгоритмов и уметь использовать их, отвечая на требования бизнес-условий. Важно осваивать лучшие из существующих подходы к кредитному скорингу и участвовать в разработке новых, чтобы обеспечить оптимальное качество оказываемых кредитных услуг и положение банка в отрасли. |