Главная страница
Навигация по странице:

  • Задача привлечения новых клиентов банка.

  • Другие задачи сегментации клиентов.

  • Задача управления ликвидностью банка. Прогнозирование остатка на счетах клиентов.

  • Задача выявления случаев мошенничества с кредитными карточками.

  • Промышленное производство

  • Применение Data Mining в CRM

  • Исследования для правительства

  • Data Mining для научных исследований Биоинформатика

  • Молекулярная генетика и генная инженерия

  • Предварительные знания


    Скачать 3.17 Mb.
    НазваниеПредварительные знания
    АнкорDataMining.pdf
    Дата02.03.2017
    Размер3.17 Mb.
    Формат файлаpdf
    Имя файлаDataMining.pdf
    ТипДокументы
    #3306
    страница9 из 34
    1   ...   5   6   7   8   9   10   11   12   ...   34
    Банковское дело
    Технология Data Mining используется в банковской сфере для решения ряда типичных задач.
    Задача "Выдавать ли кредит клиенту?"
    Классический пример применения Data Mining в банковском деле - решение задачи определения возможной некредитоспособности клиента банка. Эту задачу также называют анализом кредитоспособности клиента или "Выдавать ли кредит клиенту?".
    Без применения технологии Data Mining задача решается сотрудниками банковского учреждения на основе их опыта, интуиции и субъективных представлений о том, какой клиент является благонадежным. По похожей схеме работают системы поддержки принятия решений и на основе методов Data Mining. Такие системы на основе исторической (ретроспективной) информации и при помощи методов классификации выявляют клиентов, которые в прошлом не вернули кредит.
    Задача "Выдавать ли кредит клиенту?" при помощи методов Data Mining решается следующим образом. Совокупность клиентов банка разбивается на два класса (вернувшие и не вернувшие кредит); на основе группы клиентов, не вернувших кредит, определяются основные "черты" потенциального неплательщика; при поступлении информации о новом клиенте определяется его класс ("вернет кредит", "не вернет кредит").
    Задача привлечения новых клиентов банка.
    С помощью инструментов Data Mining возможно провести классификацию на "более выгодных" и "менее выгодных" клиентов. После определения наиболее выгодного сегмента клиентов банку есть смысл проводить более активную маркетинговую политику по привлечению клиентов именно среди найденной группы.
    Другие задачи сегментации клиентов.
    Разбивая клиентов при помощи инструментов Data Mining на различные группы, банк имеет возможность сделать свою маркетинговую политику более целенаправленной, а потому - эффективной, предлагая различным группам клиентов именно те виды услуг, в которых они нуждаются.
    Задача управления ликвидностью банка. Прогнозирование остатка на счетах
    клиентов.
    75

    Проводя прогнозирования временного ряда с информацией об остатках на счетах клиентов за предыдущие периоды, применяя методы Data Mining, можно получить прогноз остатка на счетах в определенный момент в будущем. Полученные результаты могут быть использованы для оценки и управления ликвидностью банка.
    Задача выявления случаев мошенничества с кредитными карточками.
    Для выявления подозрительных операций с кредитными карточками применяются так называемые "подозрительные стереотипы поведения", определяемые в результате анализа банковских транзакций, которые впоследствии оказались мошенническими. Для определения подозрительных случаев используется совокупность последовательных операций на определенном временном интервале. Если система Data Mining считает очередную операцию подозрительной, банковский работник может, ориентируясь на эту информацию, заблокировать операции с определенной карточкой.
    Страхование
    Страховой бизнес связан с определенным риском. Здесь задачи, решаемые при помощи
    Data Mining, сходны с задачами в банковском деле.
    Информация, полученная в результате сегментации клиентов на группы, используется для определения групп клиентов. В результате страховая компания может с наибольшей выгодой и наименьшим риском предлагать определенные группы услуг конкретным группам клиентов.
    Задача выявление мошенничества решается путем нахождения некого общего стереотипа поведения клиентов-мошенников.
    Телекоммуникации
    В сфере телекоммуникаций достижения Data Mining могут использоваться для решения задачи, типичной для любой компании, которая работает с целью привлечения постоянных клиентов, - определения лояльности этих клиентов. Необходимость решения таких задач обусловлена жесткой конкуренцией на рынке телекоммуникаций и постоянной миграцией клиентов от одной компании в другую. Как известно, удержание клиента намного дешевле его возврата. Поэтому возникает необходимость выявления определенных групп клиентов и разработка наборов услуг, наиболее привлекательных именно для них. В этой сфере, так же как и во многих других, важной задачей является выявление фактов мошенничества.
    Помимо таких задач, являющихся типичными для многих областей деятельности, существует группа задач, определяемых спецификой сферы телекоммуникаций.
    Электронная коммерция
    В сфере электронной коммерции Data Mining применяется для формирования рекомендательных систем и решения задач классификации посетителей Web-сайтов.
    Такая классификация позволяет компаниям выявлять определенные группы клиентов и проводить маркетинговую политику в соответствии с обнаруженными интересами и потребностями клиентов. Технология Data Mining для электронной коммерции тесно связана с технологией Web Mining [28].
    76

    Промышленное производство
    Особенности промышленного производства и технологических процессов создают хорошие предпосылки для возможности использования технологии Data Mining в ходе решения различных производственных задач. Технический процесс по своей природе должен быть контролируемым, а все его отклонения находятся в заранее известных пределах;
    т.е. здесь мы можем говорить об определенной стабильности, которая обычно не присуща большинству задач, встающих перед технологией Data Mining.
    Основные задачи Data Mining в промышленном производстве [29]:

    комплексный системный анализ производственных ситуаций;

    краткосрочный и долгосрочный прогноз развития производственных ситуаций;

    выработка вариантов оптимизационных решений;

    прогнозирование качества изделия в зависимости от некоторых параметров технологического процесса;

    обнаружение скрытых тенденций и закономерностей развития производственных процессов;

    прогнозирование закономерностей развития производственных процессов;

    обнаружение скрытых факторов влияния;

    обнаружение и идентификация ранее неизвестных взаимосвязей между производственными параметрами и факторами влияния;

    анализ среды взаимодействия производственных процессов и прогнозирование изменения ее характеристик;

    выработку оптимизационных рекомендаций по управлению производственными процессами;

    визуализацию результатов анализа, подготовку предварительных отчетов и проектов допустимых решений с оценками достоверности и эффективности возможных реализаций.
    Маркетинг
    В сфере маркетинга Data Mining находит очень широкое применение.
    Основные вопросы маркетинга "Что продается?", "Как продается?", "Кто является потребителем?"
    В лекции, посвященной задачам классификации и кластеризации, подробно описано использование кластерного анализа для решения задач маркетинга, как, например, сегментация потребителей.
    Другой распространенный набор методов для решения задач маркетинга - методы и алгоритмы поиска ассоциативных правил.
    Также успешно здесь используется поиск временных закономерностей.
    Розничная торговля
    В сфере розничной торговли, как и в маркетинге, применяются:
    77


    алгоритмы поиска ассоциативных правил (для определения часто встречающихся наборов товаров, которые покупатели покупают одновременно). Выявление таких правил помогает размещать товары на прилавках торговых залов, вырабатывать стратегии закупки товаров и их размещения на складах и т.д.

    использование временных последовательностей, например, для определения необходимых объемов запасов товаров на складе.

    методы классификации и кластеризации для определения групп или категорий клиентов, знание которых способствует успешному продвижению товаров.
    Фондовый рынок
    Вот список задач фондового рынка, которые можно решать при помощи технологии Data
    Mining [30]:

    прогнозирование будущих значений финансовых инструментов и индикаторов по их прошлым значениям;

    прогноз тренда (будущего направления движения - рост, падение, флэт) финансового инструмента и его силы (сильный, умеренно сильный и т.д.);

    выделение кластерной структуры рынка, отрасли, сектора по некоторому набору характеристик;

    динамическое управление портфелем;

    прогноз волатильности;

    оценка рисков;

    предсказание наступления кризиса и прогноз его развития;

    выбор активов и др.
    Кроме описанных выше сфер деятельности, технология Data Mining может применяться в самых разнообразных областях бизнеса, где есть необходимость в анализе данных и накоплен некоторый объем ретроспективной информации.
    Применение Data Mining в CRM
    Одно из наиболее перспективных направлений применения Data Mining - использование данной технологии в аналитическом CRM.
    CRM (Customer Relationship Management) - управление отношениями с клиентами.
    При совместном использовании этих технологий добыча знаний совмещается с "добычей денег" из данных о клиентах.
    Важным аспектом в работе отделов маркетинга и отдела продаж является составление целостного представления о клиентах, информация об их особенностях, характеристиках, структуре клиентской базы. В CRM используется так называемое профилирование клиентов, дающее полное представление всей необходимой информации о клиентах.
    Профилирование клиентов включает следующие компоненты: сегментация клиентов, прибыльность клиентов, удержание клиентов, анализ реакции клиентов. Каждый из этих компонентов может исследоваться при помощи Data Mining, а анализ их в совокупности, как компонентов профилирования, в результате может дать те знания, которые из каждой отдельной характеристики получить невозможно.
    78

    В результате использования Data Mining решается задача сегментации клиентов на основе их прибыльности. Анализ выделяет те сегменты покупателей, которые приносят наибольшую прибыль. Сегментация также может осуществляться на основе лояльности клиентов. В результате сегментации вся клиентская база будет поделена на определенные сегменты, с общими характеристиками. В соответствии с этими характеристиками компания может индивидуально подбирать маркетинговую политику для каждой группы клиентов.
    Также можно использовать технологию Data Mining для прогнозирования реакции определенного сегмента клиентов на определенный вид рекламы или рекламных акций - на основе ретроспективных данных, накопленных в предыдущие периоды.
    Таким образом, определяя закономерности поведения клиентов при помощи технологии
    Data Mining, можно существенно повысить эффективность работы отделов маркетинга, продаж и сбыта. При объединении технологий CRM и Data Mining и грамотном их внедрении в бизнес компания получает значительные преимущества перед конкурентами.
    Исследования для правительства
    В планах правительства США стоит создание системы, которая позволит отслеживать всех иностранцев, приезжающих в страну. Задача этого комплекса: начиная с пограничного терминала, на основе технологии биометрической идентификации личности и различных других баз данных контролировать, насколько реальные планы иностранцев соответствуют заявленным ранее (включая перемещения по стране, сроки отъезда и др.).
    Предварительная стоимость системы составляет более 10 млрд. долларов, разработчик комплекса - компания Accenture.
    По данным аналитического отчета Главного контрольного управления американского
    Конгресса, правительственные ведомства США участвуют приблизительно в двухстах проектах на основе анализа данных (Data Mining), собирающих разнообразную информацию о населении. Более ста из этих проектов направлены на сбор персональной информации (имена, фамилии, адреса e-mail, номера соцстрахования и удостоверений водительских прав), и на основе этой информации осуществляют предсказания возможного поведения людей. Поскольку в упомянутом отчете не приведена информация о секретных отчетах, надо полагать, что общее число таких систем значительно больше.
    Несмотря на пользу, которую приносят системы отслеживания, эксперты упомянутого управления, так же как и независимые эксперты, предупреждают о значительном риске, с которым связаны подобные проекты. Причина опасений - проблемы, которые могут возникнуть при управлении и надзоре за такими базами.
    Data Mining для научных исследований
    Биоинформатика
    Одна из научных областей применения технологии Data Mining - биоинформатика, направление, целью которого является разработка алгоритмов для анализа и систематизации генетической информации. Полученные алгоритмы используются для определения структур макромолекул, а также их функций, с целью объяснения различных биологических явлений.
    79

    Медицина
    Несмотря на консервативность медицины во многих ее аспектах, технология Data Mining в последние годы активно применяется для различных исследований и в этой сфере человеческой деятельности. Традиционно для постановки медицинских диагнозов используются экспертные системы, которые построены на основе символьных правил, сочетающих, например, симптомы пациента и его заболевание. С использованием Data
    Mining при помощи шаблонов можно разработать базу знаний для экспертной системы.
    Фармацевтика
    В области фармацевтики методы Data Mining также имеют достаточно широкое применение. Это задачи исследования эффективности клинического применения определенных препаратов, определение групп препаратов, которые будут эффективны для конкретных групп пациентов. Актуальными здесь также являются задачи продвижения лекарственных препаратов на рынок.
    Молекулярная генетика и генная инженерия
    В молекулярной генетике и генной инженерии выделяют отдельное направление Data
    Mining, которое имеет название анализ данных в микро-массивах (Microarray Data
    Analysis, MDA). Подробно с применением Microarray Data Analysis можно ознакомиться в
    [22].
    Некоторые применения этого направления:

    ранняя и более точная диагностика;

    новые молекулярные цели для терапии;

    улучшенные и индивидуально подобранные виды лечения;

    фундаментальные биологические открытия.
    Примеры использования Data Mining - молекулярный диагноз некоторых серьезнейших заболеваний; открытие того, что генетический код действительно может предсказывать вероятность заболевания; открытие некоторых новых лекарств и препаратов.
    Основные понятия, которыми оперирует Data Mining в областях "Молекулярная генетика и генная инженерия" - маркеры, т.е. генетические коды, которые контролируют различные признаки живого организма.
    На финансирование проектов с использованием Data Mining в рассматриваемых сферах выделяют значительные финансовые средства.
    Химия
    Технология Data Mining активно используется в исследованиях органической и неорганической химии. Одно из возможных применений Data Mining в этой сфере - выявление каких-либо специфических особенностей строения соединений, которые могут включать тысячи элементов.
    Далее мы рассмотрим технологии, в основу которых также положено понятие Mining или "добыча".
    80

    Web Mining
    Web Mining можно перевести как "добыча данных в Web". Web Intelligence или Web
    Интеллект готов "открыть новую главу" в стремительном развитии электронного бизнеса.
    Способность определять интересы и предпочтения каждого посетителя, наблюдая за его поведением, является серьезным и критичным преимуществом конкурентной борьбы на рынке электронной коммерции.
    Системы Web Mining могут ответить на многие вопросы, например, кто из посетителей является потенциальным клиентом Web-магазина, какая группа клиентов Web-магазина приносит наибольший доход, каковы интересы определенного посетителя или группы посетителей.
    Технология Web Mining охватывает методы, которые способны на основе данных сайта обнаружить новые, ранее неизвестные знания и которые в дальнейшем можно будет использовать на практике. Другими словами, технология Web Mining применяет технологию Data Mining для анализа неструктурированной, неоднородной, распределенной и значительной по объему информации, содержащейся на Web-узлах.
    Согласно таксономии Web Mining [31], здесь можно выделить два основных направления:
    Web Content Mining и Web Usage Mining.
    Web Content Mining подразумевает автоматический поиск и извлечение качественной информации из разнообразных источников Интернета, перегруженных "информационным шумом". Здесь также идет речь о различных средствах кластеризации и аннотировании документов.
    В этом направлении, в свою очередь, выделяют два подхода: подход, основанный на агентах, и подход, основанный на базах данных.
    Подход, основанный на агентах (Agent Based Approach), включает такие системы:

    интеллектуальные поисковые агенты (Intelligent Search Agents);

    фильтрация информации / классификация;

    персонифицированные агенты сети.
    Примеры систем интеллектуальных агентов поиска:

    Harvest (Brown и др., 1994),

    FAQ-Finder (Hammond и др., 1995),

    Information Manifold (Kirk и др., 1995),

    OCCAM (Kwok and Weld, 1996), and ParaSite (Spertus, 1997),

    ILA (Information Learning Agent) (Perkowitz and Etzioni, 1995),

    ShopBot (Doorenbos и др., 1996).
    Подход, основанный на базах данных (Database Approach), включает системы:

    многоуровневые базы данных;

    системы web-запросов (Web Query Systems);
    Примеры систем web-запросов:
    81


    W3QL (Konopnicki и Shmueli, 1995),

    WebLog (Lakshmanan и др., 1996),

    Lorel (Quass и др., 1995),

    UnQL (Buneman и др., 1995 and 1996),

    TSIMMIS (Chawathe и др.., 1994).
    Второе направление Web Usage Mining подразумевает обнаружение закономерностей в действиях пользователя Web-узла или их группы.
    Анализируется следующая информация:

    какие страницы просматривал пользователь;

    какова последовательность просмотра страниц.
    Анализируется также, какие группы пользователей можно выделить среди общего их числа на основе истории просмотра Web-узла.
    Web Usage Mining включает следующие составляющие:

    предварительная обработка;

    операционная идентификация;

    инструменты обнаружения шаблонов;

    инструменты анализа шаблонов.
    При использовании Web Mining перед разработчиками возникает два типа задач. Первая касается сбора данных, вторая - использования методов персонификации. В результате сбора некоторого объема персонифицированных ретроспективных данных о конкретном клиенте, система накапливает определенные знания о нем и может рекомендовать ему, например, определенные наборы товаров или услуг. На основе информации о всех посетителях сайта Web-система может выявить определенные группы посетителей и также рекомендовать им товары или же предлагать товары в рассылках.
    Задачи Web Mining согласно [31] можно подразделить на такие категории:

    Предварительная обработка данных для Web Mining.

    Обнаружение шаблонов и открытие знаний с использованием ассоциативных правил, временных последовательностей, классификации и кластеризации;

    Анализ полученного знания.
    1   ...   5   6   7   8   9   10   11   12   ...   34


    написать администратору сайта