века. Отчет 4 Weka Подготовила Елимисова а 19 m сбд2 Проверила Смаилова С. С. Усть
Скачать 119.33 Kb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН ВОСТОЧНО-КАЗАХСТАНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. Д.СЕРИКБАЕВА Отчет 4 Weka Подготовила: Елимисова А 19-MСБД-2 Проверила: Смаилова С.С. Усть Каменогорск 2019 Банковский маркетинг Эти данные связаны с прямыми маркетинговыми кампаниями португальского банковского учреждения. Маркетинговые кампании основывались на телефонных звонках. Часто требовалось более одного контакта с одним и тем же клиентом, чтобы получить доступ, если продукт (банковский срочный депозит) будет (или нет) подписан. Цель классификации-предсказать, подпишется ли клиент на срочный депозит (переменная y). Входящие данные: Данные банка и клиента 1-Возраст (числовой) 2-задание: тип задания (категорическое: "админ.", "неизвестный", "безработный", "менеджмент", "горничная", "предприниматель", "студент", "синий воротничок", "самозанятый", "пенсионер", "техник", " услуги") 3-семейное положение: семейное положение (категорическое: "женат", "разведен", "холост"; Примечание: "разведен" означает разведенный или вдовец) 4-образование (категориальное: "неизвестное", "среднее", "начальное", " высшее") 5-дефолт: имеет ли кредит по умолчанию? (двоичный код: "Да", " нет") 6-баланс: средний годовой баланс, в евро (числовой) 7-жилье: есть ли жилищный кредит? (двоичный код: "Да", " нет") 8 - кредита: личные кредит? (двоичный код: "Да", " нет") - связанный с последним контактом текущей кампании: 9-контакт: тип контактной связи (категориальный: "неизвестно", "телефон", " сотовая связь") 10-День: последний контактный день месяца (числовой) 11-месяц: последний контактный месяц года (категорический: "январь", "февраль", "март", ..., "ноябрь-декабрь") 12-длительность: длительность последнего контакта, в секундах (числовая) - прочие атрибуты: 13-кампания: количество контактов, выполненных во время этой кампании и для данного клиента (числовое, включая последний контакт) 14-pdays: количество дней, прошедших после последнего обращения клиента из предыдущей кампании (числовое значение -1 означает, что клиент ранее не обращался) 15-предыдущий: количество контактов, выполненных до этой кампании и для данного клиента (числовое значение) 16- презультат: результат предыдущей маркетинговой кампании (категорический: "неизвестный", "другой", "неудача", " успех") - выходная переменная (желаемая цель): 17-й-подписался ли клиент на срочный депозит? (двоичный код: "Да", " нет") Выходные данные с кластеризации: === Run information === Scheme: weka.clusterers.SimpleKMeans -N 3 -S 10 Relation: bank-marketing-full Instances: 45211 Attributes: 17 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 Class Test mode: split 66% train, remainder test === Clustering model (full training set) === kMeans ====== Number of iterations: 9 Within cluster sum of squared errors: 133810.33023816897 Cluster centroids: Cluster 0 Mean/Mode: 38.88 blue-collar married secondary no 1238.6759 yes no cellular 13.2858 may 263.8615 2.3144 99.0714 1.2168 unknown 1 Std Devs: 8.8204 N/A N/A N/A N/A 2493.9577 N/A N/A N/A 6.9884 N/A 261.1109 2.1043 141.1297 3.549 N/A N/A Cluster 1 Mean/Mode: 40.1114 blue-collar married secondary no 1135.2119 yes no unknown 15.3468 may 251.0918 2.8324 1.2644 0.0295 unknown 1 Std Devs: 9.3248 N/A N/A N/A N/A 2556.5558 N/A N/A N/A 8.5396 N/A 248.743 3.4762 33.4758 0.5687 N/A N/A Cluster 2 Mean/Mode: 42.7588 management married secondary no 1577.8869 no no cellular 17.7111 jul 258.7034 3.0135 25.389 0.4979 unknown 1 Std Devs: 12.0139 N/A N/A N/A N/A 3576.4957 N/A N/A N/A 8.5105 N/A 260.2533 3.3557 74.7274 1.7663 N/AN/A === Evaluation on test split === kMeans ====== Number of iterations: 12 Within cluster sum of squared errors: 129235.7312549903 Cluster centroids: Cluster 0 Mean/Mode: 39.6167 blue-collar married secondary no 1062.4686 yes no unknown 14.6153 may 256.0752 2.645 43.5985 0.5069 unknown 1 Std Devs: 8.971 N/A N/A N/A N/A 2271.2255 N/A N/A N/A 7.9305 N/A 248.4594 2.9827 109.46 1.8016 N/AN/A Cluster 1 Mean/Mode: 45.0617 management married tertiary no 1803.3408 no no cellular 14.9616 aug 255.535 2.7744 37.9945 0.6936 unknown 1 Std Devs: 11.8381 N/A N/A N/A N/A 3880.4834 N/AN/A N/A 8.1475 N/A 256.9926 2.8589 92.34 3.4377 N/A N/A Cluster 2 Mean/Mode: 38.1484 technician single secondary no 1216.2954 no no cellular 18.7574 jul 261.8982 2.8475 35.5164 0.5743 unknown 1 Std Devs: 10.1941 N/A N/A N/A N/A 2520.052 N/A N/A N/A 8.4412 N/A 262.3828 3.2915 90.408 1.9513 N/AN/A Clustered Instances 0 6434 ( 42%) 1 4981 ( 32%) 2 3957 ( 26%) Визуализация данных: С полученных результатов можно сказать что подписываются на продукты по телефонным звонкам клиенты с меньшими годовыми доходами и клинты возраста с 18 по 50. |