Лабораторна работа №7. Освоение основных методов и способов построения деревьев решений
Скачать 293.76 Kb.
|
Цель работы: Освоение основных методов и способов построения деревьев решений. Приобретение практических навыков по использованию инструментария Deductor для решения задачи классификации с помощью построения дерева решений. Задание на лабораторную работу: 1. Выполните действия, описанные выше, с данными содержащимися в файлах: Вариант 4 (номер студента в журнале 16, 17, 18, 19, 20, 21, 22) На основе исходных данных файла «Голосование конгресса.txt» найти алгоритм голосования. Провести следующие исследования: А) Постройте дерево решения для указанных выше вариантов. Попробуйте использовать различные значения параметров обучения дерева решения и сравните полученные деревья. Б) Выведите 2 правила из построенного дерева решений. 2. Выполните действия, описанные выше, с данными содержащимися в файле «Риск1.txt». Определить какие факторы являются наиболее важными а какие наименее важными для выдачи кредита. 3. По аналогии с данными, приведенными в файле «Риск1.txt» составить свой файл данных для решения задачи классификации: «зачтено – не зачтено». В качестве атрибутов использовать: средний бал обучения за семестр, количество пропусков занятий, количество оценок полученных на занятиях. В течение семестра проведено 21 занятие, обязательное количество оценок – 13. Автоматически выставляется «Зачет» при среднем балле больше или равном 3.0, при условии, что в течение семестра получено не менее 13 оценок и было не более 4 пропусков занятий. Меньшее количество полученных в семестре оценок и большее количество пропусков приводит к уменьшению среднего балла за семестр. Построить дерево решений и вывести правила из построенного дерева для своих данных. Выполнение лабораторной работы: 1.На основе файла «Грибы» сравниваем деревья решений, при различных параметрах обучения. На рисунке 1 показаны первые заданные параметры обучения дерева решений. Рисунок 1- Параметры обучения дерева решений. Рисунок 2- дерево решений. Задаем новые параметры обучения дерева решения, результаты показаны на рисунках 3 и 4. Рисунок 3- параметры дерева решений. Рисунок 4- дерево решений. Снова задаем новые параметры дерева решений и видим результат на рисунках 5 и 6. Рисунок 5- параметры дерева решений. Рисунок 6- дерево решений. Сравнивая все три результата деревьев решений, можем сказать, что изменяя параметры обучения, получаем различные представления дерева решений. Чем меньше уровень доверия, тем больше узлов отсечено и тем компактнее дерево. Правила из построенного дерева решений:
2. Задаем параметры для обучения дерева решений файла «Риск1» Рисунок 7- параметры обучения. Рисунок 8- дерево решений. Самый важный фактор при выдачи кредита является возраст, остальные факторы менее важные. Вывод: Сравнивая все три результата деревьев решений, можем сказать, что изменяя параметры обучения, получаем различные представления дерева решений. Чем меньше уровень доверия, тем больше узлов отсечено и тем компактнее дерево. Самый важный фактор при выдачи кредита является возраст, остальные факторы менее важные. |