Главная страница
Навигация по странице:

  • Matrix

  • Задача

  • Корреляционной

  • Нумерация

  • RapidMiner_ЛР_№2. Руководство по лабораторной работе Перетащите импортированный набор данных на поле


    Скачать 159.16 Kb.
    НазваниеРуководство по лабораторной работе Перетащите импортированный набор данных на поле
    Дата23.02.2022
    Размер159.16 Kb.
    Формат файлаdocx
    Имя файлаRapidMiner_ЛР_№2.docx
    ТипРуководство
    #371356

    ФГБОУ BПO «Уфимский государственный авиационный технический университет» кафедра вычислительной математики и кибернетики

    Система интеллектуального анализа данных


    «RapidMiner»

    Лабораторная работа №2

    Цель и задачи


    Цель: приобрести навыки корреляционного анализа набора данных с помощью системы интеллектуального анализа данных RapidMiner.

    Задачи:


    1. Выполнить обучающее задание в соответствии с настоящим руководством по выполнению лабораторной работы;

    2. Выполнить задание для самостоятельной работы в соответствии с настоящим руководством по выполнению лабораторной работы;

    3. Оформить отчет о выполнении лабораторной работы в соответствии с требованиями к его оформлению.

    Обучающее задание

    Создайте новый проект и импортируйте файл LabO2DataSet.csv[сы.руководство по лабораторной работе № 1). Перетащите импортированный набор данных на поле Главный Пpoqecc, соедините его сплайном с портом результата и нажмите кнопку Запуск. В результате будет произведена аналитическая обработка выбранного набора данных в соответствии со структурой ГлавногоПроцессаи автоматически откроется окно РезультатыПроцесса(рис. 1).



    Result Overview I Example S et (R etrieve Lab0?DataSet)

    Data View Meta Data View Plot View Advanced Charts Annotations





    Role

    Name

    Type

    Statistic s

    Range




    regular




    Insulation

    integer

    avg = 6.214 +/- 2.768

    [2.000 ; 1 0.000]







    Temperature

    integer

    avg = 65.079 +/- 16.932

    [38.000 ; 90.000]

    0







    Heating Oil

    integer

    avg = 19 7.394 +/- 56.248

    [114.000 ; 3 01.000]

    0

    regular




    Num Occupants

    integer

    avg = 3.113 +/- 1.691

    [1.000 ; 1 0.000]

    0

    regular




    Avg Age

    real

    avg = 42.706 +/- 15.051

    [15.1 00 ; 72.200]

    0

    regular




    Home_Size

    integer

    avg = 4.649 +/- 2.321

    [1.000 ; 8.000}

    0




    Example 3et (1 21 8 example s, 0 special attribute s. 6 re gular attributes)

    Рис. 1. Окно Результаты Процесса

    Набор данных содержит 1218 экземпляров и 6 атрибутов:


    • Insulation -теплоизоляция дома по десятибалльной шкале, 1 плохая теплоизоляция,..., 10 отличная теплоизоляция.

    • Temperature-среднегодовая температура за окнами дома в Фаренгейтах.
    • Heating_Oil - количество приобретенных блоков нагревательного материала в течение года на один дом.


    • Num_Occupants-количество жильцов в доме.

    • Avg_Age-средний возраст жильцов в доме.
    • Home_Size-размер дома по восьмибальной шкале, 1 небольшой дом, ..., 8


    огромный дом.

    Отсутствующих данных или данных, не соответствующих типу атрибута нет.

    Таким образом, набор данных готов к аналитической обработке.
    Произведите корреляционный анализ атрибутов набора данных. Для этого переключитесь на окно проекта.

    Во вкладке Операторы в строке поиска введите имя оператора CorrelationMatrix(Корреляционная Матрица). Перетащите найденный оператор на поле ГлавныйПроцессна сплайн, идущий к порту результата, внедряя его в существующий Главньш Процессаналитической обработки данных. Порт mat

    (МаТрица) операТОра /foppeяqпOHH‹2я МатрицаТаКже соедиНиТе спорТОМ реЗулЬТаТа Гл‹28НОзо Процесса. В реЗулЬТаТе поле ГлавНЬіО Процесс примеТ Bи,Q КаК На рисуНКе 2.





    Proess |XML

    i в$' • | .Process



    РИС. 2. поле глаВНьІН процесс пocяеqобаВлеНип оператора КорреляцИОННая Матјэии,а
    НажмиТе KHonKy Janycu, и RapidMiner аВТОМаТичесКи OTKpoeT oKHO

    КорреляционнаяМатрица(pгiC. 3).





    Result Overview IË Correlation Matrix (Gorrelation Matrix) І ExampleSet (Retrieve Lab02DataSet)


    Insulation

    1

    -0.794

    0.736

    -0.013

    0.643

    0.201

    Temperature

    -0.794

    1

    -0.774

    0.013

    -0.673

    -0.214

    Heating_OiI

    0.736

    -0.774

    1

    -0.042

    0.848

    0.381

    Num occupants

    -0.013

    0.013

    -0.042

    1

    -0.048

    -0.023

    Avg Age

    0.643

    -0.673

    0.848

    -0.048

    1

    0.307

    Home Size

    0.201

    -0.214

    0.381

    -0.023

    0.307

    1



    /J.’ Table View /.' P airwise Tabie '/”'. Plot View './” Annotations Attributes Insulation Temperature Heating_OiI Num_Occupants Avg_Age Home_Size

    PгiC. 3. OKHO КоррелпцГіОННая MaTpиu,a

    Задача№1Обучающегозадания: проанализировать полученную КорреляционнуюМатрицу,описать взаимную связь изменения значений всех возможных пар атрибутов, сделать вывод о силе данной связи.

    Визуализируйте анализируемый набор данных, чтобы убедиться в правильности расчета КорреляционнойМатрицы.Для этого переключитесь на окно Результаты Процесса во вкладку PlotView(Визуализация) и настройте параметры визуализации в соответствии с рисунком 4.

    Result Overview Ё°§ С orrelation Matrix orrelation Matrix) | ExanJpleSet (Retrieve Lab0?DataSet) Data View Meta Data View Plot View Advanced Charts Annotations

    Plotter

    x-Axis

    @ Log Scale

    yAxis

    @ Log 3cale Color Column

    Home_S iz е 1.ОО0

    tеј е Si



    @ Log Scale

    @ Rotate Labels

    lnsu Іиion
    Рис. 4. Визуализация набора данных
    Задание для самостоятельного выполнения

      1. Составьте отчет по результатам выполнения обучающего задания лабораторной работы, включая ответы на все задачи обучающего задания. Отчет должен быть выполнен по аналогии с настоящим руководством по лабораторным работам и содержать изображения всех промежуточных этапов работы с их подробным описанием.

      2. Сформируйте свой сsv-файл данных, содержащий минимум 60 наблюдений

    и минимум 8 атрибутов (все атрибуты должны быть численного типа). В качестве наблюдений набора данных используйте профессиональных спортсменов, в качестве атрибутов — их спортивные показатели. Например, при выборе в качестве спортсмена профессионального баскетболиста в качестве атрибутов можно использовать такие показатели, как: позиция, количество лет в профессионалах, рост, среднее количество очков за игру, среднее количество подборов за игру, годовая зарплата и т.д.

      1. Создайте новый проект, импортируйте сформированный сsv-файл.

      2. Опишите импортированный набор данных, включая полное описание всех атрибутов.

      3. Определите базовые статистические показатели всех атрибутов набора

    данных.


      1. Рассчитайте КорреляционнуюМатрицу,проанализируйте ее, опишите взаимную связь изменения значений всех возможных пар атрибутов, сделайте вывод о силе данной связи.

      2. Визуализируйте анализируемый набор данных. Покажите соответствие Корреляционной Матрицы результатам визуализации.

      3. Добавьте в отчет по результатам выполнения обучающего задания результаты выполнения самостоятельного задания. Отчет должен быть выполнен по аналогии с настоящим руководством по лабораторным работам и содержать изображения всех промежуточных этапов работы с их подробным описанием.

    Требования по оформлению отчета:


    • Текст: шрифт Calibri, размер - 12 pt., расстояние между строками множитель 1.15.

    • Поля: верхнее 2 см., нижнее 2 см., левое 3 см. правое 1.5 см.

    • Нумерация страниц: есть, в правом нижнем углу.

    • Титульный лист: есть, без нумерации.







    написать администратору сайта