Главная страница
Навигация по странице:

  • 1-й шаг – импорт данных

  • 2-й шаг – обработка данных

  • эпоху

  • Сценарий выполнения практического задания с использованием нейро. ПЗ. Использование нейросетей. Теоретические сведения о пакете Deductor


    Скачать 1.73 Mb.
    НазваниеПЗ. Использование нейросетей. Теоретические сведения о пакете Deductor
    Дата23.01.2018
    Размер1.73 Mb.
    Формат файлаdoc
    Имя файлаСценарий выполнения практического задания с использованием нейро.doc
    ТипДокументы
    #34997

    Золотарюк А.В.

    ПЗ. Использование нейросетей.

    Теоретические сведения о пакете Deductor.


    Deductor является аналитической платформой - основой для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.

    Deductor состоит из пяти частей:

    1. Deductor Warehouse - многомерное хранилище данных, аккумулирующее всю необходимую для анализа предметной области информацию. Использование единого хранилища позволяет обеспечить непротиворечивость данных и централизованное хранение, а также автоматически обеспечивает всю необходимую поддержку процесса анализа данных. Deductor Warehouse оптимизирован для решения именно аналитических задач, что положительно сказывается на скорости доступа к данным. В ряде случаев имеет смысл отказаться от традиционного хранилища данных и воспользоваться альтернативой - виртуальным хранилищем Virtual Warehouse.

    2. Deductor Studio - программа, реализующая функции импорта, обработки, визуализации и экспорта данных. Deductor Studio может функционировать и без хранилища данных, получая информацию из любых других источников, но наиболее оптимальным является их совместное использование. В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, таблицы, диаграммы, деревья и т.д.) и экспортировать их в наиболее распространенные форматы.

    3. Deductor Viewer - программа, ориентированная на конечного пользователя и предназначенная для просмотра подготовленных при помощи Deductor Studio отчетов. Deductor Viewer позволяет минимизировать требования к пользователю системы, т.к. все требуемые операции выполняются автоматически при помощи подготовленных ранее сценариев обработки. Пользователю Deduсtor Viewer нужно только выбрать и настроить вариант отображения полученных результатов.

    4. Deductor Server – служба, обеспечивающая удаленную аналитическую обработку данных. Она позволяет автоматически обрабатывать данные и переобучать модели на сервере, оптимизирует выполнение сценариев за счет кэширования проектов и использования многопоточной обработки.

    5. Deductor Client – клиент доступа к Deductor Server. Он обеспечивает доступ к серверу из сторонних приложений и управление его работой.

    Создание законченного решения занимает очень мало времени: достаточно получить данные, определить сценарий обработки и задать место для экспорта полученных результатов. Наличие мощного набора механизмов обработки и визуализации позволяет двигаться по шагам, от наиболее простых способов анализа ко все более мощным. Первые результаты пользователь получает практически сразу, но при этом можно легко наращивать мощность решения.




    Deductor Studio/Viewer - аналитическое приложение


    Deductor Studio - аналитическое ядро платформы Deductor. Deductor Studio содержит полный набор механизмов импорта, обработки, визуализации и экспорта данных для быстрого и эффективного анализа информации. В нем сосредоточены самые современные методы извлечения, очистки, манипулирования и визуализации данных. С ним вам становятся доступны моделирование, прогнозирование, кластеризация, поиск закономерностей и многие другие технологии обнаружения знаний (Knowledge Discovery in Databases) и добычи данных (Data Mining).

    В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, таблицы, диаграммы, деревья решений…) и экспортировать результаты.

    Вся работа по анализу данных в Deductor Studio базируется на выполнении следующих действий:

    ▪ Импорт данных;

    ▪ Обработка данных;

    ▪ Визуализация;

    ▪ Экспорт данных.

    Deductor Studio поддерживает множество источников данных: промышленные СУБД (Oracle, MS SQL...), текстовые файлы, офисные приложения (Excel, Access), ADO и ODBC источники и полностью интегрирован с многомерным хранилищем данные Deductor Warehouse. Кроме того, в качестве альтернативы традиционному ХД имеется виртуальное хранилище данных.

    Под обработкой подразумевается любое действие, связанной с преобразованием данных, например, построение моделей, очистка от шумов и аномальных значений. При этом механизмы обработки можно комбинировать произвольным образом так, чтобы достичь наилучшего результата.

    Визуализация - это отображение импортированных и обработанных данных. Визуализировать можно любой объект в сценарии обработки. Программа самостоятельно анализирует, каким образом можно отобразить информацию, и пользователь должен только выбрать нужный вариант.




    Мастер импорта



    Мастер обработки





    Мастер визуализации





    Мастер экспорта





    Сценарий выполнения практического задания с использованием нейросетей


    1-й шаг – импорт данных



    В демо-версии можно данные импортировать только с текстовых файлов Блокнота *.txt.



    Откроем файл Квартиры Демина. Нажимаем кнопку Далее несколько раз:



    Изменим параметры данных: Номер примера – информационное поле, остальные, кроме поля Цена – Входные значения, Цена – Выходное значение.



    Где надо, выберем тип Целое, где-то – Вещественный. Далее > Кнопка Пуск.



    Далее.



    Далее > Готово



    2-й шаг – обработка данных

    С помощью Мастера обработки. Выбираем нейросеть. Следуем указаниям Мастера. Далее.





    Далее. Далее.



    Сигмо́ида — это гладкая монотонная нелинейная функция, имеющая форму буквы "S", которая часто применяется для «сглаживания» значений некоторой величины.

    Задаем 2 скрытых слоя. В 1-м – 7 нейронов, во 2-м – 3 (что переход от входного слоя, где 11 нейронов, к выходному (нейрон – цена) был пологим.

    Выбирается эмпирически. Тип функции не меняем. Далее.



    Ничего не меняем. Далее.



    Далее.



     Эпохой обучения называют один проход алгоритма по массиву данных. Все ошибки. (максимальная и средняя) на обучающем и тестовом множестве рассчитываются в нормированном виде каждую эпоху.

    Кнопка Пуск. Остановка – по достижению эпох -10000 или минимальной ошибки в обучении. Далее.



    Далее.



    Готово.



    Вкладка Что-Если.



    Задали новые параметры квартиры. Получили новую цену.

    Задание. Решить задачу самостоятельно. Изменять число скрытых слоев и нейронов в них.

    Решить задачу с большим числом исходных данных (см. Файл Excel).



    написать администратору сайта