Главная страница

(Лаб.1)Базовые навыки работы в Deductor Studio 5.2. Практикум P. 002 Базовые навыки работы в Deductor Studio Базовые навыки работы в Deductor Studio 2


Скачать 1.76 Mb.
НазваниеПрактикум P. 002 Базовые навыки работы в Deductor Studio Базовые навыки работы в Deductor Studio 2
Дата06.11.2018
Размер1.76 Mb.
Формат файлаpdf
Имя файла(Лаб.1)Базовые навыки работы в Deductor Studio 5.2.pdf
ТипПрактикум
#55616
страница1 из 6
  1   2   3   4   5   6

© 1995-2009 Компания BaseGroup Labs
ПРАКТИКУМ
[P.002]
Базовые навыки работы в
Deductor Studio

Базовые навыки работы в Deductor Studio 5.2
2 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
З
анятие 1. Общие сведения
Развитие и назначение Deductor
Deductor – это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в
Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов.
До появления аналитических платформ анализ данных осуществлялся в основном в статистических пакетах. Их использование требовало высокой квалификации пользователя.
Большинство алгоритмов, реализованных в статистических пакетах, не позволяло эффективно обрабатывать большие объемы информации. Для автоматизации рутинных операций приходилось использовать встроенные языки программирования.
В конце 80-х гг. произошел стремительный рост объемов информации, накапливаемый на машинных носителях и возросли потребности бизнеса по применению анализа данных.
Ответом этому стало появление новых парадигм в анализе: хранилища данных, машинное обучение, Data Mining, Knowlegde Discovery in Databases. Это позволило популяризировать анализ данных, вывести его на промышленную основу и решить огромное число бизнес-задач с большим экономическим эффектом.
Венцом развития анализа данных стали специализированные программные системы –
аналитические платформы, которые полностью автоматизировали все этапы анализа от консолидации данных до эксплуатации моделей и интерпретации результатов.
Первая версия Deductor увидела свет в 2000 г. и с тех пор идет непрерывное развитие платформы. В 2007 г. выпущена пятая по счету версия системы, в 2009 г. – версия 5.2.
Сегодня
Deductor
– это яркий представитель как настольной, так и корпоративной системы анализа данных последнего поколения.
Общие сведения о Deductor
Аналитическая платформа
Deductor состоит из пяти частей:
§
Warehouse – хранилище данных, консолидирующее информацию из разных источников;
§
Studio – приложение, позволяющее пройти все этапы построения прикладного решения, рабочее место аналитика;
§
Viewer – рабочее место конечного пользователя, одно из средств тиражирования знаний (т.е. когда построенные аналитиком модели используют пользователи, не владеющие технологиями анализа данных);
§
Serve r – служба, обеспечивающая удаленную аналитическую обработку данных;
§
Client – клиент доступа к
Deductor Server
. Обеспечивает доступ к серверу из сторонних приложений и управление его работой.
Существует три типа варианта поставки платформы
Deductor
:
§
Enterprise;
§
Professional;
§
Academic.
В зависимости от типа поставки набор доступных компонентов может различаться.

Базовые навыки работы в Deductor Studio 5.2
3 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
Версия Enterprise предназначена для корпоративного использования. В ней присутствуют:
§
Серверные компоненты
Deductor Server и
Deductor Client
§
Интерфейс доступа к
Deductor через механизм
OLE Automation
§
Традиционное хранилище данных Deductor Warehouse на трех СУБД:
Firebird
,
MS
SQL
,
Oracle
§
Виртуальное хранилище данных Deductor Virtual Wareho use.
Версия Professional предназначена для небольших компаний и однопользовательской работы. В ней отсутствуют серверные компоненты, поддержка
OLE
, виртуальное хранилище, а традиционное хранилище данных можно создавать только на СУБД
FireBird
. Автоматизация выполнения сценариев обработки данных осуществляется только через пакетный режим.
Версии Professional и Enterprise требуют установки драйверов
Guardant для работы с лицензионным ключом.
Версия Academi c предназначена для образовательных и обучающих целей. Ее функционал аналогичен версии Professional за исключением:
§
отсутствует пакетный запуск сценариев, т.е. работа в программе может вестись только в
интерактивном режиме
;
§
отсутствует импорт из промышленных источников данных:

,
СУБД
, файлы
MS Excel
,
Deductor Data File
;
§
некоторые другие возможности.
Категории пользователей Deductor
В процессе развертывания и использования аналитической платформы с ней взаимодействуют различные категории пользователей. Можно выделить четыре основные категории:
§
аналитик;
§
пользователь;
§
администратор;
§
программист.
Функции аналитика:
§
создание в
Deductor Studio сценариев – последовательности шагов, которую необходимо провести для получения нужного результата.
§
построение, оценка и интерпретация моделей.
§
настройка панели отчетов для пользователей
Deductor Viewer
§
настройка сценария на поточную обработку новых данных.
Функции пользователя:
§
просмотр готовых отчетов в
Deductor Viewer
Функции администратора:
§
установка компонентов
Deductor на рабочих местах и сервера ключей
Guardant при необходимости.
§
развертывание традиционного хранилища данных на сервере.
§
контроль процедур регулярного пополнения хранилища данных.

Базовые навыки работы в Deductor Studio 5.2
4 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
§
конфигурирование сервера
Deductor Server
§
настройка пакетной и/или серверной обработки сценариев
Deductor
§
оптимизация доступа к источникам данных, в том числе к хранилищу данных.
Функции программиста:
§
интеграция
Deductor с источниками и приемниками данных.
§
вызов
Deductor из внешних программ различными способами, в том числе взаимодействие с
Deductor Server
Такая работа как проектирование и наполнение хранилище данных часто выполняется коллективно аналитиком, администратором и программистом. Аналитик проектирует семантический слой хранилища данных, то есть определяет, какие данные необходимо иметь в хранилище. Администратор создает хранилище данных и наполняет его данными. Программист при необходимости создает программные модули, выполняющие выгрузку информации из учетных систем в промежуточные источники (так называемые транспортные таблицы).
Установка Deductor
Установку
Deductor рекомендуется проводить администратору системы, однако, при наличии прав администратора в
Windows это может сделать и аналитик. Установка может быть произведена на компьютер с операционной системой
MS Windows 2000
и выше. Системные требования к компьютеру изложены в справочной системе.
Для установки
Deductor Professional/Academic запустите файл инсталлятора и следуйте инструкциям по установке. На странице Выбор компонентов программы установки предоставляется выбор, какой набор компонентов пакета
Deductor необходимо установить на компьютер. В выпадающем списке можно выбрать предопределенные конфигурации установки платформы, и программа установки сама предложит нужный набор компонентов.
После установки программ серии Professional и Enterprise дополнительно потребуется настроить работу c электронным ключом защиты от копирования. Установку и подсоединение электронного ключа осуществляет администратор.
Существуют два вида ключей – локальный и сетевой. Локальный ключ устанавливается на том же компьютере, что и
Deductor
, и работать с ним можно только с этой рабочей станции. Сетевой ключ устанавливается на сервере, и к нему могут подключаться несколько пользователей одновременно (количество пользователей ограничивается типом приобретаемой лицензии).
При каждом запуске
Deductor пытается найти доступный электронный ключ. В случае если ключ не найден, могут появиться следующие сообщения об ошибке:

Базовые навыки работы в Deductor Studio 5.2
5 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
При наличии таких ошибок следует обратиться к администратору.
Практическая работа:
1
Установите
Deductor
(конфигурация
Deductor Studio
– рабочее место аналитика) и убедитесь,
что он запускается.
Вопросы для проверки:
1
Из каких частей состоит
Deductor
?
2
Какие варианты поставки
Deductor существуют?
3
Чем отличается версия Professional от Academic?
4
Имеются ли ограничения по количеству обрабатываемых записей в версии
Deductor
Academic
?
5
Сколько категорий пользователей
Deductor можно выделить?
6
Перечислите функции аналитика.
7
Кто обычно занимается проектированием и наполнением хранилища данных?
8
Каким образом лицензируется
Deductor
?
9
У вас установлен Deductor. При его запуске появляется сообщение об ошибке:
Windows NT driver is required
Какова наиболее вероятная причина ошибки?

Базовые навыки работы в Deductor Studio 5.2
6 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
З
анятие 2. Начало работы с системой
Главное окно Deductor Studio
После запуска главное окно
Deductor Studio выглядит следующим образом.
По умолчанию панель управления представлена одной вкладкой Сценар ии . Кроме того,
доступны еще две вкладки: Отчеты и Подключения. Сделать их видимыми можно следующими способами:
§
главное меню Вид ►Отчеты и Вид ►Подключения
§
кнопки и
на панели инструментов.
Можно производить «
drag & drop»
манипуляции с вкладками, меняя их расположение и порядок.
При нажатии правой кнопки мыши на любой вкладке появляется контекстное меню:
Главное меню
Панель управления
Панель инструментов
Контекстное меню
Строка состояния
Область для визуализаторов

Базовые навыки работы в Deductor Studio 5.2
7 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
§
Скрыть
– делает вкладку невидимой;
§
Переименовать
– переименовывает название вкладки;
§
Закладки
переключается на выбранную закладку;
§
Верх/Низ
– задает расположение названий вкладок: вверху либо внизу;
§
Помощь
– открывает раздел справки.
Справка по программе
Справка по программе вызывается из главного окна системы следующими способами:
§
главное меню ? ►Справка,
§
клавиша F1,
§
кнопка на панели инструментов
Помощь содержит подробное описание работы с
Deductor Studio
: системные требования,
настройки узлов, способы осуществления действий с объектами системы.
Понятие проекта
В
Deductor Studio ключевым понятием является проект. Это файл с расширением *.ded, по структуре соответствующий стандартному xml-файлу. Он хранит в себе:
§
последовательности обработки данных (сценарии);
§
настроенные визуализаторы;
§
переменные проекта и служебную информацию.
Пример фрагмента файла *.ded:



Deductor Studio Enterprise
BaseGroup Labs
Deductor Studio Enterprise
5.2.0.50
Deductor Studio Enterprise
BaseGroup
BaseGroup
DStudio.exe
Deductor Studio Enterprise

Базовые навыки работы в Deductor Studio 5.2
8 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
5.2

Замечание
Каждый проект имеет авторские сведения:
Название
,
Версия
,
Автор
,
Компания
,
Описание
. Они заполняются в диалоговом окне Свойства проекта (меню Файл►Свойства
проекта…).
Создать новый проект можно следующими способами:
§
главное меню Файл►Со зд ать;
§
кнопка Созд ать новый проект на панели инструментов;
§
клавиша Ctrl+N.
Открытие существующего проекта:
§
главное меню Файл►Откр ыть;
§
кнопка Открыть проект на панели инструментов;
§
клавиша Ctrl+O.
Открыть проект можно еще одним способом – в главном меню Файл►История найти имя проекта. Способ работает в том случае, если вы недавно открывали этот проект, и он сохранился в менеджере историй проектов.
В одной запущенной копии
Deductor Studio можно открыть только один проект.
По умолчанию файл проекта Deductor при сохранении запаковывается, что
позволяет уменьшить его размер, поэтому просмотреть запакованный файл в виде
xml невозможно. Для этого нужно снять опцию Использовать упакованный
формат файла в диалоговом окне Сво йства проекта (меню Файл ► Свойства
проекта…)

Базовые навыки работы в Deductor Studio 5.2
9 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
Для сохранения проекта под текущим именем нужно выбрать главное меню
Файл►Сохранить, нажать кнопку или комбинацию Ctrl+S.
Для сохранения текущего проекта под другим именем: главное меню Файл►Со хранить
как…
Мастера
В
Deductor Studio вся работа ведется с использованием пяти мастеров:
§
Мастер импорта;
§
Мастер экспорта;
§
Мастер обработки;
§
Мастер визуализации;
§
Мастер подключений.
С помощью мастеров импорта, экспорта и обработки формируется сценарий. Сценарий состоит из узлов. Мастер подключений предназначен для создания настроек подключений к различным источникам и приемникам данных. Мастер визуализации настраивает визуализаторы для конкретного узла.
Визуализатором называется любое представление набора данных в каком-либо виде:
табличном, графическом, описательном. Примеры визуализаторов: таблица, дерево,
гистограмма, диаграмма, OLAP-куб и т.д.
Практическая работа:
1
Создайте новый проект и сохраните его под именем test.ded. Не используйте упакованный формат файла.
2
Заполните свойства проекта.
3
Просмотрите файл проекта через любой текстовый редактор.
4
Сделайте видимой вкладку Подключения.
5
Поменяйте местами порядок вкладок Сценар ии и Подключения.
6
Найдите в помощи раздел «Системные требования».
Вопросы для проверки:
1
Сколько вкладок на панели управления
Deductor Studio
?
2
Что такое проект в
Deductor Studio
?
3
Какое расширение имеет файл проекта?
4
Как создать новый проект?
5
Как сохранить текущий проект под другим именем?
6
Как отредактировать свойства проекта?
7
Сколько проектов можно одновременно открыть в
Deductor Studio
?
8
Сколько мастеров имеется в
Deductor Studio
?

Базовые навыки работы в Deductor Studio 5.2
10 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
З
анятие 3. Сценарии
Понятие сценария и узла обработки
В
Deductor Studio для аналитика основополагающим понятием является сценарий. Сценарий представляет собой последовательность операций с данными, представленную в виде иерархического дерева. В дереве каждая операция образует узел, заголовок которого содержит: имя источника данных, наименование применяемого метода обработки,
используемые при этом поля и т.д. Кроме этого, слева от наименования узла стоит значок,
соответствующий типу операции.
Если узел имеет подчиненные узлы, то слева от его названия будет расположен значок «+»,
щелчок по которому позволит развернуть узел, т.е. сделать видимыми все его подчиненные узлы, при этом значок «+» поменяется на «–». Щелчок по значку «–», наоборот, сворачивает все подчиненные узлы.
С помощью клавиш Ctrl+↑ и Ctrl+↓ можно перемещать узлы по дереву вверх-вниз в пределах подчинения родительскому узлу.
Сценарий состоит из
ветвей
. Deductor не имеет собственных средств для ввода данных,
поэтому сценарий
всегда
начинается с узла импорта из какого-либо источника. Любой вновь создаваемый узел импорта будет находиться на верхнем уровне (подчиненным главному узлу
Сценарии
).
Создание нового узла импорта осуществляется с помощью
мастера импорта
. Вызвать мастер можно следующими способами:
§
кнопка на панели инструментов закладки Сценарии;
§
клавиша F6;
§
контекстное меню Мастер импорта...
При вызове мастера импорта откроется окно первого шага мастера.

Базовые навыки работы в Deductor Studio 5.2
11 из 57
© 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна
В нем все источники данных сгруппированы по следующим четырем категориям:
§
хранилища данных;
§
настроенные подключения;
§
файлы данных;
§
бизнес-подключения.
.Некоторые категории могут отсутствовать в списке. Причинами этого может быть следующее:
§
Версия Deductor. Например, категории Настро енные подключения и Бизнес-
подключения отсутствуют в версии Academic.
§
В дереве подключений (вкладка Подключения) не зарегистрировано ни одного объекта из данной категории. Например, если не настроено ни одного подключения к хранилищу данных, то категория Хранилища данных будет отсутствовать.
§
Отключена «видимость» объекта или категории объекта (подробнее об этом см. в разделе Настройка конфигурации Deductor Studio в Занятии 9).
Дальнейшие шаги мастера импорта будут зависеть от того, какой объект дерева категорий был выбран аналитиком.
К любому узлу импорта можно добавить узел
обработки
или узел
экспорта,
предварительно выделив узел импорта мышью. Новый узел будет добавлен как подчиненный к узлу импорта.
Создание нового узла обработки осуществляется с помощью
  1   2   3   4   5   6


написать администратору сайта