(Лаб.1)Базовые навыки работы в Deductor Studio 5.2. Практикум P. 002 Базовые навыки работы в Deductor Studio Базовые навыки работы в Deductor Studio 2
Скачать 1.76 Mb.
|
© 1995-2009 Компания BaseGroup™ Labs ПРАКТИКУМ [P.002] Базовые навыки работы в Deductor Studio Базовые навыки работы в Deductor Studio 5.2 2 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна З анятие 1. Общие сведения Развитие и назначение Deductor Deductor – это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов. До появления аналитических платформ анализ данных осуществлялся в основном в статистических пакетах. Их использование требовало высокой квалификации пользователя. Большинство алгоритмов, реализованных в статистических пакетах, не позволяло эффективно обрабатывать большие объемы информации. Для автоматизации рутинных операций приходилось использовать встроенные языки программирования. В конце 80-х гг. произошел стремительный рост объемов информации, накапливаемый на машинных носителях и возросли потребности бизнеса по применению анализа данных. Ответом этому стало появление новых парадигм в анализе: хранилища данных, машинное обучение, Data Mining, Knowlegde Discovery in Databases. Это позволило популяризировать анализ данных, вывести его на промышленную основу и решить огромное число бизнес-задач с большим экономическим эффектом. Венцом развития анализа данных стали специализированные программные системы – аналитические платформы, которые полностью автоматизировали все этапы анализа от консолидации данных до эксплуатации моделей и интерпретации результатов. Первая версия Deductor увидела свет в 2000 г. и с тех пор идет непрерывное развитие платформы. В 2007 г. выпущена пятая по счету версия системы, в 2009 г. – версия 5.2. Сегодня Deductor – это яркий представитель как настольной, так и корпоративной системы анализа данных последнего поколения. Общие сведения о Deductor Аналитическая платформа Deductor состоит из пяти частей: § Warehouse – хранилище данных, консолидирующее информацию из разных источников; § Studio – приложение, позволяющее пройти все этапы построения прикладного решения, рабочее место аналитика; § Viewer – рабочее место конечного пользователя, одно из средств тиражирования знаний (т.е. когда построенные аналитиком модели используют пользователи, не владеющие технологиями анализа данных); § Serve r – служба, обеспечивающая удаленную аналитическую обработку данных; § Client – клиент доступа к Deductor Server . Обеспечивает доступ к серверу из сторонних приложений и управление его работой. Существует три типа варианта поставки платформы Deductor : § Enterprise; § Professional; § Academic. В зависимости от типа поставки набор доступных компонентов может различаться. Базовые навыки работы в Deductor Studio 5.2 3 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна Версия Enterprise предназначена для корпоративного использования. В ней присутствуют: § Серверные компоненты Deductor Server и Deductor Client § Интерфейс доступа к Deductor через механизм OLE Automation § Традиционное хранилище данных Deductor Warehouse на трех СУБД: Firebird , MS SQL , Oracle § Виртуальное хранилище данных Deductor Virtual Wareho use. Версия Professional предназначена для небольших компаний и однопользовательской работы. В ней отсутствуют серверные компоненты, поддержка OLE , виртуальное хранилище, а традиционное хранилище данных можно создавать только на СУБД FireBird . Автоматизация выполнения сценариев обработки данных осуществляется только через пакетный режим. Версии Professional и Enterprise требуют установки драйверов Guardant для работы с лицензионным ключом. Версия Academi c предназначена для образовательных и обучающих целей. Ее функционал аналогичен версии Professional за исключением: § отсутствует пакетный запуск сценариев, т.е. работа в программе может вестись только в интерактивном режиме ; § отсутствует импорт из промышленных источников данных: 1С , СУБД , файлы MS Excel , Deductor Data File ; § некоторые другие возможности. Категории пользователей Deductor В процессе развертывания и использования аналитической платформы с ней взаимодействуют различные категории пользователей. Можно выделить четыре основные категории: § аналитик; § пользователь; § администратор; § программист. Функции аналитика: § создание в Deductor Studio сценариев – последовательности шагов, которую необходимо провести для получения нужного результата. § построение, оценка и интерпретация моделей. § настройка панели отчетов для пользователей Deductor Viewer § настройка сценария на поточную обработку новых данных. Функции пользователя: § просмотр готовых отчетов в Deductor Viewer Функции администратора: § установка компонентов Deductor на рабочих местах и сервера ключей Guardant при необходимости. § развертывание традиционного хранилища данных на сервере. § контроль процедур регулярного пополнения хранилища данных. Базовые навыки работы в Deductor Studio 5.2 4 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна § конфигурирование сервера Deductor Server § настройка пакетной и/или серверной обработки сценариев Deductor § оптимизация доступа к источникам данных, в том числе к хранилищу данных. Функции программиста: § интеграция Deductor с источниками и приемниками данных. § вызов Deductor из внешних программ различными способами, в том числе взаимодействие с Deductor Server Такая работа как проектирование и наполнение хранилище данных часто выполняется коллективно аналитиком, администратором и программистом. Аналитик проектирует семантический слой хранилища данных, то есть определяет, какие данные необходимо иметь в хранилище. Администратор создает хранилище данных и наполняет его данными. Программист при необходимости создает программные модули, выполняющие выгрузку информации из учетных систем в промежуточные источники (так называемые транспортные таблицы). Установка Deductor Установку Deductor рекомендуется проводить администратору системы, однако, при наличии прав администратора в Windows это может сделать и аналитик. Установка может быть произведена на компьютер с операционной системой MS Windows 2000 и выше. Системные требования к компьютеру изложены в справочной системе. Для установки Deductor Professional/Academic запустите файл инсталлятора и следуйте инструкциям по установке. На странице Выбор компонентов программы установки предоставляется выбор, какой набор компонентов пакета Deductor необходимо установить на компьютер. В выпадающем списке можно выбрать предопределенные конфигурации установки платформы, и программа установки сама предложит нужный набор компонентов. После установки программ серии Professional и Enterprise дополнительно потребуется настроить работу c электронным ключом защиты от копирования. Установку и подсоединение электронного ключа осуществляет администратор. Существуют два вида ключей – локальный и сетевой. Локальный ключ устанавливается на том же компьютере, что и Deductor , и работать с ним можно только с этой рабочей станции. Сетевой ключ устанавливается на сервере, и к нему могут подключаться несколько пользователей одновременно (количество пользователей ограничивается типом приобретаемой лицензии). При каждом запуске Deductor пытается найти доступный электронный ключ. В случае если ключ не найден, могут появиться следующие сообщения об ошибке: Базовые навыки работы в Deductor Studio 5.2 5 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна При наличии таких ошибок следует обратиться к администратору. Практическая работа: 1 Установите Deductor (конфигурация Deductor Studio – рабочее место аналитика) и убедитесь, что он запускается. Вопросы для проверки: 1 Из каких частей состоит Deductor ? 2 Какие варианты поставки Deductor существуют? 3 Чем отличается версия Professional от Academic? 4 Имеются ли ограничения по количеству обрабатываемых записей в версии Deductor Academic ? 5 Сколько категорий пользователей Deductor можно выделить? 6 Перечислите функции аналитика. 7 Кто обычно занимается проектированием и наполнением хранилища данных? 8 Каким образом лицензируется Deductor ? 9 У вас установлен Deductor. При его запуске появляется сообщение об ошибке: Windows NT driver is required Какова наиболее вероятная причина ошибки? Базовые навыки работы в Deductor Studio 5.2 6 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна З анятие 2. Начало работы с системой Главное окно Deductor Studio После запуска главное окно Deductor Studio выглядит следующим образом. По умолчанию панель управления представлена одной вкладкой Сценар ии . Кроме того, доступны еще две вкладки: Отчеты и Подключения. Сделать их видимыми можно следующими способами: § главное меню Вид ►Отчеты и Вид ►Подключения § кнопки и на панели инструментов. Можно производить « drag & drop» манипуляции с вкладками, меняя их расположение и порядок. При нажатии правой кнопки мыши на любой вкладке появляется контекстное меню: Главное меню Панель управления Панель инструментов Контекстное меню Строка состояния Область для визуализаторов Базовые навыки работы в Deductor Studio 5.2 7 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна § Скрыть – делает вкладку невидимой; § Переименовать – переименовывает название вкладки; § Закладки – переключается на выбранную закладку; § Верх/Низ – задает расположение названий вкладок: вверху либо внизу; § Помощь – открывает раздел справки. Справка по программе Справка по программе вызывается из главного окна системы следующими способами: § главное меню ? ►Справка, § клавиша F1, § кнопка на панели инструментов Помощь содержит подробное описание работы с Deductor Studio : системные требования, настройки узлов, способы осуществления действий с объектами системы. Понятие проекта В Deductor Studio ключевым понятием является проект. Это файл с расширением *.ded, по структуре соответствующий стандартному xml-файлу. Он хранит в себе: § последовательности обработки данных (сценарии); § настроенные визуализаторы; § переменные проекта и служебную информацию. Пример фрагмента файла *.ded: Deductor Studio Enterprise Базовые навыки работы в Deductor Studio 5.2 8 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна 5.2 Замечание Каждый проект имеет авторские сведения: Название , Версия , Автор , Компания , Описание . Они заполняются в диалоговом окне Свойства проекта (меню Файл►Свойства проекта…). Создать новый проект можно следующими способами: § главное меню Файл►Со зд ать; § кнопка Созд ать новый проект на панели инструментов; § клавиша Ctrl+N. Открытие существующего проекта: § главное меню Файл►Откр ыть; § кнопка Открыть проект на панели инструментов; § клавиша Ctrl+O. Открыть проект можно еще одним способом – в главном меню Файл►История найти имя проекта. Способ работает в том случае, если вы недавно открывали этот проект, и он сохранился в менеджере историй проектов. В одной запущенной копии Deductor Studio можно открыть только один проект. По умолчанию файл проекта Deductor при сохранении запаковывается, что позволяет уменьшить его размер, поэтому просмотреть запакованный файл в виде xml невозможно. Для этого нужно снять опцию Использовать упакованный формат файла в диалоговом окне Сво йства проекта (меню Файл ► Свойства проекта…) Базовые навыки работы в Deductor Studio 5.2 9 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна Для сохранения проекта под текущим именем нужно выбрать главное меню Файл►Сохранить, нажать кнопку или комбинацию Ctrl+S. Для сохранения текущего проекта под другим именем: главное меню Файл►Со хранить как… Мастера В Deductor Studio вся работа ведется с использованием пяти мастеров: § Мастер импорта; § Мастер экспорта; § Мастер обработки; § Мастер визуализации; § Мастер подключений. С помощью мастеров импорта, экспорта и обработки формируется сценарий. Сценарий состоит из узлов. Мастер подключений предназначен для создания настроек подключений к различным источникам и приемникам данных. Мастер визуализации настраивает визуализаторы для конкретного узла. Визуализатором называется любое представление набора данных в каком-либо виде: табличном, графическом, описательном. Примеры визуализаторов: таблица, дерево, гистограмма, диаграмма, OLAP-куб и т.д. Практическая работа: 1 Создайте новый проект и сохраните его под именем test.ded. Не используйте упакованный формат файла. 2 Заполните свойства проекта. 3 Просмотрите файл проекта через любой текстовый редактор. 4 Сделайте видимой вкладку Подключения. 5 Поменяйте местами порядок вкладок Сценар ии и Подключения. 6 Найдите в помощи раздел «Системные требования». Вопросы для проверки: 1 Сколько вкладок на панели управления Deductor Studio ? 2 Что такое проект в Deductor Studio ? 3 Какое расширение имеет файл проекта? 4 Как создать новый проект? 5 Как сохранить текущий проект под другим именем? 6 Как отредактировать свойства проекта? 7 Сколько проектов можно одновременно открыть в Deductor Studio ? 8 Сколько мастеров имеется в Deductor Studio ? Базовые навыки работы в Deductor Studio 5.2 10 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна З анятие 3. Сценарии Понятие сценария и узла обработки В Deductor Studio для аналитика основополагающим понятием является сценарий. Сценарий представляет собой последовательность операций с данными, представленную в виде иерархического дерева. В дереве каждая операция образует узел, заголовок которого содержит: имя источника данных, наименование применяемого метода обработки, используемые при этом поля и т.д. Кроме этого, слева от наименования узла стоит значок, соответствующий типу операции. Если узел имеет подчиненные узлы, то слева от его названия будет расположен значок «+», щелчок по которому позволит развернуть узел, т.е. сделать видимыми все его подчиненные узлы, при этом значок «+» поменяется на «–». Щелчок по значку «–», наоборот, сворачивает все подчиненные узлы. С помощью клавиш Ctrl+↑ и Ctrl+↓ можно перемещать узлы по дереву вверх-вниз в пределах подчинения родительскому узлу. Сценарий состоит из ветвей . Deductor не имеет собственных средств для ввода данных, поэтому сценарий всегда начинается с узла импорта из какого-либо источника. Любой вновь создаваемый узел импорта будет находиться на верхнем уровне (подчиненным главному узлу Сценарии ). Создание нового узла импорта осуществляется с помощью мастера импорта . Вызвать мастер можно следующими способами: § кнопка на панели инструментов закладки Сценарии; § клавиша F6; § контекстное меню Мастер импорта... При вызове мастера импорта откроется окно первого шага мастера. Базовые навыки работы в Deductor Studio 5.2 11 из 57 © 1995-2009 Компания BaseGroup™ Labs – При цитировании ссылка обязательна В нем все источники данных сгруппированы по следующим четырем категориям: § хранилища данных; § настроенные подключения; § файлы данных; § бизнес-подключения. .Некоторые категории могут отсутствовать в списке. Причинами этого может быть следующее: § Версия Deductor. Например, категории Настро енные подключения и Бизнес- подключения отсутствуют в версии Academic. § В дереве подключений (вкладка Подключения) не зарегистрировано ни одного объекта из данной категории. Например, если не настроено ни одного подключения к хранилищу данных, то категория Хранилища данных будет отсутствовать. § Отключена «видимость» объекта или категории объекта (подробнее об этом см. в разделе Настройка конфигурации Deductor Studio в Занятии 9). Дальнейшие шаги мастера импорта будут зависеть от того, какой объект дерева категорий был выбран аналитиком. К любому узлу импорта можно добавить узел обработки или узел экспорта, предварительно выделив узел импорта мышью. Новый узел будет добавлен как подчиненный к узлу импорта. Создание нового узла обработки осуществляется с помощью |