Руководство по изучению курса Практикум по курсу
Скачать 1.79 Mb.
|
1.2.2. Информационные хранилища (ИХ), правила построения и функционирования (правила Инмона) ИХ – это аппаратно-программная система, являющаяся модулем ИАС и предназна- ченная для длительного хранения данных, готовая их предоставить в любое время в целях проведения разного рода аналитических работ. ИХ строятся в соответствии с правилами Инмона, которые состоят в следующем: 101 ПРАКТИКУМ ПО КУРСУ – предметная ориентированность – компоновка пулов данных по предметным областям. – интегрированность – сбор и доработка данных из различных источников и превращение их в организованный по заданным правилам массив. – неизменчивость – данные не подвергаются частым обновлениям, а лишь наращиваются по заранее определенному графику, пользователь имеет право только чтения. – поддержка хронологии – данные рассматриваются в историческом аспекте от прошлого к будущему, обязательна их привязка каким-либо способом ко времени. 1.3. Выполнение анализа Выполнение анализа производится в двух основных режимах: – оперативный анализ, широко распространено англоязычное название в виде аббревиату- ры OLAP (On Line Analytical Processing). – интеллектуальный анализ или Data mining. Данные, содержащиеся в информационном хранилище, могут быть использованы для формирования типовых отчетных документов. Такой вариант использования данных на- зывают Reporting. 1.3.1. Требования к оперативному анализу Исходя из правил доктора Кодда, сформулирован перечень требований к информа- ционным системам, называемый тест FASMI, которые обеспечивают режим оперативного анализа. Название теста является аббревиатурой английских слов – формулировок требова- ний к OLAP-системам: Fast – быстрый, Analysis – анализ, Shared – разделяемой, Multidimensional – многомерной, Information – информации. Смысл требований состоит в следующем: Быстрый – это требование ко времени отклика на запросы к OLAP-системе, допус- кается в пределах 5 (пяти) секунд. Анализ – должен выполняться без применения каких-либо языковых средств, обеспечива- ется выполнение непосредственно силами топ-менеджеров. Разделяемый – обеспечение необходимого уровня защиты данных от несанкциони- рованного доступа, от взаимных помех при многопользовательском доступе. Организует- ся комплексом организационно-технических мероприятий и программных средств. Многомерный – средства OLAP-системы должны обеспечить работу с данными в многомерном представлении данных – естественном на уровне ненормализованной ER- модели с полной поддержкой иерархий независимо от того, какие типы баз данных ис- пользуются в качестве источников. Информация – должна обеспечиваться возможность получения данных из любых источников, операции производятся с любыми объемами и структурами данных. 1.3.2. Интеллектуальный анализ Часто применяется англоязычный термин – Data mining. Для извлечения знаний из массивов данных, содержащихся в информационных хранилищах или получаемых напря- мую из первоисточников, применяются методы и средства интеллектуального анализа. 102 ПРАКТИКУМ ПО КУРСУ Задачами интеллектуального анализа являются: – выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий, определение значения фактора времени, локализация событий или явлений по месту. – классификация событий и ситуаций, материальных и других объектов по совокупностям признаков, определение профилей различных факторов. – прогнозирование событий, хода процессов. – оценка эффективности деятельности, проектов. 1.4. Представление результатов анализа Осуществляется с использованием методов инженерной, управленческой психоло- гии с целью достижения максимального эффекта восприятия полученных знаний и/или воздействия на клиента, партнера и т.д. Для этой цели используются все имеющиеся средства отображения, 3D-графика, анимации, в том числе мультимедиа. Результаты анализа могут экспортироваться в специализированные средства под- держки принятия решений. 2. Создание и применение ИАС Задачи, выполняемые пользователями системы – лицами, принимающими решения (ЛПР), аналитиками, экспертами на этапах ее создания и применения заключаются в вы- работке требований к содержанию и структуре данных в ИХ, контроле за наполнением хранилищ данных, разработке и реализации сценариев анализа. Главным в формировании требований является определение состава данных, кото- рые необходимо собирать в ходе деятельности предприятия из различных источников, приводить их к единому формату и структуре с целью удобного использования в процессе анализа. На следующем этапе работы пользователей по созданию ИАС определяется, что нужно делать с этими данными. Задача специалистов по информационным технологиям заключается в реализации требований пользователей в виде конкретных физических моделей. Состав данных представляется в виде базы метаданных (БМД) или репозитория. БМД представляет собой совокупность свойств объектов, подлежащих исследованию в ходе аналитических работ. Практически это совокупность атрибутов или реквизитов пока- зателей, отображающих объекты. Она создается по результатам обследования предметной области, в которой создается ИАС или ее фрагмент, в том числе информационное храни- лище или его секция. В результате обследования пользователи должны получить состав документов или исходных материалов для анализа и последующего использования при принятии решений. Из таких источников извлекаются атрибуты, подлежащие переносу в информационное хранилище или в секцию его. Повторяющиеся атрибуты вносятся в базу МД один раз, но добавляются атрибуты, свидетельствующие об агрегации данных. На рис. 1 показана схе- ма создания базы метаданных, касающихся конечных пользователей. К ним добавляются метаданные, относящиеся к компетенции администраторов информационных хранилищ и ИАС в целом, так называемые технические метаданные в отличие от бизнес-метаданных. Среди таблиц на рис. 1 могут быть и материалы, относящиеся к технической стороне реа- лизации ИХ и ИАС. 103 ПРАКТИКУМ ПО КУРСУ Наименования столбцов или атрибутов в таблицах, представляющих материалы или отчеты, обозначают свойства описываемых объектов. В строках содержатся значения свойств экземпляров этих объектов. Делается оценка количества экземпляров содержащихся в данной таблице объектов и размерности их атрибутов с целью определения объема требуемой памяти. Материалы 1 Атрибут 11 Атр 12 …. Атр. 1k Отчет 2 Атрибут 21 Атр 22 Атр 2l Материалы N Атрибут n1 Атр n2 Атр. nm База метаданных секции p информационного хранилища (Репозиторий) Атрибут 1 секции p хранилища 1 Атрибут 2 секции p хранилища 1 Атрибут q секции p хранилища. Рис. 1. Структура базы метаданных Множество Q атрибутов секции P информационного хранилища определяется по формуле: B A Q i N ∪ = U 1 , где: i A – множества атрибутов отчетов и материалов. N – количество отчетов и материалов. B – множество системообразующих атрибутов. 104 ПРАКТИКУМ ПО КУРСУ 3. Задания по лабораторной работе Для приобретения навыков аналитической работы с использованием специализи- рованных и массовых инструментальных средств выполняются следующие задания. Задание 1 Подобрать массивы данных по выбранной предметной области в соответствии с интересами по осваиваемой специальности, работе или другими обстоятельствами. При использовании Internet можно воспользоваться сайтами www//Rамблер.ru, www//Expert.ru, Яndex.ru и другими. Экспортировать заинтересовавшие обучающегося данные в Excel или специализи- рованное инструментальное средство в зависимости от наличия такового. Транспорт в аналитический инструмент выполняется средствами Интернетэксплорер или опцией Excel (при транспорте в него): Данные – Внешние данные – Создать запрос. Далее в зависимости от характера источника данных: Интернет; базы данных, под- держиваемые различными СУБД; электронные таблицы; текстовые файлы и т.д. выбира- ются соответствующие этим форматам данных опции. После транспортировки в Excel форматы, вид и структура полученных данных приводятся к удобному для пользователя виду. В случае, если данные получены в виде нескольких таблиц, их следует при необхо- димости свести в одну сводную таблицу с помощью опции Данные – Сводная таблица. Эта операция выполняется для того, чтобы можно было легко получать выборки, состоя- щие из атрибутов, находящихся в разных таблицах. Задание 2. На следующем этапе производится оперативный анализ подготовленных данных. При использовании инструмента Excel с помощью опций Данные –> Сортировка, Фильтр, Форма, Итоги, Группа и структура. Приведенные опции могут использоваться в последо- вательности, обеспечивающей выполнение поставленных пользователем задач анализа. К ним относятся: – выделение из подготовленной совокупности данных заинтересовавших пользователя объектов в виде группы атрибутов, – сортировка значений атрибутов по определенным критериям, – подведение итогов, – группировка (агрегация) значений по заданным формулам и другие операции оператив- ного анализа. – операции над атрибутами с целью получения новых свойств исследуемых объектов и т.д. Выполнение интеллектуального анализа средствами Excel. В этом средстве имеет- ся инструмент «Мастер функций», позволяющий выполнять математическую, статистиче- скую, логическую обработку данных, финансовый анализ с оценкой проектов современ- ными методами, прогнозирование хода процессов. Операции над сформированными дан- ными выполняются с использованием аппарата справок. Сначала решаются находящиеся в справках примеры, затем выполняется анализ собственных примеров. Задание 3. При использовании специализированного инструмента Business Objects на началь- ном этапе приобретения навыков анализа используются данные примеров, содержащиеся 105 ПРАКТИКУМ ПО КУРСУ в самом инструменте, скомпонованные в виде факт-таблиц или, как называют на жаргоне фирмы, «юниверсов». Запустить Business Objects, среди модулей Business Miner, Business Objects Designer, Business Objects (BO) вызвать BO; на стандартной панели инструментов нажать кнопку «Мастер Создания Нового Отчета». Будет вызвано окно «Мастер построения новых отчетов. Добро пожаловать» Рис. П1. Выбрать опцию «Создать стандартный от- чет» – «Начать». Появится окно «Мастер построения новых отчетов. Выбор юниверса». Рис. П2. Целесообразно выбрать юниверс Evaluation Kit, так как в его составе имеются и ка- чественные и количественные атрибуты, здесь они называются объекты, которые понадо- бятся при выполнении упражнения. Нажать на кнопку «Готово» – будет вызвана панель запроса в виде графического конструктора отчетов. Рис. П3. Рис. П1. Запросы с исполнением в виде выборок с различными условиями легко реализуют- ся перетаскиванием графических образов атрибутов – качественных в виде кубиков и количественных в виде шариков, называемых здесь объектами, в панель «объекты резуль- тата». Для постановки условий выборок в окне «Условия» Панели Запросов щелкните на значении (или значениях), находящемся на правой стороне условия. Окно «Классы и Объ- екты» становится окном «Операнды». Затем нужно дважды щелкнуть на операнде «Пока- зать Список Значений», после чего список значений появится в диалоговом окне «Список Значений». Если нужно выбрать больше значений для условия, то удерживайте клавишу «Ctrl» нажатой и в окне «Список Значений» щелкните на каждом значении, затем нажмите «OK». 106 ПРАКТИКУМ ПО КУРСУ Рис. П2. Созданные с помощью различных инструментов материалы могут быть помещены для дальнейшей аналитической обработки в среду Business Objects, для чего используется панель инструментов «Доступ к персональным данным» рис. П4. Анализ перенесенных в среду Business Objects данных производится в главной па- нели, фрагмент которой приведен на рис. П5. Рис. П3 . 107 ПРАКТИКУМ ПО КУРСУ Рис. П4. Экранная форма обеспечения доступа к персональным данным Рис. П5. Главная панель анализа Business Objects. 108 ПРАКТИКУМ ПО КУРСУ 4. Тематика лабораторных работ Темы работ выбираются в соответствии со специализацией и интересами обучаю- щихся. В качестве ориентира на рис. 2 приведен примерный состав центров генерации данных в информационном пространстве предприятия в соответствии с выполняемыми функциями. Для специализаций менеджмент, антикризисное управление, финансы и кре- дит бригада подбирает из приведенного перечня несколько функций из одного направле- ния деятельности: управления, основной деятельности (производство или торговля или другая сфера деятельности), логистики, обеспечения. Для специализаций маркетинг, ми- ровая экономика подбираются темы материалов: обзор рынка товаров (услуг), исследова- ния конкурентов по направлениям деятельности предприятия, привлекательность своих и конкурирующих изделий и т.д. При очной форме обучения бригады подбирают из рекомендуемого перечня функ- ций смежные так, чтобы в результате вся группа представила по возможности полный пе- речень функций предприятия. В результате должна получиться модель содержания и структуры данных информационного хранилища. Направление деятельности предприятия согласуется бригадами. Технология создания базы метаданных описана в разделе 2 настоящего практику- ма. В соответствии с ней разрабатываются проекты документов пользовательского назна- чения. Это могут быть регулярно представляемые отчеты о деятельности подразделений или ответственных лиц, а также аналитические запросы руководителей предприятия по сценариями т.д. Затем атрибуты таких материалов должны войти в базу метаданных ин- формационного хранилища. К ним дополняются системообразующие атрибуты, которые описывают состав источников данных, общие временные, региональные и другие харак- теристики. 109 ПРАКТИКУМ ПО КУРСУ 110 ПРАКТИКУМ ПО КУРСУ Данные по предприятию в информационном хранилище Данные по управлению Данные по основной деятельности Данные по логистике Данные по обеспечению основной деятельности топ-менедмент управление финансами контроллинг запасами и сбытом основной деятельностью Доработка сырья, материалов, комплектующих Изготовление деталей, блоков Сборка Испытания, отладка Упаковка Погрузка, разгрузка Транспортировка Складирование Комплектование Информационное сопровождение Установка и поддержание основных средств Научно-техническое сопровождение Энергоснабжение Экологическое обеспечение, уборка, утилизация Охрана Социально-культурная сфера деятельности обеспечением Рис. Центры генерации данных в информационном пространстве предприятия 110 ПРАКТИКУМ ПО КУРСУ Следующим этапом работы является наполнение структуры модели ИХ учебными данными, которые могут быть почерпнуты из доступных источников, средств массовой информации, с предприятий (для работающих студентов) или смоделированы, исходя из предположений и знаний, полученных при изучении соответствующих курсов. Требования к оформлению отчета по лабораторной работе Отчет по лабораторной работе должен быть представлен в виде документа на бумаж- ном носителе, выполнен по правилам оформления лабораторных работ. Он должен содер- жать: 1. Описание выбранной предметной области. Приводятся выполняемые задачи, объемы работ. 2. Макеты отчетных документов по выбранной группой предметной области в различных форматах, например xls, mdb, htm и/или других. На группу 2–3 чело- века – 5–6 документов. Для индивидуальной работы 2–3 документа. В докумен- тах должны быть макеты данных в объеме не менее десяти записей. 3. Фрагмент базы метаданных, относящийся к выбранной предметной области, содержащий атрибуты макетов, представленных по п. 2, а также макеты соот- ветствующих данных в скоординированном виде. В совокупности фрагмент БМД и макетов записей составляют секцию информационного хранилища, от- носящуюся к исследуемой предметной области. 4. Макеты отчетных аналитических материалов. По 2–3 материала на группу из 2– 3 человек. При индивидуальной работе – 1–2 материала. Аналитические отчеты должны сопровождаться краткими комментариями и диаграммами. 111 ПРАКТИКУМ ПО КУРСУ ЛИТЕРАТУРА 1. Смирнова Г.Н., Сорокин А.А., Тельнов Ю.Ф. Проектирование экономических ин- формационных систем. Учебник. – М., 2001. 2. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. – М., 2001. 3. Мишенин А.И. Теория экономических информационных систем. – М.: Финансы и статистика, 2000. 4. Королев М.А., Мишенин М.И., Хотяшов Э.Н. Теория экономических информацион- ных систем. – М., 1984. 5. Жеребин В.М., Информационное обеспечение АСУ. – М., 1975. 6. Козлов В.А. Открытые информационные системы. – М., 1999. 7. Бойченко А.В., Кондратьев В.К., Филинов Е.Н. Основы открытых информационных систем.Учебное пособие. – М., 2001. 8. Дубров А.М., Мхитарян В.С. Многомерные статистические методы и основы эконо- метрики. – М., 1998. 9. Ясин Е.Г. и др. Экономическая информация. – М. 1974. 10. Дейт К. Дж. Введение в системы баз данных. – М., СПБ, К., 2000. 11. .Саймон А. Р. Стратегические технологии баз данных. – М., 1999. 12. Хаан Д. ПиК Планирование и контроль: концепция контроллинга. – М., 1997. 13. Спирли, Эрик. Корпоративные хранилища данных. Планирование, разработка, реа- лизация. Том 1.: Пер. с англ. – М.: Издательский дом «Вильямс», 2001. 14. Данилочкина Н.Г. и др. Контроллинг как инструмент управления предприятием. – М., 1999. 15. Карминский А.М. и др. Контроллинг в бизнесе. – М., 1998. 16. Макарова Н.В. и др. Информатика. Учебник. – М., 1998. 17. Гаврилова Т.А. Хорошевский В. Ф.: Базы знаний интеллектуальных систем. – СПб, Питер, 2001. 18. Дюк В., Самойленко А. Data mining:Учебный курс. – Питер, 2001. 19. Боровиков В.П. Программа Statistica для студентов и инженеров. – М., 2001. 20. Андрейчиков А.В., Андрейчикова О.Н. Анализ, синтез, планирование решений в эко- номике. – М., 2000. 21. Светлов Н.М. Руководитель. Российское программное обеспечение 2000/2001. – М., 2000. 22. Плис А.И., Сливина Н.А. Mathcad: математический практикум для экономистов и инженеров. – М., 1999. 23. Архипенков С.Я. Аналитические системы на базе Oracle Express OLAP. Проектиро- вание, создание, сопровождение. – М., 2000. 24. Бритов П.А., Липчинский Е.А. Практика построения хранилищ данных: Система SAS. Ж. Системы управления базами данных. 04-05/1998/ 25. Business Objects Руководство пользователя. Материалы фирмы Терн, 1996. 26. Калянов Г.Н. Консалтинг при автоматизации предприятий: научно-методическое из- дание. – М.: СИНТЕГ, 1997. 27. Кузьмичева Т.С. Контур Стандарт. Технология работы с системой. Руководство пользователя. ISL. – M., 1999. 28. Ивантер А. Деловой барометр показывает «Ясно» ж. «Эксперт» № 29, авг. 2001. 29. Корнев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. – М., 2000. 112 ПРАКТИКУМ ПО КУРСУ 30. Маклаков С.В. Bpwin Erwin. CASE-средства разработки информационных систем. – М., 2000. 31. Маклаков С.В. Создание информационных систем с AllFusion Modeling Suite. – М.:ДИАЛОГ-МИФИ, 2003. 32. Харрингтон Д. Проектирование объектно-ориентированных баз данных / Пер. с англ. – М.: ДМК Пресс, 2001. 33. Кирстен В., Ирингер М., Рериг Б., Шульте П. СУБД Cache: объектно-ориентирован- ная разработка приложений. Учебный курс. – СПб.: Питер, 2001. 34. Замков О.О., Толстопятенко А.В., Черемных Ю.Н. Математические методы в эконо- мике: Учебник / Под ред. д.э.н., проф. Сидоровича. – М.: Изд-во «Дело и сервис», 2001. 35. Вендров А.М. Проектирование программного обеспечения экономических информа- ционных систем. Учебник. – М: Финансы и статистика. 2000. 36. Вендров А.М. Практикум по проектированию программного обеспечения экономи- ческих информационных систем: Учебное пособие. – М. Финансы и статистика, 2002. 37. Вебер А.В., Данилов А.Д., Шифрин С.И. Knoulidge-технологии в консалтинге и управлении предприятием / Под редакцией Финикова М.В. – СПб: Наука и техника, 2003. 38. Под ред. Максимовой В.Ф. Макроэкономика. – М., 2001. 39. Пендс Н. Перевод Абушаева Ш. Что относится к OLAP? OLAPReport.com Last up- dated on Jan 1999. 40. Щавелев Л.В. Способы аналитической обработки данных для поддержки принятия решений. – Ж. СУБД 04-05/1998/ 41. Белов В.С. Информационно-аналитические системы. Учебное пособие МЭСИ. – М., 2001. 42. Шрек М. Перeвод Intersoft Lab Технология Хранилищ данных: последние 10 лет, не- сомненно были впечатляющими http//www/iso/ru 08/01. 43. Елманова Н., Федоров А. Введение в OLAP: Основы OLAP. 28. Хранилища данных. КомпьютерПресс 5/2001. 44. Уринцов А.И. Основы электронного обмена данными. Учебное пособие. – М.: МЭСИ, 2004. 45. Островский Е.В. Порядок разработки ETL-процессов. Olap.ru. 2000. 46. Косов Д.В. Хранилища данных и семантические разрывы. Olap.ru. 2000. 47. Коломиец С.В. Проектирование процессов перегрузки данных. Olap.ru. 2000. 48. Федечкин С. Хранилище данных: вопросы и ответы. PCWeek, 31, 26.08.2003. 49. Строддер Д., Бурьесси Ж., Янг М. Лучшие ИТ-поставщики на 2004 год. Intelligent enterprise. Деловой ИТ-журнал. 26.01.2004. 50. Федоров А.Г., Елманова Н.З. Введение в OLAP-технологии Microsoft. Учебно- справочное издание. – М.: Диалог-МИФИ, 2002. 51. Белов В.С. Информационно-аналитические системы. Основы проектирования и при- менения. Учебное пособие. – М: МЭСИ, 2004. 113 ПРАКТИКУМ ПО КУРСУ Интернет-ресурсы 1. http://www.olap.ru – журнал СУБД 2. http://www.tern.ru – компания ТЕРН 3. http://www. iso.ru – компания Intersoftlab 4. http://www.sas.ru – SAS Institute 5. http://www.basegroup.ru – компания Basegroup РФ 6. http://www.banklist.ru – ЦБ РФ 7. http://www.megaputer.ru комания Megaputer РФ 8. http://www.expert.ru – журнал Эксперт РФ 9. http://www.relex.ru – компания РЕЛЭКС РФ 114 |