АИС_Конспект. Учебное пособие по предмету основы построения автоматизированных информационных систем для специальности
Скачать 1.88 Mb.
|
3.3. Системы поддержки принятия решенияИнформационные системы, которые используются для предоставления необходимых данных при принятии управленческих решений, используют в качестве основного элемента хранилище данных. Такие системы получили условное обозначение OLAP (On Line Analysis Processing). В отличие от обычной базы данных в хранилище данных размещается информация, полученная от различных источников. Основная операция, которая выполняется в хранилище данных это добавления новых данных. Данные добавляются большими блоками с большим интервалом. При этом данные, поступающие из различных источников, должны быть обработаны и приведены к общему формату. Использование технологии хранилища данных позволяет: оперативно обеспечить пользователей системы необходимой информацией для принятия управленческого решения; построить модель данных организации; создать интегрированный источник данных для доступа к различной информации. Информация, которая собрана в хранилище данных, должна обладать следующими особенностями: содержать достоверное описание предметной системы; содержать интегрированные данные, т.е. данные, собранные из различных источников и приведенные к определенному формату; сами данные не меняются, в хранилище добавляют только новые данные. Данные должны храниться в хронологическом порядке. Для этого используется специальный атрибут, позволяющей упорядочить информацию по времени или по календарной дате. Расположение информации в хронологическом порядке позволяет ускорить процесс получения ответа на запрос пользователя. В отличие от систем обработки транзакций запрос к системе принятия решений преследует цель получить не конкретный факт, а определенный результат. Например, запрос в OLTP системе может иметь структуру: «Вывести курс доллара к рублю на начало дня» Запрос в OLAP системе имеет структуру: «Какое среднее значение имел курс доллара к рублю в течение прошлой недели». Рис.3.1. Структура гиперкуба. Для организации хранилища данных используют различные архитектуры. Базовая концепция организации хранилища данных «гиперкуб», т.е. используется объемная модель хранения данных. Такая архитектура предусматривает использование трех мерной технологии хранения. Данное хранится в определенной «ячейке» куба и характеризуется тремя измерениями: объект, атрибут, время. На рисунке 3.1 показана ячейка гиперкуба. На рисунке: объект – определенная сущность предметной области; атрибут – свойство данной сущности; время – временной интервал, в котором изменяется атрибут объекта. С данными, которые находятся в трехмерном пространстве, выполняют следующие операции: сечение – выделение подмножества из гиперкуба с фиксированными значениями по одному или нескольким измерениям. вращение – изменение порядка представления измерений в двумерном сечении. свертка – одно значение измерения заменяется значением боле высокого уровня иерархии. Например, если получено значение соответствующее определенному временному параметру, то операция свертки позволяет получить значения соответствующие всем временным отметкам интервала. детализация – обратная операция свертке. Значение получается для конкретной временной отметки интервала. Многомерная технология хранения данных в оперативной памяти позволяет успешно решать задачи связанные с аналитической обработкой сложных запросов, так в оперативной памяти располагаются все данные гиперкуба. Однако такое размещение данных может привести к невозможности оперирования большими объемами данных, так как вычислительная система может обладать недостаточными ресурсами оперативной памяти. Для снятия ограничения на объем данных используется многомерная реляционная технология размещения данных. Данные размещают, используя принцип звезды. Рис.3.2. Трехмерное реляционное хранилище данных. Хранилище данных в этом случае представляет собой набор таблиц. Таблицы бывают двух типов: фактологические. В схеме звезда такая таблица одна. В такой таблице находится поле, в котором записано значение атрибута, и размещено несколько индексных полей одно индексное поле – код параметра остальные индексные поля – коды записей в справочных таблицах. справочные. При трехмерной организации хранилища данных таких таблиц соответственно три. В первой таблице хранятся описания параметров – атрибутов, вторая таблица хранит описания объектов, третья таблица хранит описания временных характеристик. Развертывание OLAP системы выполняется на основе технологии клиент – сервер. Для сочетания быстродействия предоставляемого многомерным способом хранения данных и возможностей хранения неограниченного объема данных при использовании реляционной модели используется следующая архитектура OLAP системы: хранилище данных строится с использованием реляционной технологии размещения данных; для решения аналитических задач подразделениями фирмы создают киоски данных с многомерными базами данных в оперативной памяти. В такой схеме киоск это специализированное тематическое хранилище данных, построенное в виде многомерной структуры. Данные в киоск загружаются из центрального хранилища. Для получения оперативной информации о хранилище данных оно снабжается описанием. Описание образуют метаданные. Метаданные позволяют получить информацию о структуре данных в хранилище, периодичности их обновления. Могут содержать сведения о методах доступа и правилах предоставления результатов. Метаданные образуют репозиторий. Системы OLAP позволяют решать следующие задачи: кластерный анализ – выделение в наборе данных группы по некоторым сходным признакам; аппроксимация зависимостей, связывающих анализируемые параметры; анализ аномалий – поиск данных существенно отклоняющихся от выявленных закономерностей; прогнозирование развития объектов, на основе ретроспективной информации. |