Главная страница
Навигация по странице:

  • В основе OLAP

  • Многомерный анализ Одновременный анализ по нескольким измерениям определяется как многомерный анализ

  • Многомерное концептуальное представление

  • Спуск и консолидация Спуск и консолидация

  • Члены и метки. Иерархии. Аналитические операции.

  • Метки используются в операциях манипулирования измерениями

  • Проекция Значения в ячейках, которые лежат на оси проекции, суммируются в соответствии с определенным признаком Вращение (rolling)

  • Разбиение с поворотом (slicing and dicing)

  • Информационные технологии управления. Информационные технологии и информационные системы Информация. Информатика. Микроэлектроника


    Скачать 2.04 Mb.
    НазваниеИнформационные технологии и информационные системы Информация. Информатика. Микроэлектроника
    АнкорИнформационные технологии управления.docx
    Дата19.05.2017
    Размер2.04 Mb.
    Формат файлаdocx
    Имя файлаИнформационные технологии управления.docx
    ТипДокументы
    #7920
    страница17 из 54
    1   ...   13   14   15   16   17   18   19   20   ...   54

    OLAP = многомерное представление = Куб

    Особое значение простота доступа к данным играет для системных аналитиков, т.к. они особые потребители корпоративной информации. Задача аналитика - находить закономерности в больших массивах данных.

    Одиночные факты в БД могут заинтересовать предметного специалиста, в компетенции которого входит поиск конкретной информации. Аналитику одной записи недостаточно -ему, к примеру, могут понадобиться все аналогичные транзакции, например, за месяц, год. Заодно аналитик отбрасывает ненужные ему подробности, и потребляет данные, которые требуются для работы, обязательно содержащие числовые значения - это обусловлено самой сущностью его деятельности. Итак, аналитику нужно много данных, которые являются выборочными, а также носят характер "набор атрибутов - число". Задачей аналитика является выявление стойких взаимосвязей между атрибутами и числовыми параметрами.

    В основе OLAP лежит идея многомерной модели данных, в которой на смену таким понятиям как отношения и сущности приходят понятия измерений и кубов данных. Технология OLAP, которую называют также интерактивной (диалоговой) аналитической обработкой, дает возможность на основе многомерной (гиперкубической) модели данных (в отличие от плоской реляционной модели данных) моделировать реальные структуры и связи, которые есть исключительно важными для аналитических систем. Она предназначенная для создания мульти параметрических моделей с целью более адекватно отбивать реальные процессы. Технология OLAP разрешает быстро изменять взгляды на данные в зависимости от выбранных параметров и обеспечить лицу, которое принимает решения, полную картину анализируемых ситуаций.

    Измерение

    С точки зрения анализа каждый анализируемый факт удобно рассматривать как функцию от его характеристик. Например, производство изделия есть функция от материалов, станков, рабочих, инженеров, технологов, управленцев, возможно, еще каких-то существенных параметров. Параметры такого типа носят название измерений. Реляционная база данных, содержащая всю информацию о предметной области, превращается в ХД в терминах OLAP, а процесс создания структуры аналитической системы сводится к определению измерений и организации витрин данных.

    Многомерный анализ

    Одновременный анализ по нескольким измерениям определяется как многомерный анализ. По измерениям (осям) в многомерной модели откладывают основные факторы (атрибуты), влияющие на деятельность предприятия, т.е. то, по чему ведется анализ. В качестве одного из измерений используется время, иными могут быть, например, изделия, филиалы компании и т.п. Так получают многомерный куб (гиперкуб, метакуб, куб фактов), который затем наполняется показателями деятельности предприятия (цены, продажи, план, прибыли, убытки и т.п.). При том гиперкуб является концептуальной логической моделью организации данных, а не физической реализацией их хранения, поскольку храниться такие данные могут и в реляционных таблицах.

    Гиперкуб (Hypercube)

    На самом деле, с точки зрения строгой математики кубом такой массив будет далеко не всегда: у на-стоящего куба количество элементов во всех измерениях должно быть одинаковым, а у кубов OLAP такого ограничения нет. Тем не менее, несмотря на эти детали, термин гиперкуб (метакуб) ввиду своей краткости и образности стал общепринятым. Гиперкуб (Hypercube) – это умозрительная многомерная конструкция в многомерном пространстве, образованном плоскостями данных, которые важны для деятельности предприятия. При этом сама OLAP-система выступает именно в роли гиперкуба, способного накапливать в себе всю информацию, интересующую руководителя. В качестве ребер (осей) куба в таком случае выступают различные данные.

    Пример.

    Товар, цена производимого или конкурентного товара, регион, тип покупателя компании-участники производственного цикла, подрядчики при организации услуг, объемы продаж, география самой компании.

    Кубы OLAP

    Куб OLAP может быть и двух-, и трех-, и многомерным - в зависимости от решаемой задачи. Особо опытным аналитикам может понадобиться порядка 20 измерений -и мощные OLAP-продукты именно на такое количество и рассчитаны. Более простые настольные приложения поддерживают 6 измерений. Измерения гиперкуба могут носить сложный характер, быть иерархическими, между ними могут быть установлены отношения.

    На пересечениях осей - измерений (dimensions) - находятся данные, количественно характеризующие процесс - меры (measures): суммы и иные агрегатные функции (min, max, avg, дисперсия, ср. отклонение и пр.).

    Пример.

    Объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п.

    Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения (уровней иерархии), где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению (различные уровни их детализации). В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Благодаря такой модели данных пользователи могут формулировать сложные запросы, генерировать отчеты, получать подмножества данных.

    схема куба

    Многомерное концептуальное представление является наиболее естественным взглядом управляющего персонала на объект управления. Оно представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям данных определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятие – подразделение – отдел – служащий». Измерение Время может даже включать два направления консолидации – «год – квартал – месяц – день» и «неделя – день», поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; на против, операция подъема (rolling up) означает движение от низших уровней к высшим.

    Пример.

    На рисунке представлен трехмерный куб, где в качестве фактов использованы суммы продаж, а в качестве измерений - время, товар и магазин, определенных на разных уровнях группировки: товары группируются по категориям, магазины - по странам, а данные о времени совершения операций - по месяцам.

    трехмерный куб

    Спуск и консолидация

    Спуск и консолидация - это специальная техника анализа, используемая при изучении данных. Пользователь имеет возможность переходить вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями. Например, если при анализе данных об объемах продаж в Сумской области выполнить операцию drill-down для измерения "Регион", то на экране будут отображены такие его элементы как "Сумы", "Шостка", и "Ахтырка". В результате дальнейшей детализации элемента "Сумы" будут отображены элементы "Заречный р-н", "Ковпаковский р-н", "Сумский р-н" и т. д. Даже трехмерный куб сложно отобразить на экране компьютера так, чтобы были видны значения интересующих мер, еще более сложно визуализировать кубы с количеством измерений, большим трех. Для представления данных, хранящихся в кубе, применяются, как правило, привычные двумерные, т.е. табличные, представления, имеющие сложные иерархические заголовки строк и столбцов. Двумерное представление куба можно получить, "разрезав" его поперек одной или нескольких осей (измерений), в этом случае фиксируются значения всех измерений, кроме двух, т.е. получается обычная двумерная таблица. В горизонтальной оси таблицы (заголовки столбцов) представлено одно измерение, в вертикальной (заголовки строк) - другое, а в ячейках таблицы - значения мер. При этом набор мер фактически рассматривается как одно из измерений - выбирается для показа либо одна мера (и тогда можно разместить в заголовках строк и столбцов два измерения), либо показывается несколько мер (и тогда одну из осей таблицы займут названия мер, а другую - значения единственного "неразрезанного" измерения).

    Пример.

    На рисунке изображены:

    • слева - двумерный срез куба для одной меры Unit Sales (продано штук) и двух "неразрезанных" измерений - Store (Магазин) и Время (Time)

    • справа представлено лишь одно "неразрезанное" измерение - Store, но зато здесь отображаются значения нескольких мер - Unit Sales (продано штук), Store Sales (сумма продажи) и Store Cost (расходы магазина)

    • внизу - двумерное представление куба, когда "неразрезанными" остается более двух измерений. При этом на осях среза (строках и столбцах) будут размещены два или более измерений "разрезаемого" куба.

    двухмерный срез куда

    Поддержка многомерной модели данных и выполнение многомерного анализа данных осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские приложения могут запрашивать требуемое многомерное представление и в ответ получать те или иные данные. При этом OLAP-серверы могут хранить многомерные данные разными способами

    В процессе анализа пользователь может менять точку зрения на данные (так называемая операция смены логического взгляда), просматривая данные в различных разрезах и разрешая конкретные задачи. Над кубами могут выполняться различные операции, включая прогнозирование и условное планирование (анализ типа “что, если”). Причем операции выполняются над кубами, т.е. произведение, например, даст в результате произведение-гиперкуб, каждая ячейка которого является произведением ячеек соответствующих гиперкубов-множителей.

    Однако куб сам по себе для анализа не пригоден. Если еще можно адекватно представить или изобразить трехмерный куб, то с шести - или девятнадцатимерным дело обстоит значительно хуже. Поэтому перед употреблением из многомерного куба извлекают обычные двумерные таблицы. Эта операция называется "разрезанием" куба. Термин этот образный, аналитик как бы берет и "разрезает" измерения куба по интересующим его меткам. Этим способом аналитик получает двумерный срез куба и с ним работает. Соответственно, "неразрезанными", как правило, остаются только два измерения - по числу измерений таблицы. Бывает, "неразрезанным" остается только измерение - если куб содержит несколько видов числовых значений, они могут откладываться по одному из измерений таблицы.

    Если внимательно всмотреться в таблицу, на основании которой был создан куб, можно заметить, что находящиеся в ней данные, скорее всего, не являются первичными, а получены в результате суммирования по более мелким элементам. Например, предприятие делится на производства, производства на цеха, цеха на участки, и т.д. Станки можно объединять в группы оборудования и т.д. В терминах OLAP такие многоуровневые объединения называется иерархиями. Средства OLAP дают возможность в любой момент перейти на нужный уровень иерархии. Причем, как правило, для одних и тех же элементов поддерживается несколько видов иерархий: например участок-цех-производство. Исходные данные берутся из нижних уровней иерархий, а затем суммируются для получения значений более высоких уровней. Для того чтобы ускорить процесс перехода, просуммированные значения для разных уровней хранятся в кубе. Таким образом, то, что со стороны пользователя выглядит одним кубом, грубо говоря, состоит из множества более примитивных кубов.

    Члены и метки. Иерархии. Аналитические операции.

    Значения, "откладываемые" вдоль измерений, называются Членами или Метками (members).

    Например, измерение "Станок" может состоять из меток "сверлильный", "токарный", "фрезерный" и так далее. Должны быть заполнены далеко не все элементы куба, например, если нет информации о количестве сверлильных станков в цехе №5, значение в соответствующей ячейке просто не будет определено. Совершенно необязательно также, чтобы приложение OLAP хранило данные непременно в многомерной структуре - главное, чтобы для пользователя эти данные выглядели именно так. Кстати именно специальным способам компактного хранения многомерных данных, "вакуум" (незаполненные элементы) в кубах не приводят к бесполезной трате памяти.

    Пример.

    Возьмем n-мерную систему координат, где n - число измерений. По каждой оси отложим члены измерения. Например, по измерению "Цех" это будут засечки, соответствующие всем производственным участкам данного цеха. В узлах координатной сетки откладываются готовность изделий. Каждый факт есть совокупность одной или нескольких мер. Например, отдельный факт изготовления заключает в себе совокупность как минимум трех величин – стоимость заготовки, стоимость изготовления и различные начисления. Таким образом, естественная структура БД для подобного представления - это многомерный куб, ребра которого соответствуют измерениям, а внутренний объем - мерам.

    Метки используются в операциях манипулирования измерениями. Они используются как для "разрезания" куба, так и для ограничения (фильтрации) выбираемых данных - когда в измерении, остающемся "неразрезанным", интересуют не все значения, а их подмножество, например три города из нескольких десятков. Значения меток отображаются в двумерном представлении куба как заголовки строк и столбцов.

    метки

    Иерархии

    Метки могут объединяться в иерархии, состоящие из одного или нескольких уровней детализации (levels). Например, метки измерения "Магазин" (Store) естественно объединяются в иерархию с уровнями: Город ( City ), Штат ( State ), Страна ( Country ), Мир( All ).

    В соответствии с уровнями иерархии вычисляются агрегатные значения, например, объем продаж для USA (уровень "Country") или для штата California (уровень "State"). В одном измерении можно реализовать более одной иерархии - скажем, для времени: {Год, Квартал, Месяц, День} и {Год, Неделя, День}.

    Поскольку в рассмотренном примере в общем случае в каждой стране может быть несколько городов, а в городе - несколько клиентов, можно говорить об иерархиях значений в измерении - регион. В этом случае на первом уровне иерархии располагаются страны, на втором - города, а на третьем - клиенты.

    иерархия

    Иерархии могут быть сбалансированными (balanced), как, например, иерархия, представленная выше (такова же иерархии, основанные на данных типа "дата-время"), и несбалансированными (unbalanced). Типичный пример несбалансированной иерархии - иерархия типа "начальник-подчиненный". Иногда для таких иерархий используется термин Parent-child hierarchy.

    Существуют также иерархии, занимающие промежуточное положение между сбалансированными и несбалансированными (они обозначаются термином ragged - "неровный"). Обычно они содержат такие члены, логические "родители" которых находятся не на непо средственно вышестоящем уровне (например, в географической иерархии есть уровни Country, City и State, но при этом в наборе данных имеются страны, не имеющие штатов или регионов между уровнями Country и City).

    схема иерархии

    Так как OLAP-системы являются специфическим ПО, в основе которого лежит технология МСУБД, то средствами пользовательского интерфейса можно выполнять такие аналитические операции:

    Сечение

    При выполнении операции сечения формируется подмножество гиперкуба, в котором значение одного или более измерений фиксировано (значение параметров для фиксированного, например, месяца)

    Проекция

    Значения в ячейках, которые лежат на оси проекции, суммируются в соответствии с определенным признаком

    Вращение (rolling)

    Операция вращения изменяет порядок представления измерений, обеспечивая представление метакуб a в более удобной для восприятия форме.

    Разбиение с поворотом (slicing and dicing)

    Позволяет получить представление данных с разных точек зрения, осуществить доступ к данным в любых разрезах, комбинациях и порядке следования. Работа пользователя с данными по принципу "slicing and dicing" осуществляется с помощью языка многомерных запросов (Multi-Dimensional Query Language), как средства формулирования запросов к многомерным базам данных. Для проведения анализа можно получать всевозможные срезы данных (двумерный (плоскостной) срез, многомерный подкуб). Например, один срез данных о доходах может содержать все сведения о доходах от продаж товаров указанного типа по каждому городу. Другой срез может представлять данные о доходах отдельной компании в каждом из городов.
    1   ...   13   14   15   16   17   18   19   20   ...   54


    написать администратору сайта