Главная страница
Навигация по странице:

  • Реляционная модель представления данных Многомерная модель представления данных Модель

  • Месяц Объем Июнь Июль

  • Показатель (Measure) Иногда вместо термина "Ячейка" используется термин показатель

  • Гиперкубические и поликубические модели данных Организация данных в МСУБД

  • Виды манипулирования для получения анализируемых данных: Срез (Slice)

  • Отображение страницы (Page Display) Текущее представление среза многомерной информации называется отображением страницы

  • Slice and Dice (нарезка на кубики и ломтики) Slice and Dice

  • Вращение (Rotate, Pivot, пивотинг)

  • Агрегации (консолидация) (Drill Up)

  • Детализации (Drill Down) Переход от более агрегированных к более детализированным данным называется операцией детализации

  • Информационные технологии управления. Информационные технологии и информационные системы Информация. Информатика. Микроэлектроника


    Скачать 2.04 Mb.
    НазваниеИнформационные технологии и информационные системы Информация. Информатика. Микроэлектроника
    АнкорИнформационные технологии управления.docx
    Дата19.05.2017
    Размер2.04 Mb.
    Формат файлаdocx
    Имя файлаИнформационные технологии управления.docx
    ТипДокументы
    #7920
    страница15 из 54
    1   ...   11   12   13   14   15   16   17   18   ...   54

    Многомерная модель данных

    "Многомерный взгляд на данные наиболее характерен для пользователя, занимающегося анализом данных" - это утверждение сегодня стало уже почти аксиомой.

    Однако, у, впервые прочитавшего это утверждение, возникают вопросы:

    • что такое многомерное представление?

    • откуда появляется многомерность в трехмерном мире?

    • чем многомерность отличается и чем она лучше ставшего уже привычным реляционного представления?

    • откуда могут появиться люди, мыслящие в четырех и более измерениях, и как это им удается?

    Однако, пользователь, занимающийся анализом, сам не замечая того, действительно имеет многомерность мышления. Весь вопрос в том, что понимать под измерением.

    Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (Модели компьютеров по оси Y и Время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.

    Реляционная модель представления данных

    Многомерная модель представления данных

    Модель

    Месяц

    Объем

     

    Июнь

    Июль

    Август

    Celeron

    Июнь

    12

    "Celeron"

    12

    24

    5

    Celeron

    Июль

    24

    "Pentium"

    2

    18

    -

    Celeron

    Август

    5

    "Athlon"

    -

    19

    -

    Pentium

    Июнь

    2

     

     

     

     

    Pentium

    Июль

    18

     

     

     

     

    Athlon

    Июль

    19

     

     

     

     

    Но в любом магазине имеется не три модели товара, а значительно больше (например, 30), и анализ проводится не за три, а за 12 месяцев. В случае построчного (реляционного) представления будет получен отчет в 360 строк (30х12), который займет не менее 5-6 страниц. В случае же многомерного (в данном случае двухмерного) представления будет получена достаточно компактная таблица 12 на 30, которая уместится на одной странице и которую, даже при таком объеме данных, можно реально оценивать и анализировать.

    И когда говорится о многомерной организации данных, вовсе не подразумевается то, что данные представляются конечному пользователю (визуализируются) в виде четырех или пятимерных гиперкубов. Это невозможно, да и пользователю более привычно и комфортно иметь дело с двухмерным табличным представлением и двухмерной бизнес-графикой.

    При многомерном представление и описании структур данных основными понятиями, с которыми оперирует пользователь и проектировщик в многомерной модели данных, являются:

    • Измерение (Dimension)

    Это множество однотипных данных, образующих одну из граней гиперкуба. Измерения играют роль индексов, используемых для идентификации конкретных значений (Показателей), находящихся в ячейках гиперкуба. Наиболее часто используемые в анализе измерения:

      • временные -Дни, Месяцы, Кварталы, Годы;

      • географических - Города, Районы, Регионы, Страны и т.д. В многомерной модели данных

    • Ячейка (Cell)

    Это часть данных, получаемая путем определения одного элемента в каждом измерении многомерного массива. Ячейки гиперкуба могут быть пусты или полны. Когда значительное число ячеек куба не содержит данных, говорят, что он "разрежен".

    Разреженность (Sparse)

    Многомерная база данных называется разреженной, если относительно большой процент ячеек содержит пустые (утраченные) данные. Вполне обычны такие наборы данных, которые содержат 1%, 0.01% и даже меньшую долю возможных данных.

    Показатель (Measure)

    Иногда вместо термина "Ячейка" используется термин показатель (Measure) - это поле (обычно числовое), значения которого однозначно определяются фиксированным набором измерений.

    Гиперкубические и поликубические модели данных

    Организация данных в МСУБД

    В различных МСУБД используются два основных варианта организации данных: гиперкубическая модель и поликубическая модель. Различие состоит в том, что системы, поддерживающие поликубическую модель (например, Oracle Express Server), предполагают, что в МБД может быть определено несколько гиперкубов с различной размерностью и с различными измерениями в качестве их граней. Например, значение показателя Рабочее Время Менеджера, скорее всего, не зависит от измерения Модель компьютера и однозначно определяется двумя измерениями: День и Менеджер. В поликубической модели в этом случае может быть объявлено два различных гиперкуба.

    2 гиперкуба:

    • двухмерный - для показателя Рабочее Время Менеджера;

    • трехмерный - для показателя Объем Продаж.

    В случае же гиперкубической модели предполагается, что все показатели должны определяться одним и тем же набором измерений. То есть только из-за того, что Объем Продаж определяется тремя измерения-ми, при описании Показателя Рабочее Время Менеджера придется также использовать три измерения и вводить избыточное для этого показателя измерение Модель Компьютера.

    Операции с измерениями

    Наличие измерений позволяет производить следующие виды манипулирования для получения анализируемых данных.

    Виды манипулирования для получения анализируемых данных:

    Срез (Slice)

    Пользователя редко интересуют все потенциально возможные комбинации значений измерений. Более того, он практически никогда не работает одновременно сразу со всем гиперкубом данных. Срез (Slice) – это созданное пользователем подмножество гиперкуба, получившееся в результате фиксации значения одного или более измерений не входящих в это подмножество.

    Пример.

    Если ограничится значением измерения Модель Компьютера - Celeron, то получится под-множество гиперкуба (в данном случае - двухмерная таблица), содержащее информацию об истории продаж этой модели различными менеджерами в различные годы.

    Пример.

    При выборе элемента "Факт" измерения "Сценарий" срез данных представляет собой под-куб, в который входят все остальные измерения. Данные, которые не вошли в сформированный срез, связаны с теми элементами измерения "Сценарий", которые не были указаны в качестве определяющих (например, "План", "Отклонение", "Прогноз" и т. п.). С позиции конечного пользователя "срезом" наиболее часто является двумерная проекция куба.

    Отображение страницы (Page Display)

    Текущее представление среза многомерной информации называется отображением страницы (Page Display). Измерения, расположенные по горизонтали (поперек дисплея), определяют измерения в столбцах таблицы. Строки таблиц измерений определяются измерениями, расположенными по вертикали (вдоль дисплея). Выбор элемента измерения страницы позволяет определить, какая именно страница отображается в данный момент. Страница во многом напоминает обычную электронную таблицу и может быть интегрирована практически с любой программой электронных таблиц, где пользователь может в дальнейшем вносить изменения в каждую ячейку.

    Slice and Dice (нарезка на кубики и ломтики)

    Slice and Dice (нарезка на кубики и ломтики) - это термин, использующийся для описания функции сложного анализа данных, обеспечиваемой средствами OLAP выборка данных (продольные и поперечные, плоскостные и объемные срезы) из многомерного куба с заданными значениями и заданным взаимным расположением измерений, при котором пользователь обычно использует операции вращения концептуального куба данных и детализации/агрегирования данных.

    Вращение (Rotate, Pivot, пивотинг)

    Изменение порядка представления измерений, применяемое при двухмерном представлении данных, называется вращением (Rotate, Pivot, пивотинг). Эта операция обеспечивает возможность визуализации данных в форме, наиболее комфортной для их восприятия. Операция вращения может заключаться в перестановке местами строк и столбцов таблицы, или перемещении интересующих измерений в столбцы или строки создаваемого отчета, что позволяет придавать ему желаемый вид. Кроме того, вращением куба данных является перемещение вне табличных измерений на место измерений, представленных на отображаемой странице, и наоборот (при этом вне табличное измерение становится новым измерением строки или измерением столбца).

    Пример для первого случая.

    Имеется отчет, для которого элементы измерения "Время" располагаются поперек экрана (заголовки столбцов таблицы), а элементы измерения "Компьютеры" -вдоль экрана (заголовки строк таблицы). После применения операции вращения отчет будет иметь следующий вид: элементы измерения "Компьютеры" будут расположены по горизонтали, а элементы измерения "Время" -по вертикали.

    Пример второго случая.

    Имеется отчет с измерениями "Меры" и "Компьютеры", расположенными по вертикали, и измерением "Время", расположенным по горизонтали. Вращением преобразуется в отчет, у которого измерение "Меры" располагается по вертикали, а измерения "Время" и "Компьютеры" - по горизонтали. При этом элементы измерения "Время" располагаются над элементами измерения "Компьютеры".

    Пример третьего случая.

    Вращением можно изменить отчета с расположенным по горизонтали измерением "Время" и измерением "Компьютеры", расположенным по вертикали, в отчет, у которого по горизонтали представлено измерение "Время", а по вертикали - измерение "География".

    Отношения (Relation)

    В данном примере значения показателей определяются только тремя измерениями. На самом деле их может быть гораздо больше и между их значениями обычно существуют множество различных отношений (Relation) типа "один ко многим". Следует отметить, что для измерений, имеющих тип Время (таких как День, Месяц, Квартал, Год), все отношения устанавливаются автоматически, и их не требуется описывать.

    Пример.

    Каждый Менеджер может работать только в одном подразделении, а каждой модели компьютера однозначно соответствует фирма, которая ее выпускает: Менеджер→Подразделение; Модель Компьютера→ Фирма-Производитель.

    Агрегации (консолидация) (Drill Up)

    В процессе анализа пользователь не только работает с различными срезами данных и выполняет их вращение. Одним из часто встречающихся способов манипулирования данными является операция агрегации (консолидации) (Drill Up) -переход от детализированных данных к агрегированным. С точки зрения пользователя, Подразделение, Регион, Фирма, Страна являются точно такими же измерениями, как и Менеджер. Но каждое из них соответствует новому, более высокому уровню агрегации значений показателя Объем продаж.

    Пример.

    Проанализировав, насколько успешно в 2005 г . Петров продавал модели "Celeron" и "Athlon", управляющий может захотеть узнать, как выглядит соотношение продаж этих моделей на уровне Подразделения, где Петров работает. А затем получить аналогичную справку по Региону или Фирме.

    Детализации (Drill Down)

    Переход от более агрегированных к более детализированным данным называется операцией детализации (Drill Down). Например, начав анализ на уровне Региона, пользователь может захотеть получить более точную информацию о работе конкретного Подразделения или Менеджера.
    1   ...   11   12   13   14   15   16   17   18   ...   54


    написать администратору сайта