Главная страница

КП информационные технологии. Курсовой проект по дисциплине Информационные технологии в экономике на тему Базы и банки данных


Скачать 0.55 Mb.
НазваниеКурсовой проект по дисциплине Информационные технологии в экономике на тему Базы и банки данных
Дата21.02.2022
Размер0.55 Mb.
Формат файлаdocx
Имя файлаКП информационные технологии.docx
ТипКурсовой проект
#368962
страница5 из 6
1   2   3   4   5   6

2 Глава. Хранилища данных и их применение для формирования экономических решений



Постоянные изменения внешней среды, конъюнктуры рынка, потребностей и поведения клиентов, политики регуляторов и многих других внешних и внутренних факторов приводят к тому, что в настоящее время все участники экономических отношений работают в условиях высокой неопределенности. Одним из факторов неопределенности является большой объём разнородной поступающей информации, влияющей на принятие решений, вынуждающий организации использовать современные информационные технологии. Одной из технологий, дающих возможность не только обработки накопленной и вновь поступающей информации, но и использования ее для получения дополнительных доходов, стала технология «Большие данные» («Big Data»).

Ценность технологии больших данных состоит в том, что она позволяет организациям сохранять большие объёмы разнообразной информации, создавая соответствующие базы данных, а также управлять ими и обрабатывать их в требуемое время с требуемой скоростью в соответствии с поставленными задачами.

Дальнейшее развитие баз данных привело к появлению хранилищ данных (ХД) — предметно ориентированного, неизменяемого и поддерживающего хронологию набора данных. ХД используются для формирования решений. В отличие от баз данных, которые предназначены для обслуживания повседневной деятельности предприятия, ХД ориентированы на многолетний оперативный, многомерный анализ данных, результаты которого могут быть использованы для принятия решений.

Предметная ориентированность ХД означает, что данные должны представлять предметы (объекты), а не процессы (выписка счёта, продажа товара). Неизменяемость указывает на то, что данные не обновляются, а пополняются за счёт баз данных, а хронологическая поддержка указывает на обязательную привязку данных ко времени, так как они накапливаются на протяжении длительного периода (10—15 лет).

Моделью данных в ХД служат гиперкубы, т.е. многомерные базы данных, в ячейках которых находятся анализируемые данные. По осям многомерного куба указываются измерители объекта с различных точек зрения.

Измерение — это последовательность значений одного из анализируемых параметров. Например, для параметра «время» это последовательность месяцев, для параметра «регион» — список городов. Каждое измерение может быть представлено в виде иерархической структуры. Например, измерение «исполнитель» может иметь следующие иерархические уровни: предприятие — подразделение — служащий.

На пересечении осей измерения находятся данные, количественно характеризующие события, факты, процессы (объёмы продаж, остатки на складах, прибыль, затраты и т.д.).

Оси измерения позволяют создавать многомерную модель данных (гиперкуб), над которым можно выполнять следующие операции:

  • срез;

  • вращение;

  • консолидация или детализация.

Операция среза позволяет выделить из многомерного куба те данные, которые соответствуют фиксированному значению одного или нескольких элементов измерений. Из одного куба можно создать множество срезов. Срезы позволяют представить информацию таким образом, что появляется возможность определить причины неудач в деятельности предприятия, выявить тенденции в тех или иных процессах, построить соответствующие диаграммы, что, в конечном счёте, обеспечивает формирование решения.

Пример операции среза представлен на рисунке 2, который иллюстрирует ХД, предназначенное для управления продажами.




Рисунок 2. Плоские файлы базы данных (а) и трёхмерный куб хранилища данных (б)
В отличие от реляционной базы данных (показанной для сравнения на рисунке 2, а) срез позволяет подготовить информацию для принятия решения о том, какие товарные группы следует сворачивать, а какие развивать в различных регионах.

Для этого обратимся к более детальному представлению ХД в виде срезов, приведенных на рисунке 3. Базовый показатель, на основе которого принимается такое решение, — объём продаж. Он зависит от времени, группы товаров и региона. Для построения информационного куба, прежде всего, необходимо определить иерархию в измерении реквизитов-признаков показателя «объём продаж».

Объём продаж характеризуется следующими признаками:

  1. время (год— квартал— месяц— неделя— день);

  2. товар (товарная группа (ТГ) — подгруппа — наименование товаров);

  3. регион:

1-й уровень (Центральный, Уральский, Поволжье);

2-й уровень (Москва, Тула, Орел);

3-й уровень (Магазин-1, Магазин-2).


Рисунок 3. Некоторые срезы информационного куба, позволяющие получить информацию об изменении объёма продаж каждой товарной группы (а) и товарной группы1 (б)

Получив необходимый срез информационного куба, можно извлечь следующую информацию:

  1. Как изменялся объём продаж по каждой товарной группе в течение 2015 г. в г. Туле (рисунок 3, а).

  2. Как изменялся объём продаж в г. Туле по ТГ1 за последние три года (рисунок 3, б).

Операция вращения — это изменение расположения измерений в пространстве, что, возможно, облегчит принятие решений. Например, измерение «время», ранее представленное горизонтально, можно повернуть и расположить вертикально, а товар показать горизонтально (рисунок 4). Возможно, именно эта операция поможет принять правильное решение.

Операции консолидации и детализации предназначены либо для агрегирования данных (обобщения), либо для их детализации. Осуществить эти операции можно благодаря иерархии, установленной среди измерителей. Рисунок 5 иллюстрирует эти операции.



Рисунок 4. Операция вращения гиперкуба



Рисунок 5. Операции консолидации (а) и детализации (б)

1   2   3   4   5   6


написать администратору сайта