Главная страница

Информационные технологии управления. Информационные технологии и информационные системы Информация. Информатика. Микроэлектроника


Скачать 2.04 Mb.
НазваниеИнформационные технологии и информационные системы Информация. Информатика. Микроэлектроника
АнкорИнформационные технологии управления.docx
Дата19.05.2017
Размер2.04 Mb.
Формат файлаdocx
Имя файлаИнформационные технологии управления.docx
ТипДокументы
#7920
страница19 из 54
1   ...   15   16   17   18   19   20   21   22   ...   54

Таблица измерений

Таблица измерений содержит неизменяемые или редко изменяемые данные. В каждой таблице измерений перечислены возможные значения одного из измерений гиперкуба. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Каждая таблица измерений должна находиться в отношении "один ко многим" с таблицей фактов.

В сложных задачах с многоуровневыми измерениями используется расширение схемы "звезда" - схема созвездие (fact constellation schema) и схема "снежинка" (snowflake schema).

Ориентация на представление многомерной информации с помощью звездообразных реляционных моделей позволяет избавиться от проблемы оптимизации хранения разреженных матриц, остро стоящей перед многомерными СУБД (где проблема разреженности решается специальным выбором схемы). Хотя для хранения каждой ячейки в таблице фактов используется целая запись (которая помимо самих значений включает вторичные ключи – ссылки на таблицы измерений), несуществующие значения могут просто не быть включены в таблицу фактов, то есть наличие в базе пустых ячеек исключается. Индексирование обеспечивает приемлемую скорость доступа к данным в таблицах фактов.

Увеличение числа таблиц фактов в БД может проистекать не только из множественности уровней различных измерений, но и из того обстоятельства, что в общем случае факты имеют разные множества измерений. При абстрагировании от отдельных измерений пользователь должен получать проекцию максимально полного гиперкуба, причем далеко не всегда значения показателей в ней должны являться результатом элементарного суммирования. Таким образом, при большом числе независимых измерений необходимо поддерживать множество таблиц фактов, соответствующих каждому возможному сочетанию выбранных в запросе измерений.

Это позволяет добиться лучшей производительности, но часто приводит к избыточности данных и к значительным усложнениям в структуре БД, в которой оказывается огромное количество таблиц фактов

Схема снежинки (Snowflake schema)

На рисунке приведен фрагмент для одного измерения в схеме "снежинка". Схема снежинки (Snowflake schema) то же, что и схема звезды, но с нормализованными таблицами измерений. При такой структуре БД большинство запросов из области делового анализа объединяют центральную таблицу фактов с одной или несколькими таблицами измерений.

схема снежинки

В любом случае, если многомерная модель реализуется в виде реляционной БД, следует создавать длинные и "узкие" таблицы фактов и сравнительно небольшие и "широкие" таблицы измерений. Таблицы фактов содержат численные значения ячеек гиперкуба, а остальные таблицы определяют содержащий их многомерный базис измерений. Часть информации можно получать с помощью динамической агрегации данных, распределенных по не звездообразным нормализованным структурам, хотя при этом следует помнить, что включающие агрегацию запросы при высоконормализованной структуре БД могут выполняться довольно медленно.

Переход от OLTP к звездной схеме позволяет получить выигрыш в аналитических запросах, несмотря на то, что с точки зрения реляционной модели OLAP противоречит всем правилами нормализации, ибо здесь имеется масса избыточности, вычисляемых полей и т.д. В частности, повышая степень денормализации, любую "снежинку" можно привести к канонической "звезде". Далее, куб вообще можно представить в виде одной плоской таблицы, выписывая построчно все комбинации членов всех измерений с соответствующими им величинами мер. Примерно так, с точностью до пустот хранятся данные в истинно многомерном MOLAP кубе. Куб не хранит пустоты с целью экономии места. Ключи (координаты по измерениям) кодируются и сжимаются до 4 - 8 байт. Для быстрого доступа к значениям в кубах используются битовые индексы. Все сказанное означает, что MOLAP намного эффективнее проявляет себя в хранении, чем ROLAP, и при одинаковых объемах данных потребляет меньше места на диске, чем ROLAP-хранилище. Меньше места - меньше операций ввода/вывода. Кроме того, MOLAP не нуждается в отработке многочисленных join'ов, не заботится о блокировках, так как все операции происходят на чтение, и работает только с численными данными (мерами не могут быть строки, BLOBы и т.п.). Следовательно, MOLAP намного быстрее, чем ROLAP. Аналитические запросы к многомерным кубам имеют простую и компактную форму.

Таблица фактов (итогов)

Таблица фактов (итогов) (Summary tables) является основной таблицей ХД. Это таблицы, которые содержат предварительно вычисленные на основе первичных данных, и для увеличения производительности запросов создаются по наиболее часто используемым измерениям. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Если проводить аналогию с многомерной моделью, то строка таблицы фактов соответствует ячейке гиперкуба. Обычно говорят о четырех наиболее часто встречающихся типах фактов. К ним относятся факты, связанные с:

транзакциями (Transaction facts)

Они основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата);

"моментальными снимками " (Snapshot facts)

Основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка;

элементами документа (Line-item facts)

Основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки);

событиями или состоянием объекта (Event or state facts)

Представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей).

На рисунке представлен куб, разложенный по плоскостям. Центральная таблица (начинка куба) - есть таблица фактов (меры). С ней отношениями "один ко многим" связаны таблицы измерений (стенки многомерной коробки). Такая схема получила название "звезда". Идея схемы звезда заключается в том, что имеются таблицы для каждого измерения, а все факты помещаются в одну таблицу, индексируемую множественным ключом, составленным из ключей отдельных измерений.

Причина, по которой данная схема названа "звездой" достаточно очевидна. Концы звезды образуются таблицами измерений, а их с таблицей фактов, расположенной в центре, образуют лучи. В терминологии Кодда, каждый луч схемы звезды задает направление консолидации данных по соответствующему измерению (например, Магазин – Город/район – Регион).

В схеме "звезда" каждое измерение куба содержится в одной таблице, в том числе и при наличии нескольких уровней иерархии (государство - регион - нас.пункт в таблице "Покупатель", год -месяц -день в таблице "Период").

схема звезда - куб

схема звезды

В общем случае факты имеют разные множества измерений, и тогда их удобно хранить не в одной, а в нескольких таблицах; кроме того, в различных запросах пользователей может интересовать только часть возможных измерений.

Пример.

Таблица Product Dim в этом примере может быть разбита на две: собственно изделия и категории изделий. Однако это все равно будет одно продуктовое измерение.

Но при таком подходе при большом числе независимых измерений необходимо поддерживать множество таблиц фактов, соответствующих каждому возможному сочетанию выбранных в запросе измерений, что приводит к неэкономному использованию внешней памяти, увеличению времени загрузки данных в БД схемы звезды из внешних источников и сложностям администрирования.

Таблица фактов индексируется по сложному ключу, составленному из ключей отдельных изменений. При этом как ключевые, так и некоторые неключевые поля таблицы фактов должны соответствовать будущим измерениям OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых полей, на основании которых в дальнейшем будут получены агрегатные данные. Замечания:

  • для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные, то есть соответствующие членам нижних уровней иерархии соответствующих измерений.

  • в таблице фактов отсутствуют какие-либо сведения о том, как группировать записи при вычислении агрегатных данных. Недостатки и преимущества каждого подхода, в общем-то, очевидны.

Другие OLAP. HOLAP. DOLAP. JOLAP.

HOLAP (Hybrid OLAP)

Новый класс аналитических инструментов, появившийся в 1997 г . Эти гибридные системы разработаны с целью совмещения достоинств и минимизации недостатков, присущих предыдущим классам. В случае использования гибридной архитектуры исходные данные остаются в реляционной БД, а агрегаты размещаются в многомерной БД. Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.

DOLAP - “Настольный” (desktop) OLAP

Это недорогой, простой в использовании OLAP-инструментарий, предназначенный для локального анализа и представления данных, которые загружаются из реляционной или многомерной БД на машину клиента. Аналитическая обработка в таких системах проводится с малыми гиперкубами, размерность их небольшая, потребности скромны, и для такой аналитической обработки достаточно ПК.

JOLAP

Это новая, основанная на Java, коллективная OLAP, предназначенная для создания и управления данными и метаданными на серверах OLAP. Основной разработчик - Hyperion Solutions. Другими членами группы являются: IBM, Oracle и др.

По месту размещения OLAP - машин

По этому признаку OLAP-продукты делятся на OLAP-серверы и OLAP-клиенты.

  • в серверных OLAP-средствах вычисления и хранение агрегатных данных выполняются отдельным процессом - сервером. Клиентское приложение получает только результаты запросов к многомерным кубам, которые хранятся на сервере. Некоторые OLAP-серверы поддерживают хранение данных только в реляционных базах, другие - только в многомерных. Многие современные OLAP-серверы поддерживают все три способа хранения данных: MOLAP, ROLAP и HOLAP. Но все же для серверных OLAP-средств более популярной архитектурой становится HOLAP, предоставляющий доступ к реляционным и многомерным базам данных одновременно.

  • в OLAP-клиенте построение многомерного куба и OLAP-вычисления выполняются в памяти клиентского компьютера. OLAP-клиенты также делятся на ROLAP и MOLAP. А некоторые могут поддерживатьоба варианта доступа к данным. Среди одних из первых клиентских OLAP-средств можно назвать Oracle Discoverer. Те же возможности обеспечивает и отечественная разработка -продукты Аналитической платформы Контур от компании Intersoft Lab.

OLAP-клиент

OLAP-клиент – это OLAP-приложение, которое позволяет пользователям выполнять нужный им анализ на основе результатов запросов к OLAP-серверу. Мощные аналитические возможности определяют диапазон модификации и представления информации (в двумерных и многомерных таблицах), средств вычисления и классификации данных. Пользователи могут легко изменять представление информации, чтобы изменить угол обзора информации. Они могут менять расположение измерения "Время" в отчете, (размещая его, например, в строках или столбцах отчета). Используется интуитивная навигация по БД, поскольку многомерная модель отображает информацию в том виде, в котором большинство людей ее себе представляет.

OLAP-клиент обычно не хранит данные, однако выполняет некоторую обработку и практически всю работу по представлению информации. Данные хранятся на сервере, где выполняется их основная обработка.

Тонкий клиент (Thin client)

Работа с OLAP-клиентом может быть не намного сложнее работы с программой электронных таблиц: OLAP-клиент выполняет произвольные запросы и результаты их отображает в OLAP-таблице. В этой таблице пользователь, хорошо знакомый с принципом работы с таблицами типа Excel, может манипулировать данными и получать на экране или на бумаге сотни различных отчетов. В то же время, OLAP-клиенты могут обладать высокой функциональностью приложений для финансового моделирования или анализа продаж. Клиенты подразделяются на однозадачные и многозадачные и могут являться версией "тонкого" или "толстого" клиента. Тонкий клиент (Thin client) – одна из форм клиент-серверной архитектуры, реализация которой означает, что все данные хранятся и обрабатываются на сервере - на стороне клиента выполняется лишь незначительная часть их обработки, при этом машина клиента может являться сетевым компьютером. Концепция "тонкого" клиента довольно популярна, однако необходимо осторожно подходить к ее реализации в архитектуре сложных аналитических приложений, а также в том случае, когда необходимо наделить правами доступа пользователя с расширенными полномочиями (power user). Необходимо отметить, что "тонким" клиентам иногда необходим большой объем оперативной памяти и мощные процессоры.

Технически системы оперативного анализа данных обычно функционируют в связке с хранилищами данных (выделенными файл-серверами или серверами БД), а клиентские OLAP-системы устанавливаются на любых пользовательских компьютерах информационной системы предприятия.

У каждого из этих подходов есть свои "плюсы" и "минусы". Нельзя однозначно говорить о преимуществах серверных средств перед клиентскими и наоборот. На практике такой выбор является результатом компромисса "эксплуатационных показателей", стоимости программного обеспечения и затрат на разработку, внедрение и сопровождение аналитической системы.

В такой классификации OLAP-продуктов различают:

  • OLAP-компонента - это инструмент разработчика. С ее помощью разрабатываются клиентские OLAP-программы.

  • инструментальные OLAP-системы - это программные продукты, предназначенные для создания аналитических приложений.

  • конечные OLAP-приложения . Это готовые прикладные решения для конечного пользователя. Они требуют только установки, и, не всегда, настройки под специфику пользователя.

OLAP-сервер

OLAP-сервер - это вычислительное ядро, которое использует многомерную модель данных. Поддержка многопользовательского режима работы обеспечивает возможность параллельного доступа к данным. В многомерной модели данные представляются в виде многомерного куба, где измерения соответствуют осям куба, а меры (показатели) - индивидуальным ячейкам. Отдельный фрагмент данных получается путем выбора одного элемента из каждого измерения многомерного массива. Элементы измерений определяют точное место пересечения между всеми измерениями, однозначно идентифицирующее отдельную ячейку данных.

OLAP-сервер - это средство многомерного представления и анализа данных Хранилища. Гибкая архитектура сервера позволяет, как непосредственно обращаться к данным Хранилища, так и размещать их в высокоэффективных многомерных структурах, оптимизированных для выполнения различного рода аналитических запросов (гибкого анализа (анализа "на лету") первичных данных и вычисленных на их основе формульных показателей).

Применение OLAP - систем

На данное время разработан довольно много аналитических систем, сконструированных с использованием OLAP-технологии (Нурегіоn OLAP, Elite OLAP, Oracle Express и много других). Рынок программных OLAP-продуктов постоянно расширяется. Современные системы оперативной аналитической обработки дают пользователям возможность решать ключевые задачи управления бизнесом-процессом, в частности прикладные программы Нурегіоn OLAP разрешают выполнять анализ прибыльности; анализ направлений развития продукции; анализ продажи; анализ положения на рынке; анализ ассортимента продуктов; анализ риска; анализ конкурентоспособности; складывания отчетов из производительности; моделирования сценария; анализ бюджета и прогнозов и т.п.

Следует отметить, что в соответствии с современными взглядами на создание информационных систем OLAP-системы должны базироваться на специальной базе данных — ХД.

В OLAP реализуется сложный интеллектуальный анализ данных. Возможность использования хорошо зарекомендовавших себя методов математической статистики, нейронных сетей, машинного обучения, визуализации данных, индукции правил, нечеткой логики, генетических алгоритмов и др. для решения задач подобного рода открыло новые возможности перед аналитиками, исследователями, а также теми, кто принимает решения - менеджерами и руководителями компаний. Сложность и разнообразие методов обработки данных требуют создания специализированных средств конечного пользователя для решения типовых задач анализа информации в конкретных областях. Поскольку эти средства используются в составе сложных многофункциональных систем поддержки принятия решений, они должны легко интегрироваться в подобные системы. Другими словами, вся эта сложная математика заботливо скрыта от конечного пользователя дружественным интерфейсом.

В OLAP-системах основное внимание уделено гибкости доступа и манипулирования информацией. На сегодняшний день большинство разработок в этой области относится к финансовой сфере, хотя возможно применение таких систем в различных областях деятельности человека.

Одним из первых пользователей технологии интеллектуального анализа данных стало федеральное правительство США. Оно применяет с 1996 года специализированное программное обеспечение, для выявления случаев уклонения от уплаты налогов и для обработки материалов перехвата информационного обмена других государств.

По оценкам специалистов, очень перспективно применение подобных систем и для решения задач защиты информации. Например, анализ подлинности электронных платежей, выявление случаев неоправданной «активности» легальных пользователей в сети до совершения ими нарушений, анализ действенности принятой политики безопасности и т.д.

OLAP в отличие от прочих способов автоматизации бизнес-деятельности дает возможность получить пользователю «на выходе» не готовое четко структурированное решение, выдаваемое после включения ранее настроенного мастера обработки форм, а своеобразный материал для творческой оценки существующей ситуации. Поэтому сфера применения OLAP-анализа обычно ограничивается менеджерским составом предприятий разных размеров, которому приходится часто заниматься тактическими и стратегическими задачами вроде анализа ключевых показателей деятельности и сценариев развития, маркетинговым и финансово-экономическим анализом групп товаров или услуг, а также долгосрочным прогнозированием работы предприятия или его подразделений.

Для этого пользователь OLAP-систем получает в руки мощный и главное очень гибкий инструмент создания различных отчетов по выбираемым им же разрезам и направлениям. При этом методики OLAP куда совершеннее привычных электронных таблиц, ведь помимо простых функций создания таблиц, графиков и диаграмм, OLAP-системы дают возможность получить обобщенные данные по самостоятельно выбранным критериям, моментально углубится в детали выбранных направлений, отфильтровать, сортировать или отбросить ненужные цифры или показатели.

Пример.

Если менеджеру продаж компании требуется получить сезонные сводки динамики продаж выбранной категории товаров, система предложит ему всевозможные данные о продажах за месяц, квартал, год, а также найдет и проанализирует их зависимость от означенных факторов, скажем, времени проведения маркетинговых акций.

Кроме того, базируясь на одной лишь статистике продаж, OLAP-система может выявить эффективность работы разных подразделений компании, в том числе и в разрезе географической иерархии их взаимодействия. При этом параметры, характеризующие успешность подразделений, выбираются менеджером самостоятельно и в ряде случаев могут стать инструментом мотивации успешного персонала.

Ниже перечислены наиболее важные сферы применения OLAP-технологий.

Сферы применения OLAP-технологий:

Продажи

Ключевой вопрос отдела сбыта любого предприятия: "Какое количество изделий продано?", "На какую сумму реализовано?" расширяются по мере усложнения бизнеса и накопления исторических данных до некоторого множества факторов, или разрезов: регион поставок, .в прошлом месяце, квартале, по сравнению с нынешним,. через канал сбыта А, по сравнению с каналом Б и т.д. Ответы на подобные вопросы необходимы для принятия управленческих решений: об изменении ассортимента, цен, закрытии и открытии филиалов, расторжении и подписании договоров с дилерами, проведения или прекращения рекламных кампаний и т.д.

Закупки

Задача обратно противоположная анализу продаж. Многие предприятия закупают комплектующие и материалы у поставщиков. Торговые предприятия закупают товары для перепродажи. Возможных задач при анализе закупок множество, от планирования денежных средств на основе прошлого опыта, до контроля размеров поставок различных поставщиков.

Маркетинг

Под маркетинговым анализом имеется ввиду только область анализа покупателей или клиентов-потребителей услуг. Например, для розничной торговли задачей анализа является правильное позиционирование товара, выявление групп покупателей для целевой рекламы, оптимизация ассортимента. Например, если выясняется, что телефонами темно-серого цвета стоимостью более $500 пользуются исключительно мужчины старше 25 лет, то стоит изобразить в рекламе таких телефонов вместо девушек одного преуспевающего бизнесмена. Это очень грубый пример, но известно, что маркетинговый анализ находится на грани между сложной наукой и малообъяснимым искусством. Поэтому задача OLAP в данном случае - дать пользователю инструмент быстрого получения ответов на вопросы, интуитивно возникающие по ходу анализа данных.

Движение денежных средств

Могут анализироваться денежные обороты безналичных и наличных средств в разрезе бизнес-операций, контрагентов, валют и времени с целью оптимизации потоков, обеспечения ликвидности, и т.д. Состав измерений сильно зависит от особенностей бизнеса, отрасли и т.д.

Бюджет

Одна из самых перспективных областей применения OLAP-технологий - ни одна современная система бюджетирования не считается завершенной без наличия в ее составе OLAP-инструментария для анализа бюджета. Большинство бюджетных отчетов легко строятся на основе OLAP-систем. При этом отчеты отвечают на очень широкую гамму вопросов: анализ структуры расходов и доходов, сравнение расходов по определенным статьям у разных подразделений, анализ динамики и тенденций расходов на определенные статьи, анализ себестоимости и прибыли.

Финансовая отчетность

Технологично построенная система отчетности есть ни что иное, как набор именованных показателей со значениями на дату, которые требуется сгруппировать и просуммировать в различных разрезах для получения конкретных отчетов. Когда это так, то отображение и печать отчетов наиболее просто и дешево реализуются в OLAP-системах. Некоторые страны уже перешли на такую технологию сбора данных. В некоторых отечественных контролирующих органах существуют планы перехода от ГОСТ-овских стандартов отчетов с многоэтажными шапками и алгоритмами типа "Итого, исключая строку 234 и включая строку 598 из отчета №987" к системе к сбору показателей и выпуску отчетов по OLAP-технологии.

Результаты социологических опросов

Возможно, что в этой области существуют тонкие нюансы, которые следует знать при решении конкретных задач, но в первом приближении кажется, что OLAP исключительно хорошо подходит для представления и анализа результатов социологических опросов.

Объемы производства

Это еще один пример статистического анализа. Таким образом, можно анализировать объемы выращенного картофеля, выплавленной стали, сваренного пива и пр.

Потребление расходных материалов

Например, имеется завод, состоящий из десятков цехов, в которых расходуются охлаждающие, промывочные жидкости, масла, ветошь, наждачная бумага - сотни наименований расходных материалов. Для точного планирования, оптимизации издержек требуется тщательный анализ фактического потребления расходных материалов.

Заработная плата

Анализ расходов на зарплату, сравнение расходов по специальностям, филиалам, людям, динамика фонда ЗП.

Текучесть кадров на предприятии

Анализ текучести кадров в отделе, цехе, филиале по предприятию в целом в разрезе профессий, уровня образования, пола, возраста, времени.

Пассажирские перевозки

Анализ количества проданных билетов и сумм в разрезе сезонов, направлений, видов вагонов (классов), типов поездов (самолетов).

Грузовые перевозки

Анализ объемов перевозок, платы в разрезе сезонов, направлений, видов вагонов, грузов, грузоотправителей, грузополучателей, станций отправления, станций получения.

Простои транспорта (вагонов, самолетов, пароходов, грузовиков)

Анализ времени простоя (полученных штрафов) в разрезе причин (ремонт, отказ от погрузки-разгрузки), клиентов, исполнителей, железнодорожных станций (вокзалов, гаражей, аэропортов), типов грузов.

Заболеваемость персонала (учащихся, трудящихся)

Измерения -категории сотрудников (граждан), регион, отдел, профессия, возраст, дата. Факт -количество дней в году, в течение которых люди были не-трудоспособны.

Выбор недвижимости (офисов, складов, квартир)

Измерения -обычные для этого рынка. Город, Район, Количество комнат, Расстояние до метро, Этаж, Тип дома, Дата и т.д. Фактов три -средняя цена, максимальная цена, минимальная цена. Манипулируя измерениями, покупатель может определиться со своими возможностями, а продавец проанализировать зависимости цен, динамику цен и назначить правильную цену.

Урожайности агрокультур

Измерения - Сорт, Регион, Почва, Удобрение, Средняя температура воздуха, уровень осадков, Год, другие факторы, влияющие на урожайность. Факт -количество центнеров с гектара. Анализ позволит выявить лучшие сорта для данного региона, лучшие удобрения для данной почвы и прочие зависимости.

Преимущества и недостатки

Информационная технология

Информационная технология, ориентированная на интеллектуальный анализ данных, имеет достаточно широкое распространение, но, как и в случаях с други ми подобными новинками, прямо пропорционально числу потенциальных выгод от ее применения растет число разнообразных, часто противоречивых, заявлений о ее сильных и слабых сторонах.

Эффект от правильной организации управления, стратегического и оперативного планирования трудно заранее оценить в цифрах, но очевидно, что он в десятки раз может превзойти затраты на реализацию аналитических систем. Например, в части, касающейся разработки политики безопасности и анализа рисков в корпоративной сети. Однако следует отметить, что этот эффект обеспечивает не сама система, а люди с ней работающие. Поэтому не совсем корректны декларации типа: «OLAP-cистемы будут помогать лицу, принимающему решение (ЛПР) принимать правильные решения». Современные аналитические системы не являются системами искусственного интеллекта, и они не могут ни помочь, ни помешать в принятии решения. Их цель своевременно обеспечить ЛПР всей информацией, необходимой для принятия качественного решения. А какая информация будет запрошена и какое решение будет принято на ее основе, зависит только от человека.

OLAP-cистемы, реализующие интеллектуальный анализ данных, применяются для выявления тенденций и взаимозависимостей, учет которых поможет повысить качество принимаемых оперативных и стратегических решений.

Перспективы использования аналитических ИС - информационных систем:

  • в большинстве случаев применение OLAP даст возможность усовершенствовать действующую организационную схему;

  • технологии OLAP могут компенсировать определенный недостаток знаний в предметной области или опыта по части построения моделей и их анализа. Но результат их внедрение показывает, что образование и опыт становятся еще более важными факторами, чем раньше;

  • применение OLAP наиболее эффективно при решении конкретных задач. Хотя средства такой обработки действительно позволяют автоматически выявлять закономерности в исследуемых данных, тем не менее, ставить им конкретные цели необходимо;

  • практически любой процесс можно изучить, понять и улучшить с помощью методов OLAP. OLAP полезен везде, где собраны данные;

  • методы, используемые в настоящее время для OLAP, являются логическим развитием и обобщением аналитических подходов, известных уже на протяжении десятилетий;

  • алгоритмы для OLAP могут быть сложными, однако их применение, благодаря появлению новых программных средств, значительно упростилось;

  • методы OLAP разработаны специально для применения к очень большим наборам данных, но и из наборов данных средних или малых размеров тоже можно извлекать полезные сведения;

  • дополнительные данные приносят пользу, только если содержат новые сведения о рассматриваемых показателях или целях. В иных случаях их привлечение может оказаться не только бесполезным, но и вредным;

Таким образом, как следует из вышерассмотренного, результаты применения компьютерных аналитических технологий представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Широкие возможности открываются и в области защиты информации. Поэтому перед разработчиками встает задача внедрения технологии OLAP в автоматизированные системы мониторинга, анализа и поддержки принятия решений. В отличие от исследовательских приложений, подобные системы должны ориентироваться на непрограммирующего пользователя и на решение конкретных проблем, которые оказываются довольно разнообразными и нередко требуют применения различных подходов.

DSS - системы поддержки принятия решений - СППР

Для функционирования ИС необходимо обеспечить как наличие средств генерации данных так и средства их анализа. Имеющиеся в ИС средства построения запросов и различные механизмы поиска хотя и облегчают извлечение нужной информации, но все же не способны дать достаточно интеллектуальную ее оценку, т. е. сделать обобщение, группирование, удаление избыточных данных и повысить достоверность за счет исключения ошибок и обработки нескольких независимых источников информации (не только корпоративных БД, но и внешних). Проблема эта становится чрезвычайно важной в связи с лавинообразным возрастанием объема информации и увеличением требований к инфосистемам по производительности — сегодня успех в управлении предприятием во многом определяется оперативностью принятия решений, данные для которых и предоставляет ИС.

Принятие решения

В последние годы все активнее стали применяться понятие "принятие решения" и связанные с этим понятием системы, методы, средства поддержки принятия решений. Принятие решения - акт целенаправленного воздействия на объект, основанный на анализе ситуации, определении цели, разработке программы достижения этой цели.

Определение DSS (СППР)

Системы поддержки принятия решений (СППР, DSS, Decision Support System) возникли в начале 70-х 20 столетия благодаря развитию управленческих информационных систем и успехам в создании систем искусственного интеллекта. На развитие СППР важное влияние оказали достижения в области информационных технологий, в частности телекоммуникационные сети, персональные компьютеры, динамические электронные таблицы, экспертные системы. Системы подобного класса основаны на технологиях искусственного интеллекта, как правило, не входят в состав интегрированных систем управления предприятием, а являются разработками третьих фирм.

Представляют собой системы, разработанные для поддержки процессов принятия решений в сложных мало структурированных ситуациях, связанных с разработкой и принятием решений. Главной особенностью информационной технологии поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой технологии, происходит в результате итерационного процесса, изображенного на рисунке, в котором участвуют:

  • система поддержки принятия решений в роли вычислительного звена и объекта управления;

  • человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере.

информационная технология поддержки принятия решений как интеграционный процесс

Окончание итерационного процесса происходит по воле человека. В этом случае можно говорить о способности информационной системы совместно с пользователем создавать новую информацию для принятия решений.

СППР могут включать в себя ситуационные центры, средства многомерного анализа данных и прочие инструменты аналитической, позволяют моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Используемые на этом уровне специальные математические методы позволяют прогнозировать динамику различных показателей, анализировать затраты по разным видам деятельности, уяснять их детальную структуру, формировать подробные бюджеты по разным схемам.

До сих пор нет единого определения СППР, в качестве примера можно привести следующие:

  • Это наиболее мощный представитель класса аналитических систем ориентированный на:

    • Анализа больших массивов данных,

    • на выполнение более сложных запросов,

    • моделирование процессов предметной области,

    • прогнозирование,

    • нахождение зависимостей между данными

    • для проведения анализа "что если"

  • Это интерактивная прикладная система, которая обеспечивает конечным пользователям, принимающим решение, легкий и удобный доступ к данным и моделям с целью принятия решений в слабоструктурированных и неструктурированных ситуациях в разных областях человеческой деятельности

  • Это такие системы, которые основываются на использовании моделей и процедур обработки данных и мыслей, которые помогают принимать решение

  • это интерактивные автоматизированные системы, которые помогают лицам, принимающим решение, использовать данные и модели для решения неструктурованных и слабоструктурованых проблем

  • это компьютерная информационная система, используемая для поддержки разных видов деятельности во время принятия решений в ситуациях, когда невозможно или нежелательно иметь автоматическую систему, полностью выполняющую весь процесс решений

  • это многоуровневая многофункциональная автоматизированная система выработки и реализации решений, которая формируется на основе:

    • синтеза функциональных и структурных схем отдельных звеньев объекта;

    • сквозных моделей и задач по стадиям жизненного цикла изделия и самого объекта;

    • объединения разрозненных локальных подсистем в единую систему управления;

    • создания взаимосвязанных контуров управления и усиления роли оперативного управления (для изучения логики и диагностики их течения);

    • углубления системного и программно-целевого подхода к планированию и автоматического анализа работы объекта;

    • развития единых сквозных норм и нормативов;

    • создания разветвленной АРМ (как интеллектуальных терминалов), обеспечения программных взаимосвязей, согласования информации и диалога.

DSS - СППР

DSS – это человеко-машинный вычислительный комплекс, ориентированный на анализ данных и обеспечивающий получение информации, необходимой для принятия решений в сфере управления. Такое разнообразие определений отображает широкий диапазон разных типов СППР. Но практически все виды этих компьютерных систем характеризуются четкой структурой, которая содержит три главных компонента, которые составляют основу классической структуры СППР, отличающей ее от других типов ИС:

3 компонента - основа классической структуры СППР

  • интерфейса пользователя, который дает возможность лицу, которое имеет право принимать решения, проводить диалог с системой, используя разные программы ввода, форматы и технологии вывода;

  • подсистемы, предназначенной для сохранения, управления, выбора, отображения и анализа данных;

  • подсистемы, которая содержит набор моделей для обеспечения ответов на множество запросов пользователей, для аналитических задач.

Характеристики DSS (СППР)

Специфические особенности и компонентов обеспечивают в СППР реализацию таких характеристик ИС:

Интерактивность СППР

Означает, что система откликается на разного рода действия, какими человек намеревается повлиять на вычислительный процесс, в частности в диалоговом режиме. Человек и система обмениваются информацией в темпе, который сравнимый с темпом обработки информации человеком. Тем не менее, практика показывает, что очень много руководителей желают и умеют вести прямой диалог с компьютером. Многие из них понимают преимущество взаимодействия с системой через посредника или в режиме косвенного доступа, когда возможная пакетная обработка информации. Вместе с тем свойство интерактивности необходимо для исследования новых проблем и ситуаций, во время адаптивного проектирования прикладных СППР

Интегрированность СППР

Обеспечивает совместимость составных систем относительно управления данными и средствами общения с пользователями в процессе поддержки принятия решений

Мощность СППР

Означает способность системы отвечать на самые важные вопросы

Доступность СППР

Это способность обеспечивать выдачу ответов на запросы пользователя в нужной форме и в необходимое время

Гибкость СППР

Характеризует возможность системы адаптироваться к изменениям потребностей и ситуаций

Надежность СППР

Означает способность системы выполнять нужные функции на протяжении заданного периода времени

Робастность (robustness) СППР

Это степень способности системы восстанавливаться в случае возникновения ошибочных ситуаций как внешнего, так и внутреннего происхождения. Например, в робастной системе допускаются ошибки в входной информации или неисправности аппаратных средств. Хотя между надежностью и робастностью может существовать определенную связь, эти две характеристики системы разные: система, которая никогда не будет возобновляться в случае наступления ошибочных ситуаций, может быть надежной, не будучи робастной, а система с высоким уровнем робастности, которая может восстанавливаться и продолжать работу в многих ошибочных ситуациях, может быть вместе с тем отнесенная к ненадежных, поскольку она не способна заранее, выполнить необходимые служебные процедуры при повреждениях

Управляемость СППР

Означает, что пользователь может контролировать действия системы, вмешиваясь в ход решения задачи.

 

Дополнительно к этой особенности информационной технологии поддержки принятия решений можно указать еще ряд ее отличительных характеристик.

Отличительные характеристики

  • использование больших объемов данных;

  • ориентация на решение плохо структурированных (формализованных) задач;

  • сочетание традиционных методов доступа и обработки компьютерных данных с возможностями математических моделей и методами решения задач на их основе;

  • добавление в систему новых данных происходит относительно редко крупными блоками (например, раз в квартал загружаются данные по итогам квартальных продаж из OLTP-приложения);

  • данные, добавленные в систему, обычно никогда не удаляются;

  • перед загрузкой данные проходят различные процедуры "очистки", связанные с тем, что в одну систему могут поступать данные из многих источников, имеющих различные форматы представления для одних и тех же понятий, данные могут быть некорректны, ошибочны;

  • направленность на непрофессионального пользователя компьютера;

  • небольшое число пользователей (аналитики);

  • высокая адаптивность, обеспечивающая возможность приспосабливаться к особенностям имеющегося технического и программного обеспечения, а также требованиям пользователя.

  • очень часто новый запрос формулируется аналитиком для уточнения результата, полученного в результате предыдущего запроса (интерактивность);

  • скорость выполнения запросов важна, но не критична. Современные компьютерные системы поддержки принятия решений имеют такие характеристики:

  • предоставляет руководителю помощь в процессе принятия решений и обеспечивает поддержку во всем диапазоне контекста структурированных, полуструктурированных и неструктурированных задач, результаты которых трудно спрогнозировать заранее. Ум человека и информация, которая генерируется компьютером, составляют единое целое для принятия решений.

  • поддерживает и усиливает (но не заменяет и не отменяет) соображения и оценки руководителя. Контроль остается за человеком. Пользователь «чувствует себя комфортно» и «как дома» в системе, а не испытывает «запугивание» со стороны системы.

  • повышает главным образом эффективность принятых решений. В отличие от административных информационных систем, в которых акцент делается на максимальной производительности аналитического процесса, в СППР значительно весомым фактором является эффективность процесса принятия решений

  • выполняет интеграцию моделей и аналитических методов со стандартным доступом к данным и выборкой данных. Для предоставления помощи в принятии решения активизируются одна или несколько моделей (математических, статистических, имитационных, количественных, качественных и комбинированных). Содержание БД охватывает историю текущих и предыдущих операций (сильная сторона типичной АИС), а также информацию внешнего характера и информацию о среде

  • простая в работе для лиц, которые не имеют значительного опыта общения с ЭВМ. Системы являются дружескими для пользователей, практически не требуют глубоких знаний вычислительной техники и обеспечивают простое взаимодействие с системой. Имеют встроенные средства обучения и прочие атрибуты программных интерфейсных систем

  • построенная по принципу интерактивного решения задач. Пользователь имеет возможность поддерживать диалог из СППР в беспрерывном режиме, а не ограничиваться заданием отдельных команд с последующим ожиданием результатов

  • ориентированны на гибкость и адаптивность с приспособлением к изменениям среды или подходов к решению задач, которые определяет пользователь. Руководитель может приспособиться к изменяемым условиям сам и соответственно подготовить систему. Но эволюция и адаптация системы должны быть объединены с ее жизненным циклом

  • не должна навязывать пользователю определенного процесса принятия решений. Пользователь должен иметь набор возможностей, чтобы выбирать их в соответствии со стилем его деятельности — стиля «воображаемых моделей».

Перечисленные характеристики требуют особой организации данных, отличных от тех, что используются в OLTP-системах (нормализованные реляционные таблицы). Для того чтобы существующие ХД способствовали принятию управленческих решений, информация должна быть представлена аналитику в нужной форме, то есть он должен иметь развитые инструменты доступа к данным хранилища и их обработки.

По критерию режима анализа данных информационно-аналитические системы подразделяются на две категории:

Статические DSS - СППР

Известны в литературе информационными системами руководителя (Executive Information Systems - EIS). EIS-системы содержат в себе предопределенные множества запросов но, будучи достаточными для повседневного обзора, неспособны ответить на все вопросы к имеющимся данным, которые могут возникнуть при принятии решений. Результатом работы такой системы, как правило, являются многостраничные отчеты, которые нельзя использовать для получения желаемого представления данных и после тщательного изучения которых у аналитика появляется новая серия вопросов

Динамические DSS - СППР

Ориентированы на обработку нерегламентированных (ad hoc) запросов аналитиков к данным. Наиболее глубоко требования к таким системам рассмотрел в 1993 г . E.F.Codd, положившей начало концепции OLAP.

 

Чтобы разобраться в работе СППР, необходимо понять суть проблем, которые она решает, а также организационные процессы, в которые она включена. Так, например, при определении возможности внедрения СППР следует учитывать:

  • структурированность решаемых управленческих задач;

  • уровень иерархии управления фирмой, на котором решение должно быть принято;

  • принадлежность решаемой задачи к той или иной функциональной сфере бизнеса;

  • вид используемой информационной технологии.

Системы поддержки принятия решений получили широкое применение в экономиках передовых стран мира, причем их количество постоянно возрастает. На уровне стратегического управления используется ряд СППР, в частности для долго-, средне- и краткосрочного, а также для финансового планирования, включая систему для распределения капиталовложений. Ориентированные на операционное управление СППР применяются в областях маркетинга (прогнозирования и анализ сбыта, исследования рынка и цен), научно-исследовательских и конструкторских работ, в управлении кадрами. Операционно-информационные применения связаны с производством, приобретением и учетом товарно-материальных запасов, их физическим распределением и бухгалтерским учетом. Обобщенные СППР могут объединять две ли больше из пересчитанных функций.
1   ...   15   16   17   18   19   20   21   22   ...   54


написать администратору сайта