Главная страница
Навигация по странице:

  • ИС руководителя

  • Хранилища данных ( Data warehouse ) и оперативный анализ данных ( On - Line Analytical Processing , OLAP

  • чч. Конспект лекций по дисциплине Хранилища данных для образовательной программы 09. 04. 03 Прикладная информатика


    Скачать 1.29 Mb.
    НазваниеКонспект лекций по дисциплине Хранилища данных для образовательной программы 09. 04. 03 Прикладная информатика
    Дата05.03.2023
    Размер1.29 Mb.
    Формат файлаdoc
    Имя файлаLk.doc
    ТипКонспект лекций
    #969120
    страница2 из 18
    1   2   3   4   5   6   7   8   9   ...   18

    Эволюция корпоративных информационных систем


    Исторически развитие информационных систем предприятий происходило без стратегического плана, снизу вверх по мере осознания необходимости автоматизации того или иного участка производства.

    Условия для автоматизации — появление:

    • информационных технологий

    • аппаратно-программных средств

    • людских ресурсов

    • бюджетных средств.

    В большинстве компаний имеются информационные системы (ИС) на базе СУБД и обслуживают повседневную деятельность отделов компании.

    Такие ИС получили название транзакционных или OLТP (On-Line Transactions Processing).
    Накопление больших объемов данных в последнее время сделали актуальными прикладные задачи, предназначенные для извлечения, сбора и представления конечному пользователю информации, необходимой для анализа текущего состояния дел и прогноза будущего решения. Такие ИС получили название систем поддержки принятия решений. Исторически первыми такими системами стали ИС руководителя (EIS — Executive Information Systems).
    Существует два подхода к интеграции корпоративной информации:

    • децентрализованное объединение источников (схема спагетти) (рис.1а)

    • централизованное объединение источников (рис.1б)



    (рис.1а) (рис.1б)
    Второй подход стимулировал появление технологии хранилищ данных, позволяющей извлекать, преобразовывать и представлять информацию из общей кучи данных.

    Хранилища данных (Data warehouse) и оперативный анализ данных (On-Line Analytical Processing, OLAP) – новые информационные технологии, которые обеспечивают аналитикам, управленцам и руководителям высшего звена возможность изучать большие объемы взаимосвязанных данных при помощи быстрого интерактивного отображения информации на разных уровнях детализации с различных точек зрения в соответствии с представлениями пользователя о предметном пространстве.

    Основная цель хранилищ — создание единого логического представления данных, содержащихся в разнотипных БД или в единой модели корпоративных данных.

    Другими словами:

    Хранилище данных создается с целью:

    Интеграции в одном месте, согласования и, возможно, агрегации ранее разъединенных детализированных данных:

    • Исторических архивов

    • Данных из оперативных систем

    • Данных из внешних источников

    Разделения наборов данных, используемых для оперативной обработки, и наборов данных, используемых для решения задач поддержки принятия решений.

    Обеспечения всесторонней информационной поддержки максимальному кругу пользователей.

    Еще лет пять назад мало, кто слышал об этих технологиях. Сегодня хранилища данных и OLAP становятся неотъемлемой частью современных корпоративных систем поддержки принятия решений. Это одно из наиболее динамично развивающихся направлений индустрии создания программного обеспечения.

    Концепция информационных хранилищ, зародилась в 80-х годах в недрах IBM. Идея хранилищ данных обязана своим развитием многим людям. Хотя эту идею предвосхищали в своих работах многие исследователи, можно смело утверждать, что первой публикацией, посвященной именно хранилищам данных, была статья Девлина (Devlin) и Мэрфи(Murphy) , вышедшая в 1988 году. В 1992 году Уильям Г.Инмон(William H. Inmon), который был техническим директором компании Prism и написал монументальную монографию «Building the Data Warehouse» («Построениехранилищ данных»), в которой дал определение хранилища данных:

    Опр.: Хранилище данных — это предметно-ориентированная, интегрированная, вариантная по времени, не разрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений.

    Имеются 2 определения хранилищ данных:

    В узком смысле: по Инмону.

    В широком:

    Хранилище данных — ориентированная на поддержку управленческих решений автоматизированная система, состоящая из организационной структуры, технических средств, базы или совокупности базы данных (БД) и ПО, которое выполняет, как правило, следующие функции:

    • извлечение данных из разрозненных источников, их трансформация и загрузка в хранилище;

    • администрирование данных и хранилища;

    • извлечение данных из хранилища, аналитическая обработка и представление данных конечным пользователям.

    Ральф Кимбалл (Ralph Kimball), один из авторов концепции хранилищ данных, описывал хранилище данных как «место, где люди могут получить доступ к своим данным» (см., например, Ralph Kimball, «The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses», John Wiley & Sons, 1996 и «The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse», John Wiley & Sons, 2000). Он же сформулировал и основные требования к хранилищам данных:

    • поддержка высокой скорости получения данных из хранилища;

    • поддержка внутренней непротиворечивости данных;

    • возможность получения и сравнения так называемых срезов данных (slice and dice);

    • наличие удобных утилит просмотра данных в хранилище;

    • полнота и достоверность хранимых данных;

    • поддержка качественного процесса пополнения данных.



    1   2   3   4   5   6   7   8   9   ...   18


    написать администратору сайта