Главная страница
Навигация по странице:

  • База данных (БД) и система управления базой данных (СУБД)

  • Предметная область и ее описание

  • Инфологическое моделирование

  • Даталогическое моделирование (иерархическая, сетевая, реляционная модели данных)

  • Лекция Управление данными. Управление данными Тема 1. Информационные системы и их виды


    Скачать 53.55 Kb.
    НазваниеИнформационные системы и их виды
    АнкорЛекция Управление данными
    Дата08.09.2021
    Размер53.55 Kb.
    Формат файлаdocx
    Имя файлаУправление данными Тема 1.docx
    ТипДокументы
    #230537

    Управление данными

    Информационные системы и их виды


    Информационная система (ИС) - это

    • система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующих информационную технологию выполнения установленных функций (ГОСТ 34.003-90 Автоматизированные системы);

    • система, которая организует хранение и манипулирование информацией о предметной области (ГОСТ 34.321-96 Информационные технологии);

    • совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств (ГОСТ Р 50922-2006 Защита информации);

    • организационно упорядоченная совокупность документов и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы (ГОСТ Р 54089-2010  Интегрированная логистическая поддержка).

    Будем понимать под ИС систему для сбора, передачи, обработки, хранения и выдачи информации пользователям и состоящую из следующих основных компонентов: программное и информационное обеспечения, технические средства, обслуживающий персонал.

    ИС по характеру представления и логической организации информации делятся на: фактографические, документальные, геоинформационные.

    По функциям  и решаемым задачам ИС делятся на справочные, поисковые, расчетные, технологические.

    База данных (БД) и система управления базой данных (СУБД)


    Сегодня ни одна ИС не обходится без базы данных и системы управления базой данных.

    База данных (БД) - именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области.

    Система управления базами данных (СУБД) - совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

    Первый этап развития СУБД связан с организацией баз данных на больших машинах типа IBM 360/370, ЕС-ЭВМ и др. В этот период

    • базы данных хранились во внешней памяти центральной ЭВМ,

    • задачи запускались в пакетном режиме,

    • интерактивный режим доступа обеспечивался с помощью терминалов,

    • программы доступа к БД писались на различных языках и запускались как обычные числовые программы,

    • управление распределением ресурсов в основном осуществляются операционной системой (ОС)..

    Второй этап связан с эпохой персональных компьютеров, когда

    • появились программы, которые назывались СУБД и позволяли хранить значительные объемы информации;

    • все СУБД были рассчитаны на создание БД в основном с монопольным доступом.

    Третий этап связан с распространением компьютерных сетей. В этот период

    • обеспечение поддержки полной реляционной модели

    • большинство СУБД рассчитаны на много платформенную архитектуру,

    • практически все СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД, и средства экспорта данных из форматов настольных СУБД второго этапа развития

    Четвертый этап характеризуется появлением новой технологии доступа к данным — интранет (технологии клиент-сервер), когда отпадает необходимость использования специализированного клиентского программного обеспечения и для работы с удаленной базой данных используется стандартный браузер

    Виды СУБД


    Американским комитетом по стандартизации ANSI (American National Standards Institute) предложена трехуровневая система организации СУБД:

    • уровень внешних моделей (определяет отдельные приложения);

    • концептуальный уровень (объединяет данные, используемые всеми приложениями и отражает обобщенную модель предметной области, для которой создавалась база данных);

    • физический уровень (собственно данные, расположенные в файлах на внешних носителях информации).

    Такая организация обеспечивает логическую (возможность изменения одного приложения без корректировки других) и физическую (возможность переноса хранимой информации с одних носителей на другие при сохранении работоспособности всех приложений) независимость уровней СУБД

    По степени распределённости различают

    • локальные СУБД (все части локальной СУБД размещаются на одном компьютере)

    • серверные СУБД (файлы данных располагаются централизовано на сервере).

    В свою очередь серверные СУБД подразделяются на файл-серверные и клиент-серверные. Для файл-серверных характерно размещение данных на файл-сервере, а СУБД  -  на каждом клиентском компьютере, а доступ СУБД к данным осуществляется через локальную сеть.

    К преимуществам таких СУБД следует отнести  низкую нагрузку на процессор файлового сервера, а к недостаткам:

    • потенциально высокую загрузка локальной сети;

    • затруднённость или невозможность централизованного управления данными;

    • затруднённость или невозможность обеспечения таких характеристик как высокая надёжность, высокая доступность и высокая безопасность.

    Недостатки файл серверных систем становятся преимуществами клиент-серверных СУБД.

    В клиент-серверных на сервере вместе с БД располагается СУБД и доступ к данным осуществляется  непосредственно  в монопольном режиме.  Все клиентские запросы обрабатываются СУБД централизованно. В этом случае предъявляются повышенные требования к серверу, но  обеспечивается

    • потенциально более низкая загрузка локальной сети;

    • удобство централизованного управления данными;

    • такие характеристики как высокая надёжность, высокая доступность и высокая безопасность.

    Примеры серверных СУБД - Oracle, IBM DB2, MS SQL Server, Sybase, My SQL

    Предметная область и ее описание


    Проектирование информационной системы, составным компонентом которой является база данных,  начинается с анализа предметной области. Предметная область (ПО) – это область применения конкретной БД. Предметной областью может быть сфера управления предприятиями, транспорт, медицина, научные исследования и т.п.

    Прежде всего, должны быть определены границы предметной области и сформулирована главная цель проектирования базы данных.

    При определении границ ПО используют :

    • подход «от реального мира», когда с помощью экспертов определяются границы ПО (состав объектов, их свойства и отношения с учетом существующего положения дел  и развития системы);

    • подход «от запросов пользователей», который широко используется для уточнения границ ПО и наибольшее применение получает в период использования ИС, когда накапливается достаточно информации  о содержании запросов и необходимо выполнить коррекцию границ ПО и модели системы.

    Будем говорить, что предметная область БД определена, если известны существующие в ней объекты, их свойства и отношения (связи).

    Объект – это то, о чем должна накапливаться информация. Выбор объектов осуществляется в соответствии с целевым назначением.  Объекты могут быть атомарными или составными, причем один и тот же объект может быть в одном приложении выступать как атомарный, в другом – как составной.

    Атомарный объект — объект определенного типа, дальнейшее разложение которого на более мелкие объекты в рамках данной предметной области невозможно. Составные объекты включают в себя множества объектов

    Каждый объект в конкретный момент времени характеризуется состоянием, которое описывается набором свойств и связей его  с другими объектами.

    Свойства объекта могут не зависеть от его связей с другими объектами, то есть являются локальными, а могут и зависеть. В последнем  случае они являются реляционными.

    Между объектами ПО могут существовать отношения подчиненности. Каждая связь (отношение)  между объектами по числу входящих в нее объектов характеризуется степенью n=2.3, …, k (бинарная, териарная, …, k-арная).

    Чтобы отобразить объекты  в информационную сферу, необходимо определить:

    • какие объекты важны для данного применения;

    • какие свойства могут иметь эти объекты;

    • какие связи существуют между объектами;

    • какие имена можно присвоить отдельным составляющим объектной системы.

    Таким образом, анализ предметной области позволяет определить ее границы и лежит в основе проектирования состава элементов информационной модели БД. 

    Инфологическое моделирование


    Цель инфологического проектирования -создание структурированной информационной модели предметной области, для которой разрабатывается БД.

    Определим требования к такой модели:

    1. обеспечение естественных для человека способов сбора и представления информации, которую предполагается хранить в создаваемой БД;

    2. адекватное отображение моделируемой предметной области (корректность схемы БД);

    3. простота и удобство использования на следующих этапах проектирования, то есть поддерживается известными СУБД (сетевые, иерархические, реляционные и др.);

    4. использование языка описания, понятного проектировщикам БД, программистам, администратору и будущим пользователям.

    Инфологическая модель  выражает информацию о предметной области в виде,  независимом от используемой СУБД. Ее называют  также семантической, смысловой или концептуальной.

    На этапе инфологического моделирования базы данных широко используется модель «сущность-связь». Модель «сущность-связь» предложена в 1976 г  Питером Пин-Шен Ченом американским профессором компьютерных наук.

    Составные элементы инфологической модели

    • сущности,

    • их атрибуты и

    • связи между ними

    Сущность – некоторая абстракция реально существующего предмета, объекта, явления.

    Тип сущности – набор однородных личностей, предметов, событий или идей, выступающих как целое.

    Экземпляр сущности относится к конкретному объекту

    Атрибут – это поименованная  характеристика сущности.  Атрибуты используются для определения того, какая информация должна быть собрана о сущности, то есть  для описания свойства сущности. Это следует из определения. Но атрибут  также используется:

    • для однозначной идентификации конкретного экземпляра сущности (ключ – минимальный набор атрибутов, по значениям которых можно однозначно найти требуемый экземпляр сущности);

    • для представления связей между сущностями, характеризует те объекты между которыми существует связь (отношение).

    Связь – средство представления отношений между сущностями.

    Графическое представление модели «сущность-связь» носит название ER(Entity Relatioship) -диаграммы.

    Множества сущностей изображаются в виде прямоугольников, а  множества отношений (связей) - в виде ромбов. Если сущность участвует в отношении, они связаны линией. Атрибуты изображаются в виде овалов и связываются линией с одним отношением или с одной сущностью (см.рисунок 1).



    Рисунок 1

    Даталогическое моделирование (иерархическая, сетевая, реляционная модели данных)


    Даталогическая модель разрабатывается на основе инфологической модели предметной области с учётом конкретной реализации СУБД.

    Существуют  различные виды даталогических моделей - иерархическая, сетевая, реляционная.

    Иерархическая модель представляет данные в виде иерархии и ориентирована на описание объектов, находящихся между собой  в отношении подчинения (см.рисунок 2).

    Иерархические модели представляются  в форме графов – форме деревьев.  Дерево – это связный граф, который не содержит циклов (корень дерева – вершина, в которую не заходит ни одно ребро). На верхнем уровне дерева в имеется один узел – “корень”, на следующем уровне располагаются узлы, связанные с этим корнем. Вершины графа – типы сущностей, а дуги – типы связей между сущностями.

    Поиск данных в иерархической системе всегда начинается с корня.

    Основные достоинства этой модели - простота описания иерархических структур реального мира и быстрое выполнение запросов,



    Рисунок 2 – Иерархическая модель

    Сетевая модель позволяет описывать более сложные виды взаимоотношений между данными, чем иерархическая, но расширение возможностей достигается за счет большей сложности реализации самой модели и трудности манипулирования данными. Эти модели данных широко применялась в 70-е годы в первых СУБД.

    Сетевая модель также использует графовую форму представления данных, но сетевой модели соответствует произвольный граф (возможно имеющий циклы и петли), см.рисунок 3.

    а)       

    б)         

    Рисунок 3 – Примеры сетевых  моделей данных

    В узлах графа помещаются типы записей, а ребра интерпретируются как связи между типами записей, причем объект-потомок может иметь не одного, а любое количество объектов-предков. Кроме того, допускаются любые связи-отношения, в том числе и одноуровневые

    Сетевые модели не распространены из-за отсутствия языков, которые бы позволили в разных прикладных ИС одинаковым образом описывать данные сетевой организации.

    Реляционная база данных представляет собой хранилище данных, организованных в виде двумерных таблиц .

    Любая таблица реляционной базы данных состоит из строк (называемых записями) и столбцов (называемых полями).

    Строки таблицы содержат сведения о представленных в ней фактах (или документах, или людях, одним словом, об однотипных объектах). На пересечении столбца и строки находятся конкретные значения содержащихся в таблице данных.

    Данные в таблицах удовлетворяют следующим принципам:

    • каждое значение на пересечении строки и столбца должно быть атомарным;

    • значения данных в одном и том же столбце должны принадлежать к одному и тому же типу;

    • каждая запись в таблице уникальна (не существует двух записей полностью совпадающих, что определяется ключом);

    • каждое поле имеет уникальное имя ;

    • последовательность полей в таблице несущественна;

    • последовательность записей в таблице несущественна.

    Поле, указывающее на запись в другой таблице, связанную с данной записью, называется внешним ключом.

    Связь между двумя таблицами устанавливается путем присвоения значений внешнего ключа одной таблицы значениям первичного ключа другой.

    Достоинство реляционной модели данных заключается в простоте, понятности и удобстве физической реализации на ЭВМ.


    написать администратору сайта