Главная страница
Навигация по странице:

  • Системы баз данных.

  • Система управления базами данных (СУБД)

  • Основные этапы проектирования БД: Трёхуровневая архитектура ANSI/SPARC.

  • Концептуальный уровень

  • Внутренний уровень

  • Все модели данных принято делить на две категории

  • Большинство моделей – сильно типизированные.

  • Базы данных

  • Атрибуты

  • Отношения: сущности.

  • Степень отношения (или арность кортежа)

  • Основные компоненты

  • Роль сущности в связи ( r )

  • Понятие данных


    Скачать 1.56 Mb.
    НазваниеПонятие данных
    Дата21.01.2021
    Размер1.56 Mb.
    Формат файлаpdf
    Имя файлаBD-Bilety-2016.pdf
    ТипДокументы
    #170274
    страница1 из 9
      1   2   3   4   5   6   7   8   9

    1. Основные понятия: определение данных, файловые системы, системы баз данных. Основные этапы проектирования баз данных: трехсхемная архитектура ANSI/SPARC.
    Понятие данных. Восприятие реального мира можно соотнести с последовательностью разных явлений. Эти явления всегда стремились описать. Такие описания внешних явлений образуют данные – они хранятся и обрабатываются.
    Описание внешних явлений (данных) включает два элемента:
    • разрозненные факты (Значения – например, просто число 187, или дата 11.02.2013);
    • смысл данных (интерпретация данных, их семантика – смыл значения, например, вес груза в кг, или дата первой лекции).
    Информация – соединение фактов и их семантики.
    Описание данных на естественном языке позволяет факты и их семантику фиксировать вместе, примеры:
    Вес перевозимого груза 187 кг; первая лекция по курсу состоится 11.02.2013…
    Наиболее часто используемый на практике способ представления информации – табличный; пример - расписание занятий.
    Файловые системы. Для файловых систем свойственно разделение данных и их семантики:
    Данные – в файлах, семантика – в прикладных программах. Доступ к данным осуществляется только через прикладные программы; никаких иных способов осмысленного доступа к данным, кроме как через приложение, нет.
    Файловые системы можно определить, как набор программ, которые выполняют для пользователя некоторые операции, связанные с обработкой данных. При этом каждая программа определяет свои собственные данные и управляет ими.
    Системы баз данных. База данных (БД) – совместно используемый набор логически связанных данных и их описаний, предназначенный для удовлетворения информационных потребностей организации.
    Система управления базами данных (СУБД) – это программное обеспечение, осуществляющее управление БД.
    Системы баз данных - Компьютеризованная система хранения записей: база данных, СУБД, аппаратура и люди.
    Основные этапы проектирования БД: Трёхуровневая архитектура ANSI/SPARC.
    Первая попытка создания стандартной терминологии и общей архитектуры
    СУБД была предпринята в 1971 году. Она была создана после конференции
    CODASYL (Conference on Data Systems and Languages — Конференция по языкам и системам данных), прошедшей в этом же году. Комитет
    ANSI/SPARC (American National Standard Institute — ANSI, Standards Planning and Requirements Committee - SPARC) признал необходимость использования трехуровневого подхода к созданию системного каталога.
    В соответствии с этим подходом используются три уровня абстракции описания элементов данных; они формируют трехуровневую архитектуру, охватывающую внешний, концептуальный и внутренний уровни (см. рис.).
    Уровень, на котором данные воспринимаются пользователями, называется внешним уровнем(external level), тогда как
    СУБД и операционная система воспринимают данные на внутреннем уровне(internal level). Концептуальный уровень
    (conceptual level) представления данных предназначен для отображениявнешнего уровня на внутренний и обеспечения необходимой независимостидруг от друга.
    Внешний уровень - представление базы данных с точки зрения пользователей. Описывает ту часть базы данных, которая относится к каждому пользователю. Внешнее представление содержит только те сущности, атрибуты и связи "реального мира", которые интересны пользователю. Другие сущности, атрибуты или связи, которые ему неинтересны, также могут быть представлены в базе данных, но пользователь может даже не подозревать об их существовании.
    Концептуальный уровень - обобщающее представление базы данных. Этот уровень описывает то, какиеданные хранятся в базе данных, а также связи, существующие между ними. На концептуальном уровне представлены следующие компоненты:
    • все сущности, их атрибуты и связи;
    • накладываемые на данные ограничения;
    • семантическая информация о данных;
    • информация о мерах обеспечения безопасности и поддержки целостности данных.
    БД
    Внутренняя схема
    Концептуаль- ная схема
    Представле ние 1
    Представле ние 2
    Представле ние 3
    Пользова- тель 1
    Пользова- тель 2
    Пользова- тель 3
    Внешний уровень
    Концептуальный уровень
    Внутренний уровень
    Физическая организация данных

    Однако уровень не содержит никаких сведений о методах хранения данных. Например, описание сущности должно содержать сведения о типах данных атрибутов (целочисленный, действительный или символьный) и их длине
    (количестве значащих цифр или максимальном количестве символов), но не должно включать сведений об организации хранения данных, например, об объеме занятого пространства в байтах.
    Внутренний уровень - физическое представление базы данных в компьютере. Уровень описывает, какинформация хранится в базе данных. Он содержит описание структур данных и организации отдельных файлов, используемых для хранения данных на запоминающих устройствах. На этом уровне осуществляется взаимодействие СУБД с методами доступа операционной системы (вспомогательными функциями хранения и извлечения записей данных) с целью размещения данных на запоминающих устройствах, создания индексов, извлечения данных и т.д. На внутреннем уровне хранится следующая информация:
    • распределение дискового пространства для хранения данных и индексов;
    • описание подробностей сохранения записей (с указанием реальных размеров сохраняемых элементов данных);
    • сведения о размещении записей;
    • сведения о сжатии данных и выбранных методах их шифрования.
    Ниже внутреннего уровня находится физический уровень(physical level), который контролируется операционной системой, но под управлением СУБД. Однако функции СУБД и операционной системы на физическом уровне не вполне четко разделены и могут варьироваться от системы к системе.
    Цели проектирования:
    • понизить избыточность данных,
    • повысить надежность и достоверность данных (т.е. устранить некоторые аномалии).
    Применительно к реляционным базам данных это сводится к решению следующих вопросов:
    • какие отношения включать в состав базы данных,
    • сколько отношений включить в состав базы данных.

    2. Определение модели данных. Понятие базы данных. Базовые структурные компоненты модели данных: домены и атрибуты; отношение сущности, схема отношения; отношение связи.
    Модель данных – это интегрированный набор понятий для описания данных, связей между ними и ограничений, накладываемых на данные в некоторой организации.
    Все модели данных принято делить на две категории:
    1. Сильно типизированные (все данные относятся к конкретным категориям);
    2. слабо типизированные (данные приписываются к той или иной категории в каждом конкретном случае) модели данных.
    Большинство моделей – сильно типизированные. В таких моделях можно выделить следующие структурные компоненты:
    • категории
    • свойства категорий
    • связи между категориями
    Схема – совокупность именованных категорий, их свойств и связей между ними. Пример:
    ВОДИТЕЛЬ (Имя, Возраст, Стаж работы) – категория со свойствами.
    АВТОМОБИЛЬ (Модель, Гос. номер, Дата приобретения)
    УПРАВЛЯЕТ (ВОДИТЕЛЬ, АВТОМОБИЛЬ)
    Базы данных - набор сведений, хранящихся некоторым упорядоченным способом.
    База данных – совокупность реализаций, полученных в результате некоторых преобразований и удовлетворяющих одной и той же схеме.
    Домены – это множества, элементы которых более или менее однородны. Домены можно рассматривать как множества, из которых черпаются значения свойств семантически значимых объектов.
    Пример: для категории СЛУЖАЩИЙ определено свойство Зарплата, значит, можно определить домен, например, шестизначных чисел, из которого будут черпаться значения данного свойства.
    Домен представляет собой множество значений, не имеющих смысловой окраски (домен шестизначных чисел можно использовать для абсолютно разных категорий).
    Атрибуты – это именованные домены, представляющие семантически значимые объекты.
    Множество – это собрание правильно идентифицированных объектов, удовлетворяющих правилу принадлежности.
    Правила (условия) принадлежности могут быть определены по- разному:

    ASCII- коды символов; или

    Целые положительные десятичные числа; или

    Вещественные числа в диапазоне от 0 до 1; и т.п.
    Правила принадлежности позволяют для каждого элемента определить, относится оно к данному множеству или нет.
    Чтобы определить множество, необходимо определить для него правила принадлежности.
    Множества характеризуются двумя важными свойствами:
    • дефиниционное по своей природе (дает определение), называется интенсионалом множества. Например, определение множества {а / а – есть четное целое положительное} задает интенсионал множества.
    • репрезентативное по своей природе (термин, обозначающий представительность выбранной части данных по отношению ко всей совокупности данных, из которых была сделана выборка) и носит название расширения (или
    экстенсионала) множества. Например, представление множества {2, 4, 6, 8, ...} задает одно из возможных расширений множества и специфицирует актуальную реализацию множества путем явного указания его элементов.
    Понятие множества не связано с какой-либо упорядоченностью.

    Однородные множества, элементы которых более или менее однородны, в моделировании данных носят название
    доменов. Именованные домены, представляющие семантически значимые объекты, называются атрибутами. Атрибут есть интенсионал домена, а значения атрибута - его расширение (экстенсионал). Атрибуты и их значения являются интерпретацией объектов реального мира и их свойств.
    Отношения: сущности. Агрегат, построенный на множествах, определяется как отношение.
    Математическое отношение – это множество, выражающее соответствие между двумя или более множествами
    (является агрегатом двух или более множеств). Пусть дана некоторая совокупность доменов D1, D2, …, Dm,. Отношение, определенное на доменах D1, D2, …, Dm, есть множество упорядоченных кортежей , таких, что d1 ∈ D1, d2
    ∈ D2, …, dm ∈ Dm. Таким образом, отношение определяет соответствие между множествами.
    Отношение можно охарактеризовать степенью и мощностью.

    Степень отношения (или арность кортежа) – характеристика, относящаяся к интенсионалу отношения; количество образующих данное отношение множеств.

    Мощность отношения – характеристика, относящаяся к экстенсионалу отношения; количество элементов в конкретной реализации отношения.
    Схема отношения – это именованный список пар <имя атрибута>:<имя домена>, имя которого задает имя отношения:
    R(A1:D1, A2:D2, …, Am: Dm, где R – имя отношения, Ai – имена атрибутов, Di – имена доменов).
    Отношение, определенное таким образом, определяет тип сущности.
    Отношения: связи. - Агрегат, построенный на других отношениях, рассматривается как связь между этими отношениями.
    Для таких агрегатов, наряду с интенсионалом и экстенсионалом, рассматривается еще одно важное свойство отношений
    – отображение между отношениями, на которых построен агрегат.
    Рассмотрим бинарное отношение связи R, построенное на двух множествах – отношениях сущностей S1 и S2: R = { | s1i ∈ S1, s2j ∈ S2}. Данное отношение связи определяет два отображения:
    • прямое – R : S1

    S2
    • обратное – R-1 : S2

    S1
    Важной характеристикой отображения является кардинальное число. Оно определяется количеством элементов одного множества, связанных с одним элементом другого множества.
    Так, для прямого отображения R : S1

    S2, кардинальное число определяется количеством элементов множества S2, связанных с одним элементом множества S1; для обратного отображения R-1 : S2  S1 – количеством элементов множества S1, связанных с одним элементом множества S2.
    Так как с разными элементами одного множества может быть связано разное количество элементов другого множества, отображения обычно характеризуются минимальным и максимальным кардинальными числами. Поскольку отношение связи определяет два отображения, используется следующая нотация: R (S1 (m1, n1): S2 (m2, n2))
    Запись S1 (m1, n1) определяет минимальное (m1) и максимальное (n1) кардинальные числа отображения S2

    S1.
    Соответственно, запись S2 (m2, n2) определяет минимальное (m2) и максимальное (n2) кардинальные числа отображения S1

    S2. Смысл такой записи:
    • каждый элемент из S1 связан минимум с m2, максимум с n2 элементами из S2,
    • каждый элемент из S2 связан минимум с m1, максимум с n1 элементами из S1.
    Если на отображения не наложены никакие ограничения, считается, что минимальное и максимальное кардинальные числа не определены: R (S1 (0, ∞): S2 (0, ∞)), или R (S1: S2). Это означает, что элемент из S2 может быть связан с любым количеством элементов из S1, и наоборот.
    Наложив те или иные ограничения на минимальное и максимальное кардинальные числа, можно получить различные типы отображений. Пусть, например, определены сущности СТУДЕНТ и КУРС (курс по выбору). Каждый студент должен выбрать один из курсов, но не более трех. На каждый курс должны быть зачислены не менее 5 и не более 100 студентов.
    Тогда получаем следующее отношение связи: ВЫБИРАЕТ (СТУДЕНТ (5, 100): КУРС (1, 3)).

    Рассмотрим некоторые особые типы отображений.
    1. Пусть имеем следующее отношение связи: R ( S1 ( 0, ∞ ) : S2 (1, ∞ ) ).
    Рассмотрим отображение S1

    S2. Минимальное кардинальное число данного отображения равно 1. Это означает, что каждый элемент из S1 связан, по крайней мере, с одним элементом из S2 (или отображается, по крайней мере, одним элементом S2). Такое отображение называется
    полностью определенным на S1, а соответствующее ограничение называется ограничением по существованию: для существования объекта в S1 необходимо, чтобы он был связан с объектом из S2 (рисунок 1 справа).
    2. Пусть имеем следующее отношение связи: R ( S1 ( 0, ∞ ) : S2 ( 0, 1 ) ).
    Рассмотрим отображение S1

    S2. Максимальное кардинальное число данного отображения равно 1. Это означает, что каждый элемент из S1 связан не более чем с одним элементом из S2 (или отображается не более чем одним элементом S2). Такое отображение называется неполным
    функциональным отображением, так как минимальное кардинальное число отображения равно 0, т.е. не все элементы из S1 отображаются в S2 (рисунок 2 справа).
    3. Пусть имеем следующее отношение связи: R ( S1 ( 0, ∞ ) : S2 ( 1, 1 ) ).
    Рассмотрим отображение S1

    S2. И минимальное, и максимальное кардинальные числа данного отображения равны 1. Это означает, что каждый элемент из S1 связан в точности с одним элементом из S2 (или отображается точно одним элементом S2). Такое отображение называется полным
    функциональным отображением (рисунок 3 справа).
    Связи, для которых хотя бы одно отображение является функциональным (полным или неполным), часто называют связями типа 1 : n, или «один ко многим». Связи, в которых оба отображения являются нефункциональными, называют связями типа n : n, или «многие ко многим».

    3. Модель данных "сущность-связь" П.Чена.
    Предложена П. Ченом (P. Chen) в 1976 г. Предложил 4 уровня представления информации:
    1. информация, относящаяся к объектам (сущностям) и связям, как она существует в нашем представлении
    2. структура информации – организация информации, в которой объекты и связи представлены данными
    3. структура данных, независимая от способа доступа
    4. структура данных, зависимая от способа доступа
    Модель данных «сущность – связь» используется на 1-м и 2-м уровнях представления информации.
    Основные компоненты: Сущность, Связь, Атрибут.
    Сущность – нечто, принадлежащее объективной реальности, облаченное в материальную форму или форму идеи; любой объект, который может быть идентифицирован некоторым способом, отличающим его от других объектов, и информацию о котором надо хранить в базе данных.
    В соответствии с определением сущности, они обладают некоторыми свойствами, позволяющими их идентифицировать.
    Следовательно, каждая сущность относится к некоторому отличному от других множеству сущностей. Например, множество сущностей (Е) – {Москва, Орел, Курск, …}. Для каждого множества сущностей определяются некоторые свойства, общие для всех сущностей из множества. Если некоторая сущность относится к определенному множеству сущностей, то эта сущность обладает свойствами, общими для всех сущностей этого множества.
    Тип сущности – некоторое обобщенное представление однородных сущностей. Для нашего примера – ГОРОД.
    Экземпляр сущности – конкретный элемент из множества (е), например, Курск.
    С каждым множеством сущностей связывается предикат, позволяющий проверить, принадлежит ли сущность данному множеству. Следовательно, предикат входит в число свойств, общих для множества сущностей.
    Связь – некоторая ассоциация, устанавливаемая между двумя или более сущностями. Для связи определяются:

    Множество связей – это математическое отношение между n сущностями, каждая из которых относится к некоторому множеству сущностей: R = {1
    , e
    2
    , ..., e n
    > | e
    1

    E
    1
    , e
    2

    E
    2
    , ..., e n

    E
    n
    }

    Тип связи – определяется как ассоциация типов сущностей.

    Экземпляр связи
    Роль сущности в связи (r) – это функция, которую сущность выполняет в данной связи: 1
    /e
    1
    , r
    2
    /e
    2
    , ..., r n
    /e n
    >.
    Упорядочение сущностей в определении связи может отсутствовать, если в связи явно указаны роли сущностей.
    Пример: <проект/e
    1
    , исполнитель/e
    2
    >
    В базе данных организации необходимо хранить информацию о сущностях и связях, интересующую данную организацию. Эту информацию получают путем наблюдения или измерения и выражают множеством пар "атрибут- значение".
    Значения классифицируются и объединяются в некоторые множества значений. С каждым множеством значений связывается предикат,позволяющий проверить, принадлежит ли значение этому множеству.
      1   2   3   4   5   6   7   8   9


    написать администратору сайта