|
ЛЕКЦИИ ПО ИНФОРМАТИКЕ II. Лекции по информатике ii теория баз данных база данных (БД)
ЛЕКЦИИ ПО ИНФОРМАТИКЕ II
ТЕОРИЯ БАЗ ДАННЫХ
База данных (БД) – это совокупность связанных структурированных данных некоторой предметной области, правила, организации которых основаны на общих принципах ввода, хранения и обработки.
Предметная область – это часть реального мира, подлежащая изучению для организации управления и в конечном счете для автоматизации.
Предметная область включает в себя совокупность взаимосвязанных сущностей.
Сущность – это любой различимый объект, информацию о котором необходимо хранить в базе данных.
Атрибут (признак, свойство) – это поименованная характеристика сущности.
Атрибут имеет название и значение.
Например:
Предметная область: Поликлиника
Сущности: врачи, пациенты, диагнозы, специальности врачей и т.д.
Структурирование – это соглашение о способе предоставления данных.
Структурирование предназначено для наиболее удобной формы представления данных для манипулирования ими.
Система управления базами данных (СУБД) – это комплекс программных и языковых свредств, необходимых для создания базы данных, поддержании их в актуальном состоянии и организации поиска в них требуемой информации и предоставление ее в удобном для воспроизведения виде.
Целостность – свойство базы данных, которое означает, что в ней содержится полная непротиворечивая и адекватно отражающая предметную область информация.
ВИДЫ МОДЕЛЕЙ ДАННЫХ
Иерархическая модель
Данные распределены по уровням подчиненности.
Состав:
- элементы: узлы;
- распределения по уровням: дуги.
Свойства: Каждый узел нижнего уровня связан только с одним узлом верхнего уровня; Каждый уровень верхнего уровня связан с несколькими узлами нижнего уровня.
Узлы последних уровней не имеют подчиненных связей; Каждый узел имеет имя (идентификатор).
Отношения: 1:М
Пример: Иерархическое дерево папок
Сетевая модель
Свойства:
Каждый узел одного уровня связан с любым количеством узлов другого уровня. Нет корневого узла
Отношения: М:М
Реляционная модель
Совокупность таблиц с установленными между ними связями.
Реляционная: «отношения».
Каждая таблица описывает одну сущность.
Столбец – поле;
Заголовки полей – логическая упорядоченная структура.
Строка – запись, отражает конкретное значение атрибутов для конкретных экземпляров сущности.
Свойства:
Каждый элемент таблицы – один элемент данных; Все элементы одного столбца (поля) имеют одинаковый тип, формат и смысл. Каждое поле имеет уникальное имя. Записи в таблице являются уникальными. Порядок следования записей – произвольный. Каждая таблица должна иметь ключ.
Первичный ключ – это поле или совокупность полей, которые единственным образом определяют каждую строку (запись) в таблице.
Простой ключ – состоит из одного поля;
Составной ключ – состоит из нескольких полей.
В качестве ключа нельзя выбирать поля, значения которых могут повторяться.
Разные таблицы, входящие в модель данных, могут характеризоваться разным количеством полей и записей.
Действия, выполняемые над таблицами:
Сортировка данных (например, по алфавиту); Выборка данных по группам (например, по датам рождения или по фамилиям); Поиск записей (например, по фамилиям).
ИНФОРМАЦИОННО-ЛОГИЧЕСКАЯ МОДЕЛЬ ДАННЫХ
- это графическая схема, по которой можно составить наглядное представление о сущностях предметной области и атрибутах, а также между сущностями.
Каждая сущность имеет ключевые и описательные атрибуты.
Графическое изображение сущности:
- изображается в виде прямоугольника;
- указывается название сущности;
- указывается атрибуты сущности.
Типы связей:
«Один-к-одному» (1:1); «Один-ко-многим» (1:М); «Многие-ко-многим» (М:М).
Связь «Один-к-одному» - это соответствие одной записи в таблице «А» только одной записи таблицы «В» и наоборот.
- имеют одинаковое количество записей;
- установлено взаимное однозначное соответствие
Например: Факультет - Деканат
Связь «Один-ко-многим» - это соответствие одной записи в таблице «А» нескольким записям таблицы «В», и одной записи в таблице «В» только одной записи таблицы «А».
Например: Дом - квартиры
Связь «Многие-ко-многим» - это соответствие нескольких записей в таблице «А» нескольким записям таблицы «В», и наоборот.
Например: Маршруты городского транспорта – остановки. НОРМАЛИЗАЦИЯ ОТНОШЕНИЙ
- это формальный аппарат ограничений на формирование отношений (таблиц), который позволит устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод корректировку) базы данных.
Основные цели информационно-логического проектирования:
сокращение избыточности хранимых данных, экономия объема используемой памяти, уменьшение затрат на многократные операции обновления избыточных копий, устранение возможных противоречий из-за хранения в разных местах сведений об одном и том же объекте.
ПЕРВАЯ НОРМАЛЬНАЯ ФОРМА
Таблица считается нормализованной или приведенной к первой нормальной форме (1НФ), если все значения полей простые (т.е. неделимые).
Каждый элемент таблицы – один элемент данных.
В результате применения 1 НФ возникают:
избыточность данных; аномалии добавления и модификации.
Пример:
ВТОРАЯ НОРМАЛЬНАЯ ФОРМА (2 НФ)
Функциональная зависимость – это набор описательных реквизитов информационного объекта логически связанных с общим, для них, ключом.
Полная функциональная зависимость – это каждый не ключевой атрибут может завесить только от полного составного ключа, и не зависит от отдельных его частей.
Таблица находиться во второй нормальной форме, если она находиться в 1 НФ, и каждый не ключевой атрибут функционально полно зависит от ключа составного ключа.
Если отношение имеет простой ключ и находиться в 1 НФ, то требования 2НФ удовлетворяются автоматически.
При наличии составного ключа отсутствие полной функциональной зависимости приводит к появлению избыточности данных и аномалиям работы с данными.
Правила приведения таблицы ко 2НФ.
Атрибуты, зависящие от части составного ключа, и сама эта часть, выносятся в отдельную (новую) таблицу и исключаются из исходной; Ключом новой таблицы становиться часть ключа исходной, от которой имеет место функционально неполная зависимость; Между новой и исходной таблицами устанавливается связь типа 1:М
Пример:
ТРЕТЬЯ НАРМАЛЬНАЯ ФОРМА (3НФ)
Транзитивная зависимость – это такое состояние таблицы при котором описательный реквизит А зависит от ключа К, а другой описательный реквизит В зависит от первого описательного реквизита А.
Свойство транзитивности приводит к дублированию данных.
Отношение будет находиться в 2НФ, если оно находиться в 2НФ и каждый не ключевой атрибут не транзитивно зависит от первичного ключа.
Правила приведения таблицы ко 3НФ.
Атрибуты, находящиеся в транзитивной зависимости между собой, выносятся в отдельную, новую таблицу и исключаются из исходной; Ключом новой таблицы становятся те атрибуты исходной, от которых была обнаружена транзитивная зависимость; Между новой и исходной таблицами устанавливается связь 1:М.
Пример:
УСТРАНЕНИЕ СВЯЗИ «МНОГИЕ-КО-МНОГИМ»
Связи «многие-ко-многим» в базах данных на прямую не устанавливаются, следовательно, требуется преобразовать их в связи «один-ко-многим».
Пример:
Правила преобразования М:М к 1:М
Требуется создать новую (вспомогательную) таблицу; Между исходной и новой таблицей установить связи типа 1:M; Из модели удалить связь М:М.
ПРЕИМУЩЕСТВА И НЕДОСТАТКИ РЕЛЯЦИОННОЙ МОДЕЛИ\
Достоинства
Структурная независимость
Изменение в структуре реляционной БД не влияет на доступ к данным со стороны СУБД.
Концептуальная простота
Реляционная модель позволяет полностью избавиться от подробностей физического хранения данных.
Нерегламентированные запросы
Применение гибких и унифицированных механизмов создания запросов
Мощная система управления БД
Недостаток:
Высокие требования к оборудованию и программному обеспечению.
Информатика II -
|
|
|