ПЛЕЩ. Учебное пособие содержит
Скачать 3.78 Mb.
|
1.5.2. Методы нормализации и денормализации отношенийМетод нормализации отношения (таблицы) это процесс постепенного улучшения отношения (таблицы) путем последовательного перевода отношения (таблицы) из ненормализованной формы в первую, во вторую, в третью (иногда в четвертую и пятую) нормальные формы. Проектирование таблиц можно начинать с построения концептуальной модели и определения состава атрибутов для каждого объекта. Затем все атрибуты можно объединить в одну исходную таблицу. Можно сразу, без построения концептуальной модели, сформировать исходную таблицу. Исходная таблица в дальнейшем нормализуется путем расщепления на взаимосвязанные новые таблицы. Таким образом, можно построить или уточнить существующую концептуальную модель базы. Определение. Таблица находится не в нормализованной форме, если существует ячейка, в которой находится несколько значений. Пример ненормализованной таблицы ИЗДЕЛИЯ (Код изделия, список деталей). Может встретиться изделие, которое содержит список из нескольких деталей. Виды зависимостей между атрибутами Атрибут (группа атрибутов) В функционально зависит от атрибута (группы атрибутов) A, если каждому значению A соответствует одно значение B. Такая зависимость изображается в виде A-->B (Табельный номер -->Фамилия сотрудника). Если существует функциональная зависимость вида A-->B и B-->A, то имеет место функциональная взаимозависимость, которая изображается в виде A<-->B (Табельный номер <-->Номер паспорта сотрудника). Частичная функциональная зависимость это зависимость неключевого атрибута от части составного ключа, а не от всего ключа. Полной функциональной зависимостью называется зависимость неключевого атрибута от всего ключа. Атрибут C транзитивно зависит от атрибута А, если выполняются условия A-->B и B-->C, но обратная зависимость отсутствует. Многозначные зависимости вида 1:M, M:1, M:M между атрибутами A и B изображаются в виде A-->>B, A<<--B и A<<-- >>B соответственно. Первая нормальная форма (1НФ) Определение. Таблица находится в первой нормальной форме, если в каждой ее ячейке находится не более одного значения. Пример. Преобразуем таблицу “ИЗДЕЛИЯ” из предыдущего примера в таблицу вида: ИЗДЕЛИЯ (код изделия, деталь). Тогда, за счет дублирования кода изделия, в каждой строке в колонке “Деталь” будет стоять только одно значение наименование кода детали. Новая таблица будет в первой нормальной форме. Покажем процесс нормализации на следующей исходной таблице: ВЫПУСК ИЗДЕЛИЙ (Код подразделения (KP), наименование подразделения (NP), код изделия (KI), наименование изделия (NI), код типа изделия (KTI), наименование типа изделия (NTI), дата выпуска (DVI), количество (KVI), себестоимость изделия (SI)). Ключевые атрибуты первичного ключа подчеркнуты. Эта таблица находится в первой нормальной форме. Рассмотрим аномалии (недостатки) первой нормальной формы.
Для устранения этих недостатков продолжим процесс нормализации. Вторая нормальная форма (2НФ) Определение. Таблица находится во второй нормальной форме, если она уже находится в первой нормальной форме, и все неключевые атрибуты целиком зависят от всего ключа, а не от отдельной его части. Рассмотрим нашу таблицу на предмет выявления неключевых атрибутов, зависящих только от части ключа. Атрибут “Наименование подразделения” зависит только от атрибута “Код подразделения” и не зависит от атрибутов “Код изделия” и “Дата выпуска”. Поэтому его следует удалить из таблицы. Чтобы не потерять информацию о подразделении создадим новую таблицу “ПОДРАЗДЕЛЕНИЯ” и в нее включим удаляемый атрибут “Наименование подразделения” вместе с ключевым атрибутом “Код подразделения” (иначе потеряется связь с таблицей “ВЫПУСК ИЗДЕЛИЙ”) и получим таблицу вида: ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения). Атрибут “Наименование изделия” зависит только от атрибута “Код изделия” и не зависит от остальных ключевых атрибутов. Аналогично предыдущему случаю, удалим его из таблицы в новую таблицу: ИЗДЕЛИЯ (Код изделия, наименование изделия). Атрибут “Код типа изделия” зависит только от атрибута “Код изделия” и не зависит от атрибутов “Код подразделения” и “Дата выпуска”. Аналогично предыдущему случаю удалим его из таблицы, добавим в таблицу “ИЗДЕЛИЯ” и получим таблицу: ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия). Атрибут “Наименование типа изделия” зависит только от атрибута “Код изделия”. Аналогично предыдущему случаю удалим его из таблицы и добавим в таблицу “ИЗДЕЛИЯ” и получим таблицу: ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия). Атрибуты “Количество” и “Себестоимость изделия” зависят от всего ключа, поэтому оставим их в исходной таблице. Таким образом, получим три таблицы: ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия). ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения). ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия). Очевидно, что все они находятся во второй нормальной форме. Третья нормальная форма (3НФ) Определение. Таблица находится в третьей нормальной форме, если она уже находится во второй нормальной форме, и все неключевые атрибуты взаимно функционально независимы. Очевидно, что первые две таблицы удовлетворяют определению третьей нормальной формы. Рассмотрим таблицу “ИЗДЕЛИЯ”. Атрибут “Наименование типа изделия” функционально зависит от неключевого атрибута “Код типа изделия”, поэтому его следует удалить (по определению третьей нормальной формы) из таблицы в новую: ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия). В результате получим модель базы данных из четырех таблиц в третьей нормальной форме (рисунок 1.5.2.1): ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия). ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения). ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия). ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия). ВЫПУСК ИЗДЕЛИЙ ПОДРАЗДЕЛЕНИЯ ИЗДЕЛИЯ ТИПЫ ИЗДЕЛИЙ Рисунок 1.5.2.1. Модель базы данных “Выпуск изделий” Убедимся в исчезновении аномалий из первой нормальной формы.
Существуют еще несколько, редко используемых нормальных форм, которые связаны только с составными ключами. Усиленная третья нормальная форма, или нормальная форма БойсаКодда (НФБК) Определение. Таблица находится в усиленной третьей нормальной форме, если она уже находится в третьей нормальной форме, и в ней отсутствуют функциональные зависимости ключевых атрибутов составного ключа от неключевых атрибутов. Четвертая нормальная форма (4НФ) Определение. Таблица находится в четвертой нормальной форме, если она уже находится в третьей нормальной форме, и в ней отсутствуют многозначные функциональные зависимости вида M:M между атрибутами. Пример. Имеется таблица вида: ПРЕПОДАВАТЕЛИ (Табельный номер преподавателя, предмет, группа). Очевидно, что имеем многозначную функциональную зависимость между атрибутами “Предмет” и “Группа”. Будем считать, что для каждой группы одним преподавателем читается один набор предметов. Существует аномалия: при добавлении новой группы нужно добавить несколько записей, по числу читаемых преподавателем предметов, что вызывает нежелательное дублирование значений атрибута “Предмет”. Исключим многозначную функциональную зависимость путем переноса этих атрибутов в разные таблицы, разделяя исходную таблицу на две: ПРЕПОДАВАТЕЛИ_ПРЕДМЕТЫ (Табельный номер преподавателя, предмет). ПРЕПОДАВАТЕЛИ_ГРУППЫ (Табельный номер преподавателя, группа). Пятую нормальную форму (5НФ) не будем рассматривать изза крайне редкого ее использования (она возможна при наличии трех и более объектов, связанных друг с другом отношением “многие-ко-многим”), тем более что она имеет недостатки. Денормализация процесс введения избыточности данных в таблицах (нарушения нормализации) в целях повышения производительности. Существуют нисходящая (копирование атрибута из родительского объекта в дочерний) и восходящая (копирование атрибута из дочернего в родительский объект в форме итога) денормализация. Пример. Нормализованные таблицы “ПРЕПОДАВАТЕЛИ_ПРЕДМЕТЫ” и “ПРЕПОДАВАТЕЛИ_ГРУППЫ” из предыдущего примера можно объединить в исходную таблицу “ПРЕПОДАВАТЕЛИ”. Хотя и будет дублирование данных, но работа с одной таблицей будет быстрее, чем с двумя нормализованными таблицами. В реальном проектировании разработчик должен достигнуть компромисса между нормализацией (устранение избыточности) и денормализацией (увеличение производительности) таблиц. |