Ерл. 1 Пул вопросов Иерархические базы данных

Название	1 Пул вопросов Иерархические базы данных
Дата	19.10.2022
Размер	0.66 Mb.
Формат файла
Имя файла	Ekzamen1.docx
Тип	Документы #741967
страница	5 из 5

1 2 3 4 5

Ответ: Аналогом является индекс. Инвертированный список — это двухуровневая индексная структура. Здесь на первом уровне находится файл или часть файла, в которой упорядочено расположены значения вторичных ключей. Каждая запись с вторичным ключом имеет ссылку на номер первого блока в цепочке блоков, содержащих номера записей с данным значением вторичного ключа. На втором уровне находится цепочка блоков, содержащих номера записей, содержащих одно и то же значение вторичного ключа. При этом блоки второго уровня упорядочены по значениям вторичного ключа.

И наконец, на третьем уровне находится собственно основной файл.

Механизм доступа к записям по вторичному ключу при подобной организации записей весьма прост. На первом шаге мы ищем в области первого уровня заданное значение вторичного ключа, а затем по ссылке считываем блоки второго уровня, содержащие номера записей с заданным значением вторичного ключа, а далее уже прямым доступом загружаем в рабочую область пользователя содержимое всех записей, содержащих заданное значение вторичного ключа.

Что справедливо при индексировании файла базы данных?

Ответ: Индексный файл – это файл, в котором хранится информация индекса. Он является файлом особого типа, в котором каждая запись состоит из двух значений: данных и указателя номера записи. При этом данные необходимы для индексного поля из индексного файла, а указатель — для связывания с соответствующей записью индексированного файла.

Для создания индексированных файлов на основе ключей были реализованы специальные таблицы, переводящие ассоциативный запрос в соответствующий адрес. Эти таблицы были названы списками ссылок или индексами. Индекс определяется как таблица, содержащая список ключевых значений, каждому из которых соответствует указатель, локализующий блок записей на носителе данных. Чтобы найти определенный блок информации, сначала необходимо отыскать в индексе его ключ, а потом получить сам блок, который хранится по адресу, связанным с этим ключом.

Основным преимуществом использования индексирования является значительное ускорение процесса выборки или извлечения данных, основным недостатком – замедление процесса обновления данных, т. к. при каждом добавлении новой записи в индексированный файл потребуется также добавить новый индекс в индексный файл.

Обращение к записи таблицы через индексы осуществляется в два этапа: сначала СУБД считывает индекс в оперативную память (ОП) и находит в нём требуемое значение атрибута и соответствующий адрес записи (КБД), затем по этому адресу происходит обращение к внешнему запоминающему устройству. Индекс загружается в ОП целиком или хранится в ней постоянно во время работы с таблицей БД, если хватает объёма ОП.

Если индексирование организовано на основе ключевого поля, то индекс называется первичным. Ключевые поля, как правило, индексируются автоматически.

Если индекс организован на основе другого поля, то он называется вторичным. Индекс, организованный на основе ключевого поля или другого ключа, называется уникальным.

На практике индексы можно использовать двумя разными способами:

последовательного доступа к индексированному файлу, т. е. в последовательности, заданной значениями индексного поля;
прямого доступа к отдельным записям индексированного файла на основе заданного значения индексного поля.

Хранимый файл может иметь несколько индексов. Часто индекс создают на основе комбинации двух или более поле.

Нормализация данных в БД

Ответ: После определения таблиц, полей, индексов, связей между таблицами и правил ссылочной целостности следует посмотреть на проектируемую базу данных в целом и проанализировать ее с целью устранения логических ошибок. При этом большие отношения, как правило, содержащие большую избыточность, разбиваются на более мелкие логические единицы, группирующие только данные, объединенные «по природе».

В реляционных базах данных схема содержит как структурную, так и семантическую информацию. Структурная информация связана с объявлением отношений, а семантическая выражается множеством известных функциональных зависимостей между атрибутами отношений, объявленных в схеме. Однако некоторые функциональные зависимости могут быть нежелательными из-за побочных эффектов или аномалий, которые они вызывают при модификации баз данных.

Корректной считается схема, в которой отсутствуют нежелательные функциональные зависимости. В противном случае приходится прибегать к процедуре, называемой декомпозицией.

Декомпозиция — разложение множества отношений, при котором данное множество заменяется другими, являющихся проекциями первых, при этом их число возрастет.

Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т. е. исключена избыточность информации. Избыточность информации устраняется не только с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных и упрощения управления ими.

Различают следующие проблемы, возникающие при использовании ненормализованных таблиц:

избыточность данных проявляется в том, что в нескольких записях таблицы базы данных повторяется одна и та же информация.
аномалия обновления тесно связана с избыточностью данных. Предположим, что у сотрудника, работающего на нескольких должностях, изменился адрес. Чтобы информация, содержащаяся в таблице, была корректной, необходимо будет внести изменения в несколько записей. В противном случае возникает несоответствие информации, которое и называется аномалией обновления;
аномалия удаления возникает при удалении записей из ненормализованной таблицы. Пусть в организации некоторые должности аннулируются. При этом следует удалить соответствующие записи в рассматриваемой таблице. Однако удаление приводит к потере информации о сотруднике, занимавшем эту должность.

1 2 3 4 5