Главная страница

Базы данных. Лекции БД. Лекция 5 Основные понятия информационных систем 5 История развития компьютеризации информационных процессов и систем. 5


Скачать 1.07 Mb.
НазваниеЛекция 5 Основные понятия информационных систем 5 История развития компьютеризации информационных процессов и систем. 5
АнкорБазы данных
Дата05.01.2022
Размер1.07 Mb.
Формат файлаdoc
Имя файлаЛекции БД.doc
ТипЛекция
#324711
страница22 из 24
1   ...   16   17   18   19   20   21   22   23   24

9.4.Инвертированные списки


До сих пор мы рассматривали структуры данных, которые использовались для ускорения доступа но первичному ключу. Однако достаточно часто в базах дан­ных требуется проводить операции доступа по вторичным ключам. Напомним, что вторичным, ключом является набор атрибутов, которому соответствует набор искомых записей. Это означает, что существует множество записей, имею­щих одинаковые значения вторичного ключа. Например, в случае нашей БД «Библиотека» вторичным ключом может служить место издания, год издания. Множество книг могут быть изданы в одном месте, и множество книг могут быть изданы в один год.

Для обеспечения ускорения доступа по вторичным ключам используются струк­туры, называемые инвертированными списками, которые послужили основой ор­ганизации индексных файлов для доступа по вторичным ключам.

Инвертированный список в общем случае это двухуровневая индексная струк­тура. Здесь на первом уровне находится файл пли часть файла, в которой упорядочено расположены значения вторичных ключей. Каждая запись с вторич­ным ключом имеет ссылку на номер первого блока в цепочке блоков, содержа­щих номера записей с данным значением вторичного ключа. На втором уровне находится цепочка блоков, содержащих номера записей, содержащих одно и то же значение вторичного ключа. При этом блоки второго уровня упорядочены по значениям вторичного ключа.

И наконец, на третьем уровне находится собственно основной файл.

Механизм доступа к записям по вторичному ключу при подобной организации записей весьма прост. На первом шаге мы ищем в области первого уровня за­данное значение вторичного ключа, а затем по ссылке считываем блоки второго уровня, содержащие номера записей с заданным значением вторичного ключа, а далее уже прямым доступом загружаем в рабочую область пользователя со­держимое всех записей, содержащих заданное значение вторичного ключа.

На рис.9.9. представлен пример инвертированного списка, составленного для вторичного ключа «Номер группы» в списке студентов некоторого учебного заведения. Для более наглядного представления мы ограничим пятью записями (целыми числами)


Рис. 9.9. Построение инвертированного списка по номеру группы для списка студентов
Для одного основного файла может быть создано несколько инвертированных списков по разным вторичным ключам.

Следует отметить, что организация вторичных списков действительно ускоряет поиск записей с заданным значением вторичного ключа. Но рассмотрим вопрос модификации основного файла.

При модификации основного файла происходит следующая последовательность действий:


  • Изменяется запись основного файла.

  • Исключается старая ссылка на предыдущее значение вторичного ключа.

  • Добавляется новая ссылка на новое значение вторичного ключа.

При этом следует отметить, что два последних шага выполняются для всех вто­ричных ключей, по которым созданы инвертированные списки. И, разумеется, такой процесс требует гораздо больше временных затрат, чем просто изменение содержимого записи основного файла без поддержки всех инвертированных списков.

Поэтому не следует безусловно утверждать, что введение индексных файлов (и том числе и инвертированных списков) всегда ускоряет обработку информация в базе данных. Отнюдь, если база данных постоянно изменяется, дополняется и модифицируется содержимое записей, то наличие большого количества инвер­тированных списков или индексных файлов по вторичным ключам может резко замедлить процесс обработки информации.

Можно придерживаться следующей позиции: если база данных достаточно стабильна и ее содержимое практически не меняется, то построение вторичных ин­дексов действительно может ускорить процесс обработки информации.
1   ...   16   17   18   19   20   21   22   23   24


написать администратору сайта