информатика для экономистов. 1. Информатика для экономистов. Учебное пособие Нижний Новгород Издательство Нижегородского госуниверситета 2012
Скачать 0.95 Mb.
|
8.1. Понятие базы данныхТаким образом, массивы данных, ведущиеся в ИС так или иначе взаимосвязаны. Для возможности их автоматизированной обработки с помощью компьютеров должны существовать определенные правила хранения данных с поддержкой существующих между ними связей. Поэтому все ведущие в целях решения тех или иных задач массивы данных ИС объединяются в базу данных. База данных - совокупность взаимосвязанных массивов данных, организованных по определенным правилам. С формальной точки зрения БД представляет собой информационную модель реального мира. Ее содержимое описывает объекты, свойства (характеристики, признаки) объектов и их взаимосвязи. В рамках приведенного выше примера поставщики - это отдельные объекты. Каждый объект описывается определенным набором свойств. Свойствами объекта "поставщик" являются: название фирмы, юридический и фактический адрес, номера телефонов, факсов, адреса электронной почты, номер счета в банке, название банка, его адрес, ФИО руководителя, контактных лиц и т.д. Другие объекты имеют другие свойства. Каждый объект БД представляется записью, а свойства являются атрибутами записи. Атрибут записи - это элементарное данное (строка или несколько строк текста, число, графическое изображение и т.д.). Атрибут характеризует какое-то одно качество объекта. Однотипные объекты характеризуются однотипными записями, имеющими одинаковые наборы атрибутов. У разных записей значения одного и того же атрибута могут быть разными или одинаковыми. Обычно требуется, чтобы записи БД описывали уникальные объекты. Например, нет смысла учитывать отдельно каждую единицу какого-либо вида товара. Поэтому в БД следует хранить только записи, характеризующие виды товаров и их количественные характеристики (например, остаток на складе, количество единиц, отпущенных по определенному документу и т.д.). Если различные экземпляры одного и того же вида товаров требует индивидуального учета, то создаются разные записи, но отличающиеся разными наборами атрибутов. Например, в БД могут быть записи, каждая из которых характеризует одну и ту же модель автомобиля. Поэтому часть атрибутов (код модели автомобиля) у разных записей могут быть одинаковы. Но должны быть и такие атрибуты, которые должны отличаться. Например, номер двигателя, регистрационный номер автомобиля. Благодаря им можно точно узнать, какой конкретно экземпляр автомобиля характеризуется данной записью. Таким образом, существует некоторый набор атрибутов, совокупность значений которых является уникальной для каждой записи. Эти атрибуты называются ключевыми, а набор их значений образует ключ записи. Таким образом, ключ записи однозначно идентифицирует запись и является уникальным именем записи, по которому ее всегда можно распознать. БД могут строиться на основе иерархической, сетевой или реляционной модели. (Подробнее про иерархическую и сетевую модели данных см. учебник "ЭИ"). Большинство современных БД строится на основе реляционной модели. В ней набор однотипных записей называется отношением, область допустимых значений каждого атрибута - доменом, а отдельная запись отношения - кортежем. Список атрибутов одного отношения называется схемой отношения. Порядок записей в отношении произволен. Недопустимо наличие в отношении двух записей с одинаковыми ключами. Наглядно, реляционную БД можно представить как набор взаимосвязанных таблиц. Каждое отношение образует отдельную таблицу. Кортеж - это строка таблицы (отдельная запись). Атрибут - это столбец таблицы. Ячейка таблицы на пересечении строки и столбца содержит значение атрибута в данной записи. Фундаментальными свойствами реляционной БД являются. Отсутствие кортежей-дубликатов. Каждое отношение имеет первичный ключ - минимально необходимый набор атрибутов, значения которых однозначно определяют кортеж отношения. Отсутствие упорядоченности кортежей. Записи таблицы считаются неупорядоченными. Запрос к реляционной базе данных может выдать упоядоченный по определенным признакам набор записей, но изначально порядок записей в отношении считается не заданным. Отсутствие упорядоченности атрибутов. Считается, что атрибуты в отношении могут располагаться в любой последовательности. Однако неявный порядок следования атрибутов может определяться в линейной форме определения схемы отношения. Атомарность значений атрибутов. Атрибут является неделимым, то есть не может содержать множества значений. Отношение может находиться в одной из 5 нормальных форм. В первой нормальной форме (1NF) находится любое отношение, удовлетворяющее свойствам 1-4. Отношение находится во второй нормальной форме (2NF), если оно удовлетворяет свойствам 1NF и каждый неключевой атрибут (не входящий в состав первичного ключа) полностью зависит от первичного ключа. Отношение находится в третьей нормальной форме (3NF), если все неключевые атрибуты взаимно независимы и полностью зависят от первичного ключа. |