Главная страница
Навигация по странице:

  • Первый этап — базы данных на больших ЭВМ.

  • Эпоха персональных компьютеров

  • Распределенные базы данных

  • Перспективы развития систем управления базами данных

  • Иерархическая модель данных

  • Достоинства иерархической модели

  • Недостатки иерархической модели

  • Реляционная модель данных

  • Постреляционная модель данных

  • Достоинство постреляционной модели

  • Недостаток постреляционной модели

  • Эволюция систем баз данных


    Скачать 236.08 Kb.
    НазваниеЭволюция систем баз данных
    Дата24.02.2022
    Размер236.08 Kb.
    Формат файлаdocx
    Имя файла15.docx
    ТипДокументы
    #372046
    страница1 из 4
      1   2   3   4

    1. Эволюция систем баз данных.

    Информационная система представляет собой программно-аппаратный комплекс, обеспечивающий выполнение следующих функций:

    - надежное хранение информации в памяти компьютера;

    - выполнение специфических для данного приложения преобразований информации и вычислений;

    - предоставление пользователям удобного и легко осваиваемого интерфейса.

    Обычно такие системы имеют дело с большими объемами информации, имеющей достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы, автоматизированные системы управления предприятиями, системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т. д.

    С появлением магнитных дисков началась история систем управления данными во внешней памяти. До этого каждая прикладная программа, которой требовалось хранить данные во внешней памяти, сама определяла расположение каждой порции данных на магнитной ленте или барабане и выполняла обмены между оперативной памятью и устройствами внешней памяти с помощью программно-аппаратных средств низкого уровня (машинных команд или вызовов соответствующих программ операционной системы). Такой режим работы не позволяет или очень затрудняет поддержание на одном внешнем носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации данных во внешней памяти.

    Первый этап — базы данных на больших ЭВМ.

    История развития СУБД насчитывает более 30 лет. В 1968 году была введена в эксплуатацию первая промышленная СУБД система IMS фирмы IBM. В 1975 году появился первый стандарт ассоциации по языкам систем обработки данных — Conference of Data System Languages (CODASYL), который определил ряд фундаментальных понятий в теории систем баз данных, которые и до сих пор являются основополагающими для сетевой модели данных.

    Первый этап развития СУБД связан с организацией баз данных на больших машинах типа IBM 360/370, ЕС-ЭВМ и мини-ЭВМ типа PDP11 (фирмы Digital Equipment Corporation — DEC), разных моделях HP (фирмы Hewlett Packard).

    Особенности этого этапа развития выражаются в следующем:

    1. Все СУБД базируются на мощных мультипрограммных операционных системах (MVS, SVM, RTE, OSRV, RSX, UNIX), поэтому в основном поддерживается работа с централизованной базой данных в режиме распределенного доступа.

    2. Функции управления распределением ресурсов в основном осуществляются операционной системой (ОС).

    3. Поддерживаются языки низкого уровня манипулирования данными, ориен­тированные на навигационные методы доступа к данным.

    4. Значительная роль отводится администрированию данных.

    5. Проводятся серьезные работы по обоснованию и формализации реляционной модели данных, и была создана первая система (System R), реализующая идеологию реляционной модели данных.

    6. Проводятся теоретические работы по оптимизации запросов и управлению распределенным доступом к централизованной БД, было введено понятие транзакции.

    7. Результаты научных исследований открыто обсуждаются в печати, идет мощный поток общедоступных публикаций, касающихся всех аспектов теории и практики баз данных, и результаты теоретических исследований активно внедряются в коммерческие СУБД.

    Эпоха персональных компьютеров

    Особенности этого этапа следующие:

    1. Все СУБД были рассчитаны на создание БД в основном с монопольным доступом. И это понятно. Компьютер персональный, он не был подсоединен к сети, и база данных на нем создавалась для работы одного пользователя. В редких случаях предполагалась последовательная работа нескольких пользователей, например, сначала оператор, который вводил бухгалтерские документы, а потом главбух, который определял проводки, соответствующие пер­вичным документам.

    2. Большинство СУБД имели развитый и удобный пользовательский интерфейс. В большинстве существовал интерактивный режим работы с БД как в рамках описания БД, так и в рамках проектирования запросов. Кроме того, боль­шинство СУБД предлагали развитый и удобный инструментарий для разра­ботки готовых приложений без программирования. Инструментальная среда состояла из готовых элементов приложения в виде шаблонов экранных форм, отчетов, этикеток (Labels), графических конструкторов запросов, которые достаточно просто могли быть собраны в единый комплекс.

    3. Во всех настольных СУБД поддерживался только внешний уровень представления реляционной модели, то есть только внешний табличный вид структур данных.

    4. При наличии высокоуровневых языков манипулирования данными типа реляционной алгебры и SQL в настольных СУБД поддерживались низкоуровневые языки манипулирования данными на уровне отдельных строк таблиц.

    5. В настольных СУБД отсутствовали средства поддержки ссылочной и структурной целостности базы данных. Эти функции должны были выполнять приложения, однако скудость средств разработки приложений иногда не позволяла это сделать, и в этом случае эти функции должны были выполняться пользователем, требуя от него дополнительного контроля при вводе и изме­нении информации, хранящейся в БД.

    6. Наличие монопольного режима работы фактически привело к вырождению функций администрирования БД и в связи с этим — к отсутствию инструментальных средств администрирования БД.

    7. И, наконец, последняя и в настоящий момент весьма положительная особенность — это сравнительно скромные требования к аппаратному обеспечению со стороны настольных СУБД. Вполне работоспособные приложения, разработанные, например, на Clipper, работали на PC 286.

    8. В принципе, их даже трудно назвать полноценными СУБД. Яркие представители этого семейства — очень широко использовавшиеся до недавнего времени СУБД Dbase (DbaseIII+, DbaselV), FoxPro, Clipper, Paradox.


    Распределенные базы данных

    Особенности данного этапа:

    1. Практически все современные СУБД обеспечивают поддержку полной реля­ционной модели, а именно:

    • структурной целостности — допустимыми являются только данные, пред­ставленные в виде отношений реляционной модели;

    • языковой целостности, то есть языков манипулирования данными высо­кого уровня (в основном SQL);

    • ссылочной целостности, контроля за соблюдением ссылочной целостности в течение всего времени функционирования системы, и гарантий невозможности со стороны СУБД нарушить эти ограничения.

    1. Большинство современных СУБД рассчитаны на многоплатформенную архитектуру, то есть они могут работать на компьютерах с разной архитектурой и под разными операционными системами, при этом для пользователей доступ к данным, управляемым СУБД на разных платформах, практически неразличим.

    2. Необходимость поддержки многопользовательской работы с базой данных и возможность децентрализованного хранения данных потребовали развития средств администрирования БД с реализацией общей концепции средств защиты данных.

    3. Потребность в новых реализациях вызвала создание серьезных теоретиче­ских трудов по оптимизации реализаций распределенных БД и работе с распределенными транзакциями и запросами с внедрением полученных результатов в коммерческие СУБД.

    4. Для того чтобы не потерять клиентов, которые ранее работали на настольных СУБД, практически все современные СУБД. имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД, и средства экспорта данных из форматов настольных СУБД второго этапа развития.

    5. Именно к этому этапу можно отнести разработку ряда стандартов в рамках языков описания и манипулирования данными начиная с SQL89, SQL92, SQL99 и технологий по обмену данными между различными СУБД, к которым можно отнести и протокол ODBC (Open DataBase Connectivity), предложенный фирмой Microsoft.

    6. Именно к этому этапу можно отнести начало работ, связанных с концепцией объектно-ориентированных БД — ООБД. Представителями СУБД, относящимся ко второму этапу, можно считать MS Access 97 и все современные серверы баз данных Огас1е7.3,Oracle 8.4 MS SQL6.5, MS SQL7.0, System 10, System 11, Informix, DB2, SQL Base и другие современные серверы баз данных, которых в настоящий момент насчитывается несколько десятков.


    Перспективы развития систем управления базами данных

    Этот этап характеризуется появлением новой технологии доступа к данным — интранет. Основное отличие этого подхода от технологии клиент-сервер состоит в том, что отпадает необходимость использования специализированного клиентского программного обеспечения. Для работы с удаленной базой данных используется стандартный браузер Интернета, например Microsoft Internet Explorer или Netscape Navigator, и для конечного пользователя процесс обращения к данным происходит аналогично скольжению по Всемирной Паутине (см. рис. 1.1). При этом встроенный в загружаемые пользователем HTML-страницы код, написанный обычно на языке Java, Java-script, Perl и других, отслеживает все действия пользователя и транслирует их в низкоуровневые SQL-запросы к базе данных, выполняя, таким образом, ту работу, которой в технологии клиент-сервер занимается клиентская программа. Удобство данного подхода привело к тому, что он стал использоваться не только для удаленного доступа к базам данных, но и для пользователей локальной сети предприятия. Простые задачи обработки данных, не связанные со сложными алгоритмами, требующими согласованного изменения данных во многих взаимосвязанных объектах, достаточно просто и эффективно могут быть построены по данной архитектуре. В этом случае для подключения нового пользователя к возможности использовать данную задачу не требуется установка дополнительного клиентского программного обеспечения. Однако алгоритмически сложные задачи рекомендуется реализовывать в архитектуре «клиент-сервер» с разработкой специального клиентского программного обеспечения.

    У каждого из вышеперечисленных подходов к работе с данными есть свои достоинства и свои недостатки, которые и определяют область применения того или иного метода, и в настоящее время все подходы широко используются.

    2. Типы баз данных.

    База данных – совокупность взаимосвязанных данных, которые можно использовать для большого числа приложений, быстро получать и модифицировать необходимую информацию.

    Модели базы данных базируются на современном подходе к обработке информации. Структура информации базы позволяет формировать логические записи их элементов и их взаимосвязи. Взаимосвязи могут быть: один к одному, один ко многим и многие ко многим.

    Применение того или иного типа взаимосвязи определены тремя моделями базы данных: иерархической, сетевой, реляционной.

    Ранние СУБД были основаны, в основном, на следующих моделях данных (начиная с 1968 года):

    1) иерархические модели (древовидные),

    2) сетевые модели (графовые).

    Затем возникли СУБД, основанные на реляционной модели данных.

    Иерархическая модель данных

    Наиболее известным и распространенным представителем иерархических СУБД является Information Management System (IMS) фирмы IBM. Первая версия системы появилась в 1968 году. Система до сих пор эксплуатируется, что создает существенные проблемы с переходом как на новую технологию БД, так и на новую технику.

    Иерархическая БД (рис. 1.2) состоит из упорядоченного набора структур записей. Каждая структура имеет вид дерева. Вершины дерева называются узлами. Один из узлов, который находится на самом верху иерархии, называется корнем. Остальные узлы называются потомками и связаны так, что каждый узел имеет предка. Узлы, не имеющие потомков, называются листьями. Все экземпляры узла-потомка, имеющие общего предка, называются близнецами.

    Примерами типичных операторов манипулирования иерархически организованными данными могут быть следующие:

    • найти указанное дерево БД (например, плановый отдел);

    • перейти от одного дерева к другому;

    • перейти от одного узла к другому внутри дерева (например, от отдела – к первому сотруднику);

    • перейти от одного узла к другому в порядке обхода иерархии;

    • вставить новую запись (экземпляр узла) в указанную позицию;

    • удалить текущую запись.

    Поддерживается ограничение целостности в следующей формулировке: никакой потомок не может существовать без своего родителя. Однако аналогичное ограничение целостности по ссылкам между узлами, не входящими в одно дерево, не поддерживается.

    Достоинства иерархической модели:

    • простота и естественность представления (по крайней мере, экономических) данных;

    • минимальный расход памяти по сравнению с другими моделями.

    Недостатки иерархической модели:

    • сложность отображения связей многие-ко-многим (когда, например, каждый сотрудник может работать во многих отделах и в каждом отделе может работать много сотрудников) без увеличения избыточности;

    • сложность включения информации о новых объектах и удаления устаревших данных;

    • доступ к данным возможен только через корень дерева, что может значительно увеличить время поиска данных для некоторых запросов.

    Сетевая модель данных

    Отличие сетевой модели (рис. 1.3) от иерархической заключается в том, что в сетевой структуре любой элемент данных может быть связан с любым другим, то есть иерархическая модель является разновидностью сетевой.

    Различают простую и сложную сетевую структуру. В простой сетевой структуре между исходным и порожденными узлами реализуется связь один-ко-многим (когда, например, каждый сотрудник может работать в одном отделе и в каждом отделе может работать много сотрудников).

    Сложной сетевой структурой называют такую схему, в которой присутствует хотя бы одна связь многие-ко-многим.В настоящее время большинство сетевых СУБД поддерживают только простые сетевые структуры.

    Такие системы называют СУБД с равноправными (однотипными) файлами. Типичным представителем является Integrated Database Management System (IDMS) компании Cullinet Software Inc., предназначенная для использования на машинах основного класса фирмы IBM под управлением большинства операционных систем.

    Главным достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.

    Реляционная модель данных

    Что означает термин «реляционная модель»? Термин происходит от relation (отношение, зависимость, связь). Отношение в общем математическом смысле – это подмножество декартова произведения множеств, то есть

    R⊆A1×…×An={(x1,…,xn )| x1∈A1,…,xn∈An}
    Таким образом, в реляционных базах данных (РБД) данные организованы в виде отношений и представлены в форме таблиц. Однако формы представления или, как еще говорят, изображения, могут быть различными. 

    Достоинством реляционной модели данных является ее простота, удобство реализации на ЭВМ, наличие теоретического обоснования и возможность формирования гибкой схемы БД, допускающей настройку при формировании запроса. Однако при увеличении числа таблиц в БД заметно падает скорость работы с ней. Определенные проблемы использования реляционной модели возникают при создании систем со сложными структурами данных, например, систем автоматизации проектирования.
    Постреляционная модель данных

    Классическая реляционная модель предполагает атомарность (неделимость) данных, хранящихся в полях записей таблицы. Существуют случаи, когда это ограничение мешает эффективной организации приложений. Постреляционная модель данных представляет собой расширенную реляционную модель, в которой отменено требование атомарности атрибутов. Эта модель использует трехмерные структуры, позволяя хранить в полях таблицы другие таблицы и, тем самым, расширить возможности по описанию сложных объектов реального мира.

    В качестве языка запросов в системах, использующих постреляционную модель, используется несколько расширенный язык реляционных баз данных SQL, позволяющий извлекать сложные объекты из одной таблицы без использования операции соединения.

    Достоинство постреляционной модели – это возможность представления совокупности связанных реляционных таблиц одной постреляционной таблицей. Это обеспечивает высокую наглядность представления информации и повышает эффективность ее обработки. 

    Недостаток постреляционной модели – это сложное решение проблемы обеспечения целостности и непротиворечивости.
    Объектно-ориентированные модели данных

    Направление объектно-ориентированных баз данных (ООБД) возникло уже в середине 1980-х годов. Однако наиболее активно это направление развивается в последние годы. Возникновение направления ООБД определяется необходимостью разработки сложных информационных прикладных систем, для которых технология распространенных систем БД не всегда удовлетворительна.

    Базис ООБД обеспечивают как предыдущие работы в области БД, особенно реляционных, так и давно развивающееся направление объектно-ориентированных языков программирования.

    Современная ситуация с ООБД напоминает ситуацию с реляционными системами середины 1970-х годов. При наличии большого количества экспериментальных проектов (и даже коммерческих систем) отсутствует общепринятая объектно-ориентированная модель данных, и не потому, что нет ни одной разработанной полной модели, а по причине отсутствия общего согласия о принятии какой-либо модели.

    В наиболее общей постановке объектно-ориентированный подход базируется на концепциях:

    1) объекта и идентификатора объекта;

    2) атрибутов и методов;

    3) классов;

    4) иерархии и наследования классов.

    Любая сущность реального мира в объектно-ориентированных языках и системах моделируется в виде объекта. Любой объект при своем создании получает генерируемый системой уникальный идентификатор, который связан с объектом во все время его существования и не меняется при изменении состояния объекта.

    Каждый объект имеет состояние и поведение. Состояние объекта – это набор значений его атрибутов. Поведение объекта – это набор методов, реализуемых программным кодом, и оперирующих над состоянием объекта. Значение атрибута объекта – это тоже некоторый объект или множество объектов. Состояние и поведение объекта инкапсулированы в объекте; взаимодействие между объектами производится на основе передачи сообщений и выполнении соответствующих методов.

    Множество объектов с одним и тем же набором атрибутов и методов образует класс объектов. Объект должен принадлежать только одному классу (если не учитывать возможности наследования). Допускается наличие примитивных предопределенных классов, объекты-экземляры которых не имеют атрибутов (целые, строки и т.д.). Класс, объекты которого могут служить значениями атрибута объектов другого класса, называется доменом этого атрибута.

    Допускается порождение нового класса на основе уже существующего класса, то есть наследование. В этом случае новый класс, называемый подклассом существующего класса (суперкласса) наследует все атрибуты и методы суперкласса. В подклассе, кроме того, могут быть определены дополнительные атрибуты и методы. Различаются случаи простого и множественного наследования.

    В первом случае подкласс может определяться только на основе одного суперкласса, во втором случае суперклассов может быть несколько. Если в языке или системе поддерживается простое наследование классов, набор классов образует древовидную иерархию. При поддержании множественного наследования классы связаны в ориентированный граф (с корнем), называемый решеткой классов. Объект подкласса считается принадлежащим любому суперклассу этого класса.

    Наиболее важным новым качеством ООБД является поведенческий аспект объектов. В среде ООБД проектирование, разработка и сопровождение прикладной системы становится процессом, в котором интегрируются структурный (статический) и поведенческий (динамический) аспекты. Для этого нужны специальные языки, позволяющие определять объекты и создавать на их основе прикладную систему.
      1   2   3   4


    написать администратору сайта