Главная страница
Навигация по странице:

  • ВВЕДЕНИЕ В БАЗЫ ДАННЫХ Утверждено Редакционно-издательским советом института в качестве Учебного пособия Москва 2005

  • 1.1. Информация, данные, знания. Терминология Информация

  • Система обработки данных

  • Автоматизированная информационная система

  • 1.2. Автоматизированная информационная система

  • Программные средства ИПС

  • Информационный язык системы

  • 1.3. Предметная область информационной системы

  • Министерство образования российской федерации московский государственный институт электроники и математики (Технический университет)


    Скачать 1.02 Mb.
    НазваниеМинистерство образования российской федерации московский государственный институт электроники и математики (Технический университет)
    Дата24.11.2022
    Размер1.02 Mb.
    Формат файлаpdf
    Имя файлаdblect2005.pdf
    ТипДокументы
    #810923
    страница1 из 10
      1   2   3   4   5   6   7   8   9   10

    МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
    Московский государственный институт электроники и математики
    (Технический университет)
    И.П. Карпова
    ВВЕДЕНИЕ В БАЗЫ ДАННЫХ
    Утверждено Редакционно-издательским советом института
    в качестве Учебного пособия
    Москва 2005

    – 2 –
    УДК 681.3.07
    ББК 32.973
    К26
    Рецензенты: докт. техн. наук И.П. Беляев канд. ф.-м. наук В.Н. Тимакин
    Карпова И.П.
    К26 Введение в базы данных. Учебное пособие. – Московский Государствен- ный институт электроники и математики. – М.: 2005. – 75 с.
    Рассматриваются основные модели данных, технологии организации баз дан- ных, методы проектирования и функциональной поддержки баз данных.
    Для студентов технических факультетов, изучающих автоматизированные информа- ционные системы и системы управления базами данных.
    ISBN
     Карпова И.П., 2005

    – 3 –
    Оглавление
    1. ВВЕДЕНИЕ .................................................................................................... 5 1.1. Информация, данные, знания. Терминология ........................................ 5 1.2. Автоматизированная информационная система .................................... 6 1.2.1. Информационно-поисковые системы............................................... 7 1.2.1. Информационно-поисковые системы............................................... 7 1.3. Предметная область информационной системы .................................... 8 1.4. Назначение и основные компоненты системы баз данных ................... 9 1.5. Уровни представления данных ............................................................... 10 2. ОСНОВНЫЕ МОДЕЛИ ДАННЫХ ............................................................. 11 2.1. Понятие модели данных .......................................................................... 11 2.1.1. Типы структур данных ...................................................................... 11 2.1.2. Операции над данными ..................................................................... 13 2.1.3. Ограничения целостности ................................................................. 13 2.2. Сетевая модель данных (СМД) ............................................................... 14 2.3. Иерархическая модель данных (ИМД) ................................................... 16 2.4. Реляционная модель данных (РМД) ....................................................... 17 2.4.1. Понятие отношения ........................................................................... 17 2.4.2. Свойства отношений ......................................................................... 18 2.4.3. Достоинства и недостатки РМД ....................................................... 20 2.4.4. Операции реляционной алгебры....................................................... 20 2.4.5. Преобразования операций реляционной алгебры............................ 22 2.5. Другие модели данных ............................................................................ 23 2.5.1. Объектно-реляционные модели данных .......................................... 23 2.5.2. Объектно-ориентированные модели данных ................................... 24 3. ЭЛЕМЕНТЫ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ ................................... 24 3.1. Инфологическое проектирование ........................................................... 25 3.2. Определение требований к операционной обстановке.......................... 29 3.3. Выбор СУБД и инструментальных программных средств ................... 29 3.4. Логическое проектирование БД .............................................................. 29 3.5. Физическое проектирование БД ............................................................. 29 3.6. Автоматизация проектирования БД........................................................ 30 3.7. Особенности проектирования реляционных БД .................................... 31 3.7.1. Аномалии модификации данных ...................................................... 31 3.7.2. Нормализация отношений................................................................. 31 4. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ....................................... 35 4.1. Классификация СУБД.............................................................................. 36 4.2. Основные функции СУБД ....................................................................... 36 4.3. Логическая и физическая целостность БД ............................................. 38 4.4. Администрирование БД........................................................................... 39 4.5. Словари-справочники данных................................................................. 40 5. ФИЗИЧЕСКАЯ ОРГАНИЗАЦИЯ ДАННЫХ ............................................... 41 5.1. Механизмы среды хранения и архитектура СУБД ................................ 41

    – 4 –
    5.2. Пространство памяти и размещение хранимых данных........................ 41 5.3. Структура хранимых данных .................................................................. 44 5.4. Виды адресации хранимых записей........................................................ 45 5.5. Организация связей между хранимыми записями ................................. 46 6. МЕХАНИЗМЫ РАЗМЕЩЕНИЯ ДАННЫХ И ДОСТУПА К ДАННЫМ... 47 6.1. Способы доступа к записям .................................................................... 47 6.2. Индексирование данных.......................................................................... 48 6.2.1. Способы организации индексов ....................................................... 49 6.2.2. Многоуровневые индексы на основе В-дерева ................................ 50 6.2.3. Использование индексов ................................................................... 53 6.3. Хеширование............................................................................................ 54 6.3.1. Методы хеширования ........................................................................ 54 6.3.2. Разрешение коллизий ........................................................................ 55 6.3.2. Использование хеширования ............................................................ 56 6.4. Кластеризация данных............................................................................. 57 6.4.1. Принцип организации кластеров ...................................................... 57 6.4.2. Использование кластеров.................................................................. 58 7. ОРГАНИЗАЦИЯ ПАРАЛЛЕЛЬНОГО ДОСТУПА К ДАННЫМ ........... 58 7.1. Механизм транзакций .............................................................................. 59 7.2. Взаимовлияние транзакций ..................................................................... 60 7.3. Уровни изоляции транзакций.................................................................. 61 7.4. Блокировки ............................................................................................... 62 8. СПЕЦИАЛЬНАЯ ОБРАБОТКА БАЗЫ ДАННЫХ ................................... 64 8.1. Обеспечение целостности данных .......................................................... 64 8.2. Обеспечение защиты данных .................................................................. 65 8.2.1. Безопасность данных (обеспечение физической защиты) .............. 65 8.2.2. Защита от несанкционированного доступа ...................................... 68 8.2.3. Управление доступом к базе данных................................................ 69 9. ПЕРСПЕКТИВЫ РАЗВИТИЯ ТЕХНОЛОГИИ БАЗ ДАННЫХ ................. 70
    Предметный указатель....................................................................................... 72
    Список используемых сокращений................................................................... 74
    Библиографический список............................................................................... 74

    – 5 –
    1. ВВЕДЕНИЕ
    Развитие средств вычислительной техники обеспечило возможности для создания и широкого использования автоматизированных информационных систем (АИС) разнообразного назначения. К АИС относятся информационные системы управления хозяйственными и техническими объектами (автоматизи- рованные системы управления, АСУ), модельные комплексы для научных ис- следований, системы автоматизации проектирования (САПР), тренажеры, ав- томатизированные обучающие системы (АОС) и т.д.
    Мы будем говорить только об информационных системах, основанных на данных (в отличие от информационных систем, основанных на знаниях).
    Существуют две основные предпосылки создания таких систем:
    1. Разработка методов конструирования и эксплуатации систем, предназначен- ных для коллективного пользования.
    2. Возможность собирать, хранить и обрабатывать большое количество данных о реальных объектах, процессах и явлениях, то есть оснащение этих систем "памятью".
    Массив данных общего пользования в подобных системах называется ба-
    зой данных. Концепция баз данных стала определяющим фактором при созда- нии эффективных автоматизированных систем обработки данных.
    Основным принципом организации базы данных является совместное хранение данных и их описаний.
    Эти описания обычно называют метаданными. Метаданные обеспечива- ют независимость данных от программ их обработки. Если описание данных хранится вместе с данными, то это позволяет запрашивать и модифицировать данные без написания дополнительных программ.
    1.1. Информация, данные, знания. Терминология
    Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.
    Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находя- щаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ.
    Обработка данных – это совокупность задач, осуществляющих преобразова- ние массивов данных. Обработка данных включает в себя ввод данных в
    ЭВМ, отбор данных по каким-либо критериям, преобразование структу- ры данных, перемещение данных на внешней памяти ЭВМ, вывод дан- ных, являющихся результатом решения задач, в табличном или в каком- либо ином удобном для пользователя виде.
    Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.

    – 6 –
    Управление данными – весь круг операций с данными, которые необходимы для успешного функционирования СОД.
    Предметная область (ПО) – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге, автоматизации. ПО представляется множеством фрагментов, которые характеризуются множеством объектов, множеством процессов, использующих объекты, а также множеством пользователей, которые имеют единый взгляд на предметную область.
    База данных (БД) – совокупность структурированных взаимосвязанных дан- ных, относящихся к определённой предметной области и организованных таким образом, что эти данные могут быть использованы для решения многих задач многими пользователями.
    В дальнейшем речь пойдёт только об электронных базах данных, т.е. та- ких, которые хранятся и используются с помощью ЭВМ.
    Автоматизированная информационная система (АИС) – это аппаратно- программный комплекс, функционирующий на основе вычислительной техники и обеспечивающий сбор, хранение, актуализацию и обработку данных в целях информационной поддержки какого-либо вида деятель- ности.
    Банк данных (БнД) – это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (ма- тематических, информационных, программных, языковых, организаци- онных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных за- просов пользователей.
    1.2. Автоматизированная информационная система
    АИС, основанная на базе данных, служит для сбора, накопления, хране- ния информации, а также её эффективного использования для разнообразных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ.
    При проектировании АИС решается два основных вопроса:
     какие сведения и для каких целей будут содержаться в системе,
     как соответствующие данные будут организованы в памяти ЭВМ, как они будут поддерживаться и обрабатываться при эксплуатации АИС.
    В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические.
    На практике используются также и системы комбинированного типа.
    В документальной системе объект хранения – документ, который содер- жит информацию, относящуюся к определённой предметной области. Это мо- гут быть графические изображения (например, географические карты); инфор- мация на естественном языке (монографии, тексты законодательных актов, на- учные отчёты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки информации не важно, какие сведе- ния хранятся в документах.

    – 7 –
    Фактографические АИС хранят сведения об объектах предметной облас- ти, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции
    (нахождение суммы, минимума, максимума и т.п.).
    По сферам применения различают два основных класса АИС: информа-
    ционно-поисковые (ИПС) и системы обработки данных (СОД).
    1.2.1. Информационно-поисковые системы
    ИПС ориентированы, как правило, на извлечение подмножества храни- мых данных, удовлетворяющих некоторому поисковому критерию. Пользова- теля ИПС интересует извлекаемые из базы данных сведения, а не результаты их обработки (пример ИПС – справочные службы).
    Основные компоненты ИПС:
    – программные средства,
    – поисковый массив документов,
    – средства поддержки информационного языка системы.
    Программные средства ИПС служат для организации управления дан- ными (ввода, хранения, защиты, поиска и выдачи).
    Поисковый массив документов в ИПС обычно называется базой дан- ных. Он представляет собой набор ссылок на документы или описаний доку- ментов, хранящий основную информацию о документах. Этот набор организо- ван так, чтобы обеспечить быстрый поиск. Описание документа определяется предметной областью и состоит из значений атрибутов, характеризующих со- держание документа. Например, для БД географических карт это могут быть координаты и масштаб, а для БД законодательных актов – тип документа (за- кон, указ и т.п.), дата его принятия, область действия и т.д.
    Информационный язык системы предназначен для того, чтобы пользо- ватель мог сформулировать запрос к системе. Системными средствами запрос преобразуется в формализованное поисковое предписание – поисковый запрос.
    Этот запрос далее сопоставляется с поисковыми образами документов, храни- мыми в системе, по критерию смыслового соответствия. Информационный язык системы может быть основан на подмножестве естественного языка, кото- рое относится к обслуживаемой предметной области. Но чаще поиск документа осуществляется с помощью шаблонов – экранных форм, включающих поля описания документа.
    ИПС обычно являются документальными системами.
    1.2.1. Системы обработки данных
    СОД принципиально отличаются от ИПС тем, что обращения пользова- теля к СОД чаще всего приводят к обновлению данных. Пользователя прежде всего интересует результат обработки данных, а не сами данные. Вывод данных может вовсе отсутствовать или представлять собой результат программной об- работки хранимых сведений. Пример СОД – банковские системы, осуществ- ляющие открытие/закрытие счетов, пересчёт вкладов в зависимости от процен-

    – 8 – тов, приём/снятие сумм и т.п. Системы обработки данных обычно являются фактографическими системами.
    Мы будем основное внимание обращать на системы обработки данных, имея в виду, что ИПС создаются с помощью те же программных средств и на тех же принципах, что и СОД, а специфические моменты обработки данных реализуются через приложения (программы, внешние по отношению к ядру
    СОД).
    Разработка любой информационной системы начинается с определения предметной области.
    1.3. Предметная область информационной системы
    Предметная область (ПО) информационной системы рассматривается как совокупность реальных процессов и объектов (сущностей), представляющих интерес для её пользователей.
    Каждый из объектов обладает определённым набором свойств (атрибу- тов), среди которых можно выделить существенные и малозначительные. При- знание какого-либо свойства существенным носит относительный характер.
    Для упрощения процедуры формализации ПО в большинстве случаев прибега- ют к разбиению всего множества объектов ПО на группы объектов, однород- ных по структуре и поведению (относительно рамок рассматриваемой ПО), на- зываемых типами объектов. Данные ПО представлены экземплярами объек-
    тов. Экземпляры объектов одного типа обладают одинаковыми наборами атри- бутов, но должны отличаться значением хотя бы одного атрибута для того, что- бы быть узнаваемыми.
    Для каждого объекта определяется идентификатор – ключевой атрибут или комбинация атрибутов. Такой идентификатор называется первичным
    ключом, его значение является уникальным и обязательным.
    Между объектами ПО могут существовать связи, имеющие различный содержательный смысл (семантику). Эти связи могут быть факультативными
    или обязательными (рис.1.1). Если вновь порождённый объект одного из ти- пов оказывается по необходимости связанным с объектом другого типа, то ме- жду этими типами объектов существует обязательная связь. Иначе связь явля- ется факультативной. замещает
    СОТРУДНИК
    ДОЛЖНОСТЬ
    замещается
    – обязательная связь
    – факультативная связь
    Рис.1.1. Примеры обязательной и факультативной связей
    Различают типы множественных связей: "один к одному" (1:1), "один ко многим" (1:n) и "многие ко многим" (m:n) (рис. 1.2).

    – 9 –
    КОЙКА
    ПАЦИЕНТ
    ПАЛАТА
    ВРАЧ
    ПАЦИЕНТ
    ПАЦИЕНТ
    Рис.1.2. Примеры типов множественных связей
    Совокупность типов сущностей и типов связей между ними характеризу- ет структуру предметной области. Собственно данные представлены экземпля- рами объектов и связей между ними.
    Множества типов объектов ПО и экземпляров объектов, значения атри- бутов объектов и связи между ними могут изменяться во времени. Поэтому ка- ждому моменту времени можно сопоставить некоторое состояние ПО. Состоя- ния ПО обладают совокупностью свойств (правил), которые характеризуют се- мантику ПО. Эти правила могут быть заданы с помощью так называемых
      1   2   3   4   5   6   7   8   9   10


    написать администратору сайта