Главная страница

Управление данными, синергия 3 семестр, шпаргалка, краткое содержание учебника. Управление данными 3 сем. Управление данными


Скачать 0.55 Mb.
НазваниеУправление данными
АнкорУправление данными, синергия 3 семестр, шпаргалка, краткое содержание учебника
Дата22.10.2022
Размер0.55 Mb.
Формат файлаdocx
Имя файлаУправление данными 3 сем.docx
ТипДокументы
#748915
страница1 из 11
  1   2   3   4   5   6   7   8   9   10   11

Управление данными
Тема 1. Введение в теорию баз данных
Первичный ключ (идентификатор) – это столбец или некоторое подмножество столбцов, которые уникально, т.е. единственным образом определяют строки. Первичный ключ не может быть полностью или частично пустым, т.е. иметь значение null.

Внешний ключ - это столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы. Внешний ключ таблицы является ссылкой на первичный ключ другой таблицы.

Домен– это совокупность допустимых значений, из которой берутся значения соответствующих атрибутов определенного отношения. С точки зрения программирования домен - это тип данных, определяемый системой (стандартный) или пользователем.

Кортеж – это строка или запись в таблице.

Кардинальность – это количество строк в таблице.

Атрибут – свойство, которое в реляционной модели становится столбцом таблицы, а в случае конкретного значения – полем.

Степень отношения– это количество столбцов.

Поле – элемент таблицы, содержащий данные определенного рода, например, фамилии. В режиме таблицы поле представляет собой ячейку.

Запись – полный набор данных об определенном объекте. В таблице запись изображается как строка.

Форма – объект Access, предназначенный в основном для ввода данных. В форме можно разместить элементы управления, применяемые для ввода, изображения и изменения данных в полях таблицы.

Запрос – объект, позволяющий получить нужные данные из одной или нескольких таблиц.

Отчет – объект БД Access, предназначенный для вывода сформированных данных на печать.
Типы отношений между таблицами: “Один-ко-многим” - чаще всего, Многие-ко-многим”, Один-к-одному.
Банк данных (БНд) - это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных. Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной областиарактерной черта БД - постоянство). Система управления базами данных (СУБД) - это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
СУБД – программный комплекс поддержки интегрированной совокупности данных, предназначенный для создания, ведения и использования базы данных многими пользователями (прикладными программами).

Банк данных – система языковых, алгоритмических, программных, технических и организационных средств поддержки интегрированной совокупности данных, а также сами эти данные, представленные в виде баз данных.

Основные функции СУБД:

  1. Определение структуры создаваемой базы данных, ее инициализация и проведение начальной загрузки.

  2. Предоставление пользователям возможности манипулирования данными.

  3. Обеспечение независимости прикладных программ и данных (логической и физической независимости).

4. Защита логической целостности БД.

5. Защита физической целостности.

6. Управление полномочиями пользователей на доступ к базе данных

7. Синхронизация работы нескольких пользователей.

8. Управление ресурсами среды хранения.

9. Поддержка деятельности системного персонала.
Транзакция - единица действий, производимых с БД.

Оператор завершения транзакций - COMMIT.
Тема 2. Принципы построения баз данных. Модели и структуры данных
Основные требования к банкам данных:

- многократное использование данных;

- простота;

- легкость использования;

- гибкость использования;

- быстрая обработка запросов на данные;

- язык взаимодействия конечных пользователей с системой; 

- база данных - это основа для будущего наращивания прикладных программ;

- сохранение затрат умственного труда;

- наличие интерфейса прикладного программирования;

- распределенная обработка данных;

- адаптивность и расширяемость;

- контроль за целостностью данных;

- восстановление данных после сбоев;

- вспомогательные средства (позволяют предсказать и оптимизировать производительность системы);

- автоматическая реорганизация и перемещение.
Компоненты (подсистемы) в структуре банка данных:

  1. Информационная базаанные, отражающие состояние определенной предметной области и используемые информационной системой). Компоненты: коллекции записей данных и описания данных - метаданные.

  2. Лингвистические средства.

  3. Программные средства: ядро, процессор языка базы данных, подсистема (библиотека) поддержки программных вызовов, сервисные программы.

  4. Технические средства.

  5. Организационно-административные подсистемы и нормативно-методическое обеспечение.


Уровни представления данных: концептуальный, внутренний и внешний.
Для повышения надежности - специализированные дисковые подсистемы RAID (несколько физических дисков, объединенных в одно устройство, управляемое специализированным контроллером).
Информационная система (ИС) - программно-аппаратный комплекс, предназначенный для хранения и обработки какой-либо предметной области. Сущности: операционная (аналог программы), пассивная (БД).

Метод декомпозиции - система разбивается на составные части, которые связаны, взаимодействуют друг с другом и образуют иерархическую структуру.

Концептуальная модель - отображает информационные объекты (обособленные объекты или события, информацию о которых необходимо сохранять, имеющие определенные наборы свойств - атрибутов), их свойства и связи между ними без указания способов физического хранения информации (модель предметной области, информационно-логическая или инфологическая моделью).

Физическая модель - отражает все свойства (атрибуты) информационных объектов базы и связи между ними с учетом способа их хранения - используемой СУБД.

Внутренняя модель - база данных, соответствующая определенной физической модели.

Внешняя модель - комплекс программных и аппаратных средств для работы с базой данных, обеспечивающий процессы создания, хранения, редактирования, удаления и поиска информации, а также решающий задачи выполнения необходимых расчетов и создания выходных печатных форм.
Модель жизненного цикла БД - структура, определяющая последовательность выполнения и взаимосвязи процессов, действий и задач, выполняемых на протяжении ЖЦ:

  1. каскадная - переход на следующий этап происходит только после полного завершения работ на текущем;

  2. поэтапная (каскадная с обратной связью);

  3. спиральная.


Методологии и стандарты:

  1. IDEF.

  2. DFD - технология анадиза “потока данных”.

  3. Workflow - технология анализа “потока работ”.

  4. Методологии и системы, использующие UML - унифицированный язык моделирования.

UEML - специальный унифицированный язык моделирования.

CASE-средства - для проектирования концептуальной модели и формирования физической модели БД ИС (стандарт IDEF1X).





Тема 3. Проектирование баз данных
Абстрагирование - способ упрощения совокупности фактов, относящихся к реальному объекту. Цель - построение конструктивного операбельного описания, удобного в обработке (для человека и машины), позволяющего организовать эффективную обработку больших объемов информации.

Способ представления ПрО в БД:

  1. фиксация логической точки зрения на данные;

  2. определение физического представления данных с учетом выбранных структур хранения данных и архитектуры ЭВМ.


Концептуальная схема - абстрагированное описание ПрО с (фиксированной) логической точки зрения.
Любое состояние объекта характеризуется совокупностью актуализированных атрибутов, кот. фиксируются на некотором материальном носителе в виде записи - совокупности (группы) формализированных элементов данных (значений атрибутов, представленных в том или ином формате).
Хорошо структурированные данные имеют фактографическую природу, предполагают возможность их непосредственной интерпретации. Атрибутивный способ практически не подходит для идентификации слабо структурированной информации, связанной с объектами, имеющими идеальную природу.
Идентификатор - ключ, обеспечивающий доступ к данным; отдельный элемент данных:

  1. первичный (главный) ключ - идентифицирует запись единственным образом;

  2. вторичный (альтернативный) ключ - идентифицирует некоторую группу записей, имеющих определенное общее свойство;

  3. сцепленный ключ - несколько элементов данных, которые в совокупности, например, обеспечат уникальность идентификации каждой записи набора данных.


Индекс - физическая реализация ключа, обеспечивающая доступ к записям, соответствующим отдельным значениям ключа.
Типология простых (атомарных) запросов:



Типы архитектур доступа для 2го типа: системы со вторичными индексами, системы частично инвертированных файлов, системы полностью инвертированных файлов.

Индексы для ускорения процесса поиска: индекс экземпляров (значений ключей) и индекс данных (инвертированный список). Характерны для организации данных документальных информационных систем.
Физическому размещению данных предшествует описание логической структуры ПрО.
Структура информации - схематичная форма представления сложных композиционных объектов и связей реальной ПрО, выделяемых как актуально необходимые для решения прикладных задач.

Структура данных - атрибутивная форма представления свойств и связей ПрО, ориентированная на выражение описания данных средствами формальных языков. Определение информационных массивов.

Структура записей - целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и их элементов (с целью определения основных и вспомогательных функциональных массивов, а также совокупности унифицированных процедур манипулирования данными). Определение структуры физической памяти: выделение, освобождение, защита областей физического носителя, способы адресации и пересылки.
Запись - упорядоченная в соответствии с характером взаимосвязей совокупность полей (элементов) данных, размещаемыхв памяти в соответствии с их типом.

Схемы выделения памяти: статическая (до того, как появляются значения), динамическая(в момент, когда программа во время исполнения получает значение).
Виды структур:

  1. 1) линейные (массивы и последовательности, таблицы);

2) нелинейные (списки, деревья и сети);

2. 1) однородные (все элементы находятся на одном понятийном уровне и имеют один тип данных);

2) неоднородные (элементы относятся к нескольким понятийным уровням или имеют разную природу).

Линейная структура допускает возможность прямого доступа к произвольному элементу. Массив - совокупность однотипных элементов (число элементов известно до его размещения). Последовательность - совокупность однотипных элементов (число элементов до размещения неизвестно). Очередь - порядок размещения/выборки определяется правилом «первым размещен – первым выбран». Стек - «первым размещен – последним выбран». Таблица - это последовательности, представляемые строками - совокупностями разнотипных элементов; это множество записей, каждая из которых представляет набор поименованных полей.

Нелинейные структуры. Списки (линейное упорядочивание), виды ссылок: перекрестные, боковые, иерархические, множественные. Деревья (двумерное упорядочивание) представляют собой иерархию элементов, называемых узлами. Упорядоченные (сбалансированные - в каждом узле имеет одинаковое число ветвей, процесс включения ветвей в узлы сверху вниз, а на каждом уровне дерева слева направо и двоичные - не более двух ветвей для одного узла) и неупорядоченные деревья. Сети (произвольное упорядочивание) - в сетевой структуре любой элемент может быть связан с любым другим элементом (исходный-порожденный - сдвоенные стрелки, порожденный-исходный - одинарные стрелки). Цикл - ситуация, в которой преддественник узла является в то же время его последователем.
Реляционная модель - форма представления данных в виде таблицы. Однородная. Домен - совокупность значений, из которой берутся значения соответствующих атрибутов определенного отношения. Отношение. Кортеж. Кардинальность. Атрибуты. Степень. Первичный ключ - столбец или некоторое подмножество столбцов, которые уникально (единственным способом определяют строки). Внешний ключ - столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы.



Домен

Совокупность допустимых значений

Кортеж

Строка таблицы

Кардинальность

Количество строк в таблице

Атрибут

Поле, столбец таблицы

Степень отношения

Количество полей (столбцов)

Первичный ключ

Уникальный идентификатор



Правила Кодда (определяют концепцию реляционной модели):

  1. Правило информации.

  2. Правило гарантированного доступа.

  3. Правило поддержки недействительных значений.

  4. Правило динамического каталога, основанного на реляционной модели.

  5. Правило исчерпывающего подъязыка данных.

  6. Правило обновления представлений.

  7. Правило добавления, обновления и удаления.

  8. Правило независимости физических данных.

  9. Правило независимости логических данных.

  10. Правило независимости условий целостности.

  11. Правило независимости распространения.

  12. Правило единственности.


Реляционная алгебра:

  1. Традиционные операции над множествами:

  1. объединение - возвращает отношение, содержащее все кортежи, которые пренадлежат либо одному из двух заданных отношений, либо им обоим;

  2. пересечение - возвращает отношение, содержащее все кортежи, которые принадлежат одновременно двум заданным отношениям;

  3. разность - возвращает отношение, содержащее все кортежи, которые принадлежат первому из двух заданных отношений и не принадлежат второму;

  4. декартово произведение- возвращает отношение, содержащее все возможные кортежи, которые являются сочетанием двух кортежей, принадлежащих соответственно двум заданным отношениям;

  1. Специальные реляционные операции:

  1. выборка - возвращает отношение, содержащее все кортежи из заданного отношения, которые удовлетворяют указанным условиям;

  2. проекция - возвращает отношение, содержащее все кортежи (под-кортежи) заданного отношения, которые остались в этом отношении после исключения из него некоторых атрибутов;

  3. соединение - возвращает отношение, содержащее все возможные кортежи, которые представляют собой комбинацию атрибутов двух кортежей, принадлежащих двум заданным, при условии, что в этих двух комбинированных кортежах присутствуют одинаковые значения в одном или нескольких общих для исходных отношений атрибутов (общие значения в результирующем кортеже появляются один раз, а не дважды);

  4. деление - для заданных двух унарных отношений и одного бинарного возвращает отношение, содержащее все кортежи из первого унарного отношения, которые содержатся также в бинарном отношении и соответствуют всем кортежам во втором унарном отношении.


Начальной стадией проектирования системы БД является построение семантической модели ПрО. Эта стадия наз. концептуальным проектированием системы, а ее результат - концептуальная модель ПрО (Инфологическое проектирование/Инфологическая модель).

Компоненты инфологического уровня описания ПрО:

  1. система описания объектов и связей между ними (модель «сущность-связь»);

  2. система атрибутов и средств описания предметной области;

  3. ограничения целостности, определяющие допустимость значения отдельных полей и взаимосвязей как на уровне семантики содержимого БД, так и ее физической структуры (отдельных файлов данных и взаимосвязей между ними);

  4. описание информационных потребностей пользователей.


Модель “сущность-связь” - базируется на использовании графических диаграмм, включающих сравнительно небольшое число компонентов и технологию построения таких диаграмм. Диаграмма “сущность-связь” - ER-диаграмма. Семантическую основу ER-модели составляют предположения:

  1. та часть реального мира (совокупность взаимосвязанных объектов), сведения о которых должны быть помещены в базу данных, может быть представлена как совокупность сущностей;

  2. каждая сущность обладает характеристическими свойствами (атрибутами), отличающими ее от других сущностей и позволяющими ее идентифицировать;

  3. сущности можно классифицировать по типам сущностей: каждый экземпляр сущности (представляющий некоторый объект) может быть отнесен классу - типу сущностей, каждый экземпляр которого обладает общими для них свойствами и отличающим их от сущностей других классов;

  4. систематизация представления, основанная на классах, в общем случае предполагает иерархическую зависимость типов: сущность типа А является подтипом сущности B, если каждый экземпляр типа А является экземпляром сущности типа B;

  5. взаимосвязи объектов могут быть представлены как связи - сущности, которые служат для фиксирования (представления) взаимозависимости двух или нескольких сущностей.

Сущности: сильные и слабые(существование завит от другой сущности: прямоугольник с двойными линиями в диаграмме).

Связь - ассоциация, объединяющая несколько сущностей. Кроме связей между объектом и его свойствами, инфологическая модель отражает связи между объектами разных классов. Участники - сущности, объединяемые связью.

Супертип - сущность, на основе которой определяются подтипы.

Свойства в диаграмме в виде эллипсов (двойная линия - многозначные, штриховая - производные, соединяется пунктирной линией - условное), имена ключевых свойств подчеркиваются, связь (бинарная, рекурсивная) - ромб (двойные линии - связь сущности слабой с сущностью, от кот. она зависит).
Даталогическое (логическое) проектирование - выбор подходящей СУБД и отображение в ее среду спецификаций инфологической модели ПрО. Результатом явл. концептуальная схема БД.
  1   2   3   4   5   6   7   8   9   10   11


написать администратору сайта