Управление данными, синергия 3 семестр, шпаргалка, краткое содержание учебника. Управление данными 3 сем. Управление данными
Скачать 0.55 Mb.
|
Управление данными Тема 1. Введение в теорию баз данных Первичный ключ (идентификатор) – это столбец или некоторое подмножество столбцов, которые уникально, т.е. единственным образом определяют строки. Первичный ключ не может быть полностью или частично пустым, т.е. иметь значение null. Внешний ключ - это столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы. Внешний ключ таблицы является ссылкой на первичный ключ другой таблицы. Домен– это совокупность допустимых значений, из которой берутся значения соответствующих атрибутов определенного отношения. С точки зрения программирования домен - это тип данных, определяемый системой (стандартный) или пользователем. Кортеж – это строка или запись в таблице. Кардинальность – это количество строк в таблице. Атрибут – свойство, которое в реляционной модели становится столбцом таблицы, а в случае конкретного значения – полем. Степень отношения– это количество столбцов. Поле – элемент таблицы, содержащий данные определенного рода, например, фамилии. В режиме таблицы поле представляет собой ячейку. Запись – полный набор данных об определенном объекте. В таблице запись изображается как строка. Форма – объект Access, предназначенный в основном для ввода данных. В форме можно разместить элементы управления, применяемые для ввода, изображения и изменения данных в полях таблицы. Запрос – объект, позволяющий получить нужные данные из одной или нескольких таблиц. Отчет – объект БД Access, предназначенный для вывода сформированных данных на печать. Типы отношений между таблицами: “Один-ко-многим” - чаще всего, “Многие-ко-многим”, ”Один-к-одному”. Банк данных (БНд) - это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных. Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области (характерной черта БД - постоянство). Система управления базами данных (СУБД) - это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями. СУБД – программный комплекс поддержки интегрированной совокупности данных, предназначенный для создания, ведения и использования базы данных многими пользователями (прикладными программами). Банк данных – система языковых, алгоритмических, программных, технических и организационных средств поддержки интегрированной совокупности данных, а также сами эти данные, представленные в виде баз данных. Основные функции СУБД: Определение структуры создаваемой базы данных, ее инициализация и проведение начальной загрузки. Предоставление пользователям возможности манипулирования данными. Обеспечение независимости прикладных программ и данных (логической и физической независимости). 4. Защита логической целостности БД. 5. Защита физической целостности. 6. Управление полномочиями пользователей на доступ к базе данных 7. Синхронизация работы нескольких пользователей. 8. Управление ресурсами среды хранения. 9. Поддержка деятельности системного персонала. Транзакция - единица действий, производимых с БД. Оператор завершения транзакций - COMMIT. Тема 2. Принципы построения баз данных. Модели и структуры данных Основные требования к банкам данных: - многократное использование данных; - простота; - легкость использования; - гибкость использования; - быстрая обработка запросов на данные; - язык взаимодействия конечных пользователей с системой; - база данных - это основа для будущего наращивания прикладных программ; - сохранение затрат умственного труда; - наличие интерфейса прикладного программирования; - распределенная обработка данных; - адаптивность и расширяемость; - контроль за целостностью данных; - восстановление данных после сбоев; - вспомогательные средства (позволяют предсказать и оптимизировать производительность системы); - автоматическая реорганизация и перемещение. Компоненты (подсистемы) в структуре банка данных: Информационная база (данные, отражающие состояние определенной предметной области и используемые информационной системой). Компоненты: коллекции записей данных и описания данных - метаданные. Лингвистические средства. Программные средства: ядро, процессор языка базы данных, подсистема (библиотека) поддержки программных вызовов, сервисные программы. Технические средства. Организационно-административные подсистемы и нормативно-методическое обеспечение. Уровни представления данных: концептуальный, внутренний и внешний. Для повышения надежности - специализированные дисковые подсистемы RAID (несколько физических дисков, объединенных в одно устройство, управляемое специализированным контроллером). Информационная система (ИС) - программно-аппаратный комплекс, предназначенный для хранения и обработки какой-либо предметной области. Сущности: операционная (аналог программы), пассивная (БД). Метод декомпозиции - система разбивается на составные части, которые связаны, взаимодействуют друг с другом и образуют иерархическую структуру. Концептуальная модель - отображает информационные объекты (обособленные объекты или события, информацию о которых необходимо сохранять, имеющие определенные наборы свойств - атрибутов), их свойства и связи между ними без указания способов физического хранения информации (модель предметной области, информационно-логическая или инфологическая моделью). Физическая модель - отражает все свойства (атрибуты) информационных объектов базы и связи между ними с учетом способа их хранения - используемой СУБД. Внутренняя модель - база данных, соответствующая определенной физической модели. Внешняя модель - комплекс программных и аппаратных средств для работы с базой данных, обеспечивающий процессы создания, хранения, редактирования, удаления и поиска информации, а также решающий задачи выполнения необходимых расчетов и создания выходных печатных форм. Модель жизненного цикла БД - структура, определяющая последовательность выполнения и взаимосвязи процессов, действий и задач, выполняемых на протяжении ЖЦ: каскадная - переход на следующий этап происходит только после полного завершения работ на текущем; поэтапная (каскадная с обратной связью); спиральная. Методологии и стандарты: IDEF. DFD - технология анадиза “потока данных”. Workflow - технология анализа “потока работ”. Методологии и системы, использующие UML - унифицированный язык моделирования. UEML - специальный унифицированный язык моделирования. CASE-средства - для проектирования концептуальной модели и формирования физической модели БД ИС (стандарт IDEF1X). Тема 3. Проектирование баз данных Абстрагирование - способ упрощения совокупности фактов, относящихся к реальному объекту. Цель - построение конструктивного операбельного описания, удобного в обработке (для человека и машины), позволяющего организовать эффективную обработку больших объемов информации. Способ представления ПрО в БД: фиксация логической точки зрения на данные; определение физического представления данных с учетом выбранных структур хранения данных и архитектуры ЭВМ. Концептуальная схема - абстрагированное описание ПрО с (фиксированной) логической точки зрения. Любое состояние объекта характеризуется совокупностью актуализированных атрибутов, кот. фиксируются на некотором материальном носителе в виде записи - совокупности (группы) формализированных элементов данных (значений атрибутов, представленных в том или ином формате). Хорошо структурированные данные имеют фактографическую природу, предполагают возможность их непосредственной интерпретации. Атрибутивный способ практически не подходит для идентификации слабо структурированной информации, связанной с объектами, имеющими идеальную природу. Идентификатор - ключ, обеспечивающий доступ к данным; отдельный элемент данных: первичный (главный) ключ - идентифицирует запись единственным образом; вторичный (альтернативный) ключ - идентифицирует некоторую группу записей, имеющих определенное общее свойство; сцепленный ключ - несколько элементов данных, которые в совокупности, например, обеспечат уникальность идентификации каждой записи набора данных. Индекс - физическая реализация ключа, обеспечивающая доступ к записям, соответствующим отдельным значениям ключа. Типология простых (атомарных) запросов: Типы архитектур доступа для 2го типа: системы со вторичными индексами, системы частично инвертированных файлов, системы полностью инвертированных файлов. Индексы для ускорения процесса поиска: индекс экземпляров (значений ключей) и индекс данных (инвертированный список). Характерны для организации данных документальных информационных систем. Физическому размещению данных предшествует описание логической структуры ПрО. Структура информации - схематичная форма представления сложных композиционных объектов и связей реальной ПрО, выделяемых как актуально необходимые для решения прикладных задач. Структура данных - атрибутивная форма представления свойств и связей ПрО, ориентированная на выражение описания данных средствами формальных языков. Определение информационных массивов. Структура записей - целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и их элементов (с целью определения основных и вспомогательных функциональных массивов, а также совокупности унифицированных процедур манипулирования данными). Определение структуры физической памяти: выделение, освобождение, защита областей физического носителя, способы адресации и пересылки. Запись - упорядоченная в соответствии с характером взаимосвязей совокупность полей (элементов) данных, размещаемыхв памяти в соответствии с их типом. Схемы выделения памяти: статическая (до того, как появляются значения), динамическая(в момент, когда программа во время исполнения получает значение). Виды структур: 1) линейные (массивы и последовательности, таблицы); 2) нелинейные (списки, деревья и сети); 2. 1) однородные (все элементы находятся на одном понятийном уровне и имеют один тип данных); 2) неоднородные (элементы относятся к нескольким понятийным уровням или имеют разную природу). Линейная структура допускает возможность прямого доступа к произвольному элементу. Массив - совокупность однотипных элементов (число элементов известно до его размещения). Последовательность - совокупность однотипных элементов (число элементов до размещения неизвестно). Очередь - порядок размещения/выборки определяется правилом «первым размещен – первым выбран». Стек - «первым размещен – последним выбран». Таблица - это последовательности, представляемые строками - совокупностями разнотипных элементов; это множество записей, каждая из которых представляет набор поименованных полей. Нелинейные структуры. Списки (линейное упорядочивание), виды ссылок: перекрестные, боковые, иерархические, множественные. Деревья (двумерное упорядочивание) представляют собой иерархию элементов, называемых узлами. Упорядоченные (сбалансированные - в каждом узле имеет одинаковое число ветвей, процесс включения ветвей в узлы сверху вниз, а на каждом уровне дерева слева направо и двоичные - не более двух ветвей для одного узла) и неупорядоченные деревья. Сети (произвольное упорядочивание) - в сетевой структуре любой элемент может быть связан с любым другим элементом (исходный-порожденный - сдвоенные стрелки, порожденный-исходный - одинарные стрелки). Цикл - ситуация, в которой преддественник узла является в то же время его последователем. Реляционная модель - форма представления данных в виде таблицы. Однородная. Домен - совокупность значений, из которой берутся значения соответствующих атрибутов определенного отношения. Отношение. Кортеж. Кардинальность. Атрибуты. Степень. Первичный ключ - столбец или некоторое подмножество столбцов, которые уникально (единственным способом определяют строки). Внешний ключ - столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы.
Правила Кодда (определяют концепцию реляционной модели): Правило информации. Правило гарантированного доступа. Правило поддержки недействительных значений. Правило динамического каталога, основанного на реляционной модели. Правило исчерпывающего подъязыка данных. Правило обновления представлений. Правило добавления, обновления и удаления. Правило независимости физических данных. Правило независимости логических данных. Правило независимости условий целостности. Правило независимости распространения. Правило единственности. Реляционная алгебра: Традиционные операции над множествами: объединение - возвращает отношение, содержащее все кортежи, которые пренадлежат либо одному из двух заданных отношений, либо им обоим; пересечение - возвращает отношение, содержащее все кортежи, которые принадлежат одновременно двум заданным отношениям; разность - возвращает отношение, содержащее все кортежи, которые принадлежат первому из двух заданных отношений и не принадлежат второму; декартово произведение- возвращает отношение, содержащее все возможные кортежи, которые являются сочетанием двух кортежей, принадлежащих соответственно двум заданным отношениям; Специальные реляционные операции: выборка - возвращает отношение, содержащее все кортежи из заданного отношения, которые удовлетворяют указанным условиям; проекция - возвращает отношение, содержащее все кортежи (под-кортежи) заданного отношения, которые остались в этом отношении после исключения из него некоторых атрибутов; соединение - возвращает отношение, содержащее все возможные кортежи, которые представляют собой комбинацию атрибутов двух кортежей, принадлежащих двум заданным, при условии, что в этих двух комбинированных кортежах присутствуют одинаковые значения в одном или нескольких общих для исходных отношений атрибутов (общие значения в результирующем кортеже появляются один раз, а не дважды); деление - для заданных двух унарных отношений и одного бинарного возвращает отношение, содержащее все кортежи из первого унарного отношения, которые содержатся также в бинарном отношении и соответствуют всем кортежам во втором унарном отношении. Начальной стадией проектирования системы БД является построение семантической модели ПрО. Эта стадия наз. концептуальным проектированием системы, а ее результат - концептуальная модель ПрО (Инфологическое проектирование/Инфологическая модель). Компоненты инфологического уровня описания ПрО: система описания объектов и связей между ними (модель «сущность-связь»); система атрибутов и средств описания предметной области; ограничения целостности, определяющие допустимость значения отдельных полей и взаимосвязей как на уровне семантики содержимого БД, так и ее физической структуры (отдельных файлов данных и взаимосвязей между ними); описание информационных потребностей пользователей. Модель “сущность-связь” - базируется на использовании графических диаграмм, включающих сравнительно небольшое число компонентов и технологию построения таких диаграмм. Диаграмма “сущность-связь” - ER-диаграмма. Семантическую основу ER-модели составляют предположения: та часть реального мира (совокупность взаимосвязанных объектов), сведения о которых должны быть помещены в базу данных, может быть представлена как совокупность сущностей; каждая сущность обладает характеристическими свойствами (атрибутами), отличающими ее от других сущностей и позволяющими ее идентифицировать; сущности можно классифицировать по типам сущностей: каждый экземпляр сущности (представляющий некоторый объект) может быть отнесен классу - типу сущностей, каждый экземпляр которого обладает общими для них свойствами и отличающим их от сущностей других классов; систематизация представления, основанная на классах, в общем случае предполагает иерархическую зависимость типов: сущность типа А является подтипом сущности B, если каждый экземпляр типа А является экземпляром сущности типа B; взаимосвязи объектов могут быть представлены как связи - сущности, которые служат для фиксирования (представления) взаимозависимости двух или нескольких сущностей. Сущности: сильные и слабые(существование завит от другой сущности: прямоугольник с двойными линиями в диаграмме). Связь - ассоциация, объединяющая несколько сущностей. Кроме связей между объектом и его свойствами, инфологическая модель отражает связи между объектами разных классов. Участники - сущности, объединяемые связью. Супертип - сущность, на основе которой определяются подтипы. Свойства в диаграмме в виде эллипсов (двойная линия - многозначные, штриховая - производные, соединяется пунктирной линией - условное), имена ключевых свойств подчеркиваются, связь (бинарная, рекурсивная) - ромб (двойные линии - связь сущности слабой с сущностью, от кот. она зависит). Даталогическое (логическое) проектирование - выбор подходящей СУБД и отображение в ее среду спецификаций инфологической модели ПрО. Результатом явл. концептуальная схема БД. |