Конспект Лекций БД. Конспект лекций_БД. Конспект лекций по курсу Информационное обеспечение, базы данных
Скачать 0.89 Mb.
|
Министерство образования и науки РФ Государственное образовательное учреждение высшего профессионального образования «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых ВлГУ» Кафедра Управления качеством и технического регулирования Конспект лекций по курсу «Информационное обеспечение, базы данных» Направление подготовки: 27.03.02 Управление качеством Профиль подготовки: Квалификация (степень) выпускника: бакалавр Форма обучения: дистанционная Составитель: Касаткина Э.Ф. ТЕМА 1. Базы данных. Основные понятия и определения. Архитектура информационных систем. Модели и типы данных. Иерархическая, сетевая, реляционная. Основные типы данных. Архитектура СУБД: локальная, файл-серверная, клиент-серверная, распределенная и интернет-архитектура. Классификация СУБД. ТЕМА 2. Проектирование базы данных. Жизненный цикл БД. Проектирование БД: концептуальное, логическое и физическое. Пять нормальных форм таблиц. Модели структурного проектирования: ER-диаграммы, диаграммы потоков данных, методология функционального проектирования. ТЕМА 3. Реляционная модель данных. Основные элементы реляционной модели. Ключи: первичный и внешний, понятие домен. Индексирование. Основные виды связей таблиц. Целостность связей и ее контроль. Работа с записями. Характеристика языка запросов по образцу QBE. Основы структурированного языка запросов SQL: назначение, синтаксические конструкции, основные операторы. ТЕМА 5. Технологии искусственного интеллекта. Определение понятия «знания» и модели их представления: логическая, продукционная, фреймовые, семантические сети и модели, основанные на нечетких множествах. Определение экспертных систем и базы знаний. Классификация экспертных систем и перечень задач, для решения которых используются экспертные системы. Инструментальные средства построения экспертных систем. Определение понятия «инженерия знаний». Основные этапы построения базы знаний. ТЕМА 6. Microsoft Access как настольная СУБД реляционного типа. Объекты, входящие в БД. Различие между СУБД Microsoft Access и электронных таблиц Microsoft Excel. Проектирование БД. Запуск Microsoft Access и открытие БД. Создание новой БД. Рабочая среда Microsoft Access. Работа с таблицами: способы создания; ввод, удаление и модификация данных; определение ключевых полей; связывание таблиц на схеме данных; обеспечение целостности данных; сортировка данных; поиск и замена данных; фильтрация данных. Запросы: способы создания, создание вычисляемых полей; запросы с параметрами; построитель выражений. Создание форм: автоформа; мастер создания форм; режимы работы с формами. Отчеты: автоотчет; мастер создания отчетов. Преобразование отчета в формат документа Word. ТЕМА 7. Сервер InterBase. Утилита IBConsol: доступ к локальному и удаленному серверам; создание БД; диалект БД. Основные типы данных, используемых в InterBase. Домены. Таблицы: создание, модификация, удаление; первичные ключи; генераторы; индексы; ограничения БД. Представления. Хранимые процедуры: процедуры-выборки, исполнительные процедуры; обработка исключений и ошибок. Триггеры: создание, модификация, удаление; контекстные переменные; управление состоянием триггера. Транзакции. параметры транзакций. Реализация механизма транзакций. Многоверсионная архитектура. Сборка мусора. Сохранение и восстановление БД. Проверка состояния БД. Анализ статистики. ТЕМА 1. . Базы данных. Основные понятия и определения. Архитектура информационных систем. Модели и типы данных. Иерархическая, сетевая, реляционная. Архитектура СУБД: локальная, файл-серверная, клиент-серверная, распределенная и интернет-архитектура. Классификация СУБД. Наиболее характерная черта нынешнего развития мировой экономики - колоссальные успехи и достижения в области техники и технологии, развитие наукоемких производств. Высокие темпы развития науки и технологий, а главное, масштабы и темпы их внедрения в производство и общественную жизнь превратили научно-техническую революцию в естественный процесс, она стала перманентной. Благодаря всепланетному масштабу коммуникаций и росту уровня образования "ноу-хау" сейчас практически сразу после изобретения становятся общечеловеческим достоянием. В условиях динамичного развития рынка, усложнения его инфраструктуры информация становится таким же стратегическим ресурсом, как и традиционные материальные и энергетические. Современные технологии, позволяющие создавать, хранить, перерабатывать и обеспечивать эффективные способы представления информации, стали важным фактором конкурентоспособности и средством повышения эффективности управления всеми сферами общественной жизнедеятельности. Уровень информатизации является сегодня одним из главных факторов успешного развития всякого предприятия. Можно выделить две основные области использования вычислительной техники (ВТ). Первая - применение ВТ для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Вторая - это использования средств ВТ для автоматизированной обработки информации при помощи специально созданных информационных систем (ИС). Обычно такие системы имеют дело с большими объемами информации, и эта информация имеет достаточно сложную структуру. Классическими примерами ИС являются банковские системы, системы документа оборота любого предприятия и т.д. Различают 2 основных класса ИС: 1. Информационно-поисковые системы, ориентированные на поиск данных по определенному критерию из общего множества. Для пользователя в данном случае важно сама извлекаемая информация, а не способы ее обработки. (Например, справочная телефонная служба, пользователя в данном случае интересует конкретная информация номер телефона, а не способ ее обработки). 2. Системы обработки данных (СОД). Системы этого типа ориентированы на обработку данных, обычно выходная информация является результатом обработки, а не сами данные. (Например, метеорологическая служба, в которой данные собираются со всего региона, а затем производится их обработка, пользователей интересуют не сами данные, а результат их обработки). К функциям информационных систем относятся: - хранение информации; - ввод и редактирование информации; - просмотр и поиск информации; - выборка информации по заданным критериям; - получение отчетов в той или иной форме; - контроль правильности информации. Информационная система предназначена для хранения, поиска и выдачи информации по запросам пользователей. Информационная технология - совокупность методов, производственных процессов и программно-технических средств, объединенных в технологическую цепочку, обеспечивающую сбор, хранение, обработку, вывод и распространение информации для снижения трудоемкости процессов использования информационных ресурсов, повышения их надежности и оперативности. Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ «Об информации, информационных технологиях и о защите информации» даёт следующее определение: «информационная система — совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств». По мнению одних авторов, ИС в широком смысле включает в себя персонал, её эксплуатирующий, по мнению других — нет. В узком смысле информационной системой называют только подмножество компонентов ИС в широком смысле, включающее базы данных, СУБД и специализированные прикладные программы. В любом случае основной задачей ИС является удовлетворение конкретных информационных потребностей в рамках конкретной предметной области. Современные ИС де-факто немыслимы без использования баз данных и СУБД, поэтому термин «информационная система» на практике сливается по смыслу с термином «система баз данных». Информационное обеспечения АИС. Во всех областях человеческой деятельности, где необходимо проводить исследования, анализ, выработку и принятие решений с последующим их контролем – основным ресурсом этих действий является информация. Информационные ресурсы – это все виды информации, доступные пользователю и необходимые для выполнения стоящих перед ним задач и (или) повышающие эффективность его деятельности. Если провести аналогию с природными и производственными ресурсами, то можно сказать, что для превращения природных ресурсов (полезные ископаемые, вода и т.д.) в производственные их подвергают определенной первичной обработке, например, обогащение полезных ископаемых. Информационные ресурсы, для того, чтобы они могли быть использованы в вышеперечисленных процессах, также должны быть подвергнуты определенной обработке. После первичной обработки они накапливаются в информационных фондах предприятий, организаций и др. Информационные фонды – это информационные ресурсы, организованные специальным образом для повышения эффективности информационной работы. Сбор, упорядочение, хранение, обработку и выдачу пользователям информационных ресурсов осуществляют АИС. Под информационным обеспечением АИС понимается система реализованных решений по объемам, размещению и формам организации информации, циркулирующей в АИС при ее функционировании. Специфическими формами организации информации в АИС являются: база данных (БД) – поименованная, целостная, единая система данных, организованная по определенным правилам, которые предусматривают общие принципы описания, хранения и обработки данных; база знаний (БЗ) – формализованная система сведений о некоторой предметной области, содержащая данные о свойствах объектов, закономерностях процессов и явлений и правила использования в задаваемых ситуациях этих данных для принятия новых решений. В БЗ центральным понятием является – представление знаний в информационных системах, т.е. формализация метапроцедур, используемых биологическими объектами при решении интеллектуальных задач. В современных АИС все средства обработки данных организовываются в виде системы управления базами данных (СУБД) – совокупности программных и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных, обеспечения многопользовательского доступа к данным. В СУБД информация описывается с помощью метаданных – данных, которые являются описанием других данных, их характеристик, местонахождения, способов использования и тому подобное. Кроме того вводится понятие – автоматизированного банка данных (АБД), как совокупности системы управления базами данных и конкретной базы (баз) данных, находящейся (находящихся) под ее управлением. В последнее время в публикациях по информационным системам все чаще стало использоваться понятие хранилища данных, которые работают по принципу центрального склада. Хранилища данных отличаются от традиционных БД тем, что они проектируются для поддержки процессов принятия решений, а не просто для эффективного сбора и обработки данных. Как правило, хранилище содержит многолетние версии обычной БД, физически размещаемые в той же самой базе. Данные в хранилище не обновляются на основании отдельных запросов пользователей. Вместо этого вся база данных периодически обновляется целиком. Хранилища данных могут быть очень внушительных размеров. Например, банк Chase Manhatten Bank имеет хранилище объемом более 560 Гбайт, компания MasterCard OnLine – 1200 Гбайт. Базы данных (БД). База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей. База данных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных База данных — некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия. База данных — совокупность взаимосвязанных данных, совместно хранимых в одном или нескольких компьютерных файлах. База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации. Существует множество других определений, отражающих скорее субъективное мнение тех или иных авторов о том, что означает этот термин в их понимании, однако общепризнанная единая формулировка отсутствует. Наиболее часто используются следующие отличительные признаки: База данных хранится и обрабатывается в вычислительной системе. Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т. п.) базами данных не являются. Данные в базе данных логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе. Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определённая семантика и допустимые операции. База данных включает метаданные, описывающие логическую структуру БД в формальном виде (в соответствии с некоторой метамоделью). В соответствии с ГОСТ Р ИСО МЭК ТО 10032-2007, «постоянные данные в среде базы данных включают в себя схему и базу данных. Схема включает в себя описания содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных. База данных включает в себя набор постоянных данных, определенных с помощью схемы. Система управления данными использует определения данных в схеме для обеспечения доступа и управления доступом к данным в базе данных». Из перечисленных признаков только первый является строгим, а другие допускает различные трактовки и различные степени оценки. Можно лишь установить некоторую степень соответствия требованиям к базам данным (далее БД). В такой ситуации не последнюю роль играет общепринятая практика. В соответствии с ней, например, не называют базами данных файловые архивы, интернет-порталы или электронные таблицы, несмотря на то, что они в некоторой степени обладают признаками БД. Принято считать, что эта степень в большинстве случаев недостаточна (хотя могут быть исключения). Системы управления базами данных (СУБД). Система управления базами данных (СУБД) — совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных. Основные функции СУБД: управление данными во внешней памяти (на дисках); управление данными в оперативной памяти с использованием дискового кэша; журнализация изменений, резервное копирование и восстановление базы данных после сбоев; поддержка языков БД (язык определения данных, язык манипулирования данными). Обычно современная СУБД содержит следующие компоненты: ядро, которое отвечает за управление данными во внешней и оперативной памяти, и журнализацию, процессор языка базы данных, обеспечивающий оптимизацию запросов на извлечение и изменение данных и создание, как правило, машинно-независимого исполняемого внутреннего кода, подсистему поддержки времени исполнения, которая интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД а также сервисные программы (внешние утилиты), обеспечивающие ряд дополнительных возможностей по обслуживанию информационной системы. Банки данных. Банк данных - автоматизированная информационная система централизованного хранения и коллективного использования данных. В состав банка данных входят одна или несколько баз данных, справочник баз данных, СУБД, а также библиотеки запросов и прикладных программ. Базы знаний. База знаний в информатике и исследованиях искусственного интеллекта (БЗ; англ. knowledge base, KB) — это особого рода база данных, разработанная для оперирования знаниями (метаданными). Под базой знаний понимают совокупность фактов и правил вывода, допускающих автоматические умозаключения и осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний. Современные базы знаний обычно работают совместно с продвинутыми системами поиска информации и имеют тщательно продуманную структуру и формат представления знаний. За несколько десятилетий последовательно появились системы, основанные на трех базовых моделях, или концептуальных методах структурирования данных иерархическая, сетевая, реляционная. Модель данных совокупность структур данных и операций по их обработке. С помощью модели данных можно наглядно представить структуру объектов и установленные между ними связи. Для терминологии моделей данных характерны понятия “элемент данных” т.е. описание любого набора данных и “правила связывания” которые определяют алгоритмы взаимосвязи элементов данных. Иерархическая модель. Иерархическая модель (ИМ) - связи между данными имеют вид иерархии, на ее основе были созданы первые ИС использующие БД. Иерархически организованные данные встречаются в повседневной жизни часто. Например, структура высшего учебного заведения это многоуровневая, иерархическая или древовидная структура. ИБД состоит из упорядоченного набора элементов. В этой модели исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы. Каждый порожденный элемент имеет только один порождающий элемент. Автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя. Особенности иерархической структуры следующие. Узел, находящийся на высшем уровне иерархии, называется корнем. Узлы, из которых выходят дуги на низший уровень, являются исходными узлами, а в которые входят дуги с высшего уровня порожденными. Узлы, не имеющие порожденных узлов, называются листьями. Из каждого узла может исходить несколько дуг, но входить только одна. Это отношение называется “один ко многим”, т.е. одному экземпляру записи одного типа соответствует несколько экземпляров записи другого типа. Простейшим случаем отношения является отношение “один к одному”, т.е. одному экземпляру записи одного типа соответствует один экземпляр записи другого типа и наоборот. Файлы такой структуры называются плоскими или прямоугольными. Древовидную структуру можно разложить на прямоугольную, представив отношение “один ко многим” отношением “один к одному”. При этом в БД вносится избыточность. Основным недостатком данной модели является необходимость использования той иерархии, которая была заложена в основу БД при проектировании. Потребность в постоянной реорганизации данных (а часто невозможность этой реорганизации) привело к созданию более общей модели сетевой. Сетевая модель. Сетевой подход к организации данных является расширением иерархического подхода. Данная модель отличается от ИМ тем, что каждый порожденный элемент может иметь более одного порождающего элемента. В сетевых структурах порожденный узел может иметь более одного исходного. Для сетей характерны отношения “многое к одному” и “многое ко многим”. Примером связи “М к М” может служить связь “поставщик изделие”, т.к. каждый поставщик может поставлять несколько видов изделий, а изделие одного типа могут поставлять несколько поставщиков. Поскольку СБД может представлять непосредственно все виды связей, присущих данным, по этим данным можно перемещаться, исследовать и запрашивать их всевозможными способами. Для БД с большим количеством узлов реализация такого подхода затруднена. Он плохо приспособлен к изменению структуры (введению новых узлов и связей). Манипулирование данными с ростом количества узлов резко усложняется, т.к. для того чтобы составить запрос к СБД, необходимо достаточно глубоко вникнуть в ее структуру (иметь схему БД) и выработать механизм манипулирования БД. Извлечение данных из файлов в двух рассмотренных системах происходило на основе указателя. Указатель физический адрес, указывающий место хранения данных на диске. Среди реализаций иерархически моделей преобладает система IMS (Information Management System компании IBM, информационно-управляющая система). IMS была создана в 60-х годах в результате совместных усилий компаний IBM и North American Aviation (позднее Rockwell) по созданию СУБД для поддержания лунного проекта Аполлон. При создании IMS была необходимость в управлении большим количеством деталей, связанных друг с другом иерархическим образом. Применяют и другие иерархические системы: TDMS (Time-shared Data Management System компании Development Corporation), MARK IV (Multi-Access Retrieval System компании Control Data Corporation) и System-2000 (SAS – Institute). Реляционная модель данных. Реляционные структуры лишены указанных недостатков. Основная идея реляционной модели данных заключается в том, чтобы представить любой набор данных в виде двухмерной таблицы. В простейшем случае реляционная модель описывает единственную двумерную таблицу, но чаще всего эта модель описывает структуру и взаимоотношения между несколькими различными таблицами. Основоположником теории РБД считается сотрудник фирмы IBM Е.Ф. Кодд, опубликовавший 6.07.70 г. статью A Relational Model of data for Large Shared Data Banks (Реляционная модель данных для больших коллективных банков данных). В этой статье впервые был использован термин “реляционная модель данных” РМД, что и положило начало РБД. Была выдвинута идея о том, что данные нужно связывать в соответствии с их внутренними логическими взаимоотношениями, а не физическими указателями. Кодд, являясь математиком по образованию, предложил использовать для обработки данных аппарат теории множеств (объединение, пересечение, разность, декартово произведение). Он доказал, что любой набор данных можно представить в виде двумерных таблиц особого вида, известных в математике как “отношения”, состоящий из строк и столбцов данных. Слово “реляционная” происходит от английского relation, что означает отношение. Классификация информационных систем Информационные системы классифицируются по различным признакам. Наиболее часто используемые классификации: по масштабу, по сфере применения, по способу организации. Классификация по масштабу По масштабу информационные системы подразделяются на следующие группы: одиночные; групповые; корпоративные. Одиночные информационные системы реализуются, как правило, на автономном персональном компьютере (сеть не используется). Такая система может содержать несколько простых приложений, связанных общим информационным фондом, и рассчитана на работу одного пользователя или группы пользователей, разделяющих по времени одно рабочее место. Подобные приложения создаются с помощью так называемых настольных или локальных систем управления базами данных (СУБД). Групповые информационные системы ориентированы на коллективное использование информации членами рабочей группы и чаще всего строятся на базе локальной вычислительной сети. При разработке таких приложений используются серверы баз данных (называемые также SQL-серверами) для рабочих групп. Существует довольно большое количество различных SQL-серверов, как коммерческих, так и свободно распространяемых. Среди них наиболее известны такие серверы баз данных, как Oracle, DB2, Qicrosoft SQL Server, InterBase, Sybase, Inforqix. Корпоративные информационные системы являются развитием систем для рабочих групп, они ориентированы на крупные компании и могут поддерживать территориально разнесенные узлы или сети. В основном они имеют иерархическую структуру из нескольких уровней. Для таких систем характерна архитектура клиент-сервер со специализацией серверов или же многоуровневая архитектура. При разработке таких систем могут использоваться те же серверы баз данных, что и при разработке групповых информационных систем. Однако в крупных информационных системах наибольшее распространение получили серверы Oracle, DB2 и Qicrosoft SQL Server. Для групповых и корпоративных систем существенно повышаются требования к надежности функционирования и сохранности данных. Эти свойства обеспечиваются поддержкой целостности данных, ссылок и транзакций в серверах баз данных. Классификация по сфере применения По сфере применения информационные системы обычно подразделяются на четыре группы: системы обработки транзакций; системы принятия решений; информационно-справочные системы; офисные информационные системы. Системы обработки транзакций, в свою очередь, по оперативности обработки данных, разделяются на пакетные информационные системы и оперативные информационные системы. В информационных системах организационного управления преобладает режим оперативной обработки транзакций — OLTP (OnLlne Transaction Processing), для отражения актуального состояния предметной области в любой момент времени, а пакетная обработка занимает весьма ограниченную часть. Для систем OLTP характерен регулярный (возможно, интенсивный) поток довольно простых транзакций, играющих роль заказов, платежей, запросов и т. п. Важными требованиями для них являются: высокая производительность обработки транзакций; гарантированная доставка информации при удаленном доступе к БД по телекоммуникациям. Системы поддержки принятия решений — DSS (Decision Support Systeq) — представляют собой другой тип информационных систем, в которых с помощью довольно сложных запросов производится отбор и анализ данных в различных разрезах: временных, географических и по другим показателям. Информационно-справочные системы – это гипертекстовые документы и мультимедиа. Наибольшее развитие получили в сети Internet. Офисные информационные системы в основном переводят бумажные документы в электронный вид, автоматизируют делопроизводство и управление документооборотом. Классификация по способу организации. |