индивидуальный проект. Введение бд. Сегодня, системы управления базами данных являются наиболее устоявшейся областью информационных технологий
Скачать 31.38 Kb.
|
Введение Сегодня, системы управления базами данных являются наиболее устоявшейся областью информационных технологий. В те годы, когда формировалось понятие «база данных», в ней действительно хранились только данные. Однако в современных системах управления базами данных имеется возможность не только хранить структурированные данные, но и хранить программный код, т.е. методы, с помощью которых происходит взаимодействие с потребителем или с другим программно - аппаратным комплексом. Таким образом, можно утверждать, что в современных базах данных хранятся не только данные, но и информация. В данной работе рассмотрим подробнее понятие базы данных, их значение и применение, классификацию, понятие систем управления базами данных и приведем некоторые примеры таких систем. 1. Основы баз данных 1.1 История баз данных История возникновения и развития технологий баз данных может рассматриваться как в широком, так и в узком аспекте. В широком аспекте понятие истории баз данных обобщается до истории любых средств, с помощью которых человечество хранило и обрабатывало данные. В таком контексте упоминаются, например, средства учёта царской казны и налогов в древнем Шумере (4000 г. до н.э.), узелковая письменность инков - кипу, клинописи, содержащие документы Ассирийского царства и т.п. Следует помнить, что недостатком этого подхода является размывание понятия «база данных» и фактическое его слияние с понятиями «архив» и даже «письменность». История баз данных в узком аспекте рассматривает базы данных в традиционном (современном) понимании. Эта история начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Для хранения данных использовалисьперфокарты. Оперативные сетевые базы данных появились в середине 1960-х. Операции над оперативными базами данных обрабатывались в интерактивном режиме с помощью терминалов. Простые индексно-последовательные организации записей быстро развились к более мощной модели записей, ориентированной на наборы. За руководство работой Data Base Task Group (DBTG), разработавшей стандартный язык описания данных и манипулирования данными, Чарльз Бахман получил Тьюринговскую премию. В это же время в сообществе баз данных COBOL была проработана концепция схем баз данных и концепция независимости данных. Следующий важный этап связан с появлением в начале 1970-х реляционной модели данных, благодаря работам Эдгара Ф. Кодда. Работы Кодда открыли путь к тесной связи прикладной технологии баз данных с математикой и логикой. За свой вклад в теорию и практику Эдгар Ф. Кодд также получил премию Тьюринга. Сам термин database (база данных) появился в начале 1960-х годов, и был введён в употребление на симпозиумах, организованных фирмой SDC (System Development Corporation) в1964 и 1965 годах, хотя понимался сначала в довольно узком смысле, в контексте систем искусственного интеллекта. В широкое употребление в современном понимании термин вошёл лишь в 1970-е годы. 1.2 Основные понятия БД В настоящее время жизнь человека настолько насыщена различного рода информацией, что для ее обработки требуется создание огромного количества хранилищ информации различного назначения. Современные информационные системы характеризуются огромными объемами хранимых данных, сложной организацией, необходимостью удовлетворять разнообразные требования многочисленных пользователей. Основой информационной системы является база данных. Целью любой информационной системы является обработка данных об объектах реального мира. В широком смысле слова база данных - это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области. Кроме того, база данных - это хранилище данных для совместного использования. При автоматизации деятельности человека происходит перенос реального мира в электронный формат. Для этого выделяется какая-то часть этого мира и анализируется на предмет возможности автоматизации. Она называется предметной областью и строго очерчивает круг объектов, которые изучаются, измеряются, оцениваются и т.д. В результате этого процесса выделяются объекты автоматизации и определяются реквизиты, по которым данные объекты оцениваются. Результатом данного процесса становится база данных, которая описывает конкретную часть реального мира со строго определенных позиций. Объектами могут быть: люди, например, перечисленные в какой-либо платежной ведомости или являющиеся объектами учетов органов внутренних дел; предметы, например, номерные или имеющие характерные отличительные особенности вещи, средства автомототранспорта; построения - воображаемые объекты; события. Базы данных выполняют две основные функции. Они группируют данные по информационным объектам и их связям и предоставляют эти данные пользователям. Данные - это формализованное представление информации, доступное для обработки, интерпретации и обмена между людьми или в автоматическом режиме. Информация может храниться в неструктурированном виде, например, в виде текстового документа, где данные об объектах предметной области записаны в произвольной форме: Студент Иванов Иван родился 4 апреля 1981 года, обучается в 411 группе, номер его зачетной книжки 200205; студент Виктор Сидоров 06.08 1982 г.р., имеет зачетную книжку №200213, обучается в 413 группе; Женя Петров, родился в 1982 году 25 марта, номер зачетной книжки 200210, обучается в 411 группе. В качестве предметной области в данном примере может быть представлена сфера деятельности деканата факультета по учету студентов. Объектами этой предметной области выступают как сами студенты, так и данные их номеров зачетных книжек. Структурированный вид хранения информации предполагает введение соглашений о способах представления данных. Это означает, что в определенном месте хранилища могут находиться данные определенного типа, формата и содержания. Указанная выше информация о гражданах Петрове, Сидорове и Иванове в структурированном виде будет выглядеть следующим образом:
Представление информации в таблице - наилучший способ структурирования данных. Все данные записаны в клеточках таблицы по определенным правилам - форматам, одинаковым для всего столбца. Все столбцы имеют названия. Кроме этого нетрудно заметить, что фамилии студентов записаны по алфавиту, при этом для записей имен и фамилий используются заглавные буквы. Каждая строка таблицы имеет порядковый номер. Автоматизировать обработку данных, которые хранятся в неструктурированном виде сложно, а порой и просто невозможно. Поэтому вырабатывают определенные соглашения о способах представления данных. Обычно это делает разработчик базы данных. В результате все реквизиты имеют одинаковый вид и тип данных, что делает их структурированными и позволяет создать базу данных. База данных - это поименованная совокупность структурированных данных, относящихся к определенной предметной области. 1.3 Классификация БД Существует огромное количество разновидностей баз данных, отличающихся по различным критериям. Рассмотрим основные классификации. Классификация БД по модели данных: - Иерархическая модель базы данных состоит из объектов с указателями от родительских объектов к потомкам, соединяя вместе связанную информацию. Иерархические БД могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй - объекты второго уровня и т.д.; - Сетевая модель базы данных подобна иерархической, за исключением того, что в ней имеются указатели в обоих направлениях, которые соединяют родственную информацию; - Реляционная модель - «реляционный» от англ. Relation (отношение), ориентирована на организацию данных в виде двумерных таблиц, называемых еще реляционными таблицами. Информация, введенная в одну таблицу, может быть связана с одной или несколькими записями другой таблицы. В реляционной БД используются четыре основных типов полей: Числовой, Символьный (слова, тексты, коды и т.д.), Дата (календарные даты в форме «день/месяц/год»), Логический (принимает два значения: «да» - «нет» или «истина» - «ложь»). Классификация БД по степени распределенности: - Централизованные (сосредоточенные) базы данных - хранятся в памяти одной вычислительной системы, к которой подключены несколько других компьютеров; - Распределенные базы данных - состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ПК. Классификация БД по технологии хранения: - БД во вторичной памяти (традиционные); - БД в оперативной памяти (in-memory databases); - БД в третичной памяти (tertiary databases). Классификация БД по содержимому: - Географические; - Исторические; - Научные; - Мультимедийные и др. Примеры баз данных: - Astrophysics Data System - астрофизическая информационная система НАСА, интерактивная база данных, содержит более 7 000 000 документов по астрономии и физике как из рецензируемых, так и не рецензируемых источников; - Scientific and Technical Network - европейская база данных, содержащая около 10 млн. наименований журнальных статей, книг, диссертаций, патентов и материалов научных конференций в области прикладной физики, химии, биофизики, технологий, биотехнологий, медицины. База данных является одной из самых больших в мире; - ABC-CLIO - американская база данных, содержащая свыше 1 млн. журнальных статей, книг, материалов и политических наук. В базе данных имеются почти все исторические журналы мира. База платная, создана и управляется Калифорнийским университетом в Санта-Барбаре; - ArXiv - крупнейший бесплатный архив электронных препринтов научных статей по физике, математике, астрономии, информатике и биологии; - SPIRES - база данных очень популярные среди физиков-теоретиков, специалистов в области физики высоких энергий, астрофизиков. Большое внимание уделяется созданию и комплектации системы цитирования работ. Содержит порядка 1 млн. наименований, делится на базу данных статей и конференций и на базу данных книг. 2. Системы управления базами данных 2.1 Понятие СУБД Структурированные данные обрабатывает централизованный программный механизм, который называется системой управления базами данных. Система управления базами данных (СУБД) - специализированная программа, предназначенная для организации и ведения базы данных. Основные функции СУБД: - управление данными во внешней памяти (на дисках); - управление данными в оперативной памяти с использованием дискового кэша; - журнализация изменений, резервное копирование и восстановление базы данных после сбоев; - поддержка языков БД (язык определения данных, язык манипулирования данными). Основные действия, которые пользователь может выполнять с помощью СУБД: создание структуры БД; заполнение БД информацией; изменение (редактирование) структуры и содержания БД; поиск информации в БД; сортировка данных; защита БД; проверка целостности БД. Часто для работы с БД используются не СУБД, а созданные с их помощью информационные системы, которые обеспечивают работу с информацией, регламентируя доступ к структуре БД. 2.2 Классификация СУБД СУБД классифицируются: - по модели данных (иерархические, сетевые, реляционные); - по степени распределенности (локальные, распределенные); - по способу доступа к БД: 1. Файл-серверные - Microsoft Access, Paradox, dBase, FoxPro, Visual FoxPro и др. В файл-серверных СУБД файлы данных располагаются централизованно на файл-сервере. СУБД располагается на каждом клиентском компьютере (рабочей станции). Доступ СУБД к данным осуществляется через локальную сеть. Синхронизация чтений и обновлений осуществляется посредством файловых блокировок. Преимуществом этой архитектуры является низкая нагрузка на ЦП сервера. Недостатки: потенциально высокая загрузка локальной сети; затруднённость централизованного управления; затруднённость обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность. На данный момент файл-серверные СУБД считаются устаревшими. 2. Клиент-серверные - Oracle, Firebird, Interbase, IBM DB2, MS SQL Server, Sybase, PostgreSQL, MySQL, MDBS, ЛИНТЕР и др. Клиент-серверная СУБД располагается на сервере вместе с БД и осуществляет доступ к БД непосредственно, в монопольном режиме. Все клиентские запросы на обработку данных обрабатываются клиент-серверной СУБД централизованно. Недостаток клиент-серверных СУБД состоит в повышенных требованиях к серверу. Достоинства: потенциально более низкая загрузка локальной сети; удобство централизованного управления; удобство обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность. 3. Встраиваемые СУБД - OpenEdge, SQLite, BerkeleyDB, Microsoft SQL Server Compact, Sav Zigzag и др. Встраиваемая СУБД - это библиотека, которая позволяет унифицированным образом хранить большие объемы данных на локальных машине. Доступ к данным может происходить через SQL либо через особые функции СУБД. Встраиваемые СУБД быстрее обычных клиент-серверных и не требуют установки сервера, поэтому востребованы в локальном ПО, которое имеет дело с большими объёмами данных (например, геоинформационные системы). 2.3 Таблица базы данных Базу данных, хранящую данные о группе объектов с одинаковыми свойствами, удобно представлять в виде двумерной таблицы: в каждой ее строке последовательно размещаются значения свойств одного из объектов; каждое значение свойства - в своем столбце, озаглавленном именем свойства. Поле базы данных - это столбец таблицы, содержащий значения определенного свойства. Строки таблицы являются записями об объекте; эти записи разбиты на поля столбцами таблицы, поэтому каждая запись представляет набор значений, содержащихся в полях. Запись базы данных - это строка таблицы, содержащая набор значений свойств, размещений в полях базы данных. Каждая таблица должна содержать, по крайней мере, одно ключевое поле, содержимое которого уникально для каждой записи в этой таблице. Ключевое поле позволяет однозначно идентифицировать запись в таблице. Ключевое поле - это поле, значения которого однозначно определяют запись в таблице. В качестве ключевого поля чаще всего используют поле, содержащее тип данных счетчик. Однако иногда удобнее в качестве ключевого поля таблицы использовать другие поля, код объекта, например инвентарный номер и т.п. Тип поля. Тип поля определяется типом данных, которые оно содержит. Поля могут содержать данные следующих основных типов: Счетчик. Содержит последовательность целых чисел, которые задаются автоматически при вводе записей. Эти числа не могут быть изменены пользователем. Текстовый. Содержит символы различных типов. Числовой. Содержит числа различных типов. Дата/Время. Содержит даты или время. Картинка. Содержит изображения. Логический. Содержит значения Истина (Да) или Ложь (Нет). Пример табличной базы данных. Каждый тип поля имеет свой набор свойств. Наиболее важными свойствами полей являются: Размер поля. Определяет максимальную длину текстового или числового поля. Формат поля. Устанавливает формат данных. Обязательное поле. Указывает на то, что данное поле обязательно надо заполнить. 2.4 Запрос в базах данных После того как база данных создана, ее можно использовать в качестве информационного справочника. В этом и состоит основное назначение всякой информационной системы. Действия, выполняемые над информацией, хранящейся в базе данных, называют манипулированием данными. К ним относятся выборка данных по некоторым условиям, сортировка данных, обновление, удаление и добавление данных. Выполнение этих действий производится с помощью запросов. Запрос - это команда на выполнение определенного вида манипулирования данными. Существует универсальный язык, на котором формулируются запросы во многих СУБД. Он называется SQL (Structured Query Language) - структурированный язык запросов. Здесь мы оказываемся перед выбором, с которым часто приходится сталкиваться в информатике: обучаться составлению запросов на языке SQL или воспользоваться каким-то более высокоуровневым вспомогательным средством. В большинстве современных СУБД такие средства имеются. Например, в MS Accessэто конструктор запросов. 2.5 Форма в базе данных Записи базы данных можно просматривать и редактировать в виде таблицы или в виде формы. Часто вид Таблица не позволяет видеть полностью всю информацию на экране. Если база данных содержит достаточно мало полей, а значения полей содержат много символов, то не все поля таблицы могут умещаться на экране, а значения полей могут быть видны не полностью. Форма отображает одну запись в удобном для пользователя виде. В процессе создания формы можно указать, какие поля базы данных включили в форму, как расположить поля в окне формы, а также как можно сделать форму визуально привлекательной. Фактически с помощью формы создается графический интерфейс доступа к базе данных, который может содержать различные элементы управления (текстовые поля, кнопки, переключатели и т.д.), а также надписи. Обычно на форме размещаются надписи, являющиеся именами полей базы данных, и текстовые поля, содержащие данные из базы данных. Пользователь может изменять дизайн формы (размер, цвет и т.д.), элементов управления и надписей. Пример формы в базе данных. данные база управление отчет 2.6 Отчет в базе данных СУБД предоставляет возможность создания и печати итоговых документов - отчетов - по имеющейся в БД информации. Для этого используется так называемый генератор отчетов, который позволяет сформировать внешний вид окончательного документа. Здесь можно также задать упорядочивание и группировку данных по тем или иным значениям и сформировать итоговые значения для конкретных полей. Следует отметить, что данные для форм и отчетов берутся как из конкретных таблиц, так и из запросов. 2.7 Программы СУБД в своем составе содержат средства программирования, с помощью которых можно создавать программы для определенных действий, как по обработке данных, так и по использованию интерфейса БД. Сюда входят разнообразные стандартные функции: математические, финансовые и пр., для получения информации на основе имеющихся данных. Тем не менее, язык программирования в СУБД в ряде случаев не обеспечивает необходимой быстроты обработки данных. Поэтому обычно имеется возможность использовать программы, написанные на других языках программирования. В свою очередь, во многих языках программирования имеется возможность использовать таблицы БД. Это позволяет создать быстрый интерфейс и вычислительную часть информационной системы, использующей созданные БД. 2.8 Реализации СУБД СУБД MS FoxPro СУБД - одни из наиболее распространенных программных продуктов. Они различаются скоростью обработки данных (выполнения запросов, поиска в таблицах), возможностями хранения различных типов данных, способами поддержания целостности и непротиворечивости данных в таблицах. Основное отличие между СУБД заключается в реализации модели данных БД. Наиболее распространены в настоящее время СУБД dBase, FoxPro, Paradox, Clarion, Access, которые могут решить практически все задачи пользователя. dBase была первой наиболее распространенной СУБД для ОС MS-DOS. FoxPro - также одна из первых СУБД, до сих пор остающаяся популярной, отличается большой скоростью обработки данных. Paradox - мощная СУБД, созданная фирмой Borland, обладает высокой интеграцией со средствами разработки приложений этой фирмы. Clarion - интегрированная среда разработчика, позволяет быстро создавать различные приложения, в том числе и БД. Однако при взаимодействии нескольких пользователей применение указанных СУБД неэффективно. Здесь следует реализовать схему «клиент-сервер», когда данные хранятся на сервере, а к ним осуществляются запросы из приложений различных клиентов. Для обработки большого количества данных на сервере используются более мощные СУБД - Oracle, Interbase, Microsoft SQL Server. Последние версии всех популярных СУБД разрабатываются для ОС Windows 95. Это обеспечивает возможность использования всех преимуществ графического интерфейса, повышения качества печати, большую интеграцию с другими программными продуктами. Следует отметить, что большинство СУБД имеют практически одинаковые возможности создания БД и обработки данных. СУБД MS Access Наибольшее распространение для пользователей получила СУБД Microsoft Access. Очень простые и удобные средства wizard (встроенные стандартные последовательности действий) позволяют быстро создавать таблицы, запросы, формы, отчеты. Простой способ определения макросов (последовательности команд) и написания программ на языке Access Visual Basic позволяет реализовать сложную обработку данных. Большой набор типов полей позволяет хранить разнообразную информацию в таблицах БД. Очень просто установить взаимосвязь между таблицами, СУБД полностью контролирует целостность и непротиворечивость данных в этих таблицах. Имеется удобное средство создания различных запросов, причем не обязательно знать язык SQL. Формы могут содержать все привычные элементы интерфейса ОС Windows, которые позволяют сделать обработку информации понятной и удобной. Генератор отчетов позволяет легко создавать различные виды отчетов, что с большими возможностями по оформлению реализует практически все потребности пользователей в получении документов. Access предоставляет очень гибкие и надежные средства защиты как данных, так и структуры БД. Следует отметить, что Access обладает возможностями как использовать, так и предоставлять данные для других СУБД. Данные Access просто используются для дальнейшей обработки и отчетов в электронной таблице Excel и текстовом процессоре Word. СУБД MySQL Свободная система управления базами данных. MySQL является решением для малых и средних приложений. Входит в состав серверов WAMP, AppServ, LAMP и в портативные сборки серверов Денвер, XAMPP. Обычно MySQL используется в качестве сервера, к которому обращаются локальные или удалённые клиенты, однако в дистрибутив входит библиотека внутреннего сервера, позволяющая включать MySQL в автономные программы. Гибкость СУБД MySQL обеспечивается поддержкой большого количества типов таблиц: пользователи могут выбрать как таблицы типа MyISAM, поддерживающие полнотекстовый поиск, так и таблицы InnoDB, поддерживающие транзакции на уровне отдельных записей. Более того, СУБД MySQL поставляется со специальным типом таблиц EXAMPLE, демонстрирующим принципы создания новых типов таблиц. Благодаря открытой архитектуре и GPL-лицензированию, в СУБД MySQL постоянно появляются новые типы таблиц. Заключение Из вышеизложенного можно сделать вывод о том, что из себя представляют базы данных, а также системы управления ими. В современном мире базы данных просто необходимы, исходя из количества информации, с которым приходится иметь дело. Итак, использование концепции бах данных позволяет: - повысить надежность, целостность и сохранность данных; - сохранить затраты интеллектуального труда; - обеспечить простоту и легкость использования данных; - обеспечить независимость прикладных программ от данных (изменений их описаний и способов хранения); - обеспечить достоверность данных; - обеспечить требуемую скорость доступа к данным; - стандартизовать данные в пределах одной предметной области; - автоматизировать реорганизацию данных; - обеспечить защиту от искажения и уничтожения данных; - сократить дублирование информации за счет структурирования данных; - обеспечить обработку незапланированных запросов к хранимой информации; - создать предпосылки для создания распределенной обработки дaнныx. Следовательно, СУБД - это программная оболочка, расширяющая функции операционной системы (OC), которая управляет доступом к базам данных и обеспечивает сервисные функции для пользователя. Список литературы |