ИГА. Понятие базы данных
Скачать 0.77 Mb.
|
Распределенные базы данных. СУРБДБаза данных – интегрированная совокупность данных, с которой работает множество пользователей. Напомним основные принципы, положенные в основу теории баз данных: централизованное хранение данных; централизованное обслуживание данных (ввод, корректировка, чтение, контроль целостности). БД появились в период господства больших ЭВМ и велись на одной ЭВМ. Если проанализировать работу пользователей с данными в компаниях, организациях, на предприятиях в «докомпьютерное» время, то нетрудно заметить, что на отдельных участках пользователи работали со «своими» данными (осуществляли сбор определенных данных, их хранение, обработку, передачу обработанных данных на другие участки или уровни управления). У такой технологии были существенные недостатки, которые уже отмечались ранее: дублирование некоторых данных, отсутствие возможности сравнительного анализа данных всех участков. Развитие вычислительных компьютерных сетей обусловило новые возможности в организации и ведении баз данных, позволяющие каждому пользователю иметь на своем компьютере свои данные и работать с ними и в то же время позволяющие работать всем пользователям со всей совокупностью данных как с единой централизованной базой данных. Соответствующая совокупность данных называется распределенной базой данных. Термин «распределенная база данных» часто встречается в литературе. Однако в разных источниках он трактуется по-разному. Часть авторов понимают под распределенной базой данных то, что имеется удаленный сервер, на котором расположены данные, а также клиентские компьютеры, расположенные территориально в другом месте. Такая трактовка представляется неполной. Настоящая распределенная база данных располагается на нескольких компьютерах. При этом одна часть файлов расположена на одном компьютере, другая часть – на другом и т. д. Более того, возможна ситуация, когда информация на этих компьютерах пересекается, дублируется. Распределенная база данных – совокупность логически взаимосвязанных разделяемых данных (и описаний их структур), физически распределенных в компьютерной сети. Распределенная база данных (РаБД) состоит из единой логической базы данных, разделенной на некоторое количество фрагментов. Каждый фрагмент хранится на одном из компьютеров компьютерной сети. Система управления распределенной базой данных (РаСУБД) – программная система, позволяющая пользователю работать как с его локальными данными, так и со всей базой данных в целом. РаСУБД также представляет собой распределенную систему. Каждый фрагмент БД работает под управлением отдельной СУБД, которая осуществляет доступ к данным фрагмента. Пользователи взаимодействуют с РаБД через локальные и глобальные приложения. Локальные приложения дают пользователю возможность работать со своими локальными данными и не требуют доступа к другим фрагментам. Глобальные приложения дают пользователю возможность работать с другими фрагментами базы данных, расположенными на других компьютерах сети. Объединение данных организуется виртуально. Соответствующий подход, по сути, отражает организационную структуру предприятия (и даже общества в целом), состоящего из отдельных подразделений. Причем, хотя каждое подразделение обрабатывает свой набор данных (эти наборы, как правило, пересекаются), существует необходимость доступа к данным, как к единому целому (в частности, для управления всем предприятием). В качестве примера реализации такой модели может служить сеть Интернет – данные вводятся и хранятся на разных компьютерах по всему миру, любой пользователь может получить доступ к этим данным, не задумываясь о том, где они физически расположены. Считается, что для пользователя распределенная система должна выглядеть точно так же, как нераспределенная. Из этого принципа следует ряд правил: Локальная автономия. Независимость от центрального узла. Непрерывное функционирование. Независимость от расположения. Независимость от фрагментации. Независимость от репликации. Обработка распределенных запросов. Управление распределенными транзакциями. Независимость от аппаратного обеспечения. Независимость от операционной системы. Независимость от сети. Независимость от СУБД. Таким образом, РаБД можно понимать как совокупность логически взаимосвязанных распределенных по разным компьютерам баз данных. Перечислим основные проблемы при создании РаБД: Фрагментация данных и распределение по компьютерам. Cоставление глобального каталога, содержащего информацию о каждом фрагменте БД и его местоположении в сети (каталог может храниться на одном узле или быть распределенным). Организация обработки запросов (синхронизация нескольких запросов к одним и тем же данным, исключение аномалий удаления и обновления одних и тех же данных, расположенных на различных узлах, оптимизация последовательности шагов при обработке запроса и т. д.). К существенному достоинству РаБД можно отнести приближение данных к месту их порождения, что позволяет существенно повысить их достоверность, к недостатку – высокую сложность управления данными, как единым целым. К сожалению, процесс создания и обслуживания РаБД связан и с техническими трудностями, среди которых можно выделить жесткие требования к пропускной способности каналов связи, а также низкую производительность, связанную со значительными затратами коммуникационных и вычислительных ресурсов при их синхронизации во время выполнения транзакций (особенно при интенсивных обращениях из разных узлов к одному фрагменту). Технология, связанная с использованием РаБД, в наибольшей степени соответствует организации человеческой деятельности (информация распределена по месту деятельности людей, и они обмениваются ей в процессе работы) и позволяет наиболее успешно решать связанные с ведением баз данных проблемы: повысить достоверность информации (информация вводится в месте ее порождения лицом, которое лучше всех понимает ее смысл); повысить оперативность локальной обработки информации (соответствующие вопросы решаются на локальном компьютере с фрагментом БД). |