Лекция по теме Технологии хранения, поиска и сортировки данных_. Тема Технологии хранения, поиска и сортировки данных Цель лекции
![]()
|
Тема «Технологии хранения, поиска и сортировки данных» Цель лекции: Раскрыть значение и возможности систем управления базами данных для организации и обработки больших массивов информации в автоматизированных информационных системах. Задачи лекции: познакомиться с терминологией баз данных; классифицировать и охарактеризовать базы данных; рассмотреть основные модели баз данных; выделить основные функции системы управления базами данных; дать характеристику основных объектов СУБД Access; выделить основные этапы работы с базами данных. Информационное обеспечение: Михеева Е.В. Информационные технологии в профессиональной деятельности. Технические специальности : учебник для студ. учреждений сред. проф. Образования / Е. В. Михеева, О.И. Титова. – М.: Издательский центр «Академия», 2019.- 416 с. http://fcior.edu.ru/ - Федеральный центр информационно-образовательных ресурсов Содержание лекции: Терминология: информация, данные, знания. Классификация базы данных. Назначение и основные компоненты систем баз данных. Основные модели данных. Реляционная модель данных. Системы управления базами данных. Проектирование и формирование базы данных в среде Access. Информационный материал. Терминология: информация, данные, знания Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятие, передача, преобразование, хранение или использование. Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ. Подготовка информации – состоит в ее формализации, сборе и переносе на машинные носители. Обработка данных – это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде. Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными. Управление данными – совокупность функций обеспечения требуемого представления данных, их накопления и хранения, обновления, удаления, поиска по заданному критерию и выдачи данных. Предметная область – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге автоматизации. База данных (БД) – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ. Эти данные относятся к определенной предметной области и организованы таким образом, что могут быть использованы для решения задач многими пользователями. Введение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования. Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами. Автоматизированная информационная система (АИС) представляет собой совокупность данных, экономико-математических методов и моделей, технических, программных средств и специалистов, предназначенную для обработки информации и принятия управленческих решений. Банк данных (БнД) - это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей. Классификация баз данных Развитие средств вычислительной техники и информационных технологий обеспечило возможности для создания и широкого применения автоматизированных информационных систем (АИС) разнообразного назначения. Разрабатываются и внедряются информационные системы управления хозяйственными и техническими объектами, модельные комплексы для научных исследований, системы автоматизации проектирования и производства, всевозможные тренажеры и обучающие системы. Технологии баз данных одна из наиболее востребованных технологий в практической разработке информационных систем, сформирована широкая сфера самых разнообразных приложений систем баз данных. Обычно БД создается для хранения и доступа к данным из некоторой предметной области. Под автоматизированной информационной системой (АИС) понимают совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. АИС, основанная на базе данных, служит для сбора, накопления, хранения информации, а также ее эффективного использования для различных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ. По сферам применения и правилам организации различают два основных класса АИС, основанных на базе данных: информационно-поисковые (ИПС) и системы обработки данных (СОД). ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересует, в основном, сами извлекаемые из базы данных сведения, а не результаты их обработки. Примером ИПС является любая справочная служба: к ней обращаются с запросом и получают в результате те данные, которые удовлетворяют этому запросу. Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД – банковские системы, осуществляющие открытие\закрытие счетов, пересчет вкладов в зависимости от процентов, прием\снятие сумм и т.п. В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические. На практике используются также системы комбинированного типа. Фактографические АИС хранят сведения об объектах предметной области, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции (нахождение суммы, минимума, максимума и т.п.). Фактографические АИС обычно принадлежат к классу систем обработки данных. В документальной системе объект хранения – документ, который содержит информацию, относящуюся к определенной предметной области. Это могут быть графические изображения (например, географические карты): информация на естественном языке (монографии, тексты законодательных актов, научные отчеты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки данных не важно, какие сведения хранятся в документах. Обычно (но не всегда) документальные АИС реализуются в виде информационно-поисковых систем (ИПС). Назначение и основные компоненты систем баз данных Система БД включает два основных компонента: собственно базу данных и систему управления базами данных – СУБД (рисунок 3.1.). Большинство СОД включают также программы обработки данных (прикладное программное обеспечение), которые обращаются к данным через СУБД. ![]() Рисунок 3.1. Компоненты системы баз данных Таким образом, обращение к базе данных возможно только через СУБД. База данных предназначена для хранения данных информационной системы. Пользователи обращаются к базе данных обычно не напрямую через средства СУБД, а с помощью внешнего интерфейса – приложения, входящего в состав АИС. Основной характеристикой баз данных является совместное использование данных многими пользователями. Основные модели данных Модель данных - является фундаментом технологий баз данных; на ней базируется конкретная СУБД. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ими базы данных, если они основываются на этой модели. Создавая базу данных, необходимо упорядочить информацию по различным признакам для того, чтобы потом извлекать из нее необходимые данные в любом сочетании. Сделать это возможно, только если данные структурированы. Структура данных упорядочивает элементы информации и описывает их взаимосвязи. Модель данных – это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения. История создания и развития СУБД насчитывает около сорока лет. За этот период были разработаны многочисленные модели данных, прежде всего это сетевые, иерархические и реляционные модели данных. Сетевые и иерархические модели в настоящее время считаются устаревшими, но существует множество баз данных созданных на их основе и требующих поддержания их работы. Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней. Сетевая модель позволяет организовывать БД, структура которых представляется графом общего вида. Сетевая база данных является обобщением иерархической, в которой каждый элемент вышестоящего уровня может быть связан одновременно с любым элементом следующего уровня. На связи между объектами в сетевых моделях не накладывается никаких ограничений. Пример сетевой базы данных приведён на рисунке 4.1. ![]() Рисунок 4.1. Пример фрагмента сетевой базы данных Сетевой базой данных фактически является «всемирная паутина» сети Интернет. Гиперссылки связывают собой сотни миллионов документов в единую сетевую базу данных. Иерархическая модель позволяет строить БД с иерархической древовидной структурой. В основе иерархической модели лежит понятие дерева. Дерево – это связный неориентированный граф, который не содержит циклов. При работе с деревом выделяют какую-то конкретную вершину, определяют её как корень дерева и рассматривают особо – в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным, ориентация определяется от корня. Иерархическая база данных по своей структуре соответствует иерархической файловой системе. В иерархических моделях данных используется ориентация древовидной структуры от корня к листьям. Поиск данных в таком случае может осуществляться последовательным «спуском» с одного уровня на другой Пример иерархической базы данных приведён на рисунке 4.2. ![]() Рисунок 4.2. Пример фрагмента иерархической базы данных Реляционная модель данных Реляционная модель данных была предложена в 1970 г. математиком Эдгаром Коддом. Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL. Реляционная модель БД (от английского “ relation” - отношение) представляет собой одну или несколько взаимосвязанных двумерных таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные. Столбцы таблицы называют полями. Каждое поле содержит значения определенного свойства и характеризуется своим именем и типом данных. Строки таблицы являются записями об объекте и содержат набор значений свойств, принадлежащих одному объекту. Записи разбиты на поля столбцами таблицы, поэтому каждая запись представляет набор значений, содержащихся в полях. Ключевое поле (первичный ключ) – это поле (совокупность полей), которое однозначно определяет каждую запись в таблице, т.е. не повторяется у разных записей (простой, составной). Пример реляционной базы данных приведен на рисунке 5.1. ![]() Рисунок 5.1. Пример фрагмента реляционной базы данных Системы управления базой данных Развитие информационных технологий привело к созданию компьютерных баз данных. Взаимодействие с базой данных происходит при помощи системы управления базами данных (СУБД), которая расшифровывает запросы пользователя и производит операции с информацией в базе данных. Система управления базами данных – это важнейший компонент АИС, основанный на базе данных. СУБД необходима для создания и поддержки базы данных информационной системы. Программные составляющие СУБД включают в себя ядро и сервисные средства (утилиты). Ядро СУБД – это набор программных модулей, необходимый и достаточный для создания и поддержания БД, то есть универсальная часть, решающая стандартные задачи по информационному обслуживанию пользователей. Сервисные программы предоставляют пользователям ряд дополнительных возможностей и услуг, зависящих от описываемой предметной области и потребностей конкретного пользователя. Системой управления базами данных называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержания её в актуальном состоянии и обеспечения эффективного доступа пользователей к содержащимся в ней данным в рамках предоставленных им полномочий. СУБД описывает логическую структуру БД, её организацию в среде хранения и пользовательские представления данных (соответственно концептуальную схему БД, схему хранения и внешние схемы). Обрабатывая эти схемы, СУБД создаёт пустую БД требуемой структуры и предоставляет средства для наполнения её данными предметной области и дальнейшей эксплуатации. Система управления базой данных (СУБД) – это языковые и программные средства для организации, пополнения, модификации и использования баз данных. В мире существует множество систем управления базами данных. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий. Различают универсальные и специализированные СУБД. Универсальные СУБД являются системами широкого профиля и не имеют четко очерченных границ применения, а специализированные создаются для БД конкретного назначения: банковских, бухгалтерских и т. д. Специализированные СУБД в наибольшей степени учитывают специфику предметной области, что отражается в интерфейсе и процедурах обработки информации. СУБД организует хранение информации таким образом, чтобы ее было удобно: просматривать, пополнять, изменять, искать нужные сведения, делать любые выборки, осуществлять сортировку в любом порядке. В связи с распространением сетевых технологий, от современных СУБД требуется возможность работы с отдаленными и распределенными ресурсами, которые находятся на серверах Интернета. Проектирование и формирование базы данных в среде Access Microsoft Access - высокопроизводительная система управления реляционными базами данных, которая входит в состав профессиональной версии интегрированного пакета Microsoft Office (Access в переводе с английского означает «доступ»). СУБД Access поддерживает реляционную модель представления данных и функционирует под управлением операционных систем Windows, используется для разработки настольных баз данных, обеспечивает обработку, сортировку и поиск данных. Основными функциями СУБД Access являются: создание пустой структуры базы данных; наличие средств ее заполнения или импорта данных из таблиц другой базы; возможность доступа к данным; наличие средств поиска и фильтрации. Основные типы данных: текстовый, числовой, дата/время, счетчик (вводится автоматически с вводом каждой записи), поле объекта OLE (содержит рисунки, звуковые файлы, таблицы Excel, документы Word и т.д.). СУБД Access работает с объектами, к которым относятся таблицы, запросы, формы, отчеты, макросы и модули. Все связанные между собой объекты организованы в один файл, называемый базой данных. Основные разделы главного окна соответствуют типам объектов, которые может содержать база данных Access. Это Таблицы, Запросы, Формы, Отчеты, Макросы и Модули. Таблица – это основной объект любой базы данных, предназначенный для хранения данных в виде записей (строк) и полей (столбцов). Обычно каждая таблица используется для хранения сведений по одному конкретному вопросу. Таблицы хранят структуру БД (поля, их типы и свойства) и все данные, имеющиеся в БД. Форма - это объект, предназначенный для ввода данных, позволяющий отображать данные в удобном для восприятия виде. В форме можно разместить элементы управления, применяемые для ввода, изображения и произвести изменения данных в полях таблицы. Запрос – это объект, позволяющий получить нужные данные по определенным условиям из одной или нескольких таблиц. С помощью запросов выполняют такие операции как отбор данных, их сортировку и фильтрацию. Отчет – это объект базы данных, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления. Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций. Модули - служат для автоматизации работы с базой данных. Интерфейс работы с объектами базы данных унифицирован. По каждому из них предусмотрены стандартные режимы работы: Создать – предназначен для создания структуры объектов. Конструктор – предназначен для изменения структуры объектов. Открыть – предназначен для работы с объектами базы данных. Важным средством, облегчающим работу с MS Access для начинающих пользователей, являются мастера – специальные программные надстройки, предназначенные для создания объектов базы данных в режиме последовательного диалога. Для опытных пользователей существуют возможности более гибкого управления ресурсами и возможностями объектов СУБД в режиме конструктора. Специфической особенностью СУБД MS Access является то, что вся информация, относящаяся к одной базе данных, хранится в едином файле. Такой файл имеет расширение “.mdb”. Основные этапы работы с базами данных в среде MS Access: 1-й этап - проектирование БД. Процесс формирования базы данных в виде таблицы включает создание структуры, т.е. полей из которых будет состоять каждая запись. Определяются имя, тип (текстовый, числовой, логический, объект OLE и др.), размер полей. Кроме того СУБД формирует записи специального типа, содержащие уникальные номера - ключи, с помощью которых можно организовывать связь между таблицами. 2-й этап - наполнение БД содержимым. Осуществляется ввод и редактирование данных. СУБД дает возможность создать с помощью мастера экранную форму окна с кнопками, полями для ввода, т.е. создать удобный пользовательский интерфейс. 3-й этап - визуализация информации. Отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройства вывода или передачи по каналам связи. Пользователь получает удобное средство для обработки данных – запрос и использовать фильтрацию записей в базе данных. СУБД позволяет пользователю вывести на принтер необходимую информацию в виде отчета, в который можно включить: выборочную информацию из таблицы, новую информацию, информацию из других таблиц. Терминологический словарь: Автоматизированная информационная система (АИС) - совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. База данных (БД) – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными. Введение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования. Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, Запрос – объект, предназначенный для извлечения данных из таблиц на основе заданных условий. Иерархическая модель БД – данные представлены в виде древовидной структуры, состоящей из объектов различных уровней. Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций. Модель данных – это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения. Отчет – объект, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления. Реляционная модель БД (от английского “ relation” - отношение) – модель, представленная в виде одной или нескольких взаимосвязанных двумерных таблиц. Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней. Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами. Фильтрация (выборка) данных – способ отображения данных в таблице, которые отвечает заданному условию или нескольким условиям. Форма – объект, предназначенный для ввода данных, позволяющие отображать данные в удобном для восприятия виде. Контрольные вопросы в тетради: Как можно классифицировать базы данных? В чем состоит разница между терминами «база данных» и «система управления базами данных»? Чем различаются между собой реляционные, иерархические и сетевые базы данных? Приведите примеры. Какова структура реляционных баз данных? Какие программные средства обеспечивают работу с базами данных? Что входит в функции современных СУБД? Какие этапы выделяют при работе с базами данных? Что понимается под проектированием базы данных? |