Главная страница
Навигация по странице:

  • Файловые системы

  • Основные компоненты информационной системы (банка данных)

  • Р исунок 4 - Сравнение представления данных и знаний в ЭВМ

  • Системы поддержки принятия решений

  • Влияние характеристик БД на затраты

  • Характеристика БД Влияние на затраты по получению информации Влияние на ценность информации

  • Лекция 1_вводная. I. история и состояние развития бд


    Скачать 363.5 Kb.
    НазваниеI. история и состояние развития бд
    Дата09.09.2022
    Размер363.5 Kb.
    Формат файлаdoc
    Имя файлаЛекция 1_вводная.doc
    ТипДокументы
    #668873
    страница3 из 3
    1   2   3

    Технологии ввода данныхначинались с непосредственного ввода в ЭВМ, затем были созданы отдельные устройстваперфорации, занесения с экрана в персональном варианте (с использованием и без СУБД), через web, с приборов с микропроцнссорами, сканирование бумажных документов - распознавание документов, с голоса.Самые большие изменения в пользовательском интерфейсе связаны с появлением планшетного персонального компьютера, позволяющего рисовать, писать что-то ручкой, словно чернилами, и даже преобразовывать этот рукописный текст в обычный текстовый вид. Имеются также средства преобразования в текст произнесенной речи.

    Развитие концепции БД

    Формами организации информации являются файлы данных, персональные БД, интегрированные БД, базы пространственных данных для использования в ГИС, распределенные БД.

    Эволюцию развития БД - от файлов данных до многомерных БД можно представить в виде следующих этапов:

    60-е годы – первые массивы данных на перфокартах;

    70-е годы – массивы данных на магнитных лентах;

    80-е годы – банки данных, иерархические и сетевые БД;

    90-е годы – реляционные БД (сети ЭВМ);

    21 век – доступ к БД через web-интерфейс, многомерные БД.

    Файловые системы. Недостатком их является недостаточные возможности управления данными, большие затраты труда программистов, дублирование разработок.

    БД это множество взаимосвязанных единиц данных, которые могут обрабатываться одной или несколькими прикладными системами. Преимуществами БД являются:

    • наличие метаданных,

    • поддержка целостности БД (все изменения в различных таблицах производятся в соответствии с установленными правилами);

    • одновременный доступ к данным нескольких пользователей;

    • ориентированные на пользователя запросы и отчеты;

    • представление сложных структур информации, когда объектом хранения являются не только данные, но описания структур данных;

    • сокращение дублирования информации;

    • независимость прикладных программ от изменений описаний данных и наоборот;

    • сокращение затрат на обслуживание БД;

    • возможности создания интегрированных баз данных;

    • множество пользователей и прикладных программных приложений;

    • индексация по основным ключам путем автоматической рубрикации;

    • возможности поиска данных по любому логическому выражению (для нескольких атрибутов), полнотекстовый поиск (с учетом близости слов), комбинированный (по словам и атрибутам);

    • экспорт – импорт данныхв другие СУБД, ASCII и XML файлы, HTML, PDF, rtf-документы.

    Основные компоненты информационной системы (банка данных) включают БД, СУБД, оборудование, организационно - методическое обеспечение. СУБД включает язык описания данных (ЯОД), язык манипулирования данными (ЯМД), одним из наиболее распространенных и стандартизированных вариантов которого является структурированный язык запросов - SQL, резидентный модуль СУБД.

    БД по структуре их хранения можно разделить на две части:

    • классические БД в виде таблиц;

    • документальные системы, представляющие метаданные во входных или выходных формах системы в виде "ключевое слово: значение". На этом подходе построен язык JSON.

    Базы знаний это системы искусственного интеллекта основанные на правилах. На рис.4 дано отличие в представлении данных (фактов) и знаний.

    В простейшем случае информационная система, использующая СУБД, состоит из двух основных компонентов: сервера БД, управляющего данными и выполняющего запросы, самих клиентских приложений, обеспечивающих интерфейс пользователя и посылающих запросы к серверу. Именно сервер БД манипулирует файлами, в которых хранятся данные, выполняет пользовательские запросы, поддерживает ссылочную целостность данных, обеспечивает доступ к ним, осуществляет резервное копирование данных и протоколирует операции, связанные с их изменением.

    Результатом работ многих направлений развития вычислительной техники, информатизации, программирования является создание безбумажной технологиииспользования информацииза счетширокого использования Web, e-mail, электронной подписи и различных внешних устройств.

    Р
    исунок 4 - Сравнение представления данных и знаний в ЭВМ


    Современные информационные технологии

    Главными и наиболее интересными и перспективными подходами при создании и использовании БД являются следующие направления:

    • децентрализация системы создания, хранения, поиска, обработки и распространения данных с широким применением Web-технологий в Интернет, Интранет инфраструктуре,

    • создание баз метаданных,

    • широкое использование методов управления данными,

    • интеграция данных,

    • развитие ГИС, создание СППР, электронных справочных пособий.

    Управление данными (на организационном и физическом уровнях). Для эффективного сбора и обработки данных необходимо организовать управление данными на уровнях выполнения научной программы (эксперимента), проекта, центра, а также на физическом уровне в хранилище данных и БД. Информационной основой управления данными являются базы метаданных. Список объектов метаданных включает сведения об организациях, массивах фактографических и пространственных данных, исследовательских проектах, экспертах, информационных ресурсах, имеющиеся в Интернет, источниках информации, методах обработки, форматах данных, кодификаторы. При этом предлагается три уровня организации поиска данных и метаданных (поиск общих сведений о данных на сайтах со статической организацией информации, поиск на сайте с использованием СУБД для динамического представления данных и информации, и поиск с помощью СУБД на корпоративном уровне).

    Интеграция данных. Крупные информационные системы подразумевают взаимодействие информационных ресурсов, в основе которых лежат самые разные форматы и модели представления данных. При интеграции данных в качестве центрального звена создается модель интегрированной БД. Каждый источник данных описан и имеются возможности транслирования данных между частным представлением и глобальным представлением. Необходимо обеспечить интеграцию различных видов данных (географических, экономических, технических и др.), типов физического представления данных (фактографических, текстовых, пространственных, графических) в рамках одной СУБД за счет нормализации данных, типизации ключей и создания многомерных БД.

    Case технологии. Огромный объем данных, участие больших коллективов разработчиков из различных организаций, требуют применения современных средств проектирования информационных систем.

    ГИС типа ArcInfo, MapInfo, RADS и др. используются для представления картографической основы, тематических объектов (демографических, макроэкономических и др. показателей). ГИС используются для представления значений данных на карте. Электронные справочные пособия предназначены для улучшения поиска и доступа к статистическим данным. Целью создания таких справочников является объединение всех статистических характеристик в рамках одной программной среды. Бумажными аналогами таких пособий являются статистические отчеты. Данные в справочниках представляются в виде карт, текста, графиков, таблиц, могут сопровождаться звуком, анимацией и др. Средствами создания таких справочников являются ГИС, СУБД, модели, приложения по вычислению новых характеристик и представлению данных. Информационная база справочника включает средние характеристики за последний год, по месяцам, в сравнении с предыдущим годом, временные ряды, картографические данные. Часть данных справочника может пополняться и при этом в справочнике должны автоматически отобразиться эти изменения.

    Системы поддержки принятия решений (СППР) предназначены для улучшения использования информации, уменьшения убытков. Основная идея создания СППР заключается в следующем. Зная ситуацию на экономическом объекте, можно заранее определить перечень возможных последствий на объекте экономики. Зная перечень последствий, можно составить перечень рекомендаций по уменьшению или предотвращению этого воздействия. Средствами реализации системы являются экспертные системы и базы знаний. Информационной базой системы являются матрицы влияния, рекомендации, базы знаний в виде правил.

    Для обеспечения эффективного принятия решений полной, оперативной и удобной для использования информацией первоочередной задачей является создание и поддержка единого информационного пространства организации, интегрирующего по возможности, всю корпоративную информацию, и позволяющего представлять ее в удобном для использования виде. К этому же классу задач относится уменьшение зависимости компании от конкретных персоналий, что требует максимально возможного отчуждения существенной информации и знаний. А это возможно только при создании БД.
    Децентрализация сбора и обработки данных, создание распределенных БД позволит улучшить обслуживание пользователей, ускорить доступ к данным. Достижения в этом направлении приведут к:

    • распределенному проектированию систем;

    • безбумажной технологии использования данных на всех уровнях принятия решений;

    • отмиранию переносных технических носителей – практически вся информация будет доступна в сети;

    • в любое время, где бы ни было ЛПР, появится возможность получить любую информацию, включая рекомендации для принятия решений. В случае какого - либо инцидента компьютер сам напомнит о том, что объект находится в зоне инцидента и что надлежит сделать, чтобы обезопасить себя и предприятие.

    Характеристики БД

    Характеристиками БД и потоков данных являются:

    • объем данных в логических и физических единицах;

    • объем потока данных в единицу времени;

    • доступность данных 24*7*365;

    • оперативность поступления данных;

    • полнота БД в % — относительное число объектов или документов, имеющихся в БД, к общему числу объектов по данной тематике или по отношению к числу объектов в аналогичных БД;

    • актуальность - устаревание во времени — относительное число устаревших данных об объектах в БД к общему числу накопленных и обрабатываемых данных, определяется скоростью ввода в БД;

    • оперативность доведения - время в течение которого данные становятся доступны пользователям.

    • качество (достоверность) данных - вероятность ошибки (управление 10-4 10-5; планирование - 10-5 , статистика -10-5 , бухучет - 10-6 -10-7). Обеспечение вероятности ошибок выше, чем 10-4 требует увеличения капитальных и эксплуатационных затрат до 50%, времени программирования до 50%, времени работы программ, персонала;

    • идентичность — относительное число описаний объектов, не содержащих дефекты и ошибки, к общему числу документов об объектах в БД;

    • ценность полученной информации определяется потребностью человека в этой информации и его подготовленностью к ее восприятию и использованию;

    • точность определения атрибутов;

    • формы представления (таблицы, графики, карты, тексты, мультимедиа).

    Влияние характеристик БД на затраты, связанные с получением и ценностью данных, табл.3.

    Таблица 3 - Влияние характеристик БД на затраты, связанные с ее получением и ценностью данных

    Характеристика БД

    Влияние на затраты по получению информации

    Влияние на ценность информации

    Доступность

    Затраты на поиск

    Увеличение доступности увеличивает полезность данных

    Объем данных

    Увеличиваются затраты на ведение БД

    Рост объемов увеличивает потенциальную полезность

    Актуальность

    Требует затрат на разработку соответствующих технологи и их эксплуатацию

    Чем быстрее данные будут доступны, тем быстрее пользователь может их увидеть

    Оперативность доведения

    Требует затрат на разработку и эксплуатацию соответствующей технологии

    Чем быстрее данные будут доступны, тем лучше будет решение

    Полнота БД

    Достижение 100% полноты сопряжено с трудностями реализации и связано со значительными затратами

    Очень важна

    Качество данных

    Требует затрат на разработку

    Чрезвычайно важна

    Точность определения атрибутов

    Обходится все дороже и дороже

    Не столь полезна, как об этом принято думать, т.к. случайные наблюдения в океане в пространстве и во времени дают большую ошибку при вычислении климатических характеристик

    Форма представления

    Требует затрат на разработку соответствующих приложений

    Очень важна

    Выводы

    За минувшие шесть десятилетий компьютер превратился в универсальный инструмент для работы с данными. Первое поколение компьютеров было построено на лампах, второе — на дискретных полупроводниковых элементах, третье — на микросхемах, четвертое — на микропроцессорах, пятое поколение - на кристаллах. Деление на поколения отражает только ту часть эволюционного процесса, которую зафиксировал Гордон Мур, а именно уплотнение числа транзисторов на кристалле с интервалом полтора-два года.

    Не меньшую роль в становлении современных ИТ играют сети связи и средства для интерактивного взаимодействия человека с компьютером. По «закону Меткалфа» значение сетей возрастает пропорционально квадрату числа узлов сети. Закон Гилдера утверждает, что пропускная способность коммуникационных систем возрастает втрое каждые двенадцать месяцев, то есть сети развиваются быстрее, чем процессор.

    Современная эра информатизации ориентирована на распределенные ресурсы (информационные, вычислительные, сетевые). Всё возрастающая сложность систем приведёт к тому, что они будут состоять из сотен тысяч или даже из миллионов различных компонент, приложений, служб, сенсоров, работающих на различном оборудовании, написанных разными производителями. И трудно будет найти эксперта, который бы знал, как это всё работает. На первый план выходят надежность работы, адаптируемость, масштабируемость, персонализация - настройка программных компонент под пользователя. Появилась острая необходимость в самонастраивающихся, самовосстанавливающихся после сбоев программных средствах, способных к самопроверке и различной реакции на ошибки.

    Список литературы

    1. Вязилов Е.Д. Базы данных. - Учебное пособие. Обнинск, ИАТЭ, 2004. - 107 с.

    2. Вязилов Е.Д. Лабораторный практикум по курсу «Базы данных». - Обнинск, ИАТЭ, 2005- 49 с.

    3. Гиляревский Р.С. Основы информатики: Курс лекций, М.: Экзамен, 2003. - 320 с.

    4. Дейт К. Введение в системы БД / Пер. с англ. - М.: Вильямс, 2006. — 1328 с.

    5. Кузьминский М. Платформа-2015 // Издательство «Открытые системы». Computerworld, 2005. Вып.15.

    6. Макмиллан Роберт. Ленточный накопитель емкостью 100 Тбайт // Журнал «Computerworld», 2005. Вып.3.

    7. Мартин Дж. Организация БД в вычислительных системах. - М.: Мир, 1978.

    8. Хансен Гэри, Хансен Джеймс. БД: разработка и управление: Пер. с англ. - М.: ЗАО "Издательство БИНОМ", 1999. - 704 с.

    9. Черняк Л. Навстречу системам хранения неструктурированных данных. // Издательство «Открытые системы». Журнал «Открытые системы», № 03, 2004», 2004. Вып.3. http://www.osp.ru/os/2004/03/184057/#top.

    10. ГОСТ Р /ISO/TR 15801:2009 Системы электронного документооборота. Управление документацией информация, сохраняемая в электронном виде: Рекомендации по обеспечению достоверности и надёжности. - М.- Стандартинформ. 2011. – 64 с.

    Перечень вопросов для самопроверки

    1. Назовите новые информационные технологии и выделите наиболее перспективные с Вашей точки зрения и объясните, почему Вы их выделяете.

    2. Какие технические носители Вы знаете и перечислите их характеристики.

    3. Как Вы понимаете создание безбумажной технологии для лиц, принимающих решение?

    4. Какие формы организации данных и знаний Вы знаете?

    5. Каковы проблемы управления хранением наиболее остры?
    1   2   3


    написать администратору сайта