Лекция 1_вводная. I. история и состояние развития бд
Скачать 363.5 Kb.
|
I. ИСТОРИЯ И СОСТОЯНИЕ РАЗВИТИЯ БД Вопросы информатизации Краткая история развития технических средств для хранения и ввода данных в ЭВМ Развитие средств хранения Развитие концепции БД Современные информационные технологии Характеристики БД Если в течение 40 лет наиболее значимым сырьевым ресурсом была нефть, то сейчас таким сырьем становится информация. Бывший премьер-министр Великобритании Энтони Блэр Вопросы информатизации Современные информационные технологии (ИТ) формируют новую экономику. В обиход вошли такие понятия как "электронный бизнес", " электронное правительство", "виртуальный офис". Скорость появления и внедрения новых "прорывных" ИТ неуклонно возрастает. Основным капиталом любого предприятия становятся информационные ресурсы. Возникли новые отрасли бизнеса - электронная индустрия развлечений, электронная торговля, дистанционное обучение, аутсорсинг, офшорное программирование. Выиграет только тот, кто выдвигает новые идеи, кто подготовлен к обработке огромных потоков информации, кто готов к постоянным изменениям, кто активно использует полученную информацию для принятия решений. На наших глазах рождается новый "средний класс": место традиционных посредников (дилеров, дистрибьюторов, реселлеров, агентов) занимают "информационные посредники" - люди, организующие движение потоков данных, информации, знаний. По мере нарастания потоков данных человечество предпринимает все более энергичные меры, чтобы уберечь мир от информационного хаоса. В результате на сегодняшний день потребитель информации располагает большим арсеналом средств, позволяющих эффективно ориентироваться в потоках информации. Одно из них БД. Развитие БД требует поддержки и поиска объектных файлов, распределенного хранения данных, разработки приложений для доступа к данным через Web, управления потоками данных, мониторинга работы БД, простоты управления данными и их использования. В последние годы появилась целая плеяда современных СУБД, поддерживающих XML и способных реализовать преимущества современных аппаратных средств. Поток информации на различных носителях возрастает все быстрее. Рост объемов информации так велик, что его часто называют информационным взрывом. Объем накопленной на планете цифровой информации в 2010-м преодолел порог в зеттабайт (Збайт - миллиард терабайтов). Этот объем стабильно увеличивается на порядок каждые пять лет. 90% этой информации приходится на неструктурированную информацию (файлы, видео, почта), что существенно усложняет ее обработку и учет. К 2015 г. человечество накопит 7,9 Збайт. Гбайт "реальных" данных косвенно порождает петабайт временных данных (например, цифровое ТВ). 75% данных генерируется индивидуальными пользователями. Рост числа документов носит экспоненциальный характер. При этом ежегодный прирост потоков данных составляет 15-20%. Кривая роста объемов данных может быть описана экспонентой вида [1]: y = Aekt где y – объем данных в Мбайтах, е – основание натуральных логарифмов (е = 2,718...), t – индекс времени (годы); A – объем данных в начале отсчета (при t = 0), K – коэффициент, характеризующий скорость роста объемов данных. Приведем основные определения, взятые из различных источников [3,4,7,8]: Сведения (факты) - это набор сигналов физических процессов воспринимаемых субъектом через органы его чувств. Субъектом может быть человек или машина, которая предназначена для восприятия сигналов. Данные - это сведения, полученные путём измерения, наблюдения, логических или арифметических операций представленные в форме, пригодной для хранения, передачи и обработки.Информация – это сведения, независимо от формы их представления, усваиваемые субъектом в форме знаний. Передача данных - обмен данными любого характера между различными устройствами по каналам связи. Формат данных – характеристика данных, способствующая оптимальному их использованию и определяющая структуру и способ их хранения, диапазон возможных значений и допустимые операции, которые можно выполнять над этими данными. (графический документ, электронный формат и т.д.). Структура данных– это организационная схема, в соответствии с которой данные упорядочены с тем, чтобы их можно было максимально эффективно интерпретировать или выполнять над ними различные операции. Атрибуты – характеристики, которые должен содержать документ для хранения свойств его значений. Документ – это материальный объект с зафиксированной на нем информацией, предназначенный для передачи во времени и пространстве в целях хранения и общественного использования, содержащий реквизит. Документ в электронной форме – это документ, представленный в форме набора состояний элементов вычислительной техники или иных средств обработки, хранения, передачи информации, допускающий преобразования в форму, пригодную для однозначного восприятия человека. Информационный продукт – это документированная информация, подготовленная в соответствии с потребностями пользователей и представленная в форме товара. Основные особенности информационного продукта, отличающие информацию от других товаров [3]: информация не исчезает при потреблении и может быть использована многократно; информационный продукт в большинстве случаев со временем теряет актуальность (за исключением данных о погоде и климате) несмотря на появление более новых копий; разным потребителям даются различные способы потребления (восприятия) информационного продукта (экран, распечатка, на которых может быть представлены таблица, график, карта, текст, мультимедиа) в зависимости от адресности информации; производство информации в отличие от производства материальных товаров требует значительных затрат по сравнению с затратами на тиражирование; информационная продукция быстро устаревает и дорого стоит. Метаданные – данные о данных – сведения о наборах данных, организациях, приборах, платформах, рейсах, проектах, ученых, др.Собственные свойства информации [3]:неаддитивность - прибавление информации к уже имеющейся не увеличивает ее суммарное количество на величину прибавленной информации; независимость содержания информации от формы и способов ее представления; устаревание во времени. Потребительские свойства информации:неэквивалентность количества и качества информации - ценность полученной человеком информации определяется не количеством снимаемой ею неопределенности, а потребностью человека в данной информации, подготовленностью человека к восприятию информации и ее использованию. неисчезаемость информации после ее использования (потребления). независимость ценности информации от количества затрат на ее получение. Информационная инфраструктура – это информационные технологии в виде вычислительных комплексов, оргтехники, средств и каналов связи, управляемая и поддерживаемая в рабочем состоянии с помощью программных средств и определенных организационных мероприятий. Основными частями информационной инфраструктуры являются: вычислительная техника; организационная техника; носители для хранения информации (жесткий диск, магнитная лента); средства связи (радио и телевещание); системы передачи данных (коммутаторы, маршрутизаторы, каналы связи). Краткая история развития технических средств для хранения и ввода данных в ЭВМ Эволюция компьютерных систем представлена на рис.1. Предшествующие годы компьютерной истории можно разделить на пять этапов [9]. Сначала был централизованный период (мэйнфреймы и мини-ЭВМ), его сменил распределенный (персональный компьютер, клиент-сервер), далее началась эпоха Интернет, на ее основе получили развитие мобильные устройства, и предпоследний период, когда компьютеризация проникла во все области человеческой деятельности. А далее шестой этап — «революция встроенных систем», которая дает возможность для объединения независимых устройств в единые физические инфраструктуры. Компьютерная техника быстро развивается, каждые два – три года происходит удвоение мощностей компьютера, табл.1.
Рисунок 1 - Эволюция компьютерных систем Производительность микропроцессоров Intel до сих пор возрастала за счет частоты. За 25 лет тактовая частота процессоров Intel возросла с 5 МГц до примерно 4 ГГц — то есть в 1000 раз. Надежды на продолжение этой закономерности в будущем не оправдываются. В Intel указывают на следующее - экспоненциальное повышение производительности связано с неэффективностью самого наращивания тактовой частоты; кроме того, нарастает проблема задержек в иерархии памяти. Таблица 1 – Характеристики персональных ЭВМ
|