Информационные системы и технологии. М. С. Гаспариан Г. Н. Лихачева Информационные системы
Скачать 1.98 Mb.
|
Тема 8. Технологии интегрированных информационных систем общего назначения Дидактические единицы: распределенная обработка данных; технология файл-сервер; технология клиент-сервер; распределенные гипертекстовые и мультимедийные базы данных; информационное хранилище; погружение данных; витрины данных; метабаза; атрибутивная и полнотекстовая индексация; бизнес-процесс; маршрут движения;жизненный цикл документа; карта деловых процессов; управление дело- выми процессами (workflow); плохо формализуемые задачи; фрейм; агрегатные данные; измерение; многомерная база данных; многомерный куб. Изучив тему 8, студент должен: знать: технологии распределенной обработки данных для ис- пользования в ИС; назначение и технологии информационного хранилища; технологии электронного документооборота на предприятии; технологии интеллектуального выбора аналитических данных для принятия решений; назначение многомерных баз данных – хранение аналити- ческих данных, которые получаются путем выявления скрытых закономерностей и зависимостей в информаци- онном хранилище; уметь: получать доступ к распределенным базам данных; Информационные технологии 252 разрабатывать концептуальные схемы систем поддержки принятия решений; различать агрегатные и детализированные данные; применять аналитические данные; Приобрести навыки: использования изученных технологий в ИС; поиска информации во внешних источниках; применять инструменты web-технологии; применения новых методологий управления в среде ин- формационных технологий. При изучении темы 8 необходимо: читать лекционный материал темы 8; ответить на вопросы форума; выполнить пакет заданий; акцентировать внимание на следующем: осознание роли информации как важнейшего ресурса предприятия, региона, общества в целом; применение интеллектуальных интегрированных ин- формационных систем в ИС; появление корпоративных информационных систем на базе интернет/интранет технологий; появление новых методов хранения и предоставления информации; алгоритмы управления относятся к классу слабо струк- турированных; для всех функций управления требуется принятие ре- шений, основанных на аналитических данных; при управлении сложным экономическим объектом ис- пользуются модели принятия решений, реализуемые средствами математического моделирования в среде информационных технологий. Для самооценки темы 7 необходимо: Выполнить задания. Технологии интегрированных информационных систем общего назначения 253 Ответить на следующие вопросы: 1. Чем различаются технологии файл-сервер и клиент-сервер? 2. Что такое трафик сети? 3. Чем отличаются информационные хранилища от баз данных? 4. На кого ориентированы информационные хранилища? 5. Для чего предназначена система автоматизации деловых процессов? 6. Чем отличается жизненный цикл документа от маршрута движения? 7. Какие функции выполняют системы групповой работы? 8. В чем сложность управленческих задач? 9. В каких базах хранятся аналитические данные? 10. Для чего предназначены системы поддержки принятия решений? 11. Предоставляют ли аналитические системы руководителю решение? План практических занятий по теме 8: 1. Форум студентов по теме 8. 2. Выдача задания. 3. Компьютерная реализация задания. 4. Защита выполненного задания. 8.1. Технологии геоинформационных систем В настоящее время все большее распространение полу- чают технологии геоинформационных систем (ГИС), предна- значенных для обработки всех видов данных, включая гео- графические и пространственные. Данные, которые описывают любую часть поверхности земли или объекты, находящиеся на этой поверхности, называ- ются географическими данными. Они показывают объекты с точки зрения размещения их на поверхности Земли, т.е. пред- ставляют собой географически привязанную» карту местности. Пространственные данные – данные о местоположении, распо- Информационные технологии 254 ложении объектов или распространении явлений – представле- ны в определенной системе координат, словесном, числовом . аудио-видео виде. Каждый объект (страна, регион, город, улица, предприятия, сельхозугодия, дороги и т.д.) описывается путем присвоения ему атрибутов и операций. Атрибуты – тексто- вые, числовые, графические, аудио- и видео данные. Для работы геоинформационных систем требуются мощные аппаратные средства: запоминающие устройства большой емкости, системы отображения, оборудование высо- коскоростных сетей. В основе любой геоинформационной системы лежит информация о каком-либо участке земной поверхности: стране, континенте или городе. База данных организуется в виде набора слоев информации. Основной слой содержит географические данные (топооснову). На него накладывается другой слой, несущий информацию об объектах, находя- щихся на данной территории: коммуникации, промышлен- ные объекты, коммунальное хозяйство, землепользование, почвы и другие пространственные данные. Следующие слои детализируют и конкретизируют данные о перечисленных объектах, пока не будет дана полная информация о каждом объекте или явлении. В процессе создания и наложения сло- ев друг на друга между ними устанавливаются необходимые связи, что позволяет выполнять пространственные операции с объектами посредством моделирования и интеллектуаль- ной обработки данных. Как правило, географические данные представляются графически в векторном виде, что позволяет уменьшить объ- ем хранимой информации и упростить операции по визуа- лизации. С графической информацией связана текстовая, табличная, расчетная информация, координационная при- вязка к карте местности, видеоизображения, аудиокоммента- рии, база данных с описанием объектов и их характеристик. Многие ГИС включают аналитические функции, которые позволяют моделировать процессы, основываясь на карто- графической информации. Технологии интегрированных информационных систем общего назначения 255 Программное ядро геоинформационных систем состоит из ряда компонентов. Они обеспечивают ввод пространствен- ных данных, хранение их в многослойных базах данных, реа- лизацию сложных запросов, пространственный анализ, вывод твердых копий, просмотр введенной ранее и структуриро- ванной по правилам доступа информации, средства преобра- зования растровых изображений в векторную форму, моде- лирование процессов распространения загрязнения, модели- рование геологических и других явлений, анализ рельефа местности и многое другое. Основные сферы применения геоинформационных систем: геодезические, астрономо-геодезические и гравиметри- ческие работы; топологические работы; картографические и картоиздательские работы; аэросъемочные работы; формирование и ведение банков данных перечисленных выше работ для всех уровней управления Российской Федерации; отображение политического устройства мира; формирование атласа автомобильных и железных дорог, границ РФ и зарубежных стран, экономических зон и т.д. В экономической сфере технологии геоинформацион- ных систем обеспечивают: налоговым и страховым службам выполнение их функ- ций, так как предоставляют наглядную информацию о нахождении подведомственных предприятий и их ха- рактеристику; отслеживание финансовых потоков в банковской сфере; информационное обеспечение строительства автомо- бильных и железных дорог; коммерческим организациям работу с географическими и пространственными данными. Информационные технологии 256 Лидерами геоинформационных систем на отечествен- ном рынке являются системы Arс/Info, ArсView и др. 8.2. Технологии распределенной обработки данных Одной из важнейших сетевых технологий в экономиче- ских информационных системах является распределенная обработка данных. То, что персональные компьютеры стоят на рабочих местах, т.е. на местах возникновения и использо- вания информации, дало возможность распределить их ре- сурсы по отдельным функциональным сферам деятельности и изменить технологию обработки данных в направлении децентрализации. Распределенная обработка данных позво- ляет повысить эффективность удовлетворения изменяющей- ся информационной потребности информационного работ- ника и, тем самым, обеспечить гибкость принимаемых им решений. Преимущества распределенной обработки данных выражаются в: увеличении числа удаленных взаимодействующих поль- зователей, выполняющих функции сбора, обработки, хранения, передачи информации; снятии пиковых нагрузок с централизованной базы пу- тем распределения обработки и хранения локальных баз данных на разных ЭВМ; обеспечении доступа информационному работнику к вычислительным ресурсам сети ЭВМ; обеспечении обмена данными между удаленными поль- зователями. Формализация концептуальной схемы данных повлекла за собой возможность классификации моделей представления данных на иерархические, сетевые и реляционные. Это отрази- лось в понятии архитектуры систем управления базами данных (СУБД) и технологии обработки. Для обработки данных, раз- Технологии интегрированных информационных систем общего назначения 257 мещенных на удаленных компьютерах, разработаны сетевые СУБД, а сама база данных называется распределенной. Распределенная обработка и распределенная база дан- ных не являются синонимами. Если при распределенной обработке производится работа с базой, то подразумевается, что представление данных, содержательная обработка данных базы выполняются на компьютере клиента, а поддержание базы в актуальном состоянии – на файл-сервере. Распреде- ленная база данных может размещаться на нескольких серве- рах и для доступа к удаленным данным надо использовать се- тевую СУБД. Если сетевая СУБД не используется, то реализу- ется распределенная обработка данных. При распределенной обработке клиент может послать запрос к собственной локальной базе или удаленной. Уда- ленный запрос – это единичный запрос к одному серверу. Несколько удаленных запросов к одному серверу объединя- ются в удаленную транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то тран- закция называется распределенной. При этом запрос тран- закции обрабатывается одним сервером. Если запрос тран- закции обрабатывается несколькими серверами, он называет- ся распределенным. Только обработка распределенного запроса поддержи- вает концепцию распределенной базы данных. Существуют разные технологии распределенной обра- ботки данных. Одной из первых технологий распределенной обработ- ки данных была технология файл-сервер. По запросу клиен- та файл-сервер пересылает запрошенный файл. Целостность и безопасность данных не обеспечивается в должной степени. Файл-сервер содержит базу данных и файловую систему для обеспечения многопользовательских запросов. Сетевые СУБД, основанные на технологии файл-сервер, также не обеспечивают безопасность и целостность данных. При увеличении числа запросов падает производительность системы, так как файл-серверы реализуют принцип «все или Информационные технологии 258 ничего». Полные копии файлов базы перемещаются по сети, увеличивается трафик сети, что может привести к увеличе- нию времени ожидания клиентов. Трафик сети – это поток сообщений в сети. На смену была разработана технология клиент-сервер. Технология клиент-сервер является более мощной, так как позволила совместить достоинства однопользовательских сис- тем (высокий уровень диалоговой поддержки, дружественный интерфейс, низкая цена) с достоинствами более крупных компьютерных систем (поддержка целостности, защита дан- ных, многозадачность). Технология клиент-сервер за счет рас- пределения обработки транзакций между многими серверами повышает производительность, увеличивает число обслужи- ваемых пользователей, позволяет пользователям электронной почты распределять работу над документами, обеспечивает доступ к доскам объявлений и конференциям. Основная идея технологии клиент-сервер заключается в том, что базы данных располагаются на мощных серверах, а приложения клиентов, обрабатывающих данные посредством инструментальных средств, запросы клиентов – на менее мощных компьютерах. Файл-сервер заменен сервером баз данных, который содержит базу данных, сетевую операцион- ную систему, сетевую СУБД. Сервер баз данных обрабатывает запросы клиентов, выбирает необходимые данные из базы, посылает их клиентам по сети, производит обновление ин- формации, обеспечивает целостность и безопасность данных. Технология клиент-сервер позволяет независимо нара- щивать мощности сервера баз данных, увеличивая число поддерживаемых им услуг, и клиента, использующего новые приложения. Для доступа к серверу баз данных и манипулирования данными применяется язык запросов SQL. По запросу клиента отправляется не полная копия файла, а логически необходи- мая порция данных. Тем самым уменьшается трафик сети, что позволяет увеличить число обслуживаемых пользователей. Технологии интегрированных информационных систем общего назначения 259 К недостаткам технологии клиент-сервер можно отнести то, что при отсутствии сетевой СУБД трудно организовать распределенную обработку. Платформу сервера баз данных определяют операцион- ная система компьютера клиента и сетевая операционная сис- тема. В настоящее время наиболее популярными серверами баз данных являются Microsoft SQL-server, SQLbase-server, Oracle-server и др. Совмещение гипертекстовой технологии с технологией баз данных позволило создать распределенные гипертексто- вые базы данных. Разрабатываются гипертекстовые модели внутренней структуры базы данных и размещения баз дан- ных на серверах. Гипертекстовые базы данных содержат ги- пертекстовые документы и обеспечивают самый быстрый дос- туп к удаленным данным. Гипертекстовые документы могут быть текстовыми, цифровыми, графическими, аудио- и ви- деофайлами. Тем самым создаются распределенные мульти- медийные базы. Гипертекстовые базы данных созданы по многим пред- метным областям. Практически ко всем обеспечивается доступ через интернет. Примерами гипертекстовых баз данных явля- ются правовые системы: Гарант, Юсис, Консультант + и др. Рост объемов распределенных баз данных выявил сле- дующие проблемы их использования: управление распределенными системами очень слож- ное; создание новых приложений, обеспечивающих распре- деленную обработку, обходится дороже, чем планирова- лось; производительность многих приложений в распреде- ленных системах недостаточна; усложнилось решение проблем безопасности данных. Решением этих проблем становится использование больших ЭВМ, называемых мэйнфреймами. Первые семейст- ва мэйнфреймов IBM S/390 имели оперативную память от 512 Информационные технологии 260 мегабайт до 8 гигабайт. Внутреннее дисковое устройство име- ло суммарную емкость до 288 гигабайт. Посредством web- серверa мейнфрейм подключался к сети интернет. Компания Oracle совместно с HewlettPackard и EMC предложила другое решение. Для хранения данных предна- значены управляемые дисковые системы Integrated Cached Disk Array. Суммарная информационная емкость первых та- ких систем от 500 гигабайт до одного и более терабайт. Такие системы явились основой для создания информа- ционных хранилищ. 8.3. Технологии информационных хранилищ Использование баз данных не дает желаемого результата автоматизации деятельности предприятия. Причина проста: реализованные функции хранения, обработки данных по за- просу значительно отличаются от функций ведения бизнеса, так как данные, собранные в базах, не адекватны информа- ции, которая нужна лицам, принимающим решения. Решени- ем данной проблемы стала реализация технологии информа- ционных хранилищ (складов данных). Технологии информационного хранилища обеспечивают сбор данных из существующих внутренних баз предприятия и внешних источников, формирование, хранение и эксплуа- тацию информации как единой, хранение аналитических данных (знаний) в форме, удобной для анализа и принятия управленческих решений. К внутренним базам данных пред- приятия относятся локальные базы подсистем ИС: базы дан- ных бухгалтерского учета, финансового анализа, кадров, рас- четов с поставщиками и покупателями и т.д. К внешним базам – любые данные, доступные по интернету и размещенные на web-серверах предприятий-конкурентов, правительственных и законодательных органов, других учреждений. Отличие реляционных баз данных, используемых в ИС, от информационного хранилища заключается в следующем. Технологии интегрированных информационных систем общего назначения 261 Реляционные базы данных содержат только оператив- ные данные организации. Информационное хранилище обеспечивает доступ как к внутренним данным организации, так и к внешним источникам данных, доступным по интернету. База данных ориентирована на одну модель данных функ- циональной подсистемы ИС. Базы обеспечивают запросы опера- тивных данных организации. Информационные хранилища поддерживают большое число моделей данных, включая много- мерные, что обеспечивает ретроспективные запросы (запросы за прошлые годы и десятилетия), запросы как к оперативным дан- ным организации, так и к данным внешних источников. Данные информационных хранилищ могут размещаться не только на сервере, но и на вторичных устройствах хранения. Технология информационных хранилищ стала возмож- ной после появления мейнфреймов и вторичных устройств – оптических устройств хранения данных с высокой емкостью. Среди них можно выделить оптические библиотеки со сменой дисков вручную, библиотеки-автоматы с автоматической сме- ной дисков (так называемая технология Jukebox). Для размещения и доступа к данным на таких устройст- вах разработан ряд файловых систем. Наиболее используемые технологии реализуют системы HSM (Hierarchycal Storage Man- agement) и DM (Data Migration). HSM реализует технологии |