Материал. Литература по теме Тема Циклические и узловые подсети Вопрос Циклическое кольцо
Скачать 3.12 Mb.
|
Тема 3. Информационные ресурсы и теоретические основы современных информационных систем Цели и задачи изучения темы: Сформировать основные представления о базах данных, как информационном хранилище знаний. Уметь применять различные поисковые системы для получения информации. Разобраться в ключевой роли анализа сетей теории очередей (называемой также теорией массового обслуживания). Вопросы темы: 1. Информационные ресурсы сетей. 2. Поиск и отбор информации в информационных системах. 3. Электронные документы и документооборот. 4. Теоретические основы современных информационных сетей. Вопрос 1. Информационные ресурсы сетей. Ресурсы – это данные, приложения (программы) и периферийные устройства (принтер, плоттер, сканер, модем и т.п.). Понятие интерактивной связи компьютеров подразумевает обмен сообщениями в реальном режиме времени. Рис. 15. Пример разделения общих ресурсов в ИС (1 – сервер, 2 – клиенты, 3 – среда передачи данных – сетевой кабель, 4 – разделяемые ресурсы: a – данные (файлы, базы данных), b,c – периферийные устройства (принтер, плоттер)) Ресурс – это объект системы или сети, предоставленный процессу. Объекты делятся на физические и логические. К первым относятся процессоры, внешние устройства, физические каналы, узлы коммутации и другое оборудование. Логическими ресурсами являются программы, навигаторы, трансляторы, языки, платформы, интерфейсы, память, логические каналы и т.д.. Ресурс может использоваться одним либо одновременно несколькими процессами. В последнем случае необходимо организовать такое обращение к ресурсу, которое без каких-либо конфликтов распределяет его между процессами. Основной информационный ресурс сетей – находящаяся на объектах системы информация. Доступ к информационным ресурсам сети осуществляется с помощью транзакций. Транзакция — короткий во времени цикл взаимодействия объектов, включающий запрос - выполнение задания - ответ. Информация в основном расположена в базе данных. База Данных - совокупность взаимосвязанных данных, организованная по определенным правилам. Строго говоря, базой данных является специальным образом организованные один либо группа файлов. Для работы с ними используется СУБД. При этом подразумевается, что база данных определена по схеме, не зависящей от программ, которые к ней обращаются. БД характеризуется ее концепцией - совокупностью требований, определяемых представлениями пользователей о необходимой им информации. На основе баз данных создаются разнообразные системы, например, электронные библиотеки. Распределённая база данных – это БД, содержимое которой расположено в нескольких абонентских системах информационной сети. Это позволяет располагать данные так, что последние с одной стороны находятся в пунктах наибольшего их спроса, а с другой стороны обеспечивается доступ к любым данным, не зависимо от того, где они находятся. Распределённая база данных, создаваемая заново, является однородной. Вместе с этим, нередко она образуется как совокупность группы баз данных, уже функционирующих в ряде систем. В этом случае возникает неоднородная распределённая база данных. Оба типа баз погружаются в Систему Управления Распределенной Базой Данных (СУРБД). Характерными особенностями распределённой базы данных являются: использование распределенного словаря, содержащего сведения о характере имеющихся данных, их размещении и способе доступа к ним; выполнение транзакций или обеспечение работы электронной почты между всеми абонентскими системами; пространственная прозрачность, дающая возможность не знать, где расположены компоненты базы. Перемена места хранения файла не приводит к изменению способа и процедуры доступа к этому файлу; прозрачность распределения, позволяющая размещать данные в любых абонентских системах; полная функциональность, т.е. возможность выполнения всех тех же операций, которые возможны в базе, находящейся в одной системе; целостность данных, обеспечиваемая функциями слежения за данными, исправления ошибок; независимость от типов используемых в системах устройств; работа с частью базы данных, расположенной в одной системе, не может быть прервана обращением из другой системы; администратор части базы, находящейся в одной системе работает независимо от администраторов частей базы, расположенных в других системах. Информационное хранилище – это программная платформа, опирающаяся на большое количество баз данных и представляющая пользователям и прикладным программам подготовленную нужным образом информацию (рис. 16). Рис. 16. Структура информационного хранилища Здесь процесс обработки данных физически разделяется на 2 этапа: первый из них связан с обработкой транзакций в реальном времени (OLTP), в результате чего в базе данных накапливается первичная информация (например, функционировании финансового банка). На втором этапе осуществляется аналитическая обработка в реальном времени (OLAP) (например, анализ снятия наличности со счетов, планирование объёма оказываемых услуг, показатели эффективности работы отделений и всего банка и т.д.). Знания – это накопленные человечеством факты, истины и прочие объекты познания. Поэтому в отличии от базы данных в базе знаний располагаются сведения, содержащиеся в документах, книгах, статьях и отчётах. Элементы знаний, благодаря концептуальным связям, предоставляемых гиперсредой, объединяются, образуя базу знаний. Такие связи бывают четырёх видов: общность – связь двух элементов по содержанию их характеристик; партитивность – соотношение целого и его частей; противопоставление – встречается в элементах, которые имеют положительные и отрицательные характеристики; взаимосвязь – отражает взаимную зависимость элементов. Базы знаний – это организованная совокупность знаний, относящихся к какой-нибудь предметной области. Базы знаний применяются при решении задач искусственного интеллекта. Доступ к информации может быть осуществлён, например, через электронную библиотеку, электронную биржу, информационный киоск, с помощью видеотекса, телетекста и т.д. «Научно-техническая информация» (Scienceand technical information, STI) означает документированную информацию, возникающую в результате научного и технического развития, а также информацию, необходимую руководителям, научным, инженерным и техническим работникам в процессе их деятельности, включая специализированную экономическую и нормативно-правовую информацию. Вопрос 2. Поиск и отбор информации в информационных системах. Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п. Существуют различные толкования термина «поиск информации» или «информационный поиск». Термин «информационный поиск»(англ. «information retrieval») ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию. Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название «справочно-поисковый аппарат» (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов. Библиотекари определяют «информационный поиск»как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей. С точки зрения использования компьютерной техники информационный поиск - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя. Релевантность - устанавливаемое при информационном поиске соответствие содержания документа информационному запросу или поискового образа документа поисковому предписанию. Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы. Поисковые системы осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы. Информационно-поисковые системы Поисковые системы с большим набором функций и возможностей обычно входят в состав СУБД и именуются информационно-поисковыми системами. Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Internetе. Система, обеспечивающая поиск и отбор необходимых данных на основе информационно-поискового языка и соответствующих правил поиска, а база данных - как совокупность средств и методов описания, хранения и манипулирования данными, облегчающих сбор, накопление и обработку больших информационных массивов. Организация различных БД отличается видом объектов данных и отношений между ними. Терминологически «информационно-поисковая система» (англ. «information retrieval system», IRS) - представляет систему, предназначенную для поиска и хранения информации; пакет программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных. Функционирование современных ИПС основано на двух предположениях: документы, необходимые пользователю, объединены наличием некоторого признака или комбинации признаков; пользователь способен указать этот признак. Автоматизированные ИПС (АИПС), используют компьютерные программно-технические средства и технологии и предназначаются для нахождения и выдачи пользователям информации по заданным критериям. ИПС делятся на: традиционные (ручные, механические, электромеханические) и автоматизированные (электронные). Информационно-поисковые системы предназначены для поиска информации в базе данных. По характеру выдаваемой информации они делятся на 2 типа: документальные системы по заданию пользователя выдают необходимые ему документы (книги, законы, статьи и т.д.); фактографические: её задача – поиск в документах интересующих пользователя сведений (например, типы, характеристики и технологии изготовления стали). Вопрос 3. Электронные документы и документооборот. Электронный документ - документ, представленный в электронной форме (оцифрованный или подготовленный на компьютере), имеющий электронную подпись, идентифицирующую (подтверждающую) его подлинность. Электронные тексты - электронные (машиночитаемые) документы, хранящиеся на любых машинных носителях данных, доступные для использования в компьютерных программно-технических устройствах и системах. Электронное издание - это издание, представляющее электронную запись информации (произведение) на каком-либо машиночитаемом носителе информации и рассчитанное на использование с помощью электронных технических устройств. Электронная книга - это вид книги, хранящийся в электронном форме на любом машиночитаемом электронном носителе и включающий специальные средства навигации в ней. Электронная библиотека (от англ. «digital library» - «цифровая библиотека») - вид, как правило, общедоступной автоматизированной информационной системы, содержащей машиночитаемые (электронные) документы. ЭБ помогают обучаемым и преподавателям экономить время на получение нужной им литературы, что очень важно при работе в режимах активного (в том числе дистанционного) обучения. Подобная библиотека функционирует на сайте МФПУ «Синергия». Практически в любых организациях, предприятиях, учреждениях, ведомствах, фирмах, учебных заведениях и т.п. функционируют различные информационные потоки. Если деятельность таких организаций в значительной степени связана с использованием компьютерных информационных технологий, средств и методов преобразования информации, то их обычно называют электронными офисами. Они представляют собой систему автоматизации работы учреждения, основанную на применении компьютерной техники. Использование Internetа позволило создать разновидность электронного офиса, получившую название «виртуальный офис». В этом случае основные функции информационного обслуживания управленческой деятельности и информационные ресурсы не сосредоточены в реальном офисе с соответствующими атрибутами (помещением, оборудованием, персоналом и т. п.), а пространственно распределены в различных узлах информационной сети. По определению МСЭ-Т «телематические службы - службы электросвязи (кроме телефонной, телеграфной и служб передачи данных), которые организуются с целью обмена информацией через сети электросвязи». Первая телематическая служба Телетекс появилась в начале 80-х годов. Телетекс - буквенно-цифровая система передачи деловой корреспонденции, предназначенная для обслуживания учреждений и предприятий. Эта система несколько напоминает систему Телекс (абонентский телеграф - AT), но отличается от нее сохранением формы текста, значительно большим набором знаков, большей скоростью передачи, высокой достоверностью (одна ошибка на 400 страниц печатного текста), возможностью редактировать подготовляемую к передаче документацию. Телетекс – это сетевая служба передачи текстовых документов. Является простейшей разновидностью электронной почты. Функционирует в телефонной сети. Телерукопись - служба передачи графической информации, которая отображается на приемном конце согласно движениям «пера», пишущего на передающем конце. Сообщения, наносятся отправителем на бумагу, лежащую на специальном планшете. Электронная биржа – это биржа, ведущая торги с использованием информационной сети. Брокеры-посредники могут находиться в различных географических пунктах и странах. Информационный киоск — автоматизированный программно-аппаратный комплекс, предназначенный для предоставления справочной информации. Видеотекс – сетевая служба доступа терминалов к базе данных и сервисам, предоставляемым сетью. Работает в общественной телефонной сети. Различают три видеотекса: справочная служба; служба передачи сообщений; диалоговая служба. Все они в первую очередь предназначены для конторской деятельности. В последнее время стал использоваться и для широких пользователей. Факсимильная связь – это передача через коммуникационную сеть неподвижных изображений и текста. Для устранения недостатков созданы компьютерные факсимильные системы, включаемые в сеть при помощи факсимильных плат. Эти системы, соединяясь друг с другом, способны, не пользуясь бумагой, передавать точные копии документов. Рассматриваемая интеграция обеспечивает также шифрование передаваемой информации. Служба телеконференции позволяет проводить в реальном масштабе времени конференции между пользователями, расположенными в разных местах, с помощью терминалов и сетей электросвязи. Различают аудиографические и видеоконференции. Вопрос 4. Теоретические основы современных информационных сетей. Рассматриваются два характерных типа сетей: с коммутацией пакетов и коммутацией каналов. В первом случае, через сеть от источника к получателю по некоторому маршруту, выбор которого определяется проектом сети, передаются пакеты, т.е. блоки данных переменной длины. В случае коммутации каналов, для пары пользователей устанавливается маршрут передачи от одного конца к другому. Такие параметры, как число и длина пакетов, поступающих в сеть или проходящих через неё в любой момент времени, число вызовов, поступающих на вход сети за заданное время, продолжительность занятия (ресурса) – в общем случае подвержены статистическим изменениям. Поэтому для изучения их воздействия на сеть и получения соответствующих количественных характеристик должны применяться вероятностные методы. Ключевую роль в анализе сетей играет теория очередей (называемая также теорией массового обслуживания). Для сетей с коммутацией пакетов проблема очередей возникает совершенно естественно. Пакеты, поступающие на вход сети или промежуточного узла, на пути к пункту назначения накапливаются, обрабатываются с целью выбора подходящего канала передачи к следующему узлу, а затем считываются в этот канал, когда наступит время их передачи. Время, затраченное на ожидание передачи в накопителе, является важной мерой, характеризующей работу сети. Оно зависит от времени обработки в узле и длины пакета, а также от пропускной способности канала передачи и дисциплины обслуживания, применяемой при обработке пакета. Теория очередей возникает также при исследовании сетей с коммутацией каналов. Во-первых, при изучении обработки вызовов, во- вторых, при анализе зависимости между числом доступных каналов и вероятностью того, что вызов, требующий установление соединения, будет заблокирован или поставлен в очередь для ожидания обслуживания. Рассмотрим простейшую модель обслуживания: В качестве пакетов будем рассматривать пакеты данных для случая коммутации пакетов или вызовы для систем с коммутацией каналов. Пакеты поступают случайным образом со скоростью в единицу времени. Они ожидают обслуживания в накопителе, и обслуживаются в соответствии с некоторой конкретной дисциплиной со средней скоростью пакетов в единицу времени. На рисунке 17. показана одна обслуживающая линия. Рис. 17. Модель обслуживания с одной линией В более же общем случае могут быть доступны несколько обслуживающих линий, и в этом случае одновременно могут обслуживаться несколько пакетов. В контексте сети передачи данных обслуживающая линия это средство передачи (исходящий канал или линия, передающие пакеты или, в случае систем с коммутацией каналов, обрабатывающие вызовы), которое передает данные с предписанной скоростью C блоков данных в единицу времени. Таким образом, процесс обслуживания определяется длиной пакета или продолжительностью соединения. Если интенсивность поступления приближается к скорости обработки пакетов , очередь начинает расти. При накопителе конечной ёмкости очередь достигает наибольшей допустимой величины, а при переполнении накопителя поступление всех последующих пакетов будет заблокировано. Для однолинейных систем обслуживания стабильность обеспечивается при Введём параметр . Его называют коэффициентом использования канала или интенсивностью нагрузки. Когда приближается к 1 или превышает её, возникает область перегрузки, и поступающие пакеты блокируются более часто. Характеристики сети (время задержки, вероятность блокировки и т.д.) зависит также от вероятности состояний очереди. Для расчёта вероятностей состояния должны быть известны следующие характеристики: процесс поступления пакетов (статистика входящих потоков); распределение длин пакетов (распределение времени обслуживания); дисциплина обслуживания (обслуживание в порядке поступления – ОПП или FIFO, некоторые дисциплины обслуживания с приоритетами). Для многолинейных систем вероятности состояний зависят также от числа обслуживающих линий. В теории массового обслуживания принято моделировать процесс поступления вызовов с помощью Пуассоновского процесса. Пуассоновский процесс. Рассмотрим бесконечно малый промежуток времени t ( t 0), проходящий между моментами t и t+ t. При определении пуассоновского процесса используются три основные предпосылки: 1. вероятность одного поступления в течение времени t определяется в виде: t+О( t), где О( t) – члены более высокого порядка, которыми мы можем пренебречь при t 0; 2. вероятность нулевого поступления в течение времени t равна 1- t; 3. поступление – без последействия (без памяти), т.е. поступление в течение t не зависит от предыдущих поступлений. Если теперь рассмотреть большой промежуток времени Т, то вероятность p(k) того, что в промежутке Т произойдут k поступлений, равна: , где k = 0, 1, 2, … Это равенство называется распределением Пуассона. Оно нормировано: и его среднее значение имеет вид: Дисперсия распределения: Теперь рассмотрим большой промежуток времени и отметим на нём моменты, в которые наступили события Пуассоновского процесса (рис. 18). Рис. 18. События Пуассоновского процесса Очевидно, что - это положительная случайная величина с непрерывным распределением. Оказывается, что для Пуассоновского распределения величина распределена по показательному закону: Среднее значение показательного распределения: а дисперсия Система обслуживания М/М/1. Система обслуживания М/М/1 – это система с одной обслуживающей линией, Пуассоновским входящим потоком, показательным распределением обслуживания и дисциплиной ОПП (обслуживание в порядке поступления). Диаграмма изменений состояний во времени для системы может быть изображена на рисунке 19. Рис. 19. Диаграмма изменений состояний во времени Рассмотрим диаграмму состояний для системы М/М/1, представленную на рисунке 20: Рис. 20. Диаграмма изменений состояний во времени для системы M/M/1 Пусть процессы поступления и обслуживания определяются соответственно параметрами и . Определим вероятность p n (t+ t) того, что в момент времени t+ t в системе будет находиться n клиентов (пакетов или вызовов). Из диаграммы видно, что в момент времени t система могла находиться только в состоянии n-1, n или n+1. Тогда мы можем записать: Вероятности перехода из одного состояния в другое получены в результате рассмотрения путей, по которым происходят эти переходы, и расчёта соответствующих вероятностей. Например, если система осталась в состоянии n, то могли произойти либо уход и одно поступление с вероятностью t, либо ни одного ухода или поступления с вероятностью , что и показано в первом случае. Производя упрощения, иcпользуя разложение в ряд Тейлора, можно получить следующее уравнение: Для стационарного состояния вероятность p n (t) приближается к некоторому постоянному значению, поэтому . Тогда последнее уравнение для стационарного случайного процесса упрощается и принимает вид: (1) Форма уравнения (1) показывает, что при работе системы действует стационарный принцип равновесия: левая часть описывает интенсивность уходов из состояния n, а правая часть – интенсивность приходов в состояние n из n-1 или n+1. Чтобы существовали вероятности стационарного состояния, эти две интенсивности должны быть равны. Вопросы для самопроверки: 1. Что такое «Система обслуживания М/М/1», нарисовать диаграмму изменения состояний? 2. Записать формулу равенства называется распределения Пуассона. 3. Что такое информационный киоск? 4. Дать определения электронного текста, электронной книги, электронной библиотеке. 5. Что такое релевантность? 6. В чём разница между информационно-поисковыми системами и автоматизированными системами поиска? 7. На какие традиционные группы делятся ИПС? 8. На какие группы делятся ИПС по характеру выдаваемой информации? 9. В чём разница между базами знаний и базами данных? 10. Что такое информационное хранилище? Литература по теме: Основная литература: 1. Компьютерные сети. / А.В. Кузин, Учебное пособие. 3-е изд., перераб. и доп. М.: ФОРУМ, 2013. 192 с. 2. Таненбаум Э.С. Компьютерные сети. 5-е изд, – СПб.: Питер, 2013. – 960с. Дополнительная литература: 1. Дымарский Я.С., Крутякова Н.П., Яновский Г.Г. Управление сетями связи: принципы, протоколы, прикладные задачи. – М.: Мобильные коммуникации, 2003. – 384 с. 2. Компьютерные сети. / Н.В. Максимов, И.И. Попов. Учебное пособие. 5-е изд., перераб. и доп. М.: ФОРУМ, 2012. 464 с. 3. Основы Web-технологий / П.Б. Храмцов, С.А. Брик, А.М. Русак, А.И. Сурин /Под. редакцией П.Б. Храмцова. – М.: Internet-Университет Информационных Технологий: БИНОМ. Лаборатория знаний, 2010. – 374 с. 4. Пятибратов А.П., Гудыно Л.П., А.А.Кириченко, Вычислительные системы, сети и телекоммуникации (для бакалавров): Учебник / Под редакцией А.П. Пятибратова. – М.: КноРус, 2013. – 376 с. 5. СТиттел Эд, Хадсон Курт, Дж. Майкл Стюард Networking Essentials – СПб ПИТЕР, 1999. 6. Столлингс В. Компьютерные сети, протоколы и технологии Internetа. – СПб.: БХВ-Петербург, 2005. – 832 с. Интернет-ресурсы: 1. Информационные киоски // http://video-in.ru/ 2. Информационные технологии и электронные коммуникации // http://emf.ulstu.ru/metod/ITEK/index.htm 3. Системы передачи информации // http://kunegin.narod.ru/ref/lec/86.htm |