Сетевые технологии обработки информации
Скачать 1.4 Mb.
|
протоколом. Информация передается по сети в виде электромагнитных сигналов. Такие сигналы могут быть аналоговыми и цифровыми. Аналоговый сигнал — это непрерывный волновой сигнал. Например, в такой форме передается голос по телефонным линиям связи когда звуковой сигнал преобразуется в мембране микрофона в электрический. Цифровой сигнал (в отличие от аналогового) — это дискретный (преры- вистый) сигнал, способный принимать два возможных состояния: 1 или 0 (например, есть импульс — 1, нет импульса — 0). Цифровые сигналы — это 14 основа коммуникаций практически во всех современных компьютерах. Цифро- вой сигнал для его передачи по аналоговым каналам связи (например, по теле- фонной линии) необходимо преобразовать в аналоговый. Такое преобразование осуществляет модем (модулятор/демодулятор) [8]. После преобразования циф- ровой сигнал может быть передан по обычному аналоговому каналу связи на другой компьютер. Рис. 1.3. Принципы работы модема [8] Обычно скорость передачи данных по каналу связи измеряется в битах в секунду (бит/с, Bit per Second, BPS) — как количество двоичных значений (0 или 1), передаваемых в секунду, либо как количество изменений состояния ка- нала в секунду. Для последовательного канала (в котором данные следуют по одной и той же линии связи друг за другом) 1 BPS = 1 Baud (бод). При других способах организации канала связи один элемент сигнала может соответство- вать более чем одному биту, тогда 1 бод составляет больше чем 1 бит/с [3, 4]. 1.3. Топология информационной сети Важным понятием при построении информационной сети является поня- тие ее топологии. Под топологией вычислительной сети понимается конфигу- рация соединений ее отдельных компонентов. Топология влияет на производи- тельность сети и ее надежность. Рассмотрим разные виды сетевых топологий. Полносвязная топология — каждый компьютер сети связан со всеми остальными. Это достаточно громоздкий вариант (необходимо большое коли- чество коммуникационных портов, а для каждой пары компьютеров должна быть выделена своя, отдельная электрическая линия связи). Используется в многомашинных комплексах или в глобальных сетях при небольшом количе- стве компьютеров. Ячеистая топология — получается путем удаления из полносвязной то- пологии некоторых возможных связей (непосредственно связываются только компьютеры, между которыми происходит интенсивный обмен данными, а для несвязанных компьютеров используется транзитная передача данных через промежуточные узлы). Характерна для глобальных сетей. Топология «звезда» представлена на рисунке (рис. 1.4). Здесь каждая ра- бочая станция подключается отдельным кабелем к центральному серверу либо 15 сервер и рабочие станции подключаются к центральному коммуникационному устройству — концентратору. Пропускная способность такой сети определяет- ся мощностью концентратора, поэтому скорость передачи информации от од- ной рабочей станции к другой — невысокая по сравнению с достигаемой в дру- гих топологиях. Конфигурация «звезда» получила распространение в основном благодаря ее дешевизне и простоте развертывания сети на ее основе. Рис. 1.4. Архитектура сети типа «звезда» При реализации кольцевой топологии рабочие станции последовательно связаны друг с другом в замкнутое кольцо: первая станция — со второй, вторая — с третьей и т. д., а последняя связана с первой (рис. 1.5.). В такой сети сооб- щения передаются по кругу. В большинстве случаев данные передаются только в одном направлении, когда только одна соседняя станция принимает данные и передает их дальше. Недостаток такой сети — ее низкая надежность: поскольку каждая станция должна участвовать в пересылке информации, в случае выхода из строя хотя бы одной из них парализуется работа всей сети. Рис. 1.5. Кольцевая топология Более надежной является кольцевая топология с двухсторонней передачей данных, когда кольцо строится на базе двух каналов связи с встречными пото- ками информации. 16 Шинную (горизонтальную) топологию также называют магистральной, так как здесь каждая рабочая станция подключаются к одному каналу связи. Это наиболее скоростная топология: каждое сообщение может приниматься всеми станциями и любая станция может передать сообщение любой другой. Функци- онирование сети при этом не зависит от состояния отдельной рабочей станции (рис. 1.6). Рис. 1.6. Архитектура сети типа «общая шина» Древовидная топология представляет собой комбинацию вышеназванных топологий и называется «вертикальной», или «иерархической». Основание «де- рева» располагается в главной точке сети, где установлен файл-сервер; к нему ведут все коммутационные линии («ветви дерева»). Для подключения большого числа рабочих станций применяются коммутаторы. Коммутаторы, используе- мые только для разветвления сети, называют пассивными; коммутаторы, кото- рые, кроме этого, также усиливают сигнал, называют активными. Главный не- достаток древовидной сети — ее низкая надежность: вся сеть полностью зави- сит от «корневого» файл-сервера. Кроме того, при большом количестве рабо- чих станций снижается пропускная способность сети [2, 3, 4]. Для единого стандарта представления данных в линиях связи, по которым передается информация, была разработана базовая модель взаимодействия от- крытых систем — OSI (Open Systems Interconnetion). Основная идея этой моде- ли заключается в том, что весь процесс передачи данных разбивается на 7 уровней, благодаря чему общая задача передачи данных расчленяется на от- дельные, более легко обозримые и формализуемые задачи. Для каждого уровня системы OSI разработаны соответствующие стандарты. При этом каждый уро- вень использует нижерасположенные уровни, а также обслуживает вышестоя- щие уровни. Данные в пределах одной рабочей станции передаются от одного уровня к другому, а связь между рабочими станциями осуществляется на одном уровне. Необходимые соглашения для связи одного уровня с выше- и нижесто- ящими уровнями называют протоколами. Представим уровни модели OSI [8]: • Уровень 1 — физический: определяет электрические, механические и процедурные параметры для физической связи в системах. Это характеристики кабелей, разъемов, сигналов. 17 • Уровень 2 — канальный: управляет передачей данных между двумя уз- лами сети, формирует информацию, поступающую с первого уровня, обраба- тывает ошибки. • Уровень 3 — сетевой: устанавливает связь между абонентами, осуществ- ляет маршрутизацию. • Уровень 4 — транспортный: осуществляет непрерывную передачу дан- ных между двумя взаимодействующими процессами пользователей. • Уровень 5 — сеансовый: координирует прием/передачу данных в одном сеансе данных, выполняет проверку прав доступа к сетевым ресурсам. • Уровень 6 — представительный: выполняет интерпретацию передавае- мых данных, определяет форматы данных, алфавиты, коды представления спе- циальных и графических символов; используется для преобразования кадров данных, передаваемых по сетям, в экранный формат и формат печатного устройства. • Уровень 7 — прикладной: осуществляет пользовательское управление данными (пользователю представляется переработанная информация). Любая вычислительная система работает под управлением операционной системы. Сетевая операционная система — это комплекс программ, организу- ющих работу сети, обеспечивающих передачу данных между компьютерами и распределяющих вычислительные и коммутационные ресурсы между задачами и пользователями. Сетевая ОС должна обеспечивать для пользователя стан- дартный и удобный доступ к сетевым ресурсам. Сетевое программное обеспечение состоит из нескольких компонентов: • платформа сервера (операционная система сервера); • прикладные программы сетевых служб; • программы обеспечения связи для рабочих станций. Эти компоненты, взаимодействуя, организуют сетевую среду, которая обеспечивает пользователю доступ к сетевым ресурсам. При этом платформа сервера обеспечивает выполнение основных функций сети, таких как поддерж- ка файловой системы, управление памятью, планирование задач. Прикладные программы сетевых служб выполняются в среде платформы сервера и обеспе- чивают дополнительные функции (например, блокирование записей и файлов), а также поддерживают запросы языка SQL к совместно используемому серверу баз данных. Программы обеспечения связи для рабочих станций (коммутаци- онные программы) обеспечивают связь между операционной системой рабочей станции и сетевой операционной системой, поддерживают протоколы связи, передают запросы по сети и принимают ответы. Коммутационные программы устанавливаются на рабочих станциях пользователя вместе с операционными 18 системами этих рабочих станций. При этом пользователь получает прямой до- ступ к ресурсам системы, используя сетевые команды. Наиболее известной в мире и самой распространенной в России является сетевая операционная система NetWare фирмы Novell [2, 4]. Факторы, определяющие преимущества сетевого использования компью- теров: • устранение дублирования информации и проблем, связанных с актуали- зацией данных для отдельных пользователей одной организации; • экономичное коллективное использование в сети таких ресурсов, как про- граммное обеспечение, принтеры, дисковые объемные массивы памяти и т. п.; • повышение производительности за счет размещения в сети файл- серверов, серверов баз данных, телекоммуникационных серверов и других сер- веров приложений; • наличие электронной почты, проведение телеконференций и т. п.; • высокая надежность при наличии в сети дублирующих элементов единой распределенной системы обработки данных Важным преимуществом компьютерных сетей перед централизованными системами является их способность выполнять параллельные вычисления. За счет этого в системе с несколькими обрабатывающими узлами (компьютерами) может быть достигнута производительность, превышающая максимально воз- можную на данный момент производительность любого отдельного, сколь угодно мощного процессора. А также использование сети приводит к улучше- нию процесса обмена информацией и взаимодействия между сотрудниками ор- ганизации, ее клиентами и поставщиками. Компьютерные сети снижают по- требность предприятий в других формах передачи информации, таких как те- лефон или обычная почта. 2. Интернет-технологии 2.1. Сеть Интернет Сеть Интернет обеспечивает обмен информацией между всеми компьюте- рами, которые входят в состав подключенных к ней региональных и локальных сетей. Тип компьютера и используемая им операционная система при этом зна- чения не имеют. Базой для организаций сети Интернет являлась компьютерная сеть Мини- стерства обороны США — ARPAnet (ARPA — Advanced Research Projects Agency), созданная в начале 1970-х гг. для связи компьютеров научных органи- заций, военных учреждений и предприятий оборонной промышленности. Эта сеть строилась при участии Пентагона как устойчивая к внешним воздействиям 19 закрытая система, способная функционировать даже в условиях ядерного уда- ра, т. е. наибольшее внимание уделялось ее надежности. Начало развертыванию сети Интернет в России положило создание в нача- ле 1990 г. компьютерной сети Relcom на базе Института атомной энергии им. И. В. Курчатова. Уже к концу 1990 г. в эту сеть было интегрировано более 30 локальных сетей различных организаций, что позволило осуществить ее офи- циальную регистрацию и подключение к мировой сети. Развитие глобальной компьютерной сети потребовало наличия каналов связи с высокой пропускной способностью. В 1999 г. началась реализация меж- дународного проекта по созданию сети волоконно-оптических сверхскорост- ных каналов связи. Основные ячейки Интернета — это локальные вычислительные сети. Но существуют и локальные компьютеры, самостоятельно подключенные к Ин- тернету. Компьютеры (сетевые или локальные), непосредственно подключенные к Интернету, называют хост-компьютерами, или хостами (host— хозяин). Если некоторая локальная сеть подключена к Интернету, то у всех рабочих станций этой сети также есть выход в Интернет через соответствующий хост- компьютер. Каждый подключенный к сети компьютер имеет свой адрес (IP-адрес), по которому он идентифицируется в сети. Структура сети Интернет — клиент- серверная, когда одни компьютеры (клиенты) получают информацию из сети, а другие (серверы) — снабжают клиентов информацией. Сеть Интернет объеди- няет сотни миллионов компьютеров самых разных типов — от персональных компьютеров разных моделей до больших ЭВМ (мэйнфреймов) и суперкомпь- ютеров. Задача объединения компьютеров и расположенной на них информа- ции решается благодаря использованию созданной для сети Интернет системы протоколов TCP/IP. Основу этой системы составляют два главных протокола: • Internet Protocol (IP) — межсетевой протокол; • Transmission Control Protocol (TCP) — протокол управления передачей. Протокол IP организует разбиение сообщений на электронные пакеты (IP- дейтаграммы), определяет маршруты отправляемых пакетов и обрабатывает поступающие пакеты. Протокол TCP управляет потоком данных, обрабатывает ошибки и гарантирует, что информационные пакеты получены и собраны в полном составе и в необходимом порядке. На основе этих протоколов разработаны другие сетевые сервисные прото- колы, среди которых следует отметить [8, 10, 11]: • FTP (File Transfer Protocol) — протокол передачи файлов служит для об- мена файлами между компьютерами. Например, если нужно передать файл на 20 сервер или, наоборот, скачать файл с сервера, то надо подключиться к файло- вому серверу (FTP-серверу) и выполнить необходимую операцию скачивания или закачки файла. Подключение к FTP-серверу обычно осуществляется с по- мощью FTP-клиента. Простейший FTP-клиент обычно входит в состав любой операционной системы; • Telnet — протокол удаленного доступа, т. е. дистанционного исполнения команд на удаленном компьютере; • POP (Post Office Protocol) — протокол почтового отделения, используется для получения электронной почты с почтовых серверов. Для передачи элек- тронной почты с клиентского компьютера на почтовый сервер служит протокол SMTP (Simple Mail Transfer Protocol) — протокол передачи сообщений элек- тронной почты; • IMAP — также служит для чтения электронной почты, но, в отличие от протокола POP, здесь пользователь читает сообщения электронной почты, не загружая их на свой компьютер. Все сообщения хранятся на сервере и удаляют- ся оттуда только если пользователь даст соответствующую команду; • HTTP (Hyper Text Transfer Protocol) — протокол обмена гипертекстовой информацией, т. е. документами на языке HTML (базовом языке создания web- страниц). Протокол HTTP используется Web-серверами, а браузеры, использу- емые для просмотра web-страниц, являются HTTP-клиентами; • Network News Transfer Protocol (NNTP) — протокол передачи новостей (телеконференций). Для идентификации компьютеров (host-узлов), подключенных к Интерне- ту, и для межсетевой маршрутизации пакетов каждому компьютеру присваива- ется уникальный четырехбитный адрес (IP-адрес). Запись IP-адреса состоит из четырех сегментов, разделенных точками. Каждый такой сегмент представляет собой десятичное число в диапазоне от 0 до 255, что соответствует одному бай- ту. Пример записи IP-адреса: 197.25.17.34. Сегменты IP-адреса делятся на две части. Левая, сетевая часть IP-адреса обозначает сеть, на нижнем уровне кото- рой находится адресуемый компьютер. Правая, машинная часть IP-адреса ука- зывает конкретный номер host-компьютера в сети нижнего уровня иерархии. Например, IP-адрес 197.25.17.34 определяет host-компьютер с адресом 34, под- ключенный к сети №17; при этом сеть № 17 является подсетью сети № 25, а сеть № 25 является подсетью сети 197 (класса С). Поскольку числовые IP-адреса host-узлов, обеспечивающие межсетевую маршрутизацию пакетов на втором уровне протоколов ТСРМР, не очень удоб- ны для пользователей, IP-адреса были дополнены иерархической системой символических адресов компьютеров, работа с которой обеспечивается в Ин- 21 тернете особой сетевой службой доменных имен (Domain Name System — DNS). Доменная система имен — это распределенная база данных, содержащая информацию о компьютерах (в основном о серверах), подключенных к Интер- нету: символьные адреса (имена) компьютеров, их числовые IP-адреса, данные для маршрутизации и др. Основной задачей службы DNS при сетевом взаимо- действии является поиск запрашиваемых компьютеров и преобразование сим- вольных адресов в числовые IP-адреса и наоборот. Аналогично IP-адресам, доменные имена тоже имеют составную, «сег- ментную» структуру. Например, для доменного имени de.ifmo.ru обозначение ru является именем домена верхнего уровня, ifmo — это имя домена второго уровня, a de — имя домена третьего уровня. При этом в качестве домена самого нижнего уровня выступает символическое имя самого компьютера. Напомним, что к трехсимвольным доменам верхнего уровня относятся: • com — коммерческие организации; • edu — учебные заведения; • net — организации, предоставляющие сетевые услуги; • mil — военные учреждения; • gov — правительственные учреждения; • org — некоммерческие организации; • int — международные организации. Двухсимвольные домены верхнего уровня предназначаются для обозначе- ния стран и совпадают с кодами этих стран согласно ISO. Примеры: аu — Австрия; са — Канада; dk — Германия; fi — Финляндия; fr — Фран- ция; uа — Украина; ru — Россия. 2.2. Технологии WWW Долгое время Интернет представлял собой комбинацию различных ком- пьютерных сетей, по которым при помощи соответствующих команд передава- лись электронные сообщения. С появлением сервиса Word Wide Web (WWW) информация в сети Интернет стала доступной и непрофессионалам. WWW дает возможности просмотра отформатированных текстов, цветных иллюстраций и др. Новая технология, работающая по принципу «указал-нажал», позволяет пользователю в простой и наглядной форме четко формулировать свои запросы к сети и выбирать именно то, что ему нужно. Создание WWW-среды привело к тому, что электронное представление информации в сети Интернет перешло на качественно новый уровень — от преимущественно текстовой к мультимедий- ной. Сегодня WWW заслуженно является одной из самых популярных инфор- мационных служб Интернета. 22 Технология WWW получила свое название по следующим причинам: Во-первых, структура сети Интернет согласно этой технологии содержит узлы, в которых расположены компьютеры — серверы и клиенты. Во-вторых, WWW имеет паутиновидную логическую структуру: указав на выделенное слово или словосочетание, пользователь попадает в нужный узел «всемирной паутины». В-третьих, информация по сети Интернет может распространяться от од- ного узла WWW к другому самыми разными путями — по свободным в данный момент времени и надежным каналам связи. Серверы (web-серверы) содержат на своих дисках информационные стра- ницы, которые обычно называют web-страницами. Особенность информации, представленной на web-страницах, состоит в том, что она может быть пред- ставлена в виде отформатированного текста и графических (анимированных) изображений; а также снабжена перекрестными ссылками для вызова другого сервера, страницы или абзаца на странице. В основу web-технологии положена технология гипертекста, суть которой состоит в том, что текст структурируется, т. е. в нем выделяются слова — ссыл- ки (их также иногда называют гиперссылками). При активизации такой ссылки (например, щелчком мыши) происходит переход на заданный в ссылке доку- мент или фрагмент текста. Ссылки в документе обычно тем или иным способом визуально выделяются (цветом и/или подчеркиванием). Технология WWW позволяет создавать ссылки, реализующие переходы не только внутри исходного документа, но и на любой документ любого компью- тера, подключенного в данный момент к Интернету. При этом в качестве ссы- лок допускается использовать не только фрагменты текста, но и графические изображения. Структурирование документов и создание web-страниц выполняется по- средством языка HTML (Hyper Text Markup Language). Web-страница может содержать информацию, представленную в различных формах: текст, таблицы, графику, анимацию, а также звук и видео. Просмотр web-страниц осуществля- ется с помощью специальных программ — браузеров. Найти web-страницу в Интернете или сделать на нее ссылку помогает URL (Universal Resource Locator) — универсальный идентификатор ресурса. Чтобы просмотреть какую-нибудь web-страницу, нужно знать ее имя и адрес, а также протокол, с помощью которого происходит передача web-страницы. Все это вместе (протокол, адрес и имя) и составляет URL. Для web-страниц обычно указывается протокол HTTP. URL определяет «официальное» местонахождение ресурсов Интернета. Каждый такой адрес состоит из двух частей: первая пред- 23 ставляет собой идентификатор ресурса, а вторая указывает на местоположение данного ресурса. Например, рассмотрим адрес: http://www.narod.yandex.ru/userarea/after_register.html Первая его часть — http: / / — является идентификатором ресурса, или, для краткости, просто идентификатором. Он указывает браузеру, какой протокол использовать для пересылки данного ресурса. Последовательность символов http: / / означает, что доступ к данному ресурсу (в данном случае — web- странице) обеспечивается протоколом передачи гипертекста HTTP. Вторая часть URL указывает на местоположение ресурса. Ее первый ком- понент (www.narod.yandex.ru) указывает доменное имя компьютера («имя глав- ного компьютера»). Второй компонент (userarea/after_register.html) сообщает имя отдельного web-pecypca (основного файла web-страницы, который нахо- дится на одном из компьютеров, подключенных к сети Интернет). Для работы с web-страницами используются специальные программы, называемые браузерами. Таких программ сегодня достаточно много: Microsoft Internet Explorer, Opera, FireFox, Netscape Navigator, Chrome и др. Основные функциональные возможности браузеров: • дружественный русскоязычный графический интерфейс; • функция клиента электронной почты; • пересылка файлов по протоколу FTP; • работа с телеконференциями, публикации и просмотр новостей; • просмотр файлов как в текстовом формате, так и в формате HTML; • формирование системы закладок; • расширенные возможности отображения различных шрифтов; • поддержка языков скриптового программирования и технологий апплетов (JavaScript, VBScript, ActiveX). Теоретически гипертекстовая технология WWW позволяет находить лю- бую информацию в процессе целенаправленного продвижения по ссылкам. Од- нако, чтобы не «листать» множество web-страниц, удобнее для поиска нужной информации использовать справочно-поисковые системы. Все существующие типы таких систем обрабатывают массивы неоднородной информации, содер- жащейся в сети, и применяют различные механизмы поиска и отображения ин- формации. Их можно условно разделить на следующие группы: • системы web-поиска; • каталоги; • базы данных адресов электронной почты; • системы поиска FTP-файлов и др. Для WWW наиболее характерны системы web-поиска — информационные системы, позволяющие осуществлять поиск в пространстве «всемирной паути- 24 ны», объединенном протоколом HTTP. К наиболее известным зарубежным си- стемам web-поиска относятся AltaVista, Google, Yahoo, HotBot, Infoseek, Lycos, WebCrawler и др. Среди российских поисковых систем можно назвать «Ян- декс», Aport, Rambler и др. Первая поисковая российская система Rambler нача- ла работать в конце 1996 г., Aport — с лета 1997 г., а система Yandex — с конца сентября 1997 г. Основные достоинства таких систем заключаются в высокой скорости по- иска и простоте работы с ними: пользователь обращается на сервер поиска, за- дает поисковый образ — ключевые слова интересующей его темы, вводит их в специально предусмотренном поле, и система выдает списки и адреса тех до- кументов, в которых встречаются эти ключевые слова. При этом поиск может осуществляться в точном соответствии с введенным ключевым словом (с уче- том различия строчных и прописных букв), но большинство современных по- исковых систем также позволяет задавать ключевую фразу в свободной форме. В поисковом запросе можно использовать одно или несколько слов — как русских, так и английских, разделенных пробелами. При этом по умолчанию считается, что в найденных документах должны содержаться все указанные в запросе ключевые слова. Можно также использовать расширенный поиск, тогда ключевая фраза вводится с применением специальных знаков, указывающих требуемую логику запроса: • знак «&» — требуется наличие обоих связанных этим знаком слов (логи- ка И); • знак «|» — достаточно наличия любого из связанных слов (логика ИЛИ); • знак «+» — данное слово должно быть обязательно (обычно в списке сна- чала выдаются web-документы, полностью соответствующие запросу, а затем — документы, соответствующие частично; применение знака «+» позволяет исключить такие частично соответствующие страницы); • знак «-» — данное слово обязательно не должно присутствовать; • кавычки — заключенная в них фраза ищется в точности такой; • скобки — позволяют строить сложные запросы (например: бег & (мара- фонский |