Главная страница

информатика для экономистов. 1. Информатика для экономистов. Учебное пособие Нижний Новгород Издательство Нижегородского госуниверситета 2012


Скачать 0.95 Mb.
НазваниеУчебное пособие Нижний Новгород Издательство Нижегородского госуниверситета 2012
Анкоринформатика для экономистов
Дата24.01.2022
Размер0.95 Mb.
Формат файлаdoc
Имя файла1. Информатика для экономистов.doc
ТипУчебное пособие
#340905
страница33 из 43
1   ...   29   30   31   32   33   34   35   36   ...   43

6.5. Основные понятия World Wide Web


Большинство документов, доступных на серверах сети INTERNET, имеют гипертекстовый формат. Службу INTERNET, управляющую передачей таких документов, называют World Wide Web (WWW). Этим же термином или средой WWW называют совокупность Web-документов, между которыми существуют гипертекстовые связи.

Гипертекст - это система документов, связанных между собой перекрестными ссылками.

Среда WWW не имеет централизованной структуры. Она пополняется теми, кто желает разместить свою информацию в сети. Как правило, документы хранятся на постоянно подключенных к сети компьютерах - Web-серверах. Обычно на Web-сервере размещают не один документ, а группу взаимосвязанных документов. Такая группа представляет собой Web-узел, а размещенная на Web-узле информация называется Web-публикацией или Web-изданием. Web-узел выдает информацию только в ответ на обращение клиента. Чтобы следить за обновлением опубликованных материалов, пользователь вынужден регулярно обращаться к данному узлу. Современная модель Web-узла позволяет автоматически в заданное время передать обновленную информацию на компьютер зарегистрированного пользователя. Такие Web-узлы называются каналами.

Web-страницей называют отдельный документ WWW. Обычно это комбинированный документ, который может содержать текст, графические иллюстрации, мультимедийные и другие вставленные объекты.

Для создания Web-страниц используется язык HTML (HyperText Markup Language язык гипертекстовой разметки документа). Этот язык при помощи тегов описывает логическую структуру документов, управляет форматированием текста и размещением объектов.

Документы сети INTERNET предназначены для отображения в электронной форме, причем автор не знает, каковы возможности компьютера, на котором документ будет отображаться. Язык HTML обеспечивает не столько форматирование документа, сколько описание его логической структуры. Форматирование и отображение документа на конкретном компьютере производится специальными программами - навигаторами (браузерами). Отличительной особенностью среды WWW является наличие средств перехода от одного документа к другому, тематически с ним связанному без указания адреса. Связь между документами осуществляется при помощи гипертекстовых ссылок.

Адресация ресурсов в WWW осуществляется с помощью универсальной системы идентификации ресурсов - URL (Uniform Resource Locator).

Структура URL-адреса:

<вид ресурса> <имя компьютера> <путь к файлу><имя файла>[?<параметры>]

Например, http://www.home.microsoft.com/intl/ru/wwwtour.html

Адресация в электронной почте

<имя адресата>@<доменное имя провайдера>

Например, shurem@tarkus.net.ru

Адреса телеконференций Usenet составляются аналогично полному доменному имени хоста.

Например, comp.ai.philosophy

Благодаря универсальной системе адресации Web-страницы могут содержать ссылки на другие Web-страницы и иные ресурсы Интернет, которые хранятся на том же или другом узле. Через Web-ресурсы доступны почти все остальные сервисы Интернет.

6.6. Поисковые системы Интернет


Существуют разнообразные средства поиска информации в Интернет - поисковые машины (поисковые серверы, поисковые роботы). Принцип их работы состоит в том. что пользователь с помощью специализированного языка запросов формирует запрос на поиск необходимой ему информации. Машина поиска автоматически просматривает документы на контролируемых (индексируемых) ею сайтах и предъявляет пользователю перечень WWW-страниц, которые по ее "мнению" удовлетворяют сформулированному запросу. Можно уточнить запрос или искать только во множестве уже отобранных документов. Обычно запросы формулируются в естественно-языковой форме и поиск осуществляется с учетом морфологии конкретного языка. Но языки запросов позволяют использовать и специализированные конструкции, позволяющие формулировать запрос более строго.

Стратегия современных поисковых серверов базируется на трех основных подходах:

  • создание индексов;

  • создание каталогов;

  • гибридный метод.

Поддержка Web-индексов предполагает создание и непрерывное пополнение огромной базы данных по индексируемым документам. Сбор информации выполняется автоматически программами-роботами, которые просматривают серверы INTERNET, анализируют встречающиеся в них слова и выполняют индексирование. В качестве примеров таких систем можно привести следующие системы:

Alta Vista (http://altavista.digital.com);

HotBot (http://www.hotbot.com);

Open Text (http://www.opentext.com).

Поисковые системы этого типа обладают очень большими базами данных и огромной скоростью обработки запросов.

Поисковые серверы, реализованные по принципу создания каталогов, формируются людьми, которые сами просматривают Web-узлы, читают электронную почту и телеконференции. Собранная таким образом информация помещается в тематические каталоги. Примером подобных систем могут служить системы:

Yahoo! (http://www.yahoo.com);

Magellan (http://magellan.com).

Качество таких поисковых серверов значительно выше. Кроме того, Web-каталоги имеют также внутренний поисковый механизм, который позволяет локализовать поиск по теме.

В гибридных системах поиска можно воспользоваться как индексной базой данных, так структурированными тематическими каталогами. Примером могут служить системы:

Lycos (http://www.lycos.com);

Excite (http://www.excite.com);

WebCrawler (http://www.webcrawler).

Справочные системы отличаются от поисковых систем тем, что в них отсутствует внутренний механизм поиска. Примером справочных систем могут быть:

тематический справочник BigBook (http://www.bigbook.com);

алфавитный классификатор Hoovers (http://www.hoovers.com).

Поиск информации с использованием различных поисковых систем требует больших затрат времени. Стремление облегчить задачу поиска информации дало толчок к развитию систем параллельного поиска, называемых метапоисковыми системами.

В простейшем случае метапоисковые системы Ї интерфейсные программы, которые предоставляют доступ поочередно к нескольким серверам. Пример такой системы:

http://home.microsoft.com/intl/ru/access/allinone.asphttp://home.microsoft.com/intl/ru/access/allinone.asp.

Процесс поиска во многих поисковых системах имеет приблизительно следующий алгоритм:

  • выполняется переход на начальную страницу поисковой системы, на которой находятся поля для формирования запроса или кнопка для выполнения начала поиска;

  • уточняется область поиска (наука, искусство, медицина, новости и т.д.);

  • вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. Возможно уточнение параметров запроса;

  • нажимается кнопка для начала поиска;

после появления на экране результатов поиска выполняется просмотр информации и сохранение наиболее важных для пользователя данных на диске.

Поиск информации при выполнении запроса выполняется не непосредственно в INTERNET, а в базе данных поисковой системы. Возможно, что информация в первоисточнике уже не совпадает с информацией базы данных. Для минимизации этого несовпадения поисковые системы постоянно обновляют свои базы данных. При этом существует два способа обновления информации в базах данных поисковых систем:

разработчик Web-страниц самостоятельно добавляет ссылку на свою страницу в поисковую систему.

поисковая система запускает специальную программу, называемую роботом. Робот проверяет существование ранее найденных и наличие новых документов.

1   ...   29   30   31   32   33   34   35   36   ...   43


написать администратору сайта