Главная страница
Навигация по странице:

  • Краткая история Интернета В истории развития Интернета можно выделить четыре этапа. Этап 1.

  • Этап З.

  • Этап 1. Первые национальные компьютерные сети

  • Этап 2. Разработка протоколов ТCP/IP

  • Этап З. Интернационализация Интернета

  • Этап 4. Современный этап.

  • Три составляющих современного Интернета

  • Информационный компонент.

  • Соотношение между аппаратным и информационным компонентами.

  • 213.183.100.79 . IP-адрес состоит из двух частей, одна из которых является адресом сети (подсети) – 213.183.100

  • Пакетная связь в Интернет

  • Поиск информации в Интернете

  • Оценка качества поиска информации.

  • Основы работы поисковых указателей.

  • Приемы эффективного поиска информации.

  • Средства простого поиска информации.

  • Средства расширенного поиска.

  • Средства специального поиска.

  • Глобальная сеть Интернет


    Скачать 0.49 Mb.
    НазваниеГлобальная сеть Интернет
    Дата29.09.2022
    Размер0.49 Mb.
    Формат файлаpdf
    Имя файлаKozlova.pdf
    ТипМетодическое пособие
    #705202

    МУНИЦИПАЛЬНОЕ ОБЩЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
    ЛИЦЕЙ № 7 г. ТОМСКА
    Козлова Елена Геннадьевна
    Глобальная сеть Интернет
    Методическое пособие
    Томск 2006
    _______________________________________________
    ©
    Козлова Е.Г.,
    2006
    ©
    Лицей № 7 г. Томска, 2006
    © Томский государственный университет, 2006
    Введение
    17 мая 1974 года академик Андрей Дмитриевич Сахаров завершил работу над статьей «Мир через полвека». «В перспективе, быть может, поздней, чем через 50 лет», - прогнозировал А.Д. Сахаров, - «я предполагаю создание всемирной информационной системы, которая и сделает доступным для каждого в любую минуту содержание любой книги когда-либо и где-либо опубликованной…»
    Темп прогресса информатики далеко опередил ожидания Сахарова. И на сегодняшний день мы имеем целый мир под названием «Интернет», который не знает границ и дает возможность общения миллионов людей в различных частях света, независимо от их общественного положения и рода занятий.
    Интернет – это единая глобальная компьютерная сеть, все системы которой работают по единым стандартам, называемым протоколами.
    Интернет считается последним и крупнейшим техническим достижением двадцатого века. Благодаря ему оказалось возможным соединить сотни миллионов компьютеров, разбросанных по всему миру.
    Интернет – это сложное техническое образование, обладающее свойствами
    самоорганизации и саморегуляции. Это свойство, характерное для объектов живой природы, крайне редко проявляется в технических системах. На нем основана
    высокая устойчивость Интернета в техническом, экономическом, социальном и политическом смысле. Сегодня невозможно указать какой-то сектор Сети, при

    2 выходе которого из строя (по любой причине) нарушилось бы функционирование
    Интернета в целом и его дальнейшее саморазвитие.
    Краткая история Интернета
    В истории развития Интернета можно выделить четыре этапа.
    Этап 1. 1958 - 1969 годы.Создание национальных компьютерных сетей.
    Этап 2. 1969 - 1983 годы.Решение проблемы устойчивости национальных сетей.
    Разработка протокола TCP/IP.
    Этап З. 1983-1993 годы.«Интернационализация» Интернета – объединениe национальных компьютерных сетей в единую структуру на базе общего протокола TCP/IP.
    Этап 4. После 1993 года.Создание службы World Wide Web и массовое развитие
    Интернета.
    Этап 1. Первые национальные компьютерные сети
    В разных странах процессы создания национальных компьютерных сетей протекали по-разному. Раньше других этот процесс начался в США. Здесь создание первой глобальной компьютерной сети проходило под руководством
    Министерства обороны и имело четко отраженную направленность на
    «холодную войну», проходившую в то время между СССР и США. Решение о создании национальной компьютерной сети было принято правительством США как часть общего плана создания системы глобального оповещения о пусках ракет на территории СССР. Поводом для принятия такого решения стал запуск
    Советским Союзом в конце 1957 г. первого искусственного спутника Земли. Факт запуска первого спутника был воспринят Пентагоном как демонстрация наличия в СССР средств доставки ядерного оружия в любую точку планеты. В качестве ответной меры было принято решение о развертывании на севере США и
    Канады системы раннего оповещения о приближении ракет, которая получила название NORAD (North American Aerospace Defense Command -
    Североамериканское командование по аэрокосмической обороне).
    С 1958 г. начались работы по созданию станций дальнего наблюдения и увязке их в единую компьютеризированную систему. В том же году для уп- равления научной частью работ в недрах Министерства обороны США было создано Управление по перспективным разработкам DARPA (Defense Advanced
    Research Project Agency). С 1961 г. начались работы по созданию подземного центра управления NORAD в окрестностях города Колорадо Спрингс.
    К 1964 г. этот центр был введен в действие, и к нему протянулись линии связи от станций раннего оповещения, правительственных служб и военных штабов.
    Так к 1964 г. была создана первая национальная компьютерная сеть военно- стратегического назначения. С 1965 г. по 1969 г. эта сеть развивалась за счет подключения к ней метеорологических, авиационных и других служб. К 1969 г. стало ясно, что созданная система не отличается надежностью. Достаточно вывести из строя ее центральный узел, и вся система выходит из строя. Так было принято решение о разработке новых принципов построения компьютерной сети. Работу по исследованию новых протоколов компьютерной связи поручили управлению DARРA.
    Этап 2. Разработка протоколов ТCP/IP
    В качестве полигона для испытаний компьютерных сетей нового поколения

    3
    Управление перспективных разработок Министерства обороны США избрало университеты и некоторыенаучные центры. Так началось создание сети ARPANET (по имени управления DARРA). Под управлением DARРA была создана компания BBN
    (Bolt Beranek & Newman), которая начала разработку протоколов пакетной передачи данных — тех самых, которые впоследствии привели к созданию протоколов TCP/IP.
    Разработки компании BBN испытывались на линиях связи между университетами
    США: университеты в Лос-Анджелесе и Санта-Барбаре связали по сети со
    Стэнфордским университетом и Университетом штата Юта в Солт-Лейк-Сити.
    Постепенно новые протоколы набирали силу. К январю 1983 г. все узлы ARPANET уже работали по протоколам TCP/IP, и управление DARРA прекратило свое участие в проекте, передав найденные технические решения Министерству Обороны.. Сеть
    ARPANET перепоручили Национальному научному фонду (NFS — National Science
    Foundation), который в США выполняет роль Академии наук. Так в 1983 г. сеть получила название NSFNET и стала академической.
    Этап З. Интернационализация Интернета
    К середине 80-х годов во многих странах мира уже действовали свои академические, управленческие и коммерческие компьютерные сети. Так, например, академическая сеть Великобритании называлась JANЕT (Joint Academic Network -
    Объединенная академическая сеть). С внедрением протоколов TCP/IP появилась возможность объединения многочисленных сетей, действовавших доселе порознь. В середине 80-х годов произошло создание системы имен доменов (DNS), после чего началось объединение компьютерных сетей разных стран - с этого периода заговорили об
    Интернете, как о международном сетевом образовании.
    В марте 1989 года Тим Бернс Ли выступил с проектом телекоммуникационной среды для проведения совместных исследований в области физики высоких энергий, а затем, в 1991 году, Европейская лаборатория практической физики (CERN) в
    Швейцарии объявила на весь мир о создании новой глобальной информационной среды World Wide Web. С помощью гипертекстового языка Hypertext Markup
    Language (HTML), представляющего собой набор инструкций для форматирования документов, WWW унифицировала и связала воедино весь колоссальный объем информации, который хранится в Internet в виде текстов, изображений и звукового сопровождения. Работать в Internet стало просто и доступно абсолютно каждому.
    Следующее важнейшее событие в истории Internet произошло в 1990 году, когда Федеральный совет по информационным сетям отменил правило, по которому для подключения к Internet была необходима рекомендация одного из государственных органов. С этой минуты доступ в Internet мог получить любой без каких-либо серьезных оговорок и обоснований. И Internet начал захватывать мир, вовлекая его в свое виртуальное пространство.
    Этап 4. Современный этап.
    Сегодня Internet - это начало эпохи электронного бизнеса. Если на первых порах Internet был лишь средством распространения информации, то сегодня он все больше становится инструментом в коммерческой деятельности предприятий. И если три года назад, в 1997-м, через Internet было проведено коммерческих операций на 8 млрд. долларов, то, по сдержанным прогнозам, в 2000 году эта сумма вырастет до 1,3 триллиона долларов.

    4
    Три составляющих современного Интернета
    Саморазвитие Интернета происходит путем его расширения за счет включения все новых и новых компонентов. В основе этого процесса лежат экономические процессы обмена ресурсами. Рост и развитие происходят одновременно и сбалансировано по трем направлениям, соответствующим трем основным компонентам Интернета: аппаратному, программному и информационному.
    Аппаратный компонент.
    Аппаратный компонент Интернета представлен компьютерами самых различных моделей и систем, линиями связи любой физической природы и устройствами, обеспечивающими механическую и электрическую стыковку между компьютерами и линиями связи.
    Программный компонент.
    Программное обеспечение
    Сети обеспечивает функциональную совместимость аппаратного компонента. Программы следят за соблюдением единых протоколов, обеспечивают целостность передаваемых данных, контролируют состояние Сети и в случае обнаружения пораженных или перегруженных участков оперативно перенаправляют потоки данных. Программное обеспечение выполняет следующие функции:
    • хранение, поиск, сбор и воспроизведение информации;
    • обеспечение безопасности Сети.
    Информационный компонент.
    Информационный компонент в Интернет представлен сетевыми документами, т.е. документами, хранящимися на компьютерах, подключенных к Сети. Эти документы могут быть любого типа: текстовые, графические, звуковые, видео.
    Характерная особенность информационного компонента состоит в том, что он может быть распределенным. Так, например, при просмотре на экране книги, хранящейся в Интернете, текст может поступать из одних источников, звук и музыка
    – из других, графика – из третьих, а примечания – из четвертых. Таким образом, первичные документы, хранящиеся в Сети, связаны между собой гибкой системой ссылок. В итоге образуется некое информационное пространство, состоящее из сотен миллионов взаимосвязанных между собой документов.
    Соотношение между аппаратным и информационным компонентами.
    Структура аппаратной части Интернета и структура информационного пространства очень похожи. И в том и в другом случае мы имеем дело с объектами, имеющими связи по принципу один – со многими. В аппаратном понимании каждый компьютер связан со многими компьютерами. Эта архитектура получила название
    Сеть (Net). В информационном понимании каждый документ тоже связан со многими документами, и эта архитектура называется Паутиной (Web).
    Функции Интернета
    1. Информационная – позволяет потребителям быстро получать затребованную информацию.
    2. Коммуникационная – осуществляет возможность общения между людьми на любые расстояния, в том числе и в режиме реального времени.

    3. Дистанционное управление – реализует возможность управления техническими системами.
    Подключение к Интернету
    Надежность функционирования глобальной сети обеспечивает большое количество линий связи между рабочими станциями, компьютерами и другими специальными устройствами. Основу, «каркас», Интернета составляют более ста миллионов серверов, постоянно подключенных к сети. К серверам могут подключаться с помощью локальных сетей или коммутируемых телефонных линий сотни миллионов пользователей Сети.
    Структура сети Интернет
    Организации, предоставляющие своим клиентам доступ к Сети на постоянной
    (24 часа в сутки) или временной (на сеанс работы) основе, называются
    поставщиками услуг Интернета (ISP – Internet Service Provider) или сервис-
    провайдерами Интернета.
    Каждый компьютер, подключенный к Сети на постоянной основе, имеет собственный зарегистрированный IP-адрес.
    Виды подключения к сервис-провайдеру:
    1. На постоянной основе:
    • высокоскоростной оптоволоконный канал;
    • выделенное соединение;
    • беспроводной способ передачи данных (лазер, инфракрасный или радиоканал).
    2. На временной основе:
    • коммутируемое соединение удаленного доступа.
    Адресация в Сети
    Для того, чтобы в процессе обмена информацией компьютеры могли найти друг друга, в Интернете существует единая система адресации, основанная на использовании IP-адреса.
    Виды адресации:
    5 1. IP-адрес – цифровой адрес, обеспечивающий уникальность компьютера. Это

    4-х байтное число, где каждый байт отделяется точкой. Например, IP-адрес нашего компьютера 213.183.100.79.
    IP-адрес состоит из двух частей, одна из которых является адресом сети (подсети) –
    213.183.100, а другая – адресом компьютера в данной сети – 79.
    2. Доменный адрес – это слова – сокращения, разделенные точками.
    Так как человеку запомнить числовой адрес нелегко, то для удобства запоминания была введена Доменная система имен (DNS – Domain Name System), которая ставит в соответствие числовому IP-адресу компьютера его доменное имя. Доменная система имен имеет иерархическую структуру: справа налево располагаются домены верхнего уровня – домены второго уровня – домены третьего уровня Домены верхнего уровня бывают двух типов: географические (каждой стране соответствует двухбуквенный код) и административные (трехбуквенные).
    Пакетная связь в Интернет
    Общая схема передачи информации включает в себя отправителя информации
    (передает информацию), канал передачи информации и получателя информации
    (принимает информацию). Если производится двусторонний обмен информацией, то отправитель и получатель информации могут меняться ролями.
    Канал передачи информации
    6
    Канал обмена информацией
    Отправитель информации
    Получатель информации
    Основной характеристикой каналов передачи информации является их пропускная способность или скорость передачи информации.
    Скорость передачи информации по каналу связи измеряется количеством битов информации, передаваемых за единицу времени – секунду.
    Часто используется единица измерения скорости – бод.
    Бод – число изменений состояния среды передачи в секунду. Так как каждое изменение состояния может соответствовать нескольким битам данных, то реальная скорость в битах в секунду может превышать скорость в бодах.
    Пропускная способность канала передачи информации оценивается количеством знаков, передаваемых по каналу за единицу времени – секунду, поэтому эта характеристика более удобна.
    Основной способ передачи информации в Сети – пакет.
    Пакет – группа байтов, передаваемых пользователями сети друг другу. Пакет имеет строго ограниченный размер – не более 1,5 Кбайт. В пакете есть основная
    часть, где содержится передаваемая информация, и дополнительная часть, содержащая адреса отправителя и получателя информации и контрольную сумму.
    Контрольная сумма (КС) – это сумма последних цифр IP-адреса. По КС отправитель и получатель проверяют, в правильном ли виде информация доходит до получателя.
    Пакеты автономно «путешествуют» по Сети. Если происходит задержка одного пакета, то другой может его обогнать.

    Пример передачи пакетов по линиям связи
    Пакетная связь в Интернет осуществляется по правилам единого протокола передачи данных TCP/IP. Термин TCP/IP включает названия двух протоколов:
    • Transmission Control Protocol (TCP) – транспортный протокол, который обеспечивает разбиение файлов на пакеты в процессе передачи и сборку файлов в процессе получения.
    • Internet Protocol (IP) – протокол маршрутизации, обеспечивающий доставку информации от отправителя к получателю.
    За выбор маршрута, по которому будут передаваться пакеты, отвечает специальная программа, работающая на компьютере – маршрутизатор.
    Службы Интернета
    Интернет используют для получения различных услуг, которые предоставляет множество служб Сети.
    Служба – это пара программ, взаимодействующих между собой строго определенным способом. Одна из программ этой пары называется сервером, другая
    клиентом. Способ взаимодействия между ними определяется протоколом
    службы.
    Основные службы.
    • Служба World Wide Web (WWW)
    На сегодняшний день эта служба составляет 90% современного Интернета. В основе
    WWW лежит пользовательский протокол HTTP (HyperText Protocol – протокол передачи гипертекста), по правилам которого взаимодействуют Web-сервер и Web-
    браузер (программа-клиент).
    Данная служба предоставляет доступ к огромным массивам информационных ресурсов.
    Каждый Web-документ имеет свой уникальный адрес URL.
    URL (Universal Resource Locator – универсальный указатель ресурса) включает в себя протокол доступа к документу, доменное имя компьютера, на котором он хранится, путь к файлу и собственно имя файла, представляющего ресурс: protocol://domain_name/catalog/file_name.
    Например, URL-адрес газеты «Первое сентября»: http://1september.ru/ru/first.htm, где
    7

    8 http:// - протокол доступа;
    1september.ru – доменное имя компьютера; first/htm – имя файла.
    • E-mail – электронная почта – одна из старейших служб Интернета.
    Сообщения электронной почты представляют собой обычный текст без каких- либо элементов оформления. При необходимости, к электронному письму
    «прикрепляют» вложенные файлы, которые могут содержать программы, графику, звук и т.д.
    Со стороны Сети работа службы электронной почты обеспечивается программами, которые называются почтовыми серверами. На стороне потребителя должна быть установлена программа-клиент электронной почты (почтовый клиент).
    Взаимодействие этих двух программ обеспечивают два протокола службы: SMTP
    (Simple Mail Transfer Protocol – простейший протокол передачи почты) и POP3
    (Post Office Protocol – протокол почтового отделения). Необходимость в наличии двух протоколов вызвана тем, что работа с отправляемой и поступающей корреспонденцией происходит по-разному.
    Для получения доступа к службе надо зарегистрироваться на одном из почтовых серверов и создать адрес электронной почты.
    Адрес электронной почты записывается по определенной форме и состоит из двух частей, разделенных символом @: user_name@server_name
    Первая часть почтового адреса (user_name – имя пользователя) имеет произвольный характер и задается самим пользователем при регистрации почтового ящика. Вторая часть (server_name – имя сервера) является доменным именем почтового сервера, на котором пользователь зарегистрировал свой почтовый ящик.
    Адрес электронной почты записывается только латинскими буквами и не должен содержать пробелов.
    Например, адрес электронной почты нашего лицея выглядит следующим образом:
    Licey7@mail.ru
    • Usenet – служба телеконференций.
    По своей сути эта служба очень похожа на систему электронной почты, но с той разницей, что электронная почта работает по принципу один к одному, а служба телеконференций – по принципу один ко многим.
    Со стороны Сети работу службы обеспечивают серверы новостей (они есть практически у каждого сервис-провайдера), а со стороны потребителя - специальные программы-клиенты новостей.
    • FTP – служба передачи файлов.
    Служба используется в тех случаях, когда нам необходимо принять, например, не документ, а программу.
    Со стороны Сети работу службы обеспечивают FTP-серверы, а со стороны пользователя – FTP-клиенты. Их взаимодействие обеспечивает протокол FTP (File
    Transfer Protocol – протокол передачи файлов). Это один из самых сложных протоколов Интернета, позволяющий не только направлять запросы и принимать файлы. С помощью этого протокола можно хозяйничать на жестком диске удаленного компьютера: файлы можно не только принимать, но и, наоборот, направлять на сервер, их можно перемещать из папки в папку, переименовывать, удалять и т.п.

    9
    • DNS – служба имен доменов.
    DNS (Domain Name Service) – это служба имен доменов, которой мы пользуемся постоянно, но практически никогда ее не замечаем. Эта служба состоит из баз данных, в которых доменным именам компьютеров приведены их соответствующие
    IP-адреса. Единственный случай, когда приходится обращать на нее внимание, - это когда на сервере DNS, который нас обслуживает, происходит какой-то сбой, и после подключения к Сети нам не удается подключиться вообще ни к какому серверу.
    • Telnet–системы.
    Telnet-системы являются средством для удаленного управления техническими системами и реализуют третью функцию Интернета – дистанционное управление.
    Telnet
    - это особый протокол взаимодействия двух компьютеров, позволяющий клиентской программе управлять сервером. Разумеется, речь идет о строго ограниченном управлении в пределах какой-то одной предоставляемой услуги.
    Telnet-системы незаменимы, когда надо управлять технической системой, распределенной по огромной территории или в случаях управления сложным техническим объектом в неудобных условиях. Telnet-системы активно проникают в быт и подсобное хозяйство. В образовании их используют для демонстрации сложных экспериментов и опытов путем моделирования. В развлекательной сфере telnet-системы лежат в основе многопользовательских игр и так называемых виртуальных миров.
    • Служба ICQ.
    Название службы образовано транслитерацией английских слов I Seek You (Я ищу
    тебя). Служба ICQ позволяет двум участникам Интернета напрямую общаться друг с другом в режиме реального времени.
    Для того, чтобы стать клиентом службы, надо зарегистрироваться па сервере
    www.mirabilis.com и получить себе индивидуальный регистрационный номер UIN
    (User Identification Number – идентификационный номер пользователя). Услуги службы бесплатны. Второе, что нужно сделать – установить на компьютере программу-клиент ICQ. С этого момента, где бы в Сети вы ни находились, те, кто знают ваш UIN, смогут выйти на прямой контакт и начать общение.
    • Форумы прямого общения (chat-конференции).
    Служба ICQ обеспечивает прямое двустороннее общение. Аналогичные службы, обеспечивающие многостороннее общение, называются форумами прямого общения, или chat-конференциями или просто чатами (IRC – Internet Relay Chat).
    Эти службы особенно популярны у молодежи.
    Для доступа к чат-конференциям, надо установить на своем компьютере один из чат-клиентов, зарегистрироваться на одном из серверов, обеспечивающих работу этой службы. Общение в чат-конференциях происходит по тематическим группам.
    Несколько участников беседы могут организовать собственную группу (их еще называют комнатами или каналами).
    • Поисковые службы.
    Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди сотен миллионов Web-страниц и файлов становится все сложнее. Для поиска информации используются специальные поисковые службы.
    По принципу действия различают несколько видов поисковых служб. О наиболее распространенных вы узнаете в следующей главе.

    10
    Поиск информации в Интернете
    Поиск информации – одна из основных задач пользователя при работе в Сети.
    Чтобы найти нужную информацию, недостаточно иметь только программу просмотра. Если хотите что-нибудь найти, то надо не просматривать, а искать. Для этого сейчас разработано большое количество поисковых систем.
    Виды поисковых служб.
    Наиболее распространены три основных типа поисковых служб:
    - поисковые каталоги;
    - рейтинговые системы;
    - поисковые указатели.
    • Поисковые каталоги.
    Устроены по тому же принципу, что и тематические каталоги крупных библиотек.
    На основной странице каталога расположен список крупных тематических категорий. Каждая запись в списке категорий – это гиперссылка на следующие страницы, где данная тема представлена подробнее. Продолжая погружение в тему, можно дойти до списка конкретных Web-страниц и выбрать себе тот ресурс, который лучше подходит для решения задачи.
    Поисковые каталоги создаются вручную, поэтому общий объем каталогизированного пространства невелик. Но так как включенные в каталог данные прошли ручной отбор, высока вероятность, что лучшие Web-ресурсы мира в каталогах отражены хорошо. Таким образом, поиск информации практически всегда заканчивается плодотворно.
    Крупнейшими российскими поисковыми каталогами являются www.atrus.ru и weblist.ru.
    • Рейтинговые системы.
    Суть идеи рейтинговой системы основана на том, что на основной странице сервера выкладывается список наиболее важных тем, внутри каждой из которых организуется список тематических разделов. Выбрав интересующую тему, клиент получает ограниченный список Web-узлов, посвященный данной теме. Против каждого Web-узла приводится его оценка популярности (количество посещений за последние сутки).
    Поиск источников информации с помощью рейтинговой системы можно рассматривать как поиск по рекомендации.
    В России основным средством рейтингового поиска является служба Рэмблер www.rambler.ru.
    • Поисковые указатели.
    Большинство поисковых служб мира – поисковые указатели. Они ставят перед собой задачу как можно лучше охватить информационное пространство WWW и представить его пользователям в удобном виде.
    Принцип работы поисковых указателей основан на ключевых словах, задающих поисковому серверу тему поиска. Поисковая система находит по своим базам данных адреса Web-ресурсов, в которых присутствуют ключевые слова, и выдает клиенту Web-страницу со ссылками на эти ресурсы. Такая Web-страница является результирующей.

    11
    В России поисковые указатели развиты очень хорошо. Три крупнейшие системы: www.aport.ru, www.yandex.ru и www.rambler.ru.
    Оценка качества поиска информации.
    Для оценки качества поиска информации используют два параметра:
    1. коэффициент охвата – показывает, какую часть общемировых ресурсов
    WWW отражает поисковая система в своих базах данных;
    2. коэффициент попадания – показывает, какая часть ссылок, возвращаемых поисковой системой действительно соответствует ожиданиям клиента.
    Для поисковых каталогов коэффициент охвата чрезвычайно низок (доли процента), а коэффициент попадания приблизительно 100%. Для поисковых указателей картина противоположная – коэффициент охвата сравнительно высок (десятки процентов), а коэффициент попадания очень низок (не более 10%).
    Основы работы поисковых указателей.
    Поисковые указатели – наиболее сложные поисковые системы современного
    Интернета. Их работа проходит в три этапа:
    1. Сканирование World Wide Web
    Для сбора сведений о ресурсах WWW поисковый указатель использует специальные программы – поисковые роботы. Днем и ночью они сканируют информационное пространство и собирают сведения о Web-ресурсах.
    2. Индексация World Wide Web
    Собранные копии Web-ресурсов – это лишь исходный материал. Проводить по ним поиск информации, запрошенной клиентом, очень неудобно, поскольку просмотр сотен миллионов Web-документов занял бы столько времени, сколько ни один клиент ждать не будет. Поэтому собранные данные проходят предварительную обработку – индексацию. Цель индексации – получить ресурс другого типа – индексный файл, с помощью которого запрос клиента можно обработать практически мгновенно.
    3. Ранжирование результатов поиска
    На этом этапе поисковая система пытается по своим алгоритмам определить ценность каждого из найденных ресурсов и отсортировать их так, чтобы наиболее ценные (с точки зрения системы) располагались в начале списка.
    Приемы эффективного поиска информации.
    Обычно поиск по одному ключевому слову приводит к формированию огромных списков Web-страниц, на которых оно встречается. Найти в этом списке полезные ресурсы не просто, и потому поиск по одному слову малоэффективен.
    Для эффективного поиска по нескольким ключевым словам нужны специальные команды, которые позволяют связать отдельные слова между собой.
    Эти команды в поисковых системах образуют несложный язык запросов. Все команды делятся на три группы: команды простого поиска, команды расширенного поиска и команды специального поиска.
    Средства простого поиска информации.
    • Поиск группы слов
    Российские поисковые системы воспринимают поиск группы слов так, как будто между ними стоит союз ИЛИ, то есть предоставляют ссылки на Web-документы, которые содержат либо только какое-то одно из указанных слов, либо все слова вместе. Количество слов в группе не ограничивается.
    • Поиск словоформ

    12
    В связи с тем, что в русском языке слова кроме корня могут иметь приставки, суффиксы и окончания, очень важным свойством поисковой системы является поиск словоформ.
    • Поиск нормальных форм
    Поиск словоформ очень удобен, когда речь идет о таком трудном языке, как русский, но бывают случаи, когда словоформы нам совершенно не нужны, и от них лучше отказаться. В этом случае перед ключевым словом ставится восклицательный знак «!».
    • Роль прописных букв
    Если поисковая система прописные буквы воспринимает буквально, т.е. так, как они написаны в запросе. Так, например, поиск по словам Красная Шапочка вернет только те документы, в которых имеются ключевые слова Красная Шапочка. В то же время, поиск по ключевым словам красная шапочка вернет документы, в которых есть и Красная Шапочка, и Красная шапочка, и красная Шапочка, и красная шапочка.
    • Значение подстановочных символов
    При записи ключевых слов вместо любого количества любых символов до конца слова можно использовать символ «*». Так, при поиске информации о музыке можно организовать запрос, применив подстановочный символ, например так: музык*. В результате будут найдены документы, в которых встречаются слова музыка, музыкант, музыкальный и т.п.
    • Учет зарезервированных слов
    Зарезервированными считаются те слова, которые не учитываются при поиске.
    Обычно к зарезервированным относят все короткие слова, в которых менее четырех букв (предлоги, союзы, местоимения, междометия, артикли и т.п.).
    • Средства контекстного поиска
    Если ключевые слова взять в кавычки, то поисковая система найдет документы, в которых данная фраза присутствует буквально, т.е. именно так, как она записана.
    Средства расширенного поиска.
    • Оператор И
    С помощью этого оператора объединяют два или более слов таким образом, чтобы все они присутствовали в документе. Вместо оператора И можно также использовать оператор «&».
    • Оператор ИЛИ
    Он обеспечивает поиск по любому из слов группы. Вместо этого оператора в некоторых поисковых системах используется оператор OR.
    • Оператор НЕ
    Этот оператор используется, когда из результатов поиска надо исключить какое- либо ключевое слово.
    • Логические скобки
    Применяются, когда надо управлять порядком действия логических операторов.
    • Поиск с указанием расстояния
    Этот вид поиска позволяет указать, на каком расстоянии друг от друга могут располагаться слова в документе. Обычно в мировой практике для этого используется оператор NEAR.
    • Маркировка слов

    13
    Знак «+» маркирует слова, которые должны быть на каждой найденной странице.
    Слова без этого знака рассматриваются как пожелание, а не как требование.
    Знак «-» маркирует слова, которых не должно быть на найденных страницах.
    Используется, чтобы отсеять страницы с определенным словом.
    Средства специального поиска.
    Эти средства позволяют выполнять поиск документов по датам, например всех документов, выпущенных в определенный день или всех документов, выпущенных до (после) какого-то дня и т.п. Такой поиск полезен тем, кто регулярно контролируют публикации по какой-то теме и хотели бы знать, что нового появилось со времени последнего просмотра Web-ресурсов.
    Среди команд специального поиска есть команды, позволяющие находить
    Web-страницы по их заголовкам или фрагментам заголовков, а также по доменному имени сервера. Но поскольку средства специального поиска применяются, как правило, профессионалами для решения задач практической работы в Сети, мы не будем рассматривать описание этих команд.
    Литература
    1. С.В. Симонович «Интернет для школьников», М., «Десс Ком», 2000.
    2. Е. В. Якушина «INTERNET для школьников и начинающих», М.,
    «Аквариум», 1999.
    3. Н.В. Макарова «Информатика: учебник», М., «Финансы и статистика», 2000.
    4. Н. Угринович «Информатика и информационные технологии: учебное пособие для 10-11 классов», М., Лаборатория Базовых Знаний АО
    «Московские учебники», 2001.
    5. Интернет – ресурсы:
    1) http://ec.asu.ru/lib/ibusiness/products/pageI2.htm
    2) http://www.sbnet.ru/navigation/search.ru.html
    3) http://antonio.mccinet.ru/composed/adress_ip.html
    4) http://jim.pp.ru/helps/internet/tcp-ip.htm#1


    написать администратору сайта