Главная страница
Навигация по странице:

  • Поиск информации в Интернет.

  • РУ. Информационные процессы и технологии


    Скачать 3.52 Mb.
    НазваниеИнформационные процессы и технологии
    Дата07.01.2023
    Размер3.52 Mb.
    Формат файлаpdf
    Имя файлаРУ.pdf
    ТипДокументы
    #875521
    страница12 из 17
    1   ...   9   10   11   12   13   14   15   16   17
    URL (Universal, или Uniform Resource Locator, универсальный
    адрес ресурса) – предоставляет стандартный способ задания местоположения данных, доступных в глобальной компьютерной сети Интернет.
    Второй – протокол HTTP (Hyper Text Transfer Protocol, протокол передачи
    гипертекста) – предоставляет доступ к информации и позволяет передавать гипертекстовые документы по сети.
    Наконец, HTML (Hyper-Text Markup Language, язык разметки
    гипертекста) позволяет создавать текстовые документы, включающие ссылки на URL других данных. Зачастую эти ссылки указывают на другие документы
    HTML, которые, в свою очередь, доступны с помощью HTTP. В результате перед пользователем расстилается огромная паутина взаимосвязанной информации.
    Следует отметить, что HTML не позволяет точно задавать внешний вид документа. Можно лишь предлагать свой вариант оформления. Различные программы просмотра могут интерпретировать ваши предложения по-своему.
    Авторы, ориентирующиеся на возможности только одной из программ просмотра, ограничивают круг возможной аудитории.
    URL – специальная форма адреса информации в сети Интернет, содержащая данные об имени сервера, на котором хранится документ, путь к каталогу файла и собственно имя файла. URL-адрес состоит из двух частей.
    Сначала указывается способ связи, при помощи которого будет осуществляться доступ к данным. От этого зависит, какая дополнительная информация потребуется. Затем помещается информация о том, где эти данные
    расположены. Разделяются эти части двоеточием, например: http://имя_сервера/путь/файл
    Рассмотрим наиболее распространенные способы доступа к данным в сети
    Интернет.
    HTTP (протокол передачи гипертекста) был разработан специально для
    World Wide Web. При использовании этого протокола необходимо указать имя машины, а также сообщить дополнительную информацию, которую компьютер сможет использовать для поиска и создания необходимых данных. Эти дополнительные данные обычно представляют собой имя файла и информацию о каталоге. Отчасти из-за того, что первые разработки были созданы на системах Unix, для разделения имен каталогов и файла в URL используется прямая наклонная черта "/". Например, "http://www.ctc.msiu.ru".
    FTP (File Transfer Protocol, протокол передачи файлов) – давно используемый метод доступа, разработанный для передачи больших объемов информации по Интернет. Этот метод получил широкое распространение уже достаточно давно. Чтобы получить доступ к файлу или каталогу FTP,

    166 необходимо указать имя машины и имя файла или каталога этой машины.
    Например, "ftp://prep.ai.mit.edu".
    Появление в ноябре 1996 года сервиса ICQ (можно прочесть как I Seek You, то есть "Я ищу тебя", а русскоязычные пользователи ласково окрестили эту программу "аськой"), предоставило еще одну, поистине революционную, возможность общения пользователям Интернет. Название отражает самое важное отличие этой программы от большинства других программ общения в
    Интернете. ICQ на самом деле позволяет "видеть" всех ваших друзей и знакомых, как только они появляются в сети Интернет в режиме онлайн. ICQ предоставляет возможность, забыв о расстояниях, мгновенно связаться со своими знакомыми или деловыми партнерами в любое время. ICQ позволяет обмениваться сообщениями, посылать файлы и URL. С помощью удобной системы настроек можно установить требуемый уровень конфиденциальности – от простейшего до самого "засекреченного", когда вы видите всех, а вас не видит никто.
    1. Электронная почта, или e-mail, является аналогом обычной бумажной почты.
    Электронный адрес позволяет совершенно однозначно идентифицировать пользователя этой услуги среди миллионов других пользователей сети. С помощью специальных программ для пересылки электронной почты, зная адрес другого человека, можно отправить ему текстовое сообщение, программы, изображения, словом, любую информацию, способную храниться в электронном виде на компьютере, и она будет доставлена через несколько минут даже на другой конец Земли. Точно так же любой другой человек, зная ваш электронный адрес, сможет отправить электронное послание вам.
    2. Электронная почта
    (E-mail) представляет собой сервис, предназначенный для пересылки сообщений между пользователями Интернета и локальных сетей. Основная идея состоит в следующем: каждый пользователь имеет уникальный почтовый адрес, как правило образуемый из его регистрационного (входного) имени и имени сервера, где он зарегистрирован.
    Таким образом, сохраняется некоторая аналогия с бумажной почтой, где адрес состоит из двух частей: "Куда" и "Кому". "Куда" – на сервер, "Кому" – пользователю. Имя пользователя и имя сервера разделяются символом "@"
    (называемым "коммерческое ат", а русскоязычные пользователи часто используют термин "собачка"). Никакие пробелы в адресе не допускаются.
    Адрес зарегистрированного в компьютерной сети МГИУ пользователя имеет вид: logname@mail.msiu.ru, где logname заменяется на входное имя пользователя.
    3. Для работы с электронной почтой существует много различных программ.
    4. Outlook Express – это входящая в состав Windows почтовая программа, которая очень проста в использовании.
    5. С помощью Outlook Express можно:
    6. обмениваться сообщениями электронной почты;
    7. создавать и вести адресную книгу для хранения адресов электронной почты;
    8. читать и отправлять сообщения в группы новостей.

    167 9. После запуска программы Outlook Express (Пуск / Программы / Outlook
    Express) на экране появится окно приложения, которое разделено на три фрейма (три области). В левой области отображается структура системных папок, в правой верхней области – список писем, содержащихся в выделенной системной папке, в правой нижней области – содержимое той папки, на которой расположен курсор.
    Рис. 3.2. Окно содержимого папки «Входящие сообщения»
    Назначение системных папок:
    1. Входящие – хранятся сообщения, полученные по почте.
    2. Исходящие – хранятся сообщения, предназначенные для отправки, но не отправленные.
    3. Отправленные – хранятся копии отправленных сообщений.
    4. Удаленные – содержит удаленные из всех папок сообщения.
    5. Черновики – содержит сообщения, находящиеся на стадии подготовки.
    Подготовка сообщений:
    1. Откройте окно для создания нового сообщения, выполнив команду: Файл /
    Создать, Почтовое сообщение или нажмите кнопку Создать сообщение на панели инструментов.

    168
    Рис. 3.3. Окно создания сообщения в Outlook Express
    2. В полеКому введите адрес получателя сообщения. Допускается вводить несколько адресов в поле Кому, отделив, их друг от друга точкой с запятой.
    3. В полеКопия введите адреса получателей копии сообщения.
    4. В полеТема и введите тему сообщения.
    5. Введите требуемый текст в поле, предназначенное для ввода текста сообщения.
    6. При необходимости вложите файл в сообщение, щелкнув на кнопке Вложить на панели инструментов, и в открывшемся окне диалога Вставка выберите требуемый файл.
    7. Вы можете сохранить подготовленное сообщение в папке Черновики, чтобы позднее его скорректировать. Для этого в меню Файл выберите команду
    Сохранить. Если сообщение не требует доработки, вы можете поместить его в папку Исходящие, чтобы при установлении связи отправить. Для этого выполните Файл / Отправить или нажмите кнопку Отправить на панели инструментов окна сообщения.
    Отправка сообщения. Для отправки и получения сообщений из окна программы Outlook Express выполните команду Сервис / Доставить почту,
    Доставить почту. Программа Outlook Express подключится к почтовому серверу
    Internet, отправит подготовленное сообщение и получит входящую почту. Для прочтения, поступившего в ваш адрес сообщения, перейдите в папку
    Входящие.
    Ответ на сообщение. При подготовке ответа, посылаемого по электронной почте, вы можете использовать полученное сообщение. Для этого установите

    169 курсор на сообщении, адресату которого хотите подготовить ответ, и нажмите кнопку Ответить или Ответить всем на панели инструментов.
    В обоих случаях открывается окно сообщения, в котором уже указан адрес получателя, в поле Тема введена фраза Re и тема входящего сообщения.
    Содержание исходного сообщения скопировано в новое. Введите свой ответ и отправьте сообщение.
    Пересылка сообщения. Программа Microsoft Outlook Express позволяет переслать полученное сообщение кому-нибудь другому. Для этого установите курсор на сообщении и нажмите кнопку Переслать на панели инструментов.
    Откроется окно, содержащее текст исходного сообщения. Укажите адрес получателя, добавьте к исходному тексту ваши комментарии и отправьте сообщение.
    Телеконференции, или как их еще называют, группы новостей, похожи на электронную почту. Различие состоит в том, что телеконференции – это как бы огромный, непрерывно обновляющийся электронный журнал, разбитый на множество разделов по интересам, на которые можно подписаться и получать сообщения только из интересующих вас разделов, а неинтересные попросту игнорировать. Вы можете не только читать сообщения, поступающие в телеконференции, но и посылать туда свои вопросы, предложения и высказывать мнения, которые прочтут все люди, подписанные на эти разделы.
    Электронная почта и доски объявлений – самый дешевый вид межрегиональной связи – это система межкомпьютерной связи, при которой один ПК, используя специальный протокол, оставляет сообщение на специальном компьютере (сервере), физическое местонахождение которого не имеет значения, – если данное сообщение ориентировано на использование одним пользователем – это электронная почта; если же сообщение предназначено широкому кругу пользователей – это доска объявлений.
    Система телеконференций и чат-серверов – это система межкомпьютерной связи в реальном времени.
    Поиск информации в Интернет. Современная Сеть действительно в состоянии предложить своему пользователю массу информации самого разного профиля. Здесь можно познакомиться с новостями, интересно провести время, получить доступ к разнообразной справочной, энциклопедической и учебной информации. Интернет можно эффективно использовать для решения самых разных задач на работе и дома.
    Самая главная проблема, возникающая при работе с Сетью, – быстро найти нужную информацию и разобраться в ней, оценить информационную ценность того или иного ресурса для своих целей.
    Путь к огромному информационному багажу человечества, хранящемуся в библиотеках, фонотеках, фильмотеках, лежит через карточки каталогов. В
    Интернете существуют аналогичные механизмы для нахождения требуемой информации. Речь идет о поисковых серверах, служащих отправной точкой для пользователей Сети. С содержательной точки зрения о них можно говорить как

    170 о специальной службе Интернета, хотя они используют механизмы Всемирной
    Паутины и с технической точки зрения не выходят за ее рамки.
    Поисковые сервера достаточно многочисленны и разнообразны. Принято различать поисковые индексы и каталоги. Сервера-индексы работают следующим образом: регулярно прочитывают содержание большинства веб- страниц Сети ("индексируют" их), и помещают их полностью или частично в общую базу данных. Пользователи поискового сервера имеют возможность осуществлять полнотекстовый поиск по этой базе данных, используя ключевые слова, относящиеся к интересующей их теме. Выдача результатов поиска обычно состоит из выдержек рекомендуемых вниманию пользователя страниц и их адресов (URL), оформленных в виде гиперссылок. Работать с поисковыми серверами этого типа удобно, когда хорошо представляешь себе, что именно хочешь найти.
    Каталоги выросли из списков интересных ссылок, закладок (bookmarks).
    По сути дела они представляют собой многоуровневую смысловую классификацию ссылок, построенную по принципу "от общего к частному".
    Иногда ссылки сопровождаются кратким описанием ресурса. Как правило, возможен поиск в названиях рубрик (категориях) и описаниях ресурсов по ключевым словам. Каталогами пользуются тогда, когда не вполне четко знают, что именно ищут. Переходя от самых общих категорий к более частным, можно определить, с каким именно ресурсом Сети следует ознакомиться. Поисковые каталоги уместно сравнивать с тематическими библиотечными каталогами, словарями-тезаурусами или биологическими классификациями животных и растений. Ведение поисковых каталогов частично автоматизировано, но до сих пор классификация ресурсов осуществляется главным образом вручную.
    Поисковые каталоги бывают общего назначения и специализированные.
    Поисковые каталоги общего назначения включают в себя ресурсы самого разного профиля. Специализированные каталоги объединяют только ресурсы, посвященные определенной тематике. Им часто удается достичь лучшего охвата ресурсов из своей области и построить более адекватную рубрикацию.
    История поисковых служб начинается в середине 90-х годов. В 1994 году два аспиранта Стэндфордского Университета, Дэвид Фило и Джерри Янг, начали работу над созданием каталога Yahoo (http://www.yahoo.com/; англ.
    "yahoo" – "йеху" из "Путешествий Гулливера" Джонатана Свифта). Они преследовали простую цель: организовать собственные ссылки. Чтобы сделать это эффективным образом, им пришлось построить специальную систему с использованием базы данных. Она могла одновременно выдерживать обращения тысяч пользователей. И эти обращения не замедлили последовать. В начале 1995 года Марк Андрессен, один из сооснователей корпорации Netscape
    Communications, предложил создателям уже завоевавшего огромную популярность Yahoo перенести систему с кампуса Стэндфордского
    Университета на сервера Netscape. Огромная нагрузка с университетской сети была снята, а Yahoo стал коммерческим проектом. Сегодня его создатели –

    171 мультимиллионеры; над ведением каталога трудятся тысячи специалистов в самых разных областях знания.
    Один из первых индексирующих поисковых серверов, AltaVista ("вид с высоты") корпорации Digital (теперь Compaq), появился в 1995 году.
    Нескольким служащим корпорации-производителя суперкомпьютеров пришла в голову мысль использовать новейшие сервера для считывания содержимого
    Всемирной Паутины в базу данных и осуществления поиска по ней. Сервер
    AltaVista, расположенный по адресу http://altavista.digital.com/, – один из крупнейших поисковых серверов сегодняшней Сети.
    В последнее время поисковые каталоги общего назначения и индексирующие поисковые сервера интенсивно интегрируются. Yahoo уже не только каталог, но и поисковый сервер. AltaVista, как и многие другие поисковые сервера, исходно предлагавшие исключительно поиск по базе данных, сегодня включает в выдачу результатов поискового запроса еще и список рубрик, соответствующих теме запроса. Поисковые технологии не стоят на месте. Традиционные индексирующие сервера искали в базе данных документы, содержащие ключевые слова из поискового запроса. При таком подходе очень сложно оценить значение и качество ресурса, выдаваемого пользователю. Альтернативный подход – искать такие веб-страницы, на которые ссылаются другие ресурсы по данной тематике. Чем больше ссылок на страницу существует в Сети – тем больше шансов, что вы ее найдете. Такой своеобразный мета-поиск осуществляет поисковый сервер
    Google
    (http://www.google.com/), появившийся совсем недавно, но уже отлично себя зарекомендовавший.
    Кроме поисковых серверов, заносящих в свои базы веб-страницы по всей
    Сети, есть поисковые сервера, ориентированные более узко в географическом и языковом отношении. Так, существует много русских поисковых серверов. Их краткий список вы найдете в следующем разделе.
    В мире существует огромное количество WWW серверов самого разного назначения. Без специальных средств ориентировка в этом гигантском объеме информации просто невозможна. Решают эту проблему поисковые серверы, которые хранят миллионы ссылок на разные темы и производят поиск нужных документов по запросу пользователя.
    Для того чтобы облегчить поиск документов были созданы каталоги WEB- серверов и поисковые машины. В большинстве случаев каталог представляет собой тематические подборки ссылок на Web-ресурсы (медицина, политика, программирование и т.д.). Поисковые же машины позволяют попасть на страничку, текст которой содержит заданный набор слов. Каждая поисковая машина обладает своими специфическими возможностями, достоинствами и недостатками. Следует отметить, что наполнение сети Интернет русскоязычной информацией, хотя и происходит быстрыми темпами, все еще значительно отстает от уровня англоязычной информацией. Английский язык продолжает оставаться основным языком общения пользователей Интернет.

    172
    Некоторые поисковые серверы:

    Yahoo! – http://www.yahoo.com.Это не только поисковая машина, но и крупнейший классификатор ресурсов сети. Здесь выделено несколько разделов верхнего уровня: исскуство, бизнес, компьютеры, образование, развлечения, правительство и другие. Каждый из разделов помимо ссылок содержит подразделы, которые в свою очередь тоже содержат подразделы и т.д.
    Искать интересующую информацию можно как с помощью строки запроса аналогично AltaVista, так и перемещаясь по разделам, но в последнем случае необходимо точно знать, к какой именно категории относится предмет поиска.

    Rambler – http://www.rambler.ru. Помимо известной поисковой системы, сервер "Rambler" включает классификационный каталог "Rambler Top 1000", состоящий из категорий, которые охватывают все основные тематические направления российских Web-серверов.
    В разделах списки серверов оформлены в виде таблицы. На одном экране выводится 20 ссылок. По умолчанию сортировка идет по текущей посещаемости серверов в каждой категории. Для каждого ресурса приводится дополнительная информация о числе посещений и динамике популярности сервера.
    Таким образом, сервер помогает получить верное представление о популярности отечественных Web-серверов. Российская часть Интернет представлена здесь достаточно полно.

    Яndex – http://www.yandex.ru. Занимает одно из ведущих мест среди русскоязычных поисковых серверов. Активно и динамично развивается.
    Стратегии, применяемые для поиска информации в Интернет, постоянно совершенствуются. Так Google (www.google.com), некоторое время назад считавшийся экспериментальной поисковой системой, сейчас пользуются пятнадцать миллионов человек ежемесячно. Секрет Google в удачном алгоритме отбора документов, отвечающих поисковому запросу.
    Предшественники Google пытались определить "ценность" документа только на основании анализа его текста: как часто и как близко к началу документа встречаются там слова из запроса, есть ли они в заголовке и т.д.
    Создатели Google решили оценивать соответствие документа запросу с помощью специального числа, похожего по смыслу на индекс цитирования: чем больше ссылок на данный документ, тем это число, называемое PageRank, больше. Если же сервер не находит запрашиваемой комбинации в своем каталоге, то пользуется тематическим каталогом Yahoo. Результаты оказались столь хороши, что Google стал "народной" поисковой системой. Google постоянно совершенствует свой сервис: проиндексированы все документы в формате pdf, организован поиск картинок в Интернет (images.google.com).
    Одним из недостатков Google можно считать отсутствие диалога с пользователем во время подбора документов. Этот недостаток стараются исправить конкуренты Google, классифицируя найденные документы. Так поисковая система Teoma (www.teoma.com) автоматически классифицирует

    173 найденные ссылки на документы. Результаты при выводе делятся на три части: собственно классификация, занимающая верхнюю часть окна, документы, лучше всего соответствующие запросу, размещаются слева, а справа выводятся документы, в которых много ссылок на страницы, стоящие слева.
    Еще одним претендентом на роль заменителя Google является метапоисковая система Vivisimo (www.vivisimo.com), разработанная в университете Карнеги. Как и Google в прошлом, Vivisimo – экспериментальный некоммерческий проект. Основной особенностью этой системы является представление в виде дерева (иерархическая кластеризация) документов, найденных другими поисковыми системами, такими как Altavista и Fast
    (www.allthemes.com). В сущности Vivisimo даже не метапоисковая система, а приставка, способная кластеризовать любые данные. Алгоритм кластеризации
    Vivisimo присоединяется к любой поисковой системе. В окошке правее окна запросов можно вместо "Search the Web" выбрать например "Альтависту".
    Vivisimo перехватит ссылки, выданные "Альтавистой", отсортирует их и разместит их на ветках дерева в левой части своего окна.
    1   ...   9   10   11   12   13   14   15   16   17


    написать администратору сайта