Аннотированный список должен содержать не менее 10 интернетресурсов. Теоретическая часть Браузеры
Скачать 395.42 Kb.
|
Лабораторная работа № 1. Информационные ресурсы и эффективный поиск информации в Интернет Цель работы: Создать аннотированный список интернет-ресурсов (библиотек, виртуальных музеев) по информационным технологиям и вычислительной технике. Аннотированный список должен содержать не менее 10 интернет-ресурсов. Теоретическая часть Браузеры Браузер (или броузер) (от англ. слова browse - просматривать) представляет собой специальную программу для просмотра информации в Internet. Существует большое число разных браузеров, среди которых наибольшей популярностью пользуются Netscape Navigator (NN) фирмы Netscape Communications (он входит в состав пакета Netscape Communicator) и Internet Explorer (IE) фирмы Microsoft. Браузер предоставляет возможность параллельной работы с несколькими Web- страницами (см. меню File (Файл)). Переключение между окнами можно осуществлять с помощью панели задач Windows. Указав разные адреса в разных окнах, мы можем начать работать с одной Web-страницей, а в это время в другом окне будет загружаться следующая. При необходимости можно прервать процесс загрузки Web-страницы нажатием кнопки Stop (Стоп). При чтении Web-страниц, написанных на русском языке, нередко возникают проблемы связанные с различием кодировок русских букв (кириллицы) на Web-сервере, откуда читается страница, и той кодировки, которая установлена на нашем браузере. В качестве стандартной кодировки русских букв в Internet принята кодировка KOI8-R, которую поддерживают компьютеры под управлением операционной системы Unix. Однако повсеместное внедрение операционной системы Windows привело к тому, что все чаще используется ее кодировка кириллицы - Windows1251. Браузеры хранят историю (History) блуждания по сети Internet на протяжении определенного времени. Есть система электронных закладок - Bookmarks (Закладки) для NN браузера и Favorites (Избранные страницы) для IE браузера. Наиболее удобно добавлять новые адреса в папку с закладками с помощью контекстных всплывающих меню, которые появляются при нажатии правой кнопки мыши. Если при этом курсор мыши находился на гиперслове, то с помощью команды Add Bookmark в случае NN браузера, или Добавить в папку в случае IE браузера, мы можем добавить определяемый этой гиперссылкой URL-адрес в папку Bookmarks (Избранное). С помощью команды Copy Link Location этот адрес можно скопировать в буфер обмена Windows с тем, чтобы затем поместить его в какой-либо документ, например, в создаваемую нами свою собственную Web-страницу. Классификация поисковых систем Выделяют так называемые тематические каталоги (например, Yahoo!) и автоматические индексы (например, AltaVista), хотя необходимо иметь в виду, что целый ряд поисковых систем занимает некоторое промежуточное положение между этими двумя «полюсами», то есть они содержат в себе элементы обоих этих классов. Каждая из поисковых систем имеет свою обширную базу данных об адресах (местоположении) Особенности группировки слов в поисковых системах 1. Поисковые системы по-разному трактуют группы слов, введенные через пробел, как И или как ИЛИ. В большинстве систем в качестве оператора И используется «+» перед словом без пробела. Большинство российских поисковых систем по умолчанию считают, что два слова должны присутствовать в документе. На Яндексе - в одном предложении. ИЛИ в системах задается так: Рамблер – OR, Яндекс - |. 2. Прописные буквы. «хлеб» = «ХЛЕБ», но «ХЛЕБ» ≠ «хлеб». Если введены строчные символы, то разыскиваются как строчные, так и прописные символы, но если использованы прописные, то ищется точное совпадение с прописными. В системе Рамблер при индексации все прописные буквы принудительно «понижаются до строчных». 3. Зарезервированные слова – это слова, которые не учитываются при обработке запроса. К ним относятся неинформативные слова: предлоги, союзы, местоимения, артикли и др. слова малого размера. В некоторых системах зарезервированными могут быть слова, которые часто встречаются, поэтому информативными не являются. Например, в системе, ориентированной на поиск книг слово «книга» будет не информативным. При контекстном поиске необходимо точное (!) соответствие между заказом и результатом поиска. Если поисковая система «зачистила» Web-документы от зарезервированных слов, то с контекстным поиском она справиться не может. 4. Формы поиска. С 1997 г. Поисковые системы предоставляют услуги по розыску данных, записанных в разных форматах: рисунки, видеофайлов, звуковые клипы и т.д. Для этого следует включить переключатель, соответствующий типу разыскиваемых данных. Из зарубежных служб подходит для домашнего пользования Fast Search, для делового потребления – Northern Light. 5. Действия после поиска. Если представлен объемный документ, то можно воспользоваться кнопкой Правка – Найти на этой странице. 6. Приемы поиска в системе «Яндекс». Поиск по одному слову ведется на основе корня этого слова. Например, если введено слово «снег», то система выдаст документы, в состав которых входят однокоренные слова. Если поиск словоформ не требуется, то его отменить с помощью «!», например, !снегом. Поиск по группе слов · Знак «+» пишется слитно со словом без пробела. · Можно ввести оператор И (&), справа и слева от & должны быть пробелы. · Если требуется присутствие слов не только в предложении, но и во всем документе, применяется оператор &&. · «» - строгое исключение из предложения · «» - исключение из всего документа · Пример: «Москва |Петербург&&+столица» Поиск с указанием расстояния · «/±n», «/(-n+n)» Оператор NEAR позволяет находить документы, в которых искомые слова находятся близко друг от друга. Например, «Город/+1Москва» = «Город Москва». · «/±n &&» или «/±n », например, «Город/+1&&Москва» - словосочетание будет ли в одном предложении или в соседних. Использование скобок. Служат для управления порядком действий. «Москва |Петербург& (столица |город-герой)». Управление ранжированием производится с использованием весовых коэффициентов. Его можно присваивать любому ключевому слову или выражению, если оно заключено в скобки. «Москва:5 Петербург столица». Ввод уточняющего слова осуществляется после знаков <-, например «Николай +Еременко<-младший артист+театра». Выполнение работы I. Ознакомиться с теоретической частью. II. В текстовом файле создать таблицу, отражающую результаты поиска: № п/п Адрес интернет- ресурса Автор ресурса Скриншот главной страницы Аннотация 1. 2. 1. Адрес интернет-ресурса Представляет собой url-адрес ресурса. Например, http://computerhistory.narod.ru/ 2. Автор ресурса Кто создал ресурс, или кому этот ресурс принадлежит Например, автор идеи и web- дизайн: Исупов С., e-mail: ComputerHistory@yandex.ru 3. Скриншот главной страницы. Для создания скриншота используют кнопку на клавиатуре PrintScreen (PRTSC). 4. Аннотация Отражается чем полезен ресурс, его содержание, как можно использовать в учебной и профессиональной деятельности. III. Сохранить созданный текстовый файл в формате .doc. |
Тематические каталоги и автоматические индексы различаются по тому, как формируются и пополняются их базы данных: принимают ли в этом процессе участие люди, или все происходит автоматически.
Тематический каталог представляет пользователю Internet некоторую древовидную структуру категорий (разделов и подразделов), на верхнем уровне которой собраны самые общие понятия, такие как Наука, Искусство, Бизнеси т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные Web-страницы и серверы вместе с кратким описанием их содержимого. Например, для нахождения информации о состоянии научных исследований по теории суперструн можно спуститься вниз по следующей
«лестнице понятий»: Science (Наука) - Physics (Физика) - Theoretical Physics
(Теоретическая физика) -Theories (Теории) - String Theories (Теории струн).
Главным достоинством тематических каталогов является большая ценность получаемой пользователем информации, что обеспечивается присутствием
«человеческого фактора» в процессе анализа и сортировки новых Web-страниц. С другой стороны, тематические каталоги имеют существенный недостаток, связанный опять же с человеческим фактором, т.к. из-за ограниченных возможностей человека их базы данных охватывают лишь небольшую часть всего информационного Web-пространства (менее 1
%).
В отличие от тематических каталогов, базы данных для автоматических индексов создаются и пополняются полностью автоматически некоторыми специальными, внутренними поисковыми программами-роботами, которые в круглосуточном режиме просматривают Internet-узлы (сайты) в поисках вновь появившихся Web-документов. В отличие от тематических каталогов, автоматические индексы охватывают до 25 % общего
Web-пространства.
Некоторой разновидностью поисковых служб являются рейтинговые службы. Они предоставляют клиенту готовый список некоторых ссылок, к которым обращались наиболее часто другие пользователи сети Internet. Такие услуги, в частности, обеспечивает отечественная служба Rambler.
Поиск информации
Все поисковые указателя реализуют несколько алгоритмов поиска.
1. Простой поиск. В поле запроса вводится одно или несколько слов, которые могут характеризовать содержание документа. Если это слово одно, то в ответ выдается большое количество ссылок. Если несколько слов, то результат зависит от того, как эти слова введены, а это зависит от каждой конкретной системы.
2. Расширенный поиск – подразумевает запрос из группы слов. Слова связываются логическими операторами И, ИЛИ, НЕ и др.
3. Контекстный поиск – реализован не во всех поисковых указателях. Если этот метод есть, то ключевая фраза должна быть заключена в кавычки.
4. Специальный поиск - позволяет найти дополнительную информацию. Например, такие команды позволяют определить, как часто в Сети встречаются гиперссылки, указывающие на какой-то ресурс, с их помощью можно найти ключевые слова, входящие в заголовки Web-страниц и т.п.