практическое работа 14. Практическая работа 14. Эффективный поиск информации Цель работы
Скачать 44.75 Kb.
|
Практическая работа №14. Эффективный поиск информации Цель работы – ознакомиться с наиболее популярными поисковыми системами и используемыми ими языками поисковых запросов, научиться эффективно выполнять поиск информации в сети Интернет. 1. Краткое теоретическое введение 1.1. Общие понятия Основная цель информационного поиска быстро найти нужную информацию. Ключевые слова: «быстро» и «нужную», что и означает эффективность. Критерием эффективности является качество информации оценка информационной ценности того или иного ресурса для прикладной задачи. Путь к информации, хранящейся в библиотеках, фонотеках, фильмотеках, лежит через карточки каталогов. В Интернете существуют аналогичные механизмы для нахождения информации – поисковые сервера. Поисковых серверов много и они разные. Принято различать поисковые индексы и каталоги. Сервера-индексы регулярно прочитывают содержание большинства веб-страниц Интернета («индексируют» их), и помещают их полностью или частично в общую базу данных. Пользователи поискового сервера имеют возможность осуществлять полнотекстовый поиск по этой базе данных, используя ключевые слова, относящиеся к интересующей их теме. Выдача результатов поиска обычно состоит из выдержек рекомендуемых страниц и их адресов, оформленных в виде гиперссылок. Каталоги выросли из списков интересных ссылок. Представляют собой многоуровневую смысловую классификацию ссылок, построенную по принципу «от общего к частному». Ссылки сопровождаются кратким описанием ресурса. Каталогами пользуются тогда, когда не вполне четко знают, что именно ищут. Переходя от самых общих категорий к более частным, можно определить, с каким именно ресурсом следует ознакомиться. Поисковые каталоги бывают общего назначения и специализированные. Поисковые каталоги общего назначения включают в себя ресурсы самого разного профиля. Специализированные каталоги объединяют только ресурсы, посвященные определенной тематике. Им часто удается достичь лучшего охвата ресурсов из своей области и построить более адекватную рубрикацию. Современные поисковые системы сочетают в себе черты индексов и каталогов в различных комбинациях. Кроме поисковых серверов, заносящих в свои базы веб-страницы по всему Интернету, есть поисковые сервера, ориентированные более узко в географическом и языковом отношении. Коммерциализация Интернета привела к ухудшению сервиса поисковых машин. В ответ на запрос пользователя поисковые системы стали выдавать ссылки на ресурсы рекламодателей и Интернет-магазины. Рекомендации по поиску информации с помощью поисковых систем:
1.2. Наиболее популярные поисковые системы Яндекс (Компания «Яндекс») – средство полнотекстового поиска информации с учетом морфологии русского языка; поиск по сайтам, своему каталогу, новостям, товарам, географическим картам, словарям, блогам, картинкам, документам Microsoft Office и Adobe Acrobat PDF.
Rambler (ОАО «Рамблер Интернет Холдинг») – поиск по сайтам с учетом морфологии русского и английского языков; имеет и каталоговую систему поиска.
Поисковый сервис Спутник (ОАО «Ростелеком») – поиск по сайтам, госуслугам и др.; безопасный поиск NIGMA – интеллектуальная поисковая система (МГУ им. М.В. Ломоносова и Stanford University) – поиск документов, картинок, книг, новостей через Google, Yahoo, MSN, Yandex, Rambler, Altavista; также система предоставляет уникальный поиск по химическим формулам и реакциям. Google – поиск по сайтам (есть возможность поиска по русскоязычным сайтам); поиск документов в форматах Adobe Acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 и др.; поиск картинок, видео, новостей, поиск по картам; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на 49 языков.
Bing (Microsoft Corp.) – поиск по сайтам, изображений и видео; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на 22 языка. Yahoo! (Yahoo) – поиск по сайтам, адресам E-Mail и др. Список наиболее популярных поисковых серверов в России и СНГ в порядке убывания количества поисковых запросов по статистике популярного рейтингового ресурса SpyLog в настоящее время выглядит следующим образом: 1.Яндекс – 61,3 %, 2.Google – 24,9 %, 3.Mail.Ru – 8,5 %, 4.Rambler – 1,9 %, 5.Bing – 0,8 %, 6.Nigma.ru – 0,3 %, 7.Yahoo! – 0,2 %, и остальные – 1,3 %. За пределами России рейтинг поисковых систем возглавляет Google, далее следуют Bing и Yahoo!. 1.3. Поиск по ключевым словам. Язык запросов поисковой системы Поисковый запрос, это исходная информация для осуществления процедуры поиска с помощью поисковой системы. Формат поискового запроса зависит и от устройства поисковой системы, и от типа информации для поиска. Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, релевантных цели поиска. Если запрос составлен нечетко, то поисковая машина найдет слишком много документов, которые трудно просмотреть. Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при поиске по узкоспециализированным терминам – предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие. На сайтах поисковых систем обычно есть ссылки на справочную информацию по использованию поисковых сервисов, языков запросов, рекомендации по поиску. Некоторые поисковые системы, например, Яндекс и Google дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Чаще всего поисковый запрос задаётся в виде набора слов или фразы, иногда – используя расширенные возможности языка запросов поисковой системы. Но бывают и совсем иные виды запросов, так, например, в поисковой системе Tineye запросом является изображение, а результатом поиска – страницы в интернете, на которых это изображение встречается. Описание языка запросов наиболее популярных поисковых систем приведены в сравнительной таблице.
2. Практическое задание. 2.1. Изучение языков запросов Описание языка запросов Yandex можно найти по ссылке: https://yandex.ru/support/search/index.html. Описание языка запросов Google можно найти по ссылке: https://support.google.com. Выполните сравнительный анализ языков запросов Яндекс и Гугл , посылая в них идентичные запросы, по следующим метрикам. Результаты сведите в таблицу, объясните различие результатов поиска. 1. Логические операции Логическое «И» – документ включает все термины запроса, логическое «ИЛИ» – документ включает хотя бы один термин запроса. Yandex: пробел эквивалентен операции «И», операция & – в пределах предложения, && – в пределах документа, операция «или» записывается знаком |. Google: по умолчанию при написании терминов запроса через пробел отыскивает документы, содержащие все слова запроса. Операция OR (или) позволяет найти документ, который включает хотя бы один термин запроса Приведите примеры запросов с использованием логических операций. 2. Как найти слова, идущие подряд Для поиска словосочетаний используются операторы: Yandex: ″″ – точная цитата, слово или фраза в кавычках встречаются как цитата. Google: ″″ – парные кавычки, означают точное вхождение. Приведите примеры запросов для поиска точного вхождения слова, фразы. 3. Префиксы обязательности Yandex: знак плюс «+» означает, что термин обязательно должен присутствовать в документе, знак минус «–», записанный слитно с термином, означает, что термин будет исключен из запроса. Знак тильда «» исключает термин из запроса в пределах предложения, знак «» – в документе. Google: используются те же знаки, действуют те же правила. Приведите примеры запросов с использованием операций включения и исключения терминов. 4. Учет расстояний между словами Yandex: операция «/Число» означает, что между терминами запроса должно быть указанное число слов. Google: . Приведите примеры запросов с использованием операции расстояния. 5. Учет морфологии языка Для поиска словосочетаний используются операторы: Yandex: знак «!» записанный слитно с термином означает указание точной словоформы. Google: нет. Приведите примеры запросов с учетом морфологии. 6. Заглавные буквы Yandex: Google: регистр букв не различается, все буквы воспринимаются как строчные, вне зависимости от того, как введены. Приведите примеры запросов с использованием поисковых терминов и фраз с различием в регистре терминов. Оформите в отчете таблицу результатов с указанием релевантности. 2.2. Сравните механизм действия операций языка запросов: Воспользуйтесь поисковой системой Yandex. Определите, что значат скобки (), знаки & и в тексте запроса. Задайте три варианта поиска одной и той же информации на трех разных вкладках: (лингвистика) (новые информационные технологии); (лингвистика) & (новые информационные технологии); (лингвистика) (новые информационные технологии); Сравните результаты поиска. В отчете запишите количество найденных ссылок по каждому запросу, сравните, насколько совпали результаты поиска, сделайте выводы. Языки запросов других поисковых систем Придумайте подобные варианты запросов и проверьте их в других поисковых системах, используя язык поисковых запросов этих систем. В отчете приведите результаты поиска. 2.2. Поиск информации Поиск 1 Воспользуйтесь поисковой системой Google. Задайте два варианта поиска информации
Что означает знак «–» перед вторым словом? Сравните результаты поиска. Сделайте выводы. Сохраните одну из фотографий затмения для выполнения следующего задания. Поиск 2 С помощью поисковой системы Tineye найдите, на каких страницах встречается изображение затмения, сохраненное в предыдущем задании. Сделайте выводы, сохраните в отчете. Поиск 3 В любой поисковой системе задайте эффективный запрос, чтобы найти полезные лингвистические ресурсы в интернет. Экспериментируйте с текстом запроса, чтобы увеличить его эффективность. Ознакомьтесь с результатами поиска. Сделайте выводы. Сохраните ссылки на наиболее интересные ресурсы. Поиск 4 Найдите обучающие программы для изучения китайского (английского) языка. Сохраните ссылки и описание функциональности. Поиск 5 1. Используя операции языка запросов, узнайте, как зарегистрироваться на тотальный диктант в 2018 году. 2. Сформулируйте эффективный запрос, чтобы найти место, где вкусно и недорого поесть в районе ЮУрГУ. Возможно, есть лучший способ найти такую информацию. Как? 3. Найдите сонеты Шекспира не в переводе Маршака. Вопросы для самоконтроля.
|