Лаб-Информационные технологии. Лабораторная работа Тематический поиск в сети Интернет. Поисковые возможности информационной системы World Wide Web. Цель
Скачать 24.28 Kb.
|
ВЫПОЛНЕНИЕ ЛАБОРАТОРНОЙ РАБОТЫ ПО ДИСЦИПЛИНЕ Информационные технологии Группа 21М511в Студент К.А. Моторина МОСКВА 2022г. Лабораторная работа 1. Тематический поиск в сети Интернет. Поисковые возможности информационной системы World Wide Web. Цель: изучение и освоение средств и методов информационного поиска на уровне конечного пользователя в гипертекстовой среде WWW сети Интернет. В результате выполнения работы студенты должны: ознакомиться с принципами и организацией хранения гипертекстовой информации в сети Интернет; ознакомиться с принципами построения и использования современных систем поиска гипертекстовой информации; изучить основные приемы поиска информации в Интернет; научиться анализировать результаты шагов информационного поиска и принимать решения по дальнейшим действиям; приобрести первичные навыки в решении практических задач поиска гипертекстовой информации. Краткие сведения Вся совокупность сайтов в Интернете является огромным набором неструктурированной информации. WWW - распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к сети Интернет. Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW. Соответственно, чтобы что-то найти в этой огромной массе информации, не связанной едиными нормами и стандартами, необходима помощь специальных сервисов. Такими сервисами являются каталоги и поисковые системы, которые предназначены для структуризации и систематизации информации и облегчения поиска в Интернете. Каталог Интернет-ресурсов — это иерархически организованная структура, содержащая названия и аннотации сайтов, распределенных по тематике в соответствии с разделами (категориями) каталога, составление и сопровождение которых осуществляется специальным персоналом. Внутри каждой категории существует несколько уровней подкатегорий, уточняющих тематику ресурсов, которые в ней расположены. Внутри самой нижней подкатегории сайты располагаются в определенном порядке в соответствии с их рейтингом. Поисковые системы (машины) (ПМ) располагают найденные сайты в порядке убывания релевантности, — соответствия содержания сайта запросу пользователя. Поисковая машина совершает поиск в огромном массиве информации и обрабатывает такое количество сайтов, которое никогда не сможет собрать ни один каталог, формируемый людьми. Поисковые системы состоят из трех основных частей: поискового робота, базы индексов и программы поиска по базе индексов. Поисковый робот — это специальная программа, которая посещает сайты и индексирует их содержимое в соответствии с определенными правилами, заложенными в нее разработчиками. Результаты своей работы поисковый робот помещает в базу данных (базу индексов). Для совершения поиска пользователь вносит набор ключевых слов в специальное поле интерфейса поисковой системы и запускает поиск. В этот момент начинает работать третья составляющая — программа поиска. Поиск она по базе индексов. Результатом поиска является список сайтов и кратких аннотаций к ним. Сайты в списке расположены в порядке убывания релевантности. Поисковые машины отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа сформулированному запросу. Одну из лучших поисковых машин предлагает своим пользователям поисковая система Яндекс (Yandex). Метапоисковые системы обращаются сразу к нескольким поисковым машинам. Каждая метапоисковая система имеет свой язык запросов. Сформулированный на этом языке запрос, она переводит на языки запросов используемых поисковых машин. Способы формулировки запросов: Естественно-языковый (простой) – задается предложение или набор слов; Строгий (с языком запросов) – помимо ключевых слов в запросе содержатся операторы; Расширенный – разновидность простого запроса, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения специальной формы. Особенностью поиска информации в среде WWW является то, что при любых технологиях поиска данный процесс носит двухэтапный характер. 1 этап. Нахождение некоторого списка (набора) WWW-страниц, в которых может содержаться необходимая пользователю информация. Фактически это означает наличие возможности «прямого» доступа к содержанию WWW-страницы посредством некоторого элементарного действия, например, набором известного адреса в поле адреса программы-обозревателя или нажатием клавиши мыши на некоторой позиции из журнала посещения. 2 этап. Пользователь осуществляет просмотр некоторого количества WWW-страниц из состава ранее найденного на первом этапе списка, для чего он открывает страницу и знакомится с ее содержанием. После этого пользователь может принимать решение относительно дальнейших действий с найденной страницей. Например, исключение из рассмотрения из-за ее несоответствия, частичное соответствие (когда целесообразно осуществить извлечение и сохранение некоторого текстового фрагмента или изображения), сохранение всего текста или всей страницы и пр. Обработав список (или его полезную часть), пользователь может принять решение о дальнейшем ходе поискового процесса. Основными здесь являются два варианта: расширение области поиска (при малом объеме списка, с тем, чтобы вовлечь в поиск дополнительные WWW-страницы) за счет ослабления поискового требования (отмена некоторых условий поиска) сужение области поиска (при очень большом объеме списка, который может достигать сотен и тысяч страниц) путем наложения дополнительных условий. Задание 1. Выполните конкретные поисковые задачи в WWW-пространстве с соблюдением технологии поиска: 1) формулировка задачи, 2) определение стратегии поиска, 3) составление поискового запроса, 4) исполнение запроса и анализ результатов. 2. С помощью тематического поиска поисковой системы Rambler найдите информацию о результатах торгов на ММВБ. 3. Составьте сложный запрос для поиска информации на русском языке о студенческих конференциях по менеджменту или маркетингу с помощью поискового языка Rambler и выполните этот запрос. 4. Составьте сложный запрос на поисковом сервере Yandex для поиска информации: в названии документа должны быть слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика» и найдите информацию по этому запросу. 5. Составьте сложный запрос на поисковом сервере Yandex для поиска информации о московских провайдерах Интернет. Необходимо обратить внимание на следующие особенности сформулированной информационной потребности: указание территориальной принадлежности («Моск», «Москва», «Московские» и пр.) слова «провайдер» и «Интернет» должны располагаться рядом в указанном порядке, название сети может быть как «Интернет», так и «Internet». Технология работы 1. Запустите любой браузер. 2. Создайте файл с именем Протокол-Фамилия.doc, в котором будет записываться отчетная информация: поисковые запросы; количество найденных документов; адреса изучаемых страниц и пр. Тематический поиск 3. Чтобы с помощью тематического поиска найти информацию о результатах торгов на ММВБ, необходимо выполнить следующие действия: На стартовой странице поисковой системы Rambler в поисковой строке ввести запрос «результаты торгов на ММВБ»; Найдите в списке найденных страниц такую страницу, которая после перехода на неё отражает актуальные котировки ММВБ; Ознакомьтесь с содержанием страницы. 4. Сохраните в файле Протокол-Фамилия.docнайденную информацию. Поиск информации при помощи поисковых машин. Сложные запросы. 1. Для составления и выполнения сложного запроса в поисковой системе Rambler: На стартовой странице Rambler перейдите по гиперссылке «Помощь» (https://help.rambler.ru/rsearch/); Ознакомьтесь с вариантами построения сложных запросов; Вернитесь на стартовую страницу; Введите в поисковое поле следующий запрос: $Russian: (студенческие конференции)&(менеджмент | маркетинг) и выполните поиск (кнопка «Поиск»). 2. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 3. Просмотрите итоговый список и сохраните его в отчетном файле. 4. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Rambler сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 5. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос, т.е. информацию о студенческих конференциях по менеджменту или маркетингу на ближайшее время. 6. Для составления и выполнения сложного запроса в поисковой системе Yandex: Откройте страницу поисковой системы Yandex; Перейдите к странице с описанием поискового языка системы Yandex по гиперссылке «Расширенный поиск», (https://yandex.ru/support/search/query-language/search-context.html); Ознакомьтесь с синтаксисом языка запросов; Вернитесь на стартовую страницу Yandex и введите в поисковое поле следующий запрос: $Title: (студенческая конференция)&(компьютеры | графика) и выполните поиск (кнопка «Поиск»). 7. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 8. Просмотрите итоговый список и сохраните его в отчетном файле. 9. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 10. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос. Это будут документы, в названии которых содержатся слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика». 11. Для составления и выполнения сложного запроса по поиску информации о московских провайдерах Интернет в поле запроса Яндекса введите: (провайдер/+1 (Интернет | Internet)) & Москва, где: провайдер/+1 - указывает расстояние между словами провайдер и Интернет; Интернет | Internet - поиск любого из слов; (….)& Москва – слова, объединенные знаком & находятся в одном предложении. 12. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 13. Просмотрите итоговый список и сохраните его в отчетном файле. 14. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 15. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос. Индивидуальное задание
|