Главная страница
Навигация по странице:

  • 9.3. Поиск информации в World Wide Web

  • Три этапа работы поискового указателя.

  • Сбор первичной базы данных.

  • 2 3 9 в свою базу данных. Так же происходит и обновление ранее принятых докумен- тов, но измененных за время после предыдущего копирования.Индексация базы данных.

  • Рафинирование результирующего списка.

  • Новые поисковые технологии Автоматическая каталогизация.

  • Поисковые системы реального времени.

  • Рекомендации по приемам эффективного поиска

  • Рекомендации по использованию поисковых систем

  • Специальные возможности поиска в программе Internet Explorer

  • Учебник Информатика. Базовый курс. Симонович С.В.. С. В. Симоновичаинформатикабазовый курс2е издание


    Скачать 17.96 Mb.
    НазваниеС. В. Симоновичаинформатикабазовый курс2е издание
    АнкорУчебник Информатика. Базовый курс. Симонович С.В..pdf
    Дата28.01.2017
    Размер17.96 Mb.
    Формат файлаpdf
    Имя файлаУчебник Информатика. Базовый курс. Симонович С.В..pdf
    ТипКнига
    #56
    КатегорияИнформатика. Вычислительная техника
    страница32 из 76
    1   ...   28   29   30   31   32   33   34   35   ...   76
    2 3 6
    9. Получение информации из Интернета с одного узла на другой. Чтобы осуществить такую операцию, надо сначала пере- нести файл в локальную папку компьютера, а затем отправить ее оттуда на другой или в другой каталог того же
    9.3. Поиск информации в World Wide Web
    Интернет имеет три функции: коммуникационную, информационную и управленче-
    скую. Разные службы могут обеспечивать разные функции. Хотя в рамках службы
    World Wide Web есть сервисы, исполняющие коммуникационные и управленческие функции, основное назначение этой службы — информационное. Когда нам нужно разыскать какие-то сведения, мы обращаемся в первую очередь в инфор- мационное пространство
    Это пространство отличается гигантскими размерами и содержит несколько мил- лиардов
    Найти среди них именно то, что нужно, — это особая,
    отнюдь не простая задача. Разумеется, можно пользоваться рекомендациями зна- комых, коллег по работе, адресами URL, опубликованными в средствах массовой информации, но службе WWW совершенно необходимы свои поисковые сервисы,
    и они существуют.
    Поисковая система представляет собой специализированный Web-узел. Пользо- ватель сообщает поисковой системе о содержании искомой а поисковая система выдает список гиперссылок на страницы, на которых упоми- наются соответствующие сведения. Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наи- большую популярность — это поисковые каталоги и поисковые указатели.
    Поисковые каталоги
    Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Обратившись к поисковому каталогу, мы находим его основной странице сокращенный список крупных тематических категорий, например таких,
    как Наука (Science), как показано на примере поискового каталога Yahoo! (рис. 9.5).
    Каждая в списке категорий — это гиперссылка. Щелчок на ней открывает поискового каталога, на котором данная тема представлена например по предметам: Астрономия, Биология, География, Математика,
    Физика и многие другие. Щелчок на названии темы (например, Физика) открывает страницу со списком разделов (Астрофизика, Атомная физика, Гидродинамика, Меха- ника и т. д.). Продолжая погружение в тему, можно дойти до списка конкретных и выбрать себе тот ресурс, который лучше подходит для решения задачи.
    Работа с поисковыми каталогами интуитивно проста. В них поиск информации практически всегда завершается более или менее плодотворно. Однако за этой простотой высочайшая сложность создания и ведения каталога. Поис- ковые каталрги создаются вручную,
    высококвалифицированных редакторов.
    этом общий объем каталогизированных Web-ресурсов невелик, а степень охвата общего объема ресурсов WWW непрерывно уменьшается.

    9.3. Поиск информации в World Wide Web
    237
    9.5.
    страница поискового каталога
    Несмотря на низкий коэффициент охвата, поисковые каталоги пользуются огром- ной популярностью. Их принято использовать для первичного, реферативного поиска информации по заданной теме. Если для пользователя тема является со- вершенно новой и неисследованной, то ему, прежде всего, нужны указатели на классические, наиболее содержательные ресурсы, а именно это и обеспечивают поисковые каталоги. Человеческий фактор, связанный с тем, что над составлени- ем каталога работают люди, а не обеспечивает качественный отбор наиболее важных ресурсов по каждой теме.
    Поисковые указатели
    Автоматическую каталогизацию и удовлетворение запросов клиен- тов выполняют так называемые поисковые указатели. Из процесса наполнения базы данных поисковой исключается человеческий фактор. При этом значи- тельно падает качество ссылок, предоставляемых системой по результатам поиска,
    но одновременно увеличивается их количество.

    238
    Глава 9. Получение информации из Интернета
    Поиск информации по ключевым словам с помощью
    поисковой системы Яндекс
    ОСНОВНОЙ
    принцип работы поискового указателя заключается в поиске сов по ключевым словам. Пользователь описывает искомый ресурс с помощью клю- чевых слов, после чего дает задание на поиск. Поисковая система анализирует дан- ные, хранящиеся в своей базе, и выдает список соответствующих запросу. Вместе с гиперссылками выдаются краткие сведения о найденных ресурсах,
    на основании которых пользователь может выбрать нужные ему ресурсы (рис. 9.6).
    Разные поисковые указатели применяют разные информационные технологии для обработки запросов пользователей. Чтобы эффективно выполнять поиск инфор- мации в надо хотя бы в общих чертах понимать принципы их работы.
    Три этапа работы поискового указателя. Работу поискового указателя можно условно на три этапа. Из них два этапа являются подготовительными —
    они незаметны для клиента, и лишь на третьем этапе происходит взаимодействие с пользователем, но от каждого из этапов зависят функциональные свойства поис- ковой системы и эффективность работы с ней.
    Сбор первичной базы данных. На первом этапе поисковая система занимается сканированием информационного пространства World Wide Web. Для этого исполь- зуют специальные агентские программы — черви. Не следует путать агентов поис- ковых систем с разновидностью сетевых компьютерных вирусов, тоже именуемых
    червями. Черви поисковых систем совершенно безобидны для серверов и клиентов
    По своей сути это очень эффективные малоразмерные браузеры. Им не надо выполнять функции просмотра и воспроизведения содержимого — их задача состоит только в том, чтобы автоматически разыскивать следуя по гипер- ссылкам, и, убедившись, что этот ресурс системе еще не известен, копировать его

    9,3. Поиск информации в World Wide
    2 3 9
    в свою базу данных. Так же происходит и обновление ранее принятых докумен- тов, но измененных за время после предыдущего копирования.
    Индексация базы данных.
    базу данных сетевых
    — еще не значит получить функционирующую поисковую систему. Поиск ключевых слов,
    введенных пользователем, в обширной базе — это весьма продолжительная опера- ция. Чтобы не задерживать клиента более чем на доли секунды, собранные базы данных проходят предварительную обработку, называемую индексацией. На этапе индексации создаются специализированные документы — поисковые указатели.
    Рафинирование результирующего списка. Это третий этап работы, в ходе которого осуществляется взаимодействие с пользователем. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Пользо- вательское представление о качестве работы поисковой системы напрямую зависит от технологий, использованных на этом этапе.
    Рафинирование заключается в фильтрации и ранжировании результатов поиска.
    Под фильтрацией понимается отсев ссылок, которые выдавать пользователю неце- лесообразно. Прежде всего проверяется наличие дубликатов. Если система в одном списке выдает множество ссылок, ведущих к одному и тому же это говорит о том, что ее средства добросовестно отработали два первых этапа, но ничего не сделали на третьем этапе. Дублирующиеся ссылки перегружают результирую- щий список и затрудняют выбор действительно полезных ресурсов.
    Ранжирование заключается в создании специального порядка представления результирующего списка, при котором наиболее «полезные» (с точки зрения поис- ковой системы) ссылки приводятся в вершине списка, а наименее полезные — в его конце. Понимание критерия «полезности» для клиента той или иной ссылки мо- жет быть самым разнообразным. Именно поэтому разные поисковые системы, даже работающие с одинаковыми базами ресурсов, выдают разные результаты поиска.
    Новые поисковые технологии
    Автоматическая каталогизация. Для поисковых каталогов вопрос несоответствия между размерами исследованного и неисследованного стоит особенно остро. Перспективные направления развития основаны на внедрении так называемых автоматической каталогизации.
    Существует множество теоретических изысканий в области но наиболее перспективной является модель векторного информационного про- странства. Представим себе эксперта в какой-то области, например в физике. Если ему поставить задачу, то, наверное, он сможет составить словари, характерные для таких областей, как Механика, Термодинамика, Оптика и т. п. Проанализировав мно- жество документов, относящихся к этим научным областям, он сможет не только указать характерные термины и понятия, но и дать им весовые оценки. Так, напри- мер, достаточно очевидно, что слово «перемещение» имеет больший вес в механике,
    чем в термодинамике. Комбинируя термины и весовые коэффициенты, можно строить многомерные системы координат, в которых различные области знания описывались бы разными многомерными векторами.

    2 4 0 Глава 9. Получение информации из
    Автоматически получив новую Wei-страницу, поисковая система может построить для нее математический вектор, основанный на формальном анализе содержания.
    Сравнивая этот вектор с уже рассчитанными векторами для различных областей знания, система может без участия человека предположить, к какой категории, теме и разделу относится тот или иной документ.
    При таком подходе не обязательно хранить копии всех известных Wei-страниц,
    как не надо хранить и их поисковые указатели. Вполне достаточно для каждого хранить лишь его и число, соответствующее вектору.
    В настоящее время конкретные алгоритмы не публикуются,
    но можно предположить, что они уже работают, например в поисковых системах реального времени.
    Поисковые системы реального времени. Это новое направление в технологиях поиска. Для работы с такой службой пользователь должен подключиться к ее цен- тральному серверу, получить оттуда и установить на своем компьютере клиентскую программу. Эта программа подключается к браузеру и работает как дополнитель- ная панель.
    При каждом запуске браузера клиентская программа устанавливает соединение со своим центральным сервером и далее работает с ним в паре. Она передает серверу копии всех Web-страниц, которые посещает пользователь, то есть выполняет те же функции, что и автоматический червь, копирующий Web-ресурсы на сервер тради- ционной поисковой системы. Однако при этом есть два существенных различия:
    • во-первых, человек в ходе навигации в WWW руководствуется не теми прин- ципами, что автоматическая программа, поэтому сервер получает копии не всех
    Wei-ресурсов, а только тех, что заинтересовали кого-то из его клиентов;
    • во-вторых, если поставкой Web-ресурсов занимаются несколько миллионов постоянных клиентов, индексация Web-пространства происходит намного быстрее.
    В свою очередь, пользователь тоже имеет важное преимущество. На какой бы Wei- странице он ни находился, система всегда готова предложить ему список других
    Wei-страниц, имеющих близкое по тематике содержание. Она готовит этот список на основании предшествующего опыта, полученного в работе с другими людьми.
    Так можно получить рекомендации, которые было бы очень трудно (а зачастую и невозможно) разыскать в поисковыми средствами (рис. 9.7).
    Рекомендации по приемам эффективного поиска
    При проведении первичного реферативного поиска, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги. Это позволит быстро установить местоположение основных первоисточников.
    ознакомлении с пер- воисточниками следует, прежде всего, уделять внимание понятийной базе. Знание основных понятий и терминов позволит перейти к углубленному поиску в поис- ковых указателях с использованием ключевых слов, наиболее точно характеризу- ющих тему.

    9.3. Поиск информации в World Wide Web
    241
    9.7. При просмотре Web-страницы, посвященной логическим ошибкам в рассуждениях,
    система
    предлагает ссылки на другие
    аналогичной тематики
    При наличии первичных сведений по теме поиска документы можно разыскивать в поисковых указателях. При этом следует различать приемы
    ного, контекстного и специального поиска.
    Под простым поиском понимается поиск по одному или несколь- ким ключевым словам. Недостаток простого поиска заключается в том, что обычно он выдает слишком много документов, среди которых трудно выбрать наиболее подходящие.
    • При использовании расширенного
    ключевые слова связывают между собой операторами логических отношений. Расширенный поиск применяют в тех случаях, когда приемы простого поиска дают слишком много результатов.
    С помощью логических отношений поисковое задание формируют так, чтобы более точно детализировать задание и ограничить область отбора,
    по дате публикации или по типу данных.
    Контекстный поиск — это поиск по точной фразе. Он удобен для реферативного поиска информации, но доступен далеко не во всех поисковых системах. Прежде всего, чтобы обеспечивать такую возможность, система должна работать не только с индексированными файлами, но и с полноценными образами Web-
    страниц. Эта операция достаточно медленная, и ее выполняют немногие поисковые системы.

    2 4 2 Глава 9. Получение информации из Интернета
    Специальный поиск применяют при розыске Web-страниц, содержащих ссылки на заданные адреса URL, а также содержащих заданные данные в служебных полях, например в поле заголовка.
    Рекомендации по использованию поисковых систем
    Для проведения научных поисков рекомендуется пользоваться поисковой
    Northern Light (www.northernlight.com). Эта система имеет один из лучших коэффи- циентов охвата Web-пространства, и ее администрация прилагает специальные усилия для поддержания актуальности своих указателей. Кроме того, система удачно сочетает свойства поискового указателя и каталога. По наиболее популярным темам в ней можно найти специальные разделы каталожного типа — они называются
    Special Editions и подготавливаются вручную. Дополнительно система предостав- ляет платные услуги по поставке актуальных научных документов. Они находятся в разделе Special Collection.
    Самым большим поисковым указателем обладает поисковая система Fast Search
    (www.alltheweb.com).
    В России в настоящее время наиболее эффективно использовать поисковую систему
    Яндекс (www.yandex.ru), обеспечивающую максимальный охват российского сектора
    WWW. Она сочетает в себе возможности поискового каталога и поискового указа- теля. Особенно удобно использовать ее при формировании сложных поисковых заданий, поскольку она обладает очень гибким языком для расширенного поиска.
    Специальные возможности поиска в программе Internet Explorer
    Программа Internet Explorer 6.0 имеет специальные средства организации поиска без явного обращения к поисковым системам. Проще всего дать задание на поиск непосредственно с панели Адрес. Для этого надо ввести туда ключевое слово find или ? и ключевую фразу или набор ключевых слов. Поиск будет произведен с помощью поисковой системы, заданной по умолчанию. Результаты поиска отобра- жаются в виде списка ссылок.
    Другая возможность поиска состоит в обращении к мини-порталу, поддерживае- мому компанией Microsoft. Он организует поиск с помощью существующих систем в соответствии с предпочтениями пользователя. Для такого поиска следует открыть в браузере дополнительную панель Поиск, щелкнув на кнопке Поиск на панели инструментов Обычные кнопки. Содержание панели Поиск загружается с Web-узла
    компании Microsoft. Ключевые слова или ключевая фраза вводятся в текстовое поле на этой панели.
    При открытия панели Поиск из окна папки она открывается в режима поиска файлов и папок на компьютере. В режиме просмотра Web-страниц эта панель предполагает поиск в Интернете.
    Поиск начинается по щелчку на кнопке на панели Поиск. Результаты представля- ются на этой же панели в виде упрощенной страницы результатов, полученных от реально использованной поисковой системы. Чтобы с результатами было удобнее работать, можно расширить панель Поиск, перетащив правую границу, или предста-

    9.4. Отправка и получение сообщений 243
    вить результаты поиска в окне с помощью команды контекстного меню Открыть в отдельном окне.
    Выбрать используемый способ поиска можно с помощью кнопки Настроить на панели Поиск. В открывшемся диалоговом окне каждая группа элементов управ- ления соответствует определенному типу поиска и позволяет указать, какие поис- ковые системы должны использоваться.
    9.4.
    и получение сообщений
    Для работы с электронной почтой и телеконференциями обычно используют единую программу, так как и в том и в другом случае речь идет об отправке и приеме сооб- щений. Часто оказывается удобным объединение средств работы с этими службами в рамках одной программы. Например, так сделано в программе Outlook Express,
    которая позволяет получать и отправлять сообщения электронной почты телекон- ференций, используя аналогичные средства.
    Возможность использования электронной почты сегодня не рассматривается как самостоятельная услуга и автоматически предоставляется тем, кто подключается к Интернету без дополнительной оплаты. Адрес электронной почты состоит из двух частей. Доменный адрес условно соответствует двум последним частям обозначе- ния компьютера в адресе URL и фактически представляет собой адрес локальной сети, к которой принадлежит конкретный пользователь. Вторая часть адреса (которая в записи идет перед первой и отделяется от нее символом «@») указывает конкрет- ного пользователя в этой локальной сети. Сообщения для данного адресата накапли- ваются на почтовом сервере, а затем передаются на компьютер адресата по запросу.
    Например, пользователь, подключающийся к Интернету через поставщика услуг
    ABCDE, может иметь адрес типа
    Телеконференции (или группы новостей) представляют собой средства распрост- ранения сообщений, не предназначенных для конкретного адресата. Информация о наличии сообщения постепенно распространяется от одного сервера новостей
    другому. Сообщение хранится на сервере в течение некоторого времени (от несколь- ких дней до нескольких недель) после чего сбрасывается. Пользователь имеет доступ ко всем сообщениям, имеющимся на данном сервере новостей.
    Авторы сообщений направляют их в тематические телеконференции. Имена теле- конференций образуют иерархическую структуру, не имеющую единого корня.
    Элементы имени разделяются точками, старшие элементы располагаются слева,
    младшие — правее. Чем больше элементов в имени телеконференции, тем более узкой теме она посвящена.
    Например, телеконференция содержит регулярно обнов- ляемый набор сообщений (на английском языке), предназначенный для ознаком- ления начинающих с правилами использования телеконференций и сетевым эти- кетом. А скажем, с элементов начинается целое семейство телеконференций, посвященных различным темам, связанным с аппаратным обес- печением компьютеров.

    1   ...   28   29   30   31   32   33   34   35   ...   76


    написать администратору сайта