Главная страница

самира реф. О программахпоисковиках в Интернете


Скачать 0.66 Mb.
НазваниеО программахпоисковиках в Интернете
Дата21.11.2022
Размер0.66 Mb.
Формат файлаdocx
Имя файласамира реф.docx
ТипРеферат
#804585


ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ ГОРОДА МОСКВЫ

Государственное бюджетное профессиональное образовательное учреждение города Москвы

«Политехнический колледж им. Н.Н. Годовикова»

РЕФЕРАТ

Тема: «О программах-поисковиках в Интернете»

Наименование дисциплины: Информационные-технологии

Специальность (код, наименование) 43.02.06 «Сервис на транспорте»

Выполнил: Преподаватель:

Студент(ка) 1 курса, Чистова Ольга Владимировна

группа 1СТ-3

Нишонова Самира Рустамовна

(Ф.И.О.) (Ф.И.О)

(Оценка)

Москва

2022


Оглавление


Введение 2

История развития поисковых систем 4

2. Как работают механизмы поиска. 5

3. Сравнительный обзор справочно-поисковых систем 6

3.1 Gopher Gopher 6

4. Поисковые роботы. 7

5. Наиболее популярные русскоязычные справочно-поисковые системы в интернет. 8

6. Наиболее популярные зарубежные поисковики для русскоязычного пользователя 9

6.1 Googlе 9

7. Рынок поисковых систем в Китае 10

7.1 Поисковая система Baidu Компания Baidu 10

Заключение. 12

Список литературы 13





Введение


Каждый пользователь в Интернете может найти массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Выбранная тема реферата очень актуальна на сегодняшний день, т.к. поисковые системы не заменимы на сегодняшний день, в силу чрезвычайно частого посещения всемирной сети. Ресурсы Интернета превратившись в инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему. По оценке экспертов объем информации, передаваемой по каналам Интернет, удваивается каждые полгода. Ежедневно в сети появляются миллионы новых документов, и естественно, что без систем поиска они в подавляющем своем большинстве остались бы не востребованными, вообще не были бы не кем найдены, и все то огромное количество информации оказалось бы никому не нужным. Возникла необходимость создания таких средств, которые позволили бы легко ориентироваться в информационных ресурсах глобальных сетей, быстро и надежно находить нужные сведения. В интернете появились специальные поисковые средства. Еще несколько лет назад бытовало такое мнение: в Интернете есть все, но найти там ничего невозможно. Однако с появлением и быстрым развитием поисковых каталогов, поисковых машин, и всевозможных поисковых программ ситуация изменилась, и теперь в Сети срочно понадобившуюся информацию иногда можно найти быстрее, чем в книге, лежащей на столе. В данном определении поисковой системы подразумевается информация различного рода, т.е. текст, аудио, видео, изображения и т.п. Однако следует отметить, что именно текстовые данные идеально подходят для описания полной функциональности поисковой системы, т.к. алгоритмы поиска мультимедийной информации, прежде всего, основываются на алгоритмах поиска текста. Основная задача поисковой системы - минимизировать время, затрачиваемое пользователем на поиск нужной информации.

История развития поисковых систем


Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет [4]. Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов. Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году. В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет. В 1997 году Сергей Брин и Лари Пейдж создали Google самую популярную на сегодняшний момент поисковую систему в мире. сентября 1997 года была официально анонсирована поисковая система Yandex, самая популярная в русскоязычной части Интернет. В настоящее время существует 3 основных международных поисковых системы - Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных.

AltaVista - поисковая система. Название "AltaVista" буквально переводится как "взгляд сверху". Изначально, поисковая система AltaVista была настоящим новатором по созданию поисковых технологий. В 1995 году Альта виста создавалась как один из элементов оборудования исследовательской лаборатории Digital Equipment Corporation (DEC). Появившись, поисковая система AltaVista быстро получила признание пользователей и стала лидером среди себе подобных. Основной заслугой системы AltaVista считается обеспечение поддержки множества языков, в том числе китайского, японского и корейского.


2. Как работают механизмы поиска.


Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы. . Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма. Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие: Количество слов запроса в текстовом содержимом документа (т.е. в html-коде). Тэги, в которых эти слова располагаются. Местоположение искомых слов в документе. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде AltaVista, HotBot).


3. Сравнительный обзор справочно-поисковых систем

3.1 Gopher Gopher


- был широко распространен в интернете и являлся предшественником World Wide Web. По некоторым данным, до 1995 года Gopher был самой динамично развивающейся технологией интернета. Темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов. В 1993 году в мире было более полутора тысяч gopher-серверов [5]. фактически являлся системой распределенного поиска и передачи документов одновременно. Причем эти возможности реализовывались не как дополнительные сервисы-надстройки, подобно современным поисковым машинам, а были встроены в систему как ее базовые функции. С помощь специальной программы Veronica непосредственно в системе Gopher осуществлялся поиск с использованием специального языка запросов, построенного на ключевых словах. Эта система работала не только задолго до появления GOPHER (RFC-1436) представляет собой систему для поиска и доставки документов, хранящихся в распределенных хранилищах-депозитариях. Система была разработана в университете штата Миннесота (на гербе этого штата изображен хомяк, по-английски gopher). Программа Gopher предлагает пользователю последовательность меню, из которых он может выбрать интересующую его тему или статью. Объектом поиска может быть текст или двоичный файл (во многих депозитариях даже текстовые файлы хранятся в архивированном, а следовательно, двоичном виде), графический или звуковой образ. Gopher кроме того предлагает шлюзы в другие поисковые системы WWW, Wais, Archie, Whois, а также в сетевые утилиты типа telnet или FTP. Gopher может предложить больше удобств для работы с оглавлением файлов (directory), чем FTP. Для доступа в глобальную сеть Gopher использует модель клиент-сервер. Система Gopher в настоящее время устарела, многие ее серверы интегрированы в сеть WEB. Но gopher явился прототипом современных интерфейсов WWW и именно делает его интересным.


4. Поисковые роботы.


За последние годы Всемирная паутина стала настолько популярной, что сейчас Интернет является одним из основных средств публикации информации. Когда размер Сети вырос из нескольких серверов и небольшого числа документов до огромных пределов, стало ясно, что ручная навигация по значительной части структуры гипертекстовых ссылок больше не представляется возможной, не говоря уже об эффективном методе исследования ресурсов [8]. Эта проблема побудила исследователей Интернет на проведение экспериментов с автоматизированной навигацией по Сети, названной "роботами". Веб-робот - это программа, которая перемещается по гипертекстовой структуре Сети, запрашивает документ и рекурсивно возвращает все документы, на которые данный документ ссылается. Эти программы также иногда называют "пауками", " странниками", или " червями" и эти названия, возможно, более привлекательны, однако, могут ввести в заблуждение, поскольку термин "паук" и "странник" cоздает ложное представление, что робот сам перемещается, а термин "червь" мог бы подразумевать, что робот еще и размножается подобно интернетовскому вирусу-червю. В действительности, роботы реализованы как простая программная система, которая запрашивает информацию из удаленных участков Интернет, используя стандартные cетевые протоколы.

5. Наиболее популярные русскоязычные справочно-поисковые системы в интернет.


Yandex на сегодняшний день имеет самую большую базу данных, которая имеет кластерную структуру и размещена на нескольких серверах [3]. В 1996 году компанией CompTek, созданной со стопроцентным американским участием, на выставке Internetcom было официально объявлено о существовании "Яндекса". Это была морфологическая приставка к "Альтависте", которую отличало быстродействие и умение строить гипотезы. Пословный индекс для незнакомых слов организован также, как и для словарных - этим "Яндекс" отличается от других поисковиков. сентября 1997 года "Яндекс" стал интернет-проектом. Релевантность документов вычислялась в зависимости от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и так далее.


6. Наиболее популярные зарубежные поисковики для русскоязычного пользователя

6.1 Googlе


Название поисковой системы Google было образовано в результате игры букв в слове "googol". Этим компания хочет подчеркнуть их намерение индексировать и обрабатывать большие объемы информации [6]. Вы можете искать в Google на 10 различных языках. Вы также можете настроить интерфейс на нужный вам язык. Например, если вы ищите немецкий сайт, то вы можете вводить запрос на немецком языке, и все вспомогательные надписи интерфейса будут на немецком языке. Очень удобной функцией является "cache". Благодаря этой функцией пользователь может просмотреть проиндексированную страницу даже если эта страница удалена или сервер, на котором расположена страница недоступен. Вы также можете использовать эту функцию для исследования ваших конкурентов, это также помогает лучше понять принцип индексирования страницы поисковым пауком (роботом). С помощью Google можно найти страницы, которые не содержаться в его базе данных. Это возможно потому что поисковый паук индексирует текст ссылок со страниц.


7. Рынок поисковых систем в Китае

7.1 Поисковая система Baidu Компания Baidu


была основана в 2000 г. - много позже мировых лидеров веб-поиска, однако, она буквально ворвалась в первую десятку самых посещаемых сайтов мира, этому способствует стремительный рост аудитории пользователей Интернета в Китае (на январь 2010 г. - 360 млн.!) [12]. Сайт Baidu.com в Китае известен всем интернетчикам: это не только самый популярный китайский поисковик, но и самый посещаемый в Поднебесной сайт (по статистике Alexa the Web Information Company, на начало марта 2010 г. Baidu - 8-й по посещаемости сайт в миреВ индексе Baidu содержится около 800 млн. веб-страниц (в том числе более 100 млн. - на китайском языке), около 100 млн. изображений и свыше 15 млн. медиафайлов. По данным агентства ComCore, Baidu ежемесячно обрабатывает свыше 10 млрд. поисковых запросов (для сравнения: "Яндекс" обрабатывает за месяц около 3 млрд. запросов). Согласно данным шанхайского агентства Iresearch, Baidu контролирует 63% китайского рынка интернет-поиска (на 2-м месте Google - 33%). Кроме своего основного предназначения - поиска - Baidu предоставляет пользователям следующие сервисы: Байдупедия - свободная и "правильная" энциклопедия; Байду. Посты - многочисленные форумы на всевозможные темы; Байду. Пространство - блог и фотоальбом; Байду. Деньги - платежная система; Байду. Закачка - собственная файлообменная система; Байду. Знакомства; Байду. Знаю - сервис вопросов и ответов; Байду. Игры - многопользовательские онлайн-RPG, стратегии, гонки; Байду. Индекс - индекс ценных бумаг; Байду. Карты - картографический сервис ("правильный", без всяких секретных военных баз, считающий, например, Тибет - китайской территорией и т.д.); Байду. Новости - новостной RSS-агрегатор; Байду. Финансы - финансовые сервисы; Название поисковика "Поиск Мечты" заимствовано из стихотворной поэмы времен династии Сун (XII в.), в которой рассказывается о том, как мужчина ищет свою прекрасную возлюбленную в праздничной толпе.



Исследования показывают, что поисковые средства постоянно развиваются. Совершенствование идет по всем главным аспектам: рост объемов баз данных, возможности составления запроса и дружественность интерфейса, выдача результатов и наличие дополнительных сервисных функций. Системы которые долгое время не внедряют новых элементов и не оптимизируют уже имеющиеся функции постепенно выводятся из активного использования [14]. Ведущая тенденция последнего времени заключается в расширении числа обследуемых документов и одновременном увеличении глубины просмотра источника. Несколько лет назад поисковые средства были способны индексировать только несколько миллионов источников, которые на тот период включали web-страницы, статьи конференций Usenet, файлы Gopher и FTP серверов. Современные системы в среднем индексируют порядка 50 миллионов документов. При этом скорость работы не только не снизилась, но даже увеличилась за счет использования новейшего программного и аппаратного обеспечения. Однако даже более важным является то, что поисковые механизмы последнего поколения индексируют все слова на web-странице или в статье из конференции, в то время как ранее область индексирования ограничивалась как правило названием, заголовками, первыми несколькими строками и адресом документа. Это существенно ограничивало возможность выявления материалов по узкой тематике, поскольку результаты поиска не всегда отражали реально существующие данные. Устранив этот недостаток, современные поисковые системы стали намного более надежными, чем их предшественники. В ближайшем будущем полнотекстовое индексирование утвердится в качестве неотъемлемой характеристики поисковых средств, которые собираются серьезно конкурировать. На мой взгляд, это один из ключевых параметров будущего развития поисковых инструментов. Следующая важнейшая черта - совершенствование внутреннего поискового механизма, выражающееся в увеличении числа операторов и других элементов составления запросов. Общепринятой становится возможность искать данные на любых языках. Все это дает возможность составлять поисковое предписание с большой степенью точности, что, конечно же, повышает релевантность получаемых результатов.


Заключение.


Поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас - это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Самой лучшей иностранной поисковой системой по последним данным является Google, так как основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система, будь то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться было бы не правильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками вводя в них нужные запросы. Из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.

Список литературы


1.https://uniofweb.ru/wiki/poiskovye_sistemy/

2.https://dic.academic.ru/dic.nsf/ruwiki/190

3.https://ru.wikipedia.org/wiki/


написать администратору сайта