Главная страница
Навигация по странице:

  • Глава 1 Теоретические основы поисковой системы

  • 1.2 Принцип работы поисковых систем

  • 1.3 Популярные поисковые системы в настоящее время

  • Глава 2. Анализ работы Российских поисковых систем

  • Список использованной литературы

  • ДЗАПАРОВА. Теоретические основы поисковой системы


    Скачать 33.1 Kb.
    НазваниеТеоретические основы поисковой системы
    Дата11.04.2023
    Размер33.1 Kb.
    Формат файлаdocx
    Имя файлаДЗАПАРОВА.docx
    ТипРеферат
    #1053108



    СОДЕРЖАНИЕ

    Введение 2

    Глава 1 Теоретические основы поисковой системы 3

    1.1 Понятие и история создания поисковых систем 3

    1.2 Принцип работы поисковых систем 6

    1.3 Популярные поисковые системы в настоящее время 7

    Глава 2. Анализ работы Российских поисковых систем 10

    2.1 Yandex 10

    2.2 Google 11

    2.3 Mail.ru 12

    2.4 Rambler 13

    2.5 Bing 13

    Заключение 14

    Список использованной литературы 15


    Введение

    В данной работе, коснемся чрезвычайно актуальной и важной темы – поисковых систем. Умение правильно работать с ними, знание основных понятий и принципов работы смогут помочь начинающим пользователям научиться быстро и оперативно искать различную информацию в сети, получать нужные данные и быстро развивать свой интернет бизнес.

    В данной работе будет рассмотрена история создания Российских и зарубежных систем поиска, принципах их работе и структуре.

    Поисковая система – портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Поисковые системы — это инструмент, позволяющий пользователю глобальной сети в кратчайшие сроки найти интересующую его информацию.

    Целью данной работы является изучение Российских поисковых систем.

    Для реализации поставленной цели необходимо выполнить ряд задач:

    • Изучить понятие поисковой системы;

    • Рассмотреть задачи поисковых систем;

    • Изучить состав и принципы работы поисковой системы;

    • Рассмотреть Российские поисковые системы.


    Глава 1 Теоретические основы поисковой системы

    1.1 Понятие и история создания поисковых систем

    Поисковая система, данное понятие возникло еще в конце 80 – х, начале 90 – х годов прошлого века. Именно тогда и возникли их первые прототипы, как в России, так и за рубежом. Согласно определению – это система, которая позволяет искать, обрабатывать, отбирать требуемые данные запроса в своей особой базе, где находятся описания различных источников информации, а также правила пользования ими.

    Основной ее задачей является поиск нужной пользователю информации. Для того, чтобы он был более эффективным, используется понятие релевантности, то есть то, насколько сами результаты поиска точно подходят тому или иному запросу.

    Самые первые ИПС появились в середине 90 – х годов 20 века. Они весьма напоминали обычные указатели, которые находятся в любых книгах, некие справочники. В их базе данных содержались специальные ключевики (слова), которые различными способами собирались с многочисленных сайтов. Так, как интернет – технологии были не совершенными, то и сам поиск выполнялся только по ключевым словам.

    Значительно позднее был разработан специальный полнотекстовый поиск, облегчающий нахождение необходимой пользователю информации. Система производила фиксацию ключевых слов. Благодаря ей, пользователи могли производить нужные запросы по тем или иным словам и различным словосочетаниям.

    Одной из первых, была «Wandex». Ее разработкой занимался очень известный программист Мэтью Греэм в 1993 году. Также, в этом же году возникла и новая «поисковка» «Aliweb» (кстати, и по сей день успешно работает). Однако все они имели достаточно сложную структуру и не обладали современными технологиями.

    Одной из наиболее удачных явилась «WebCrawler», которая впервые была запущена в 1994 году. Отличительной особенностью и главным преимуществом, выгодно выделяющим ее среди других систем поиска, явилось то, что она могла находить любые ключевики на той или иной странице. После этого, это стало своего рода эталоном и для всех остальным ИПС, которые разрабатывались позднее.[2]

    Значительно позже возникли и другие поисковики, которые иногда конкурировали между собой. Это были – «Excite», «AltaVista», «InfoSeek», «Inktomi» и многие другие. Начиная с 96 года, российские пользователи сети начали работать с «Рамблером» и «Апортом». Но, настоящим триумфом для российского интернета, стал созданный в 1997 году «Яндекс».

    Этот российский аналог «Google» стал настоящей гордостью российских программистов. Сегодня, он уверенно теснит конкурента в рунете и также является одним из лидеров по поисковым запросам среди ИПС в России. На сегодняшний день, имеются многочисленные специальные «поисковики», которые созданы для решения определенных задач. Так, например, информационно – поисковая система «Патрон», разработана для того, чтобы хранить и искать данные по патронам для различного оружия и сейчас применяется, как в органах Министерства Внутренних Дел и спецслужб, так и для охотников – профессионалов и любителей.

    Имеются и другие, разработанные для нотариусов, врачей, инженеров, военных, автолюбителей и т д

    К основным типам ИПС относятся следующие понятия:

    Каталог, который представляет собой специально созданную структуру. Он имеет свою четкую классификацию по различным темам. Каталоги также включают особые аннотации с многочисленными ссылками на различные ресурсы в сети интернет. Это могут быть сайты, порталы, веб-страницы и т д.

    Разработка каталогов той или иной ИПС явилось очень удобной благодаря тому, что они могут поддерживать оперативный поиск той или иной категории различных ресурсов по особым ключевикам (словам) с использованием специальных роботов – пауков.

    Индексация каталога может производиться, как вручную, так и автоматически с обновлением индекса. В свою очередь сам результат работы системы включает в себя особый список. В него входят гиперссылка на требуемые ресурсы и описание того или иного документа в интернете.

    Из наиболее популярных каталогов можно выделить: Yahoo, Magellan (зарубежные) и Weblist, Улитка и @Rus из отечественных.

    Поисковая машина представляет собой особую структуру поиска, которая для формирования базы данных применяет специальных роботов. Она содержит различные данные об интернет – ресурсах. Самым главным ее преимуществом является то, что ее основные функции автоматизированы, а ее база создается поисковым роботом.

    Для того чтобы произвести поиск в данной системе, пользователь вводит запрос, который включает в себя набор доступных ключевиков, либо фразу в «кавычках». В свою очередь индекс создают роботы – индексировщики. Само описание документа содержит: начальные предложения статьи, кусочек текста, где выделены «ключевики». В документе также есть дата, когда обновляли документ, его размер в Кб или Мб, а также кодировка.

    К наиболее распространенным зарубежным ИПС относят – Google, Altavista, Excite. Русские – «Яндекс» и «Рамблер».

    В мире существует огромное количество различных видов ИПС, которые содержат множество источников информации. Разумеется, что даже наличие самого современного и мощного сервера не может удовлетворить запросы миллионов пользователей. Именно поэтому, появились специальные метапоисковые системы. Они могут одновременно пересылать запросы пользователей различным поисковым серверам, а на основе своего обобщения имеют возможность предоставить пользователю документ, содержащий ссылки на требуемый ресурс. К их числу можно отнести – MetaCrawler или SavvySearch.

    1.2 Принцип работы поисковых систем

    Работа информационно – поисковой системы является очень сложной. Однако при желании можно разобраться в ее структуре. Первое, что необходимо отметить, что существует особая программа – она называется поисковым роботом (пауком). Данная программа систематически мониторит различные страницы и индексирует их.

    Веб сервер создает запрос пользователя на получение той или иной информации, а затем предоставляет данный запрос машине поиска. Поисковик исследует требуемую базу данных, потом составляет полный список страниц, а затем передает веб-серверу. Он в свою очередь окончательно формирует все результаты запроса в «читаемый» вид, затем передает их на «комп» пользователя.

    ИПС предназначена для следующих целей:

    • Хранить значительные объемы данных;

    • Производить оперативный поиск нужной информации;

    • Добавлять, а также удалять различные данные;

    • Выводить информацию в простом и удобном виде.

    Существуют несколько основных типов ИПС:

    • Автоматизированные

    • Библиографические

    • Диалоговые

    • Документальные.

    Поисковые машины классифицируются по области поиска информации:

    1. Локальный поиск. Он предназначен, чтобы осуществлять поиск информации по всемирной сети какой-либо ее части, например, по локальной сети, либо по одному или нескольким сайтам. Таким примером являются внутренние серверы крупных компаний или поисковый скрипт на сайте.

    2. Глобальный поиск. Он предназначен для того, чтобы искать информацию по региональной части, по группе сайтов, либо в сети Интернет и т.д. Именно глобальным поиском пользуются такие крупные поисковые системы как Яндекс, Google, Yahoo и т.д.

    1.3 Популярные поисковые системы в настоящее время

    На первом месте, без всякого сомнения, находиться неотъемлемый лидер – «Google». На сегодняшний день, к нему адресуется около 80 процентов различных мировых запросов по самым различным сферам. Что касается второго места, то его, также заслуженно, занимает американский «eBay».

    На третьем месте, наш, отечественный, российский «Яндекс». На четвертом – «Yahoo» и на пятом – MSN. Еще одним отечественным браузером, но занимающим только 10 место в рейтинге Европы – это российский «Rambler».

    • Google

    Этот поисковик знают огромное количество пользователей. На сегодняшний день это первая по популярности система в мире! Ежемесячно она обрабатывает более 41 млрд запросов и проводит индексацию 25 миллиардов страниц.

    Что касается истории создания компании «Google», то еще в 1996 году, пара студентов университета Стэнфорда – Ларри Пейдж и Сергей Брин разработали браузер, созданный на новых методах поиска. Назвали они ее просто и лаконично, как собственно и дизайн поисковой системы «Google». Собственно, название google – это искаженный googol (число десять в сотой степени).

    • Яндекс

    Одним из лучших российских поисковиков, вне всякого сомнения, является «Яндекс». На сегодняшний день он стоит на четвертом месте по общему количеству запросов. В то же самое время, по популярности «Яндекс» занимает сегодня первое место в Российской Федерации. Общее количество произведенных запросов превышает 250 миллионов каждый день

    Он был представлен в сентябре 1997 года, а уже в мае 2011, произведя размещение своих акций на IPO, эта фирма смогла заработать наибольшее количество акций среди других интернет – компаний.

    • Поисковая система «Ebay»

    Ebay представляет собой интернет – компанию из США, которая специализируется на проведении интернет – аукционов. Она производит управление портала eBay.com, а также версиями в других странах мира. Помимо этого, в собственности фирмы есть еще одна eBay Enterprise.

    Основателем фирмы является американский программист Пьер Омидьяр, который в середине 90 – х годов разработал интернет – аукцион для своего личного портала. В то же время, eBay – это своего рода посредник при купле продаже. Чтобы использовать его продавцы вносят определенный взнос, а покупатели получают возможность бесплатного использования сайта.

    • MSN

    Данная поисковая система является ведущим интернет – браузером, разработанным компанией «Microsoft». Он появился одновременно с выпуском первой операционной системы Windows 95. Далее этим названием стал пользоваться и сервис электронной почты Hotmail, а также различные веб-узлы Майкрософт. В начале 2002 года он являлся одним из самых крупных интернет – провайдеров в США и имел 9 миллионов подписчиков.

    • Поисковик mail

    Одной из самых крупных почтовых служб явилась, созданная в 1998 году, Mail.ru. Сегодня она представляет собой службу электронной почты, каталог интернет – ресурсов и информационные разделы. Помимо очень удобной почты, она имеет ряд специальных проектов, которые весьма популярны и нужны подписчикам: «Авто Mail.ru», Афиша «Mail.ru», «Дети mail.ru», «Здоровье mail.ru», «Леди mail.ru», «Новости mail.ru» и «Недвижимость mail.ru».
    Глава 2. Анализ работы Российских поисковых систем

    Основное отличие русскоязычных поисковых систем от иностранных одно - это то, что глобальные поисковые системы, поддерживающие поиск на русском языке, не поддерживают русскую морфологию. В русскоязычной части сети Интернет работают около двух десятков поисковых систем, но подавляющие большинство пользователей работает лишь с несколькими, подробно остановимся на самых крупных.

    На территории РФ работает много поисковых систем. Некоторые из них родились на территории государства, другие были адаптированы под запросы россиян. Самыми популярными являются:

    • Yandex.

    • Google.

    • Mail.ru.

    • Rambler.

    • Bing.

    Это основная пятерка, лидерами которой являются первые два поисковика. Все остальные так или иначе используются или использовались в Рунете, но имеют небольшой процент популярности.

    2.1 Yandex

    В рейтинге основных российских поисковых систем первое место занимает именно «Яндекс». Это российская транснациональная компания, которая зарегистрирована в Нидерландах. Она имеет одноименную поисковую систему, интернет-портал, службы в нескольких странах. В конце 2018 года рейтинг Alexa поставил «Яндекс» на 21-е место в мире и первое - в России.

    Впервые система начала работать в 1997 году. Спустя 3 года решено было создать самостоятельную компанию. Активнее всего система развивается в России, Турции, Белоруссии и Казахстане. Ранее была популярна в Украине, до того, как ее заблокировали на территории страны.

    Принцип работы Yandex

    Российская поисковая система позволяет использовать много языков для поиска, в частности, русский, татарский, украинский, белорусский и пр. По умолчанию «Яндекс» выводит 10 результатов на каждой странице выдачи, но это можно настраивать.

    Как и в любом поисковике, в этом периодически меняется алгоритм выдачи. Отсюда происходят изменения в ранжировании: некоторые сайты могут менять свое местоположение в топе выдачи. Специалисты утверждают, что не всегда изменения полезны.

    В свое время «Яндекс» указал на ограничения, при которых он не будет индексировать сайт. Одним из наиболее весомых требований было к уникальности контента. Крайне важно, чтобы он не был скопирован или переписан с других ресурсов.

    2.2 Google

    Сейчас это самая крупная поисковая система в мире. В Рунете она находится на втором месте, но также является востребованной среди россиян. В месяц она обрабатывает более 41 миллиарда запросов, а в индексе находится более 25 миллиардов веб-страниц.

    «Гугл» тяжело назвать российской поисковой системой, но Google.ru адаптируется под Рунет. Именно поэтому логотип поисковика частенько меняется в честь какого-то праздника. Например, 12 июня он вместе со страной отмечает День России, а к открытию Олимпийских игр в Сочи был разработан специальный символ.

    Компания основана в 1998 году Ларри Пейджем и Сергеем Брином, хотя непосредственно домен был зарегистрирован годом ранее.

    Принцип работы Google

    Поисковый робот в системе не один. Сейчас насчитывается пять основных помощников, которые занимаются сканированием определенных сайтов. Например, Googlebot-Mobile индексирует сайты для мобильных устройств, а Googlebot-Image работает с картинками.

    Роботы будут против низкокачественных страниц:

    • с неуникальным контентом;

    • с негативным поведением пользователей;

    • с орфографическими ошибками;

    • без ссылок на страницы;

    • с непонятным дизайном.

    2.3 Mail.ru

    В списке российских поисковых систем интернета не обойтись без «Поиск@Mail.Ru». Конечно, этот поисковик значительно уступает двум предыдущим и занимает в Рунете лишь 2, % в 2018 году, хотя в 2013 году этот показатель был 9,2%.

    Долгое время сервис Mail.ru использовал для поиска Google, потом перешел на «Яндекс», и лишь в 2013 году стал владеть собственными поисковыми технологиями. Но с 2010 года разработчикам все равно приходилось использовать Google в качестве поддержки.

    Популярность эта поисковая система получила благодаря большому количеству связанных сервисов корпорации. Многие, кто использует «Одноклассники», «Мой мир» или почту сервиса параллельно используют и поисковик.

    Принцип работы «Поиск@Mail.Ru»

    В 2013 году появилась технология «ручного» механизма ранжирования. Оптимизаторы получили возможность самостоятельно добавлять запрос или документ для индексирования в систему. Такой способ продвижения ресурсов помог им качественно и органически встраиваться в выдачу.

    2.4 Rambler

    Еще одной российской поисковой системой является «Рамблер». Это популярный медийно-сервисный портал. Работать система начала еще в 1996 году, но сейчас потихоньку начинает уступать более именитым сервисам.

    Справедливости ради «Рамблер» уже сложно назвать поисковой системой, поскольку она не работает по своим алгоритмам. Свое существование как поисковик она прекратила еще в 2011 году, но многие россияне до сих пор используют портал в качестве поисковой системы, только не все знают, что работает он благодаря «Яндексу».

    2.5 Bing

    Этот поисковик занимает пятое место по использованию в Рунете. Разработана система компанией Microsoft, поэтому ее сложно назвать российской. Работает она под текущим названием с 2009 года. Ранее поисковик занимал в Рунете долю в 1%, но сейчас есть информация о том, что он заблокирован на территории РФ. Соответственно статистика будет постепенно снижаться, и Bing постепенно уйдет из рейтинга.
    Заключение

    В наше время информация играет огромную роль во всех сферах жизнедеятельности. Людям, имеющим дело с большими объемами текстов - это и новости, и подшивки газет в электронном виде, и электронная почта, и Web-страницы, важно быстро находить в этом море информации действительно нужную. Без помощи поисковой системы это было бы нереально. Благодаря удобству в обращении и хорошим техническим характеристикам, различные поисковые системы могут помочь в этом и новичку, и опытному пользователю.

    Поисковые системы и существующие к ним приложения, способны облегчить работу представителей многих профессий: Web-мастера, аналитика, руководителя, лингвиста. Информационный бум продолжается, происходит дальнейшее развитие электронно-компьютерных технологий, а, следовательно, и в будущем без поисковых систем обойтись будет крайне сложно.

    Как показывает статистика, пользователи русскоязычной части Интернета предпочитают несколько поисковых машин. Прежде всего, это мультиязычная платформа Google, являющаяся своеобразным эталонов универсального поискового механизма.

    Чуть менее популярный поисковик — Yahoo! - объединяет не одну, а целых 3 поисковых машины (Inktomi, AltaVista, Alltheweb).

    Лидер среди русскоязычных поисковых систем — Яндекс — индексирует документы форматов pdf, rtf, doc, txt, swf, rss и так далее. С помощью Яндекса можно искать информацию на русском, английском, украинском, белорусском, румынском, немецком и французском языках.

    Rambler — оценивает преимущественно посещаемость Интернет-страниц. Соответственно, чтобы оказаться в верхних строчка рейтинга Rambler, необходимо обеспечить своему сайту постоянный приток посетителей.

    Список использованной литературы

    1. Балдин, К.В. Информационные системы в экономике: Учебное пособие / К.В. Балдин. - М.: НИЦ ИНФРА-М, 2016. - 218 c.

    2. Бодров, О.А. Предметно-ориентированные экономические информационные системы: Учебник для вузов / О.А. Бодров. - М.: Гор. линия-Телеком, 2017. - 244 c.

    3. Васильков, А.В. Информационные системы и их безопасность: Учебное пособие / А.В. Васильков, А.А. Васильков, И.А. Васильков. - М.: Форум, 2017. - 528 c.

    4. Горбенко, А.О. Информационные системы в экономике / А.О. Горбенко. - М.: БИНОМ. ЛЗ, 2016. - 292 c.

    5. Исаев, Г.Н. Информационные системы в экономике: Учебник для студентов вузов / Г.Н. Исаев. - М.: Омега-Л, 2017. - 462 c.

    6. Мезенцев, К.Н. Автоматизированные информационные системы: Учебник для студентов учреждений среднего профессионального образования / К.Н. Мезенцев. - М.: ИЦ Академия, 2017. - 176 c.

    7. Уткин, В.Б. Информационные системы в экономике: Учебник для студентов высших учебных заведений / В.Б. Уткин, К.В. Балдин. - М.: ИЦ Академия, 2016. - 288 c.

    8. Федорова, Г.Н. Информационные системы: Учебник для студ. учреждений сред. проф. образования / Г.Н. Федорова. - М.: ИЦ Академия, 2016. - 208 c.

    9. https://ru.wikipedia.org

    10. https://fb.ru

    11. https://copirayter.ru



    написать администратору сайта