Информационнопоисковые системы
Скачать 36.88 Kb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Южно-Уральский государственный университет»(НИУ) Кафедра Экономической теории и мировой экономики Контрольная работа «Информационные системы в экономике (управлении)» Тема: Информационно-поисковые системы Выполнил: Студент группы: Ф.И.О. Проверил: Уфимцева О.В. Челябинск 2016 Оглавление 1. Введение ………………………………………………………………………………….…3 2. Понятие информационных поисковых систем ……………………………………………4 3. Значение и структура …………………………………………………………………….…5 4. Русскоязычные поисковые системы………………………………………………………...8 5. Популярные поисковые системы …………………………………………………………..9 5.1 История создания Google …………………………………………………………………10 5.2 История создания Яндекс………………………………………………………………….10 6. Требования к идеальной поисковой машине …………………………………………...…11 7. Значение данных систем в жизни ……………………………………………………….…12 8. Заключение ………………………………………………………………………………….13 9. Библиографический список ……………………………………………………………….14 1.Введение На сегодняшний день интернет стал неотъемлемой частью нашей жизни. Каждый день каждый из нас пользуется им, имея определенные цели. Все от мала до велика, являются пользователями интернета. Обычным явлением в нашей жизни стал поиск в интернете нужной информации. Погода, карты, учебные пособия, музыка, рецепты и т.д. Наша жизнь стала проще. Мы можем заказать и оплатить билеты, продукты, технику, одежду, посуду, не выходя из дома. Задумывались ли Вы, что стоит за этой чудо-машиной, которая выдаёт Вам нужную информацию? За считанные секунды на экране Вашего компьютера, телефона, планшета появляется целый список интересующей Вас информации. Сейчас поисковые системы все больше стараются «видеть» сайт именно глазами рядового посетителя, чтобы результат устроил пользователя. Что же такое информационно-поисковая система (далее ИПС)? Какая ИПС самая популярная? Что чаще всего ищут пользователи? Пользователи привыкли, что поиск данных является бесплатным. Однако в то же самое время ИПС является одним из наиболее эффективных бизнес-инструментов. Поисковый сервис – это предприятие, цель которого-получение прибыли. Чем больше людей пользуется данным поиском, тем больше мест для рекламы он можно продать. Именно поэтому между поисковиками существует конкуренция. Для того, чтобы удержать пользователей, необходимо постоянно улучшать результаты поиска, строить качественную актуальную выдачу, а также предоставлять дополнительные услуги – игры, сервисы, приложения. ИПС уже прочно обосновались в наших жизнях. Изучая интересы пользователей с помощью дополнительных сервисов, поисковая машина и, как следствие, рекламодатели получают весьма точный «социальный портрет» аудитории. Эти сведения позволяют заметно увеличить эффективность размещаемой рекламы за счет актуального рекламного сообщения для конкретного человека. Информационно-поисковые системы совершенствуются постоянно. Это обусловлено стремлением учесть особенности человеческого поведения, чтобы сделать выдачу для каждого посетителя уникальной. Теперь в механизмы обработки и поиска информации все чаще включаются технологии искусственного интеллекта, построенные на новейших вычислительных методах. В своём реферате я хочу осветить понятие, структуру и значение информационно-поисковых систем. Так же я расскажу о русскоязычных информационно-поисковых системах. Познакомлю Вас с популярными ИПС и их историей. Я постараюсь убедить Вас, что в нынешнее время технологии стали настолько совершенными, что современный человек не обходится и дня без интернета. Ко всему этому я попробую выделить, какими критериями должна обладать информационно-поисковая система, чтобы удовлетворять всех своей работой. Мы сравним статистику, прибыль, выведем закономерности и зависимости между ИПС, рекламодателями и пользователями. Вы сможете узнать синтаксис Яндекса и многие другие интересные и актуальные на сегодняшний день факты. 2. Понятие информационных поисковых систем Понятие современной информационно-поисковой системы составляет сложный комплекс, подразумевающий программно-аппаратные механизмы с веб-интерфейсом. Их работа держится в тайне компанией разработчика. Благодаря определенным алгоритмам действий специальные роботы, предназначенные для поиска, собирают информацию (заносят ее в базу данных, где она структурируется и располагается в определенном порядке). Запрос, записанный в поисковой строке пользователем, направляется к базе данных. Далее системы, осуществив отбор нужной информации, выдает список ссылок на сайты, удовлетворяющие данный запрос. Сортировка данных производится по их значимости для удобства пользователя. В середине 1990-х годов появились первые ИПС. Они были похожи на предметный указатель в обычных книгах. В базе данных ИПС хранились ключевые слова, собранные со страниц сотен сайтов. Поиск данных происходил исключительно по этим ключевым словам. Немного позднее был создан и разработан полнотекстовый поиск, значительно облегчающий поиск нужной информации. Каждое слово(фраза) фиксировалось в индексе поисковой системе. Благодаря этому, стал возможен поиск по любым словам и их сочетаниям. Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в1993. В том же 1993 году появилась поисковая система «Aliweb», которая работает до сих пор. Первой полнотекстовой поисковой системой была «WebCrawler», начавшая свою работу в 1994. Её преимущество заключалось в том, что она давала возможность пользователям искать нужные данные по любым ключевым словам на любой веб-странице. С тех пор это является стандартом во всех ИПС. Более того, «WebCrawler» стал первым информационным поиском, известным в широких кругах. Более того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона. Через некоторое время появилось множество ИПС, конкурирующих между собой- «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». В 1996 году русскоязычные пользователи интернета получили доступ к морфологическому расширению поисковой машины Altavista, и к оригинальным российским поисковым машинам «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс, ставшая популярнейшей среди русскоязычных пользователей. В настоящее же время становится популярной практика применения кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская Quintura, предлагающая визуальную кластеризацию в видеоблака тегов. «Нигма» тоже практиковала поиск с визуальной кластеризацией. Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica»для поиска в Gopher. 3. Значение и структура Работа поискового сервера достаточно сложна, но постараемся разобраться в ее структуре. Изначально специальная программа («паук») постоянно просматривает web-страницы и по базовым словам составляет базы данных индексов. Web-сервер формирует пользовательский запрос на поиск информации и передает его специальной программе – «поисковой машине». Она, в свою очередь, изучает базу данных, формирует список страниц, удовлетворяющих условиям запроса, и возвращает его web-серверу. Web-сервер оформляет результаты запроса, удовлетворяющие пользователя, и предает их на компьютер пользователя. Информационно-поисковая система - система, выполняющая функции: - хранения больших объемов информации; - быстрого поиска требуемой информации; - добавления, удаления и изменения хранимой информации; - вывода информации в удобном для человека виде. Различают: - автоматизированные (coputerised); - библиографические (reference); - диалоговые (online); - документальные и фактографические информационно-поисковые системы. Зачастую мы не всегда можем удачно сформулировать наш запрос. Существует технология эффективного поиска в интернете. Познакомимся с ней подробнее. Чтобы правильно и грамотно сформулировать свой запрос на поиск информации, нужно выполнить некоторые критерии. Но всё же это не главный ключ успеха. ИПС должна удовлетворять некоторые критерии: - полнота охвата информационного поля, в котором поиск происходит; - достоверность полученного результата; - скорость получения результата. Полнота охвата на прямую зависит от качества запроса, составленного пользователем и, конечно же, возможностей конкретной поисковой системы. Достоверность результата запроса зависит от особенностей функционирования выбранной поисковой системы, скорости обновления информации в предметной области, в которой осуществляется поиск. Скорость получения результата же зависит от характеристики каналов связи, особенностей организации работы поисковика, а так же, от «качества» построения запроса. На саму работу ИПС пользователь влиять не может, но качественно и грамотно построить запрос –его задача, ради получения результата в том объеме, в котором он нужен. Приведу несколько примеров простого поиска: Поиск группы слов Возьмём слово «финансовая» или «академия». Слова «финансовая» или «академия» дадут при поиске в отдельности большое количество всевозможных ссылок, которые относятся к совершенно различным сферам, темам и т.д. Именно поэтому рекомендуется добавлять несколько слов, связанных между собой искомой темой. Например, «финансовая академия» Также необходимостью является сужение области вопроса. Например, мы пытаемся найти информацию о геополитическому устройству по Хаусхоферу. Тогда правильнее будет ввести «геополитическое устройство по Карлу Хаусхоферу», нежели просто «геополитическое устройство». Количество слов в группе не ограничивается. Поиск словоформ Информационно-поисковая система в большинстве случаев ищет по умолчанию все словоформы, но пользователь может указать ИПС не перебирать при поиске все формы слов при поиске. Практически во всех ИПС для выполнения этой функции используется восклицательный знак. Например, «Семеро». Существует большая вероятность того, что поиск даст результат сказку «Семеро козлят» . Роль прописных букв В том случае если пользователь ввел в поисковую строку ключевое слово поиска с прописной буквы, то поисковая машина не найдёт страницы, где данное ключевое слово написано со строчной буквы. Именно поэтому, обращаясь к поисковой системе, стоит вводить слова с прописной буквы лишь в том случае, когда используются имена собственные. Например, «город Ашхабад», «торгово-развлекательный центр Европейский» и т.д. Значение подстановочных символов Когда нет уверенности в том, что поисковая система правильно обрабатывает словоформы (то есть когда речь идет, например, об именах собственных или словах иностранного происхождения) поисковые системы позволяют использовать подстановочные символы. В большинстве ИПС это символ «*» вместо любого количества любых символов до конца слова. Например, пользователь хочет найти страницы, которые содержат слова «Республика Туркменистан», но так же его запрос устроят и результаты «Республика Туркмения» . Тогда стоит создать запрос следующего содержания: «республика Туркмен*». Учет зарезервированных слов Зарезервированными являются те слова, которые состоят менее чем из четырёх букв. Их называют стоп-словами. Например, и, в, на, под, мы, вы и т.д. Данные слова не учитывает информационно-поисковая система. Средства контекстного поиска Поиск цитаты осуществляется, если ключевые слова поиска взять в кавычки. При данном запросе поисковик должен найти документы, в которых нужная фраза существует буквально. Приемы расширенного поиска Для осуществления успешного поиска наряду с ключевыми словами используются логические операторы. Благодаря этому можно сконструировать запрос так, что будут найдены не сайты на интересующую тему, а конкретные страницы и даже отдельные документы. Правила составления сложных запросов на одной поисковой машине могут отличаться от таковых на другой, но в любом случае будут использоваться следующие основные операторы: Оператор И (AND) С помощью данного логического оператора можно объединить несколько слов, чтобы они все присутствовали в искомом документе. Часто вместо логического оператора И используют & или +. Пример: по запросу финансист И программа будут найдены документы, содержащие и то и другое слово. Оператор ИЛИ (OR) Обеспечивает поиск по любому из слов группы. Пример: по запросу университет ИЛИ академия будут найдены файлы, содержащие слово университет или академия. Логические скобки Логические скобки применяются, когда надо управлять порядком осуществления логических операторов. Например: по запросу Ленин ИЛИ (Владимир Ильич) будут найдены все документы, которые содержат слова Ленин или Владимир И Ильич . Оператор НЕ (NOT) Данный оператор используется, когда из результатов поиска нужно исключить какое-либо слово, которое содержится в поисковой строке. Например, икеа не Химки. Данный запрос даст нам информацию о магазинах икеа не в Химках. Оператор БЛИЗКО (NEAR) Логический оператор БЛИЗКО используется с указанием расстояния. Он позволяет указать, на каком расстоянии друг от друга могут располагаться слова в документе. Синтаксис такого запроса различен у разных поисковых систем. Средства специального поиска Позволяют выполнять поиск документов по: датам; по ссылкам на определенный адрес; по заголовкам веб-страниц; по доменному имени сервера и т.д. Используя данные логические операторы, Вы можете с легкостью найти интересующие Вас данные. Это облегчит поиск и поможет найти нужную информацию в полном объёме. 4. Русскоязычные поисковые системы Большинство «русскоязычных» информационно-поисковых систем осуществляют поиск на многих языках — английском, белорусском, украинском и др. Русскоязычные поисковики отличаются от «всеязычных» информационно-поисковых систем, которые индексируют все документы подряд, тем, что индуцируют в основном лишь ресурсы информации, расположенные в доменных зонах, где преобладает русский язык. Некоторые русскоязычные ИПС ограничивают другими способами своих роботов, отвечающих за функционирование информационно-поисковой системы. Русскоязычные ИПС: Яндекс (46,3 % Рунета) Mail.ru (8,9 % Рунета) Rambler (3,3 % Рунета) Nigma (0,5 % Рунета) Генон (0,1 % Рунета) Gogo.ru (<0,1 % Рунета) Aport (<0,1 % Рунета) Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так, Mail.ru использует Google, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков. 5. Популярные поисковые системы Исследовательская компания comScore провела в марте 2008 года измерение популярности поисковых систем среди европейских интернет-пользователей: Первое почётное место в этом рейтинге, и стоит отметить, с большим отрывом, занял американский Google, который собрал 79,2% всех запросов европейцев.На втором оказался eBay, также являющийся американским поисковиком. Он собрал 3,1% запросов. Американскую гегемонию нарушил российский сайт «Яндекс» (2,2% запросов). Таким образом он занял третье место. Четвертое место принадлежит системе Yahoo. Пятое место занял поисковик MSN. Шестое и седьмое места поделили польские сайты Nasza-Klasa и QXL Ricardo. Завершил 10 самых популярных ИПС в Европе российский сайт Rambler, который собрал 125 млн запросов пользователей — 0,5% от всего числа. Хотелось бы еще отметить страны, занимающие лидирующие позиции по количеству запросов в целом и на жителей страны. По количеству поисковых запросов в Европе лидирует Великобритания. На долю жителей этой страны пришлось 4 млрд запросов. Далее следуют Германия и Франция с 3,9 млрд и 2,9 млрд запросов соответственно. Россия же занимает шестое место (1,14 млрд запросов). Однако по количеству запросов на одного человека Россия занимает далеко не лидирующее место в рейтинге. Исследовательский центр портала Superjob.ru провел интересный опрос среди российских пользователей интернета и составил свой рейтинг самых популярных поисковых систем в России. В данном опросе, проведенном в 2008 году, участвовали 10 000 интернет-пользователей России. Лидером этого опроса стал Yandex. Он собрал 78% голосов. Респонденты отмечали удобство в использовании, достаточно низкое количество реклам, дизайн. На втором месте обосновался поисковик Rambler. 47% опрошенных пользуются им. Его ценят за то, что: «Быстро, просто и много полезного». Опрос показал, что Google использую 37% респондентов. По их мнению, кроме Google серьезных поисковых систем в Интернете не наблюдается. Предпочитают его из-за возможности перевода содержания иностранных сайтов на русский язык. В числе других поисковых систем респонденты (11%) называли Mail.ru, а также Yahoo, Nigma, Aport и KM.ru. Согласно опросу, Rambler предпочитают люди среднего и страшего возраста. Yandex — интернет-пользователи в возрасте 20—30 лет. Поисковая система Google популярна среди молодежи до 20 лет. Интересно также, что Yandex чаще всего ипользуют женщины, тогда как среди приверженцев Google заметно больше мужчин. 5.1 История создания Google Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали новую поисковую систему Google. Датой рождения Google Inc. считается 1998 год, когда один из основателей компании Sun Энди Бехтольшайм выписал чек на сумму 100 тыс. долларов США на имя ещё не существующей организации. Название Google произошло от намеренно искажённого Сергеем Брином название создано на основе математического термина "гугол" (googol), обозначающего число, выраженное единицей со 100 нулями. У Google по итогам 2011 года общий доход компании в России составил 37,905 млн долларов США, что на 29% лучше, чем показатель 2010 года. Факты о Google Год основания: 1998 Основатели: Ларри Пейдж и Сергей Брин Регистрация: 4 сентября 1998 г. IPO (NASDAQ):19 августа 2004 г. Штаб-квартира:1600 Amphitheatre Parkway Mountain View CA 94043 5.2 История создания Яндекс История Яндекса началась в конце 80-х — с разработки поисковых технологий в компании «Аркадия», которая затем вошла в состав CompTek. Разработчики создали несколько поисковых программ, в том числе Международный классификатор изобретений и поиск по Библии, который учитывал морфологию русского языка. Технология поиска получила название «Яndex». Слово «Яndex» придумали Илья Сегалович, нынешний директор Яндекса по технологиям, и генеральный директор компании — Аркадий Волож. Илья выписывал разные производные от слов, описывающих суть технологии. В результате появился вариант «yandex». Теперь слово «яндекс» вошло в русский язык, миллионы людей употребляют его, когда говорят о поиске в интернете. Официальный день рождения поисковой системы Yandex.Ru – 23 сентября 1997. В этот день система была анонсирована на выставке Softool в Москве. Яндекс образца 1997 года учитывал морфологию русского языка, расстояние между словами и умел ранжировать документы в соответствии с их релевантностью заданному запросу. В 1998 году на Yandex.ru впервые появилась контекстная реклама — реклама, соответствующая запросу пользователя. При этом способе показа рекламу видит только ее целевая аудитория. Контекстная реклама стала одним из дополнительных ответов на вопросы пользователей, а в последующем – основной бизнес-моделью компании «Яндекс». В 2006 году Яндекс открыл свой первый удаленный офис разработки — в Санкт-Петербурге. Сейчас у Яндекса есть отделения в России (Москва, Санкт-Петербург, Екатеринбург, Новосибирск, Казань, Ростов-на-Дону), в Украине (Киев, Одесса, Симферополь), Беларуси, Калифорнии, Турции и Швейцарии. Среди них — и офисы разработки, и офисы продаж, и офисы, отвечающие за локализацию продуктов. За 2011 год операционная прибыль Яндекса составила 2,6 млрд рублей (80,8 млн долларов США), увеличившись по сравнению с аналогичным показателем прошлого года на 44% (отчет за 2011 год). 6. Требования к идеальной поисковой машине Интернет-пользователи предпочитают информационные запросы. В связи с этим владельцы сайта должны быть направлены на размещение больше сведений информационного характера. Следовательно, это сможет повысить доверие пользователей к данной компании, вызовет интерес. В будущем пользователь предпочтёт именно ее для совершения покупок. Также стоит отметить, что ИПС должна иметь представление о пользователях: пол, возраст, интересы, увлеченияю Эта информация позволит размещать рекламу, интересующую пользователя. Каждый пользователь сети интернет, формируя запрос, преследует одну из трёх целей: 1.информационную 2.навигационную 3.транзакционную Информационная подразумевает поиск определенной информации. Например, как приготовить борщ, как обработать раны и т.д. Навигационная цель состоит в том, чтобы узнать сайт фирмы, название компании, уточнить адрес, схему проезда и т.д. Транзакционную – совершить конкретное действие — купить собаку, совершить бронь билета или скачать мелодию. Выделим требования, которые должна выполнять идеальная информационно-поисковая система: 1)простота в использовании 2)чётко организованный и обновляемый индекс. 3)быстрый поиск в базе данных и быстрое реагирование. 4)надёжность и точность результатов поиска. Я думаю, что каждый из пользователей будет полностью удовлетворён такой информационно-поисковой системой. Представьте только: существует такая ИПС, которой легко пользоваться каждому. Она работает быстро, надёжно, выдает нужную и достоверную информацию. Не идеал ли это? Я думаю, да. 7. Значение данных систем в жизни Для любого из жителей 21 века интернет не является чем-то сверхнеобычным. В интернете около 250 млн. всевозможных сайтов, и 1950 млн. людей, пользующихся им.. Каждый пытается найти нужную информацию. Только представьте себе большой справочник, состоящий из 250 млн. разделов, которые по сути своей являются отдельными книгами. При этом этой огромной «книгой» хотят воспользоваться 1950 млн. человек. Как же претворить это в жизнь? Как помочь всем одновременно в поиске абсолютно разной информации. Решение простое. Это ИПС, которая хранит в себе всю информацию. Она с высокой точностью и за считанные секунды выдает результат, интересующий пользователя. ИПС с абсолютным отрывом лидируют в интернете. Просто постарайтесь представить жизнь без поисковиков. Что бы мы делали? Запоминали бы сайты всех компаний, фирм, магазинов, библиотек, банков и т.д.? Все 250 млн. сайтов? Мы бы чувствовали себя беспомощно в этом океане информации под названием интернет. Поисковики, так сказать, являются начальниками в интернете. Им подчиняются все сайты. Можно осуществить любые операции покупок, скачивания файлов, поиска информации, зная всего несколько сайтов ИПС(или даже один) Наибольшее число пользователей находят интересующую информацию, используя поисковики. Сформулировав свой запрос, человек видит через пару секунд список нужных сайтов. Облегчить жизнь, сэкономить время, силы, найти всё самое лучшее и точное-вот задачи, которые ставит перед собой ИПС, и хорошо справляется с ними. Поисковые системы имеют огромное значение, ведь веб-страниц существуют миллиарды, а известных поисковых системы не более десяти... 8. Заключение В заключении своего реферата я бы хотела обобщить все то, что сказано ранее. Информационно-поисковая система-это сложный механизм, функционирование которого является секретом фирмы. Существуют различные «хитрости», позволяющие облегчить поиск в сети, выдавая все самое-самое. Российский Яндекс популярен не только в русскоязычных странах, но и в Европе. Современный мир, заполненный Интернет-ресурсами не в состоянии функционировать без информационно- поисковых систем. Этот факт подтверждается тем, что существует около 250 млн. сайтов в интернете, но зная хотя бы один, пользователь может разобраться в этой всемирной паутине всего и обо всём. Масштабы информации с каждым годом все больше и больше. Мы живём в 21 веке, где «Кто владеет информацией, тот владеет миром». Информационно-поисковые системы являются своеобразным гидом, позволяющим нам впитывать в себя все нужное, интересное и актуальное. Мы используем ИПС, даже не задумываясь, а как без них мы бы ориентировались в интернете. Проверяя погоду, читая рецепты, гороскопы, находя маршрут пути, узнавая пробки, делая доклады, работы по иностранным языкам, мы пользуемся ИПС. Интернет продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые. 9. Библиографический список 1.http://whoyougle.ru/texts/10-search-system 2.http://www.company.yandex.ru/about/history/ 3.http://say9say.narod2.ru/10_samih_populyarnih_poiskovih_sistem/ 4.http://www.prodvizheniesite.ru/Poiskovik.html 5.http://www.metod-kopilka.ru/page-2-2-7-4.html 6.. http://startupafisha.ru/company/yandex/ 7.http://www.sembook.ru/book/poiskovye_sistemy/kratkoe_vvedenie_v_poiskovye_sistemy/ 8. Таненбаум Э. Компьютерные сети. Спб.: «Питер», 2002 9. Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989. |