Исследовательская работа по информатике. Поиск и фильтрация информации в реалиях современного интернета
Скачать 1.47 Mb.
|
Муниципальное Бюджетное Общеобразовательное Учреждение ИССЛЕДОВАТЕЛЬСКИЙ ПРОЕКТ на тему: «Поиск и фильтрация информации в реалиях современного интернета» Выполнили ученики: Руководитель: Ф.И.О.______________________________________________________________________________ Работа допущена к защите «_____» ________ 201____г. Пр.№ от_________ Подпись руководителя проекта ____________________(__________________) 2021 СОДЕРЖАНИЕ
ПАСПОРТ ПРОЕКТА
Введение. Каждый день мы потребляем огромное количество информации, «скроля» ленты социальных сетей или же просматривая разнообразные видео на «YouTube». Еще совсем недавно люди и мечтать о чем-то подобном не могли, а теперь это доступно каждому. За всей этой информацией мы совершенно забываем, каковы могут быть последствия ее бездумного потребления. Так, например, перегруженность информацией может привести к синдрому информационной усталости. Кроме того, у современных людей, особенно у молодежи, появляются серьезные проблемы с усидчивостью и усвоением этой самой информации. Конечно, это, безусловно, серьезные проблемы, которые надо решать, но более серьезной проблемой мы считаем то, что думающих людей становится все меньше Информация, которую мы поглощаем, крайне важна, причем важно как количество потребляемой информации, так и качество. ЦЕЛЬ: 1. Помочь пользователю отличать качественную информацию от некачественной 2. Обозначить положения современных источников информации ( ТВ, интернет) на площадке информации ОБЪЕКТ ИССЛЕДОВАНИЯ: 1. Поисковые системы 2. Компьютерные технологии ЗАДАЧИ: 1. Подробно объяснить все тонкости поиска информации 2. Создание памятки неопытному пользователю ГИПОТЕЗА: «Поиск информации собственноручно, является наиболее плодотворным» АКТУАЛЬНОСТЬ: Тема на сегодняшний момент времени имеет огромное значение для жизни общества. Тенденции развития цивилизации позволяют говорить о возрастающей роли информации. Информационная революция, которую сейчас переживает общество, ставит своею целью создание глобальной информационной структуры, поэтому разнообразие информационных материалов чрезвычайно стало велико. Но возникновение препятствий на пути удовлетворения информационной потребности связано с причиной неумения выстроить информационный поиск адекватной информационной задаче, в результате чего возникает информационный дефицит. Поэтому поиск и фильтрация информации позволяют потребителю информации быстро и эффективно найти необходимую информацию. Основная часть: 2.1. Какие источники информации актуальны в наши дни В наши дни мы считаем наиболее правдивым и актуальным самый передовой источник, которым пользуются все возрастные группы людей. Конечно же, речь идёт о сети Интернет. Для того, чтобы найти нужную информацию в сети Интернет необходимо воспользоваться специальными поисковыми системами. Разные поисковые системы отличаются друг от друга деталями, но не общими принципами. Например: Google - это современный мощный поисковик, он остается исключительно поисковым узлом. Эта система быстро реагирует на запросы и снабжена привлекательным интерфейсом. Yandex - самый лучший каталог русского интернета и поисковых роботов. Rambler – одна из самых старых поисковых систем. Она могла стать самой популярной в Рунете, но этого не произошло. Сейчас этот поисковик и не поисковик в общем-то, а несколько сервисов, которые сделаны на движке Yandex. 2.2. Каким образом фильтровать источники информации Любую информацию, которую вы получаете, или собираетесь получить пропустите через несколько фильтров, это довольно просто, и займет совсем немного времени: Экспертность. Является ли этот человек экспертом, в той теме, о которой говорит? Стоит ли прислушиваться к его мнению? Заинтересованность и мотивы. Есть ли у вашего собеседника личный интерес в том, что бы вы его послушали, или это просто дружеский совет, и он делится с вами информацией? Полезность и важность. Насколько эта информация ценна и полезна лично для вас? Сможете ли вы применить ее в ближайшее время, и способствует ли она достижению ваших целей? Безусловно, слушать о колонизации Марса или подготовке космонавтов интересно, но вряд ли вам это так уж необходимо в ближайшее время, если вы не специалист в этой области. Целостность и порядок. Насколько информация, которую вы воспринимаете, организована и систематизирована. Если это обрывки чьих-то знаний, да еще и не совсем понятные, то лучше обратиться к первоисточнику. Избыточность. Мало информации - плохо, много - хорошо. Но если ее слишком много, то есть риск потратить кучу времени только на ее изучение, а не на применение. Избыточность информации снижает ее ценность, особенно сейчас, в информационном обществе 21 века. Таким образом, чтобы получить качественную информацию, необходимо сформулировать цели, определить потребности. 2.3. Каким образом формировать собственное видение проблемы Наиболее важные этапы технологии формирования видения проблемы могут быть представлены в следующей последовательности: • получение информации; • анализ; • формирование предварительного видения путей развития; • формирование приоритетных направлений развития, целей и проблем; • оценка реализуемости приоритетных направлений развития; • определение кривых неопределенности и риска; • формирование углубленного видения путей развития 2.4. Средства упрощения Alexa Traffic Rank (рис.1) – официальное расширение проекта alexa.com. Позволяет просматривать данные о выбранном сайте. Расширение весьма функциональное: в нем можно не только узнать рейтинг, но и установить, как именно сайт находят в поиске, позволяет просматривать похожие страницы благодаря ссылкам по теме. Рисунок 1 – Интерфейс расширения Alexa Traffic Rank Yandex Wordstat Assistant (рис.2) – С этим расширением подбирать слова становится проще: не нужно копировать их вручную. Рисунок 2 – Интерфейс расширения Yandex Wordstat Assistant Search the current site (рис. 3-4) позволяет за считанные секунды производить поиск на сайте по выбранной ключевой фразе. Рисунок 3 – Интерфейс плагина Search the current site (нач.) Рисунок 4 - Интерфейс плагина Search the current site (прод.) 3 Памятки. 1. Как найти точную фразу или форму слова 9 правил поиска в GOOGLE С помощью оператора ” “. Заключите фразу или слово в кавычки, и Google будет искать веб-страницы, где есть ровно такая фраза (форма слова). Пример: [«я к вам пишу»]; 2. Как найти цитату, в которой пропущено слово Забыли слово в цитате? Возьмите всю цитату в кавычки, а вместо пропущенного слова поставьте звездочку *. Цитата найдется вместе с забытым словом. Пример: [«ночь улица * аптека»]; 3. Как найти любые из нескольких слов Просто перечислите все подходящие варианты через вертикальный слеш: |. Google будет искать документы с любым из этих слов. Пример: [ананасы | рябчики | шампанское] [дачные участки (Рублевское | Киевское | Минское) шоссе]; 4. Как найти слова в пределах одного предложения Используйте оператор с красивым именем «амперсанд» — &. Если соединить слова амперсандом, Google найдет документы, где эти слова стоят в одном предложении. Пример: [памятник Пушкину & Псков]; 5. Как найти документ, содержащий определённое слово Поставьте перед нужным словом плюс, не отделяя его от слова пробелом. В запрос можно включить несколько обязательных слов. Пример: [Памятник Шолохову +бульвар]; 6. Как исключить слово из поиска Поставьте минус перед словом, которое вы не хотите видеть в ответах. Так можно исключить даже несколько слов: Пример: [мумий тролль мультфильм - рок - Лагутенко] [схемы вязания спицами - купить]; 7. Как искать на определенном сайте Для этого подойдет оператор site. Он позволяет прямо в запросе указать сайт, на котором нужно искать. Только обязательно поставьте после site двоеточие. Пример: [конституция рф site:consultant(точка)ru] [маяковский окна site:lib(точка)ru]; 8. Как искать документы определенного типа Вам нужен оператор mime. Поставьте в запросе mime, двоеточие и затем тип документа, который вам нужен. Например, pdf или doc. Пример: [заявление на загранпаспорт mime:pdf]; 9. Как искать на сайтах на определенном языке С помощью оператора lang. После lang нужно поставить двоеточие и написать, на каком языке вам нужны документы. Если это русский язык, то нужно указать ru, если украинский — ua. Белорусский язык обозначается как be, английский — en, французский — fr. Заключение. Делая общий вывод по теме работы можно сказать, что самое главное для самостоятельного поиска информации - это знать методы и способы поиска информации. Сеть интернет дают возможности быстрого и эффективного поиска. Практическая часть В нашей практической части мы с вами разберем этапы работы поисковика и создадим 2 программы: поиск минимального и максимального элемента в массиве. Так как наша тема весьма сложна для рядовых пользователей, то программы не будут представлять из себя поисковики, а имитировать некоторые этапы его работы. Для начала немного теории: Работу поисковика можно поделить на 3 шага: Поиск новых страниц. Индексация. Определение релевантности (степени соответствия нуждам) данных. Разберем каждый шаг отдельно. Поиск новых страниц и сайтов Работу выполняет так называемый «паук». Он ищет новые сайты и вносит их адреса в базу данных. Найти новый сайт он сможет если на него ссылается какой-нибудь сайт, который уже есть в базе данных. Во время очередного обновления базы, поисковик заметит новую ссылку и заинтересуется новым ресурсом. Идет он от главной страницы сайта по всем разделам, карточкам товаров, рубрикам. Как только сканирование завершено, паук уходит к следующему ресурсу. Ускорить работу и "прикормить" паука можно специальными расширениями, которые устанавливаются на сайт. Так, существует файл Robots.txt и специальные карты Sitemap.xml. По их установке есть отдельные инструкции для каждой платформы. Индексация Паук собрал все сведения о страницах в базу данных. Теперь ее нужно отсортировать, проиндексировать. Этот процесс проходит практически одновременно с первым. В ходе индексации оценивается качество текстов и изображений, отсеиваются неуникальные и бесполезные материалы. Также робот учитывает время загрузки сайта, его ссылочный профиль и еще множество факторов. Релевантность Сайты сортируются в базе данных по ключевым запросам. Поисковые роботы оценивают, насколько близка информация с ресурса к запросам пользователя. Теперь мы представим вам текст наших программ: ПОИСКА МАКСИМАЛЬНОГО ЗНАЧЕНИЯ program ashihmmin; var a: array[1..5] of integer; i,max:integer; begin for i:= 1 to 5 do read(a[i]); max:= a[1]; for i:= 2 to 5 do if ( a[i] > max ) then max:= a[i]; writeln(max); end. ПОИСКА МИНИМАЛЬНОГО ЗНАЧЕНИЯ program chetirkin; var a: array[1..5] of integer; i,min:integer; begin for i:= 1 to 5 do read(a[i]); min:= a[1]; for i:= 2 to 5 do if ( a[i] < min ) then min:= a[i]; writeln(min); end. Объяснение программ Поиск максимального элемента в массиве массив содержит в себе упорядоченные элементы данных , которые имеют свои значения и адреса. Условие : С клавиатуры вводятся 5 целых чисел , требуется найти наибольший элемент и вывести его на экран. В блоке var объявляем массив "а". Диапазон индексов от 1 до 5 , так как максимальное количество введенных чисел = 5 ( исходя из условия задачи ). Тип переменных integer ( вводятся целые числа ). Также нам понадобятся ещё две переменные "i" и "max". Переменная i будет играть роль счетчика для цикла , а переменная max будет хранить в себе максимальное значение элемента в массиве. В начале программы создаем цикл , который будет заносить значения вводимые с клавиатуры в наш массив. Далее присваиваем переменной max значения первого элемента массива. Возможно у вас возникает вопрос для чего это делается ? ведь первый элемент массива может и не быть наибольшим , более того , он может быть наименьшим. Это делается для того , чтобы иметь "точку отправления" , с которой мы будем сравнивать все остальные элементы в массиве. В следующем цикле мы будем проверять все элементы в массиве ( из условия 5 ). Проверять нужно все элементы массива , так как мы не знаем где находится наибольший. Но начинать мы будем со 2 , так как первый элемент уже занесен в максимум и сравнивать одинаковые числа не имеет смысла. Во время сравнения двух элементов max и a[i] выполняется условие ( a[i] > max ). Если условие истинно ( какой-либо элемент массива больше max ) , то переменной max присваивается значение этого элемента ( a[i] ). При дальнейших сравнениях в массиве , не найдены элементы большие 17 , поэтому max остается неизменным. Поиск минимального элемента в массиве Условие : С клавиатуры вводятся 5 целых чисел , требуется найти наименьший элемент ( наименьшее число ) и вывести его на экран. алгоритм поиска минимального элемента массива почти полностью аналогичен алгоритму поиска максимального. Отличие заключается только в условии внутри второго цикла. Результаты выполнения программ Максимальное знач. Минимальное знач. Итоги В ходе выполнения практический части мы выяснили каким образом мы можем связать имеющиеся программы с темой исследования. Программы могут послужить моделью поиска новых страниц, а так же моделью релевантности, тк программа удовлетворяет наши запросы с помощью фильтрации. Источники. 2. https://habr.com/ru/post/355120/ 3. https://zen.yandex.ru/media/id/5c8b8aa2b5902c00b0e425e3/top10-brauzernyh-rasshirenii-dlia-seooptimizacii-5d1b73a9d616d900ad14e2df 4. https://www.sites.google.com/site/metodyblokirovkinezelanojinfor/sredstva-i-metody-filtracii-kontenta-v-internete 5. https://hr-portal.ru/article/kak-nauchitsya-filtrovat-informaciyu 6. https://uniofweb.ru/wiki/poiskovye_sistemy/ 7.http://mypascal.ucoz.ru/news/poisk_ehlementa_v_massive_paskal/2014-01-17-7 8.https://zen.yandex.ru/media/id/5dca5c0e9f1ed62dfcea2060/posto-i-poniatno-o-tom-kak-rabotaet-poiskovik-5ddcaf53b01a39287235c955 |