Главная страница
Навигация по странице:

  • «Сибирский институт бизнеса и информационных технологий» Письменное задание (реферат) 1 семестра Дисциплина

  • 1. Понятие информации, подходы к его определению

  • 2. Виды информации, ее свойства и характеристики

  • Классификация информации

  • 3. Поиск информации: основные понятия, виды и формы организации

  • 4. Информационно-поисковые системы

  • 6. Методы обработки результатов поиска

  • 8. Оформление результатов

  • 9. Интернет-поисковые системы

  • Список использованных источников

  • Понятие «информация». Основные пути поиска информации. Информационно-библиографическая культура. Реферат (вид работы) Понятие информация


    Скачать 57.31 Kb.
    НазваниеРеферат (вид работы) Понятие информация
    АнкорПонятие «информация». Основные пути поиска информации.
    Дата02.04.2023
    Размер57.31 Kb.
    Формат файлаdocx
    Имя файлаИнформационно-библиографическая культура.docx
    ТипРеферат
    #1032033



    Автономная некоммерческая образовательная организация высшего образования

    «Сибирский институт бизнеса и информационных технологий»

    Письменное задание (реферат)

    1 семестра

    Дисциплина: Информационно-библиографическая культура

    название дисциплины

    реферат

    (вид работы)

    Понятие «информация». Основные пути поиска информации.

    (Название темы)

    Выполнил:

    Тян Иван Русланович

    (Ф.И.О. студента)

    Прикладная информатика в экономике ИНз-1122(2)

    (направление, группа)




    Проверил(а):

    ___________________________

    (Ф.И.О. преподавателя)




    ___________________________

    (дата)

    Омск, 2023 г.

    Оглавление


    Введение 3

    1. Понятие информации, подходы к его определению 4

    2. Виды информации, ее свойства и характеристики 5

    3. Поиск информации: основные понятия, виды и формы организации 7

    4. Информационно-поисковые системы 9

    5. Организация поиска 13

    6. Методы обработки результатов поиска 14

    7. Реализация поиска 15

    8. Оформление результатов 15

    9. Интернет-поисковые системы 16

    Заключение 19

    Список использованных источников 21


    Введение


    Фундаментальной чертой цивилизации является рост производства, потребления и накопления информации во всех отраслях человеческой деятельности. Вся жизнь человека, так или иначе, связана получением, накоплением и обработкой информации. Что бы человек ни делал: читает ли он книгу, смотрит ли он телевизор, разговаривает, он постоянно и непрерывно получает и обрабатывает информацию.

    Для XXI века характерна небывалая скорость развития науки, техники и новых технологий. Так от изобретения книгопечатания (середина XV века) до изобретения радиоприемника (1895г.) прошло около 440 лет, а между изобретением радио и телевидения - около 30 лет. Разрыв во времени между изобретением транзистора и интегральной схемы составил всего 5 лет.

    В области накопления научной информации её объем начиная с XVII в. удваивался примерно каждые 10 - 15 лет. Поэтому одной из важнейших проблем человечества является лавинообразный поток информации в любой отрасли его жизнедеятельности. Подсчитано, например, что в настоящее время специалист должен тратить около 80% своего рабочего времени, чтобы уследить за всеми новыми печатными работами в его области деятельности. Увеличение информации и растущий спрос на неё обусловили появление отрасли, связанной с автоматизацией обработки информации - информатики. Но для перехода непосредственно к науке информатике, необходимо сказать о самой информации.

    Мы живём в материальном мире. Все мы непосредственно участвуем в информационном процессе. Любой информационный процесс будет происходить по следующей схеме:

    Источниками (объектами) информации являются физические тела, поля или виртуальные объекты. Источники информации проявляются в виде сигналов. Сообщением является форма представления информации в виде, понимаемом получателем. Получатель информации - человек, понимающий эту информацию или техническая система.

    Несмотря на то, что с понятием информации мы сталкиваемся ежедневно, строго и общепринятого её определения до сих пор не существует, поэтому вместо определения обычно используют понятие об информации. Понятие об информации, введённое в рамках одной научной дисциплины, может опровергаться конкретными примерами и фактами, полученными в рамках другой дисциплины.

    Для информатики как для технической науки понятие информации не может основываться на таких антропоцентрических понятиях, как знание, и не может опираться только на объективность фактов и свидетельств. Средства вычислительной техники обладают способностью обрабатывать информацию автоматически, без участия человека. Эти средства могут работать с искусственной, абстрактной и даже с ложной информацией, не имеющей объективного отражения ни в природе, ни в обществе. Итак, информация - продукт взаимодействия данных и адекватных им методов.

    В связи с этим цель работы - изучить понятие, восприятие информации и ее свойства. Для достижения этой цели нужно достичь следующих задач:

    1) рассмотреть и изучить литературу, соответствующую теме работы;

    2) дать понятие информации;

    3) изучить восприятие информации;

    4) рассмотреть свойства информации;

    5) определить основные понятия, виды и формы организации поиска информации, и ее обработки.

    1. Понятие информации, подходы к его определению


    Понятие информации является одним из самых важных и в то же время одним из самых «трудноуловимых» понятий современной науки. Отражая самые общие представления об окружающем мире, это понятие приобретает отличительные характеристики в конкретных информационных процессах, в условиях конкретной информационной среды. Именно этим объясняется отсутствие однозначного понимания, что же такое информация.

    Попутно заметим, что в науке до сих пор нет однозначного понимания и определения понятий «время», «энергия», «масса» и т.д.

    В настоящее время сформировалось три подхода к осмыслению понятия информации:

    1. Атрибутисты полагают, что информация как семантическое (смысловое) свойство материи является неотъемлемым атрибутом всех элементов и систем объективной реальности. Наиболее ярко и образно эта концепция информации выражена академиком В. М. Глушковым. Он писал, что «информацию несут не только испещренные буквами листы книги или человеческая речь, но и солнечный свет, складки горного хребта, шум водопада, шелест травы». Иными словами, информация как смысловое свойство материи создает представление о ее упорядоченности, разнообразии. Информация в этом понимании не может существовать вне материи, а значит, она существовала и будет существовать вечно.

    2. Функционалисты отрицают существование информации в неживой природе. По их мнению, информация через информационные процессы реализует функцию управления (самоуправления) в биологических, социальных и социотехнических системах, т. е. информация - это одна из функций жизни, основное отличие живого от неживого.

    3. Антропоцентристы ограничивают сферу информации главным образом социальными системами. В этом подходе информация трактуется как активная, «полезная» часть человеческих знаний, т.е. тех знаний, которые используются для ориентировки, управления и пр. Такую информацию можно понимать как содержание (смысл) сигнала, полученного системой из внешнего мира.

    Все перечисленные точки зрения существуют и используются в соответствующих областях науки: информация как семантическое свойство материи изучается в философии, физике; информация как функция управления изучается в кибернетике, физиологии, биологии; информация как содержание сигнала изучается в лингвистике, социологии, психологии.

    Информатика - «многомерная» наука. Для нее важны все аспекты понятия информации. Однако при этом она акцентирует внимание на том аспекте понятия информации, который в данный момент наиболее востребован. Например, в период стремительного развития вычислительной техники информация понималась, прежде всего, как смысл сигнала или просто как сообщение. С развитием биологических наук востребован функциональный подход к пониманию информации. В эпоху возрастания понимания всеобщей взаимосвязи явлений, фактов в окружающем мире, осознания глобальных угроз существенную роль приобрело понимание информации как семантического свойства материи.

    Все эти подходы не противоречат друг другу. Наоборот, они естественно дополняют друг друга, позволяют исследовать проблемы с разных точек зрения, многогранно, что является проявлением фундаментального общенаучного принципа дополнительности.

    Различные определения понятия «информация»

    В быту под информацией понимают сведения, которые нас интересуют. Но заинтересовать нас могут только те сведения, которые мы восприняли и осознали. Поэтому восприятие поступающих извне сигналов и их интерпретация - основа превращения этих сигналов в информацию для нас.

    В журналистике под информацией понимают не любые сообщения, а только те из них, которые обладают новизной.

    В теории связи под информацией принято понимать любую последовательность сигналов, которая хранится, передается или обрабатывается с помощью технических средств, не учитывая их смысл.

    В кибернетике под информацией понимается только та часть сообщения, которая участвует в управлении.

    2. Виды информации, ее свойства и характеристики


    Суммируя все сказанное, можно выделить следующие свойства информации, независимо от ее понимания в той или иной дисциплине:

    полнота - свойство информации исчерпывающе (для данного потребителя) характеризовать отображаемый объект или процесс;

    актуальность - способность информации соответствовать нуждам потребителя в нужный момент времени;

    достоверность - свойство информации не иметь скрытых ошибок. Достоверная информация со временем может стать недостоверной, если устареет и перестанет отражать истинное положение дел;

    доступность - свойство информации, характеризующее возможность ее получения данным потребителем;

    релевантность - способность информации соответствовать нуждам (запросам) потребителя;

    защищенность - свойство, характеризующее невозможность несанкционированного использования или изменения информации;

    эргономичность -- свойство, характеризующее удобство формы или объема информации с точки зрения данного потребителя.

    Классификация информации

    1. Информацию можно подразделить по форме представления на 2 вида:

    дискретная форма представления информации - это последовательность символов, характеризующая прерывистую, изменяющуюся величину (количество дорожно-транспортных происшествий, количество тяжких преступлений и т.п.);

    аналоговая или непрерывная форма представления информации - это величина, характеризующая процесс, не имеющий перерывов или промежутков (температура тела человека, скорость автомобиля на определенном участке пути и т.п.).

    2. По области возникновения можно выделить информацию:

    элементарную (механическую), которая отражает процессы, явления неодушевленной природы;

    биологическую, которая отражает процессы животного и растительного мира;

    социальную, которая отражает процессы человеческого общества.

    3. По способу передачи и восприятия различают следующие виды информации:

    визуальную, передаваемую видимыми образами и символами;

    аудиальную, передаваемую звуками;

    тактильную, передаваемую ощущениями;

    органолептическую, передаваемую запахами и вкусами;

    машинную, выдаваемую и воспринимаемую средствами вычислительной техники.

    4. Информацию, создаваемую и используемую человеком, по общественному назначению можно разбить на три вида:

    личную, предназначенную для конкретного человека;

    массовую, предназначенную для любого желающего ее пользоваться (общественно-политическая, научно-популярная и т.д.);

    специальную, предназначенную для использования узким кругом лиц, занимающихся решением сложных специальных задач в области науки, техники, экономики.

    5. По способам кодирования выделяют следующие типы информации:

    символьную, основанную на использовании символов - букв, цифр, знаков и т. д. Она является наиболее простой, но практически применяется только для передачи несложных сигналов о различных событиях. Примером может служить зеленый свет уличного светофора, который сообщает о возможности начала движения пешеходам или водителям автотранспорта.

    текстовую, основанную на использовании комбинаций символов. Здесь так же, как и в предыдущей форме, используются символы: буквы, цифры, математические знаки. Однако информация заложена не только в этих символах, но и в их сочетании, порядке следования. Так, слова КОТ и ТОК имеют одинаковые буквы, но содержат различную информацию. Благодаря взаимосвязи символов и отображению речи человека текстовая информация чрезвычайно удобна и широко используется в деятельности человека: книги, брошюры, журналы, различного рода документы, аудиозаписи кодируются в текстовой форме.

    графическую, основанную на использовании произвольного сочетания в пространстве графических примитивов. К этой форме относятся фотографии, схемы, чертежи, рисунки, играющие большое значение в деятельности человек.

    3. Поиск информации: основные понятия, виды и формы организации


    Поиск информации или информационный поиск представляет один из основных информационных процессов. Человечество издревле занималось им. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.

    Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

    По оценке специалистов в Интернете работает 30 и более миллионов пользователей. Из них десятки тысяч - в режиме онлайн (англ. "on-line" - интерактивный доступ в любой момент времени) и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.

    Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию. Для создания таких ИПС потребуются интеллект и знания конкретных пользователей ИПС или их посредников. Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью.

    Существуют различные толкования термина "поиск информации" или "информационный поиск".

    Термин "информационный поиск" (англ. "information retrieval") ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

    Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов. Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.

    С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.

    Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации.

    Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.

    "Поисковые системы" осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова.

    Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.

    4. Информационно-поисковые системы


    ПС с большим набором функций и возможностей обычно входят в состав СУБД и именуются информационно-поисковыми системами. Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Интернете.

    Терминологически «информационно-поисковая система» - представляет систему, предназначенную для поиска и хранения информации; пакет программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных.

    Функционирование современных ИПС основано на двух предположениях:

    1) документы, необходимые пользователю, объединены наличием некоторого признака или комбинации признаков;

    2) пользователь способен указать этот признак.

    Оба эти предположения на практике не выполняются, и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.

    Пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск. Оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, или так организовав процесс, чтобы часть результатов поиска могла использоваться для подтверждения или отрицания адекватности другой части. В то же время, для пользователей-профессионалов характерна устойчивость тематического профиля. Когда они являются «информационно-ориентированными», то им свойственно желание и способность организовать информационное пространство проблемы. Это означает, что пользователь создаёт по существу новый, «самостоятельный» проблемно-ориентированный, индивидуально обновляемый и пополняемый ИР, включающий помимо подборок документов также и метаинформацию, например, словари специальной терминологии, классификаторы предметных областей, описания ресурсов и т.д.

    ИПС делятся на: традиционные (ручные, механические, электромеханические) и автоматизированные (электронные).

    Автоматизированные ИПС (АИПС), используют компьютерные программно-технические средства и технологии и предназначаются для нахождения и выдачи пользователям информации по заданным критериям. Определяющими для понимания методов автоматизации поиска являются два следующих фактора:

    1) сравниваются не сами объекты, а описания - так называемые «поисковые образы»;

    2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций.

    Данные в АИПС вводятся на основе специально разрабатываемых форматов ввода. Все сведения об одном объекте в ИПС представляются в виде систематизированных данных, образующих одну строку таблицы, и называются записью. При этом, если ИПС представляет электронный каталог библиотеки, то любое библиографическое описание (БО) документа в нём — это одна запись, состоящая из полей, равных количеству элементов БО. Совокупность записей образует БД, которая, как правило, хранится в одном файле. Совокупность БД, объединенных одной СУБД, образует банк данных.

    Поскольку АИПС инструмент, используемый человеком при поиске (а не интеллектуальным автомат для поиска информации - готовых решений задач основной деятельности), эффективность её использования зависит от того, насколько хорошо человек знает природу операционных объектов и свойства инструмента, посредством которого он работает с этими объектами.

    Информационный поиск подразумевает использование определённых стратегий, методов, механизмов и средств. Поведение пользователя, осуществляющего управление процессом поиска, определяется не только информационной потребностью, но и инструментальным разнообразием системы - технологиями и средствами, предоставляемыми системой.

    Стратегия поиска - общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными «стратегическими» решениями - архитектурой БД, методами и средствами поиска в конкретной АИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значительной степени он определяется искусством достижения компромисса между практическими потребностями и возможностями имеющихся средств.

    Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса (ПОЗ), отбора документов (сопоставление поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.

    Поисковый образ запроса - записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.

    Методы поиска, т.е. выделение подмножества документов, потенциально содержащих описание решения задачи отбора документов (ОД), являются отражением процесса нахождения решения и зависят от характера задачи и предметной области. Рассматривая поиск как итеративный процесс, методы сокращения пространства перебора (просматриваемого подмножества) образуют по существу методологическую основу стратегии поиска и могут быть разделены на следующие классы - методы поиска в:

    1) одном пространстве (обычно, тематическом);

    2) иерархически упорядоченном пространстве;

    3) альтернативных пространствах;

    4) динамическом (изменяющемся в процессе поиска) пространстве.

    Реализуемый метод построения ПОЗа должен обеспечивать эффективные способы построения запроса для достижения целей различного типа.

    Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на поисковый запрос.

    Средства поиска, с одной стороны, - взаимозависимый комплекс информационно-поисковых языков (ИПЯ) и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов конкретной АИПС.

    Навигация как реализация процесса поиска по запросу в выбранной БД - целенаправленная, определяемая стратегией, последовательность использования методов, средств и технологий конкретной АИПС для получения и оценки результата.

    Средства навигации позволяют пользователю осуществлять управление процессом поиска. Они предоставляются пользователю в виде интерфейса, позволяющего организовать более или менее эффективный процесс взаимодействия с БД. При этом «дружественность» интерфейса характеризуется не только эргономичностью и понятностью, но и вариантностью выбора операционных объектов.

    Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. Так как пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, то оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь лишь на внешних оценках или на промежуточных результатах и обобщениях, сопоставляя их, например, с предыдущими.

    Процесс поиска можно представить в виде следующих основных компонент:

    1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;

    2) проведение поиска в одной или нескольких поисковых системах;

    3) обзор полученных результатов (ссылок);

    4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;

    5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

    Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.

    По используемым поисковым технологиям ИС можно разбить на 4 категории:

    1. Тематические каталоги;

    2. Специализированные каталоги (онлайновые справочники);

    3. Поисковые машины (полнотекстовый поиск);

    4. Средства метапоиска.

    В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.

    Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).

    Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.

    Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИПС «AltaVista» более 56 млн. URL-адресов.

    При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и «персональные программы поиска», позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).

    Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.

    ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их «релевантности», то есть близости к введенному пользователем запросу. Критериев такой близости много и выявление близких «по смыслу» к запросу документов не решает проблемы получения информации при отсутствии релевантного документа. Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.

    ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.

    5. Организация поиска


    Предлагается процедуру поиска необходимой информации разделить на девять основных этапов:

    • Определение области знаний;

    • Выбор типа и источников данных;

    • Сбор материалов необходимых для наполнения информационной модели;

    • Отбор наиболее полезной информации;

    • Выбор метода обработки информации (классификация, кластеризация, регрессионный анализ и т.д.);

    • Выбор алгоритма поиска закономерностей;

    • Поиск закономерностей, формальных правил и структурных связей в собранной информации;

    • Творческая интерпретация полученных результатов;

    • Интеграция извлеченных "знаний".

    Для проведения поиска первоначально на компьютере пользователя загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД. Первоначально следует определиться с видом поиска (простой, расширенный и т.д.). Затем с набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно или несколько полей. В последнем случае это обычно поля: автора, заглавия (названия), временного периода, вида документа, ключевых слов, рубрик и др. При формировании запроса практически все системы позволяют использовать логические элементы «И», «ИЛИ», «НЕТ».

    Технологии поиска информации

    Поисковые средства и технологии, используемые для реализации информационных потребностей, определяются типом и состоянием решаемой пользователем задачи основной деятельности: соотношением его знания и незнания об исследуемом объекте. Кроме того, процесс взаимодействия пользователя с системой определяется уровнем знания пользователем содержания ресурса (полноты представления, достоверности источника и т.д.) и функциональных возможностей системы как инструмента. В целом эти факторы обычно сводятся к понятию «профессионализма» - информационного (подготовленный/неподготовленный пользователь) и предметного (профессионал/непрофессионал) «профессионализма».

    Процесс поиска информации обычно носит эмпирический характер. Он представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.

    Обычно пользователь не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, поэтому оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, или организовав процесс так, чтобы часть результатов поиска могла использоваться для подтверждения или отрицания адекватности другой части.

    Операционными объектами, непосредственно участвующими во взаимодействии пользователей с поисковой системой являются поисковый образ документа (ПОД) и ПОЗ, соответствие которых устанавливается поисковым механизмом АИПС на формальном уровне. Адекватность образа действительному содержанию документа определяется качеством процесса свертки информации и уровнем знания субъектом средств отражения - концептуальной схемы предметной области и возможностей ИПЯ.

    Поисковый образ документа - описание документа, выраженное средствами ИПЯ и характеризующее основное смысловое содержание или какие-либо другие признаки этого документа, необходимые для его поиска по запросу.

    Большинство ПС изначально предлагают пользователям либо БО, либо ссылки на полные или частичные документы, их описание и другое, хранящиеся в различных АИПС. Современные ПС позволяют определиться и указать какой и в каком виде источник информации интересует пользователя.

    6. Методы обработки результатов поиска


    По характеру преобразований (в контексте дальнейшего использования результатов обработки) методы обработки результатов поиска можно условно разделить на две группы:

    1. Структурно-форматные преобразования;

    2. Структурно-семантические преобразования (информационно-аналитические, логико-семантические).

    7. Реализация поиска


    Что обычно ищут в Интернете: персональные данные об индивидуумах и организациях; различные адресные данные; конкретные материалы (статьи, книги, фотографии, справочные данные, программное обеспечение и др.) в том числе место их хранения; где и сколько стоят те или иные материалы, услуги, продукты и т.п.; информационные сайты и порталы и др.

    Общепринята организация поиска по начальным фрагментам слова (поиск с усечением справа), например, вместо слова «библиотечный» можно ввести его фрагмент «библиоте*». При этом будут найдены документы, в которых содержится не только слово "библиотечный", но и "библиотека", «библиотекарь», «бибилотековедение» и др. В каждом случае пользователь должен представлять, что именно он хочет найти, так как в предложенном ему варианте будет найдено гораздо большее количество документов, чем при задании данного слова полностью (без усечения). В подобном случае возможно в полученном массиве информации провести уточняющий поиск и в результате получить более релевантные и пертинентные данные.

    8. Оформление результатов


    С точки зрения ИПС результат поиска в ней есть совокупность (подмножество) найденных документов или ссылок на них. Обычно он представляется пользователю в виде списка. То есть простейшей выходной формой в данном случае будет список ссылок в виде полных или частичных БО, найденных ИР. Такой список может быть тут же распечатан или послан на какой-либо адрес электронной почты, если такая возможность предоставляется ИПС и пользователь подключен к Интернету.

    Графические и полнотекстовые ЭИР могут предлагаться пользователю только для просмотра, для копирования в различных форматах и масштабах, причём полностью или частично. Графические ИР обычно существуют в общепринятых форматах типа: JPG, GIFF, TIFF, BMP и др., а для текстовых материалов обычно используют текстовые форматы TXT, DOC и др., HTML и PDF - фактически графический формат, в котором могут сохраняться как текстовые, так и графические данные.

    Полученные в результате поиска документы сохраняют.

    Критерии оценки поиска

    Критерием результата поиска является получение пользователем списка документов, одного документа или их частей, максимально удовлетворяющего его потребностям, сформулированным в поисковом запросе. В ИПС принято формировать список полученных в результате поиска документов по их релевантности. Различают критерии смыслового и формального соответствия между поисковым предписанием и выдаваемым документом.

    Полнота и точность поиска являются взаимосвязанными показателями. Увеличение одного из них ведёт к снижению другого. В современных ИПС при сбалансированном поиске их значения составляет примерно 70%. Следует учитывать ситуацию, при которой список выданных поисковой системой ссылок содержит несколько, а порой и десятки разных адресов с одним и тем же текстом. Подобные ссылки характеризуются как дубликаты. Из них, при подсчёте коэффициентов учитывается только один документ.

    9. Интернет-поисковые системы


    Для получения информации в среде Интернета создаются специальные поисковые системы. Как правило, они общедоступны и обслуживают пользователей в любой точке планеты, где имеется возможность работы с Интернетом. Непосредственно для поиска используются поисковые машины, число которых в мире исчисляется несколькими сотнями. Они ориентируются на определенные типы запросов или их сочетание (библиографический, адресный, фактографический, тематический и др.). Кроме того, бывают полнотекстовые, смешанные и другие поисковые машины.

    Для проведения поиска в Интернете (в WWW) функционирует множество сайтов и поисковых систем, поэтому необходимо не только ориентироваться в таких системах, но и уметь осуществлять в них эффективный поиск, то есть использовать соответствующие технологии.

    Технология поиска означает совокупность правил и процедур, в результате выполнения которых пользователь получает ИР. При поиске в Интернете рекомендуется обращать внимание на две составляющие: полноту (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно соответствие найденных материалам этим критериям называют релевантностью, то есть соответствием ответа вопросу (запросу).

    Поисковые системы характеризуются также временем выполнения поиска, интерфейсом, предоставляемым пользователю и видом отображаемых результатов. При выборе поисковых систем обращают внимание на такие их параметры, как охват и глубина. Под охватом понимается объём базы поисковой машины, измеряемый тремя показателями: общим объёмом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается - существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.

    Поисковые машины используют общие принципы работы, ориентированные на выполнение двух основных функций. Первая функция реализуется программой-роботом, автоматически просматривающей различные сервера в Интернете. Находя новые или изменившиеся документы, она осуществляет их индексацию и передаёт на базовый компьютер поисковой машины. "Робот" - автоматизированный браузер, загружающий веб-страницу, изучающий её и, при необходимости, переходящим к одной из её гиперсвязей. Когда ему попадается страница, не содержащая связей, робот возвращается на одну-две ступени назад и переходит по адресу, указанному в одной из обнаруженных ранее связей. Запущенный робот проходит огромные расстояния в среде Интернета (киберпространстве), ориентируясь на развитие веб-сети и изменяя в соответствии с этим свои маршруты. Индексирующие роботы обрабатывают лишь HTML-файлы, игнорируя изображения и другие мультимедийные файлы. Они могут: обнаруживать связи с уже несуществующими страницами; устанавливать связь с наиболее популярными узлами, подсчитывая количество ссылок на них в других веб-страницах; регистрировать веб-страницы для оценки роста системы и др. Чаще всего роботы просматривают сервера самостоятельно, находя новые внешние ссылки в уже обследованных документах. Вторая функция заключается в обработке выявленных документов. При этом учитывается все содержание страниц (не только полный текст, но и наличие иллюстраций, аудио и видео файлов, Java-приложений). Индексации подвергаются все слова в документе, что дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том, какое слово, сколько раз, в каком документе и на каком сервере употребляется, составляют БД, к которой собственно и обращаются пользователи, вводя в поисковую строку ПОЗ (сочетания ключевых слов). Выдача результатов осуществляется с помощью специальной подсистемы, производящей интеллектуальное ранжирование результатов. В своих расчетах она опирается на местоположение термина, частоту его повторения в тексте, процентное соотношение данного термина с остальным текстом на данной странице и другие параметры, характеризующие возможности конкретной поисковой машины.

    «Роботы» имеют ряд разновидностей, одной из которых является «паук». Он непрерывно «ползает по сети», переходя с одной веб-страницы к другой с целью сбора статистических данных о самой «паутине»(Web) и (или) формирования некоторой БД с индексами содержимого веб.

    Автоматизированные агенты «спайдеры» регулярно сканируют веб-страницы и актуализируют БД адресов (гиперссылки), средства индексирования информации, расположенные по указанным адресам. Полученные индексы используются для быстрого и эффективного поиска по набору терминов, задаваемых пользователем.

    В разных системах эта цель достигается различным образом. Одни посылают «агентов» на каждую попадающуюся веб-страницу, индексируя все встречающиеся слова. Другие сначала анализируют БД адресов, определяя наиболее популярные (обычно подсчитывается число имеющихся ссылок на них). Именно эти веб-страницы в различной степени индексируются (только заголовки веб-страниц и ссылки, включая автоматическое аннотирование документов или весь текст).

    Все чаще применяются «интеллектуальные агенты» - небольшие программы, обладающие способностью самообучаться, и действовать самостоятельно от имени своего владельца. Имея связь с компьютером пользователя, они выступают в роли персональных помощников, выполняющих ряд задач с применением знаний о потребностях и интересах пользователя. Интеллектуальные роботы-агенты ведут самостоятельный поиск в сети по собственным уникальным алгоритмам. Некоторые из них не только просматривают ключевые слова, но и осуществляют в Интернете семантический анализ информации, выявляя степень ее смыслового соответствия поставленной задаче.

    К отечественным поисковым машинам относятся: Апорт, Rambler, Яндех, Русская машина поиска, Новый русский поиск, и др.

    Все эти поисковые машины позволяют по ключевым словам, тематическим рубрикам и даже отдельным буквам оперативно находить в сети, например, все или почти все тексты, где эти слова присутствуют. При этом пользователю сообщаются адреса сайтов, где найденные ИР постоянно присутствуют. Однако ни одна из них не имеет подавляющих преимуществ перед другими. Для проведения надежного поиска по сложным запросам специалисты рекомендуют использовать последовательно или параллельно (одновременно) различные ИПС.

    Полнотекстовая поисковая машина индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к картинкам и т.д.). Некоторые машины умеют искать словосочетания или слова на заданном расстоянии, что часто бывает важно для получения разумного результата.

    Несмотря на общие принципы построения, поисковые системы отличаются тематикой, ее объемом, классификацией и интерфейсами. Для удобства перемещения (навигации) по имеющимся на поисковых машинах разделам некоторые из них используют специальный раздел "Карта".

    При проведении поиска поисковые серверы обычно используют данные, хранящиеся в веб-страницах в тегах метаданных: (title), (meta name=”keywords”) и (meta name=”description”). Формируя свои страницы, следует отражать в этих тегах сведения о назначении сайта и его тематике.

    При этом необходимо знать, что чем меньше количество ключевых слов включено в эти теги, тем с большей частотой они могут встречаться в текстах страниц сайта и, следовательно, тем выше их релевантность. Оптимальным считается частота таких слов не более 5%. Ключевых слов должно быть не очень много, они в большей степени должны состоять из одного или двух слов, образуя наиболее употребляемые термины. Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу с точки зрения поисковых машин.

    Полноту и точность ответа пользователь получает в зависимости от точности сформулированного им запроса.

    Простые запросы в виде отдельных достаточно распространенных терминов приводят к извлечению тысяч (сотен тысяч) документов, абсолютное большинство которых пользователю не требуется (информационный шум).

    Важным аспектом также является возможность таких систем поддерживать многоязычность, то есть способность обрабатывать запросы на различных языках. Пользователям предлагаются двуязычные словари, электронный переводчик и др. Кроме того, появились системы, осуществляющие мгновенный перевод информационных ресурсов, найденных пользователем в Интернет и копируемых на его компьютер.

    Актуальным является использование машиночитаемых тезаурусов. Создаются системы, позволяющие эффективно вести поиск в полнотекстовых БД. Они базируются на использовании технологий синтаксического и морфологического анализа текста (разбивка на элементы, распознаваемые программой) и оперативной обработки текстов на естественных языках.

    Обычно поиск в полнотекстовых БД осуществляется с использованием морфологических анализаторов (как правило, русских и английских), позволяющих автоматически находить существующие словоформы по фрагменту слова, слову, фразе, даже если в словах запроса присутствуют некоторые опечатки.

    Важность проблемы информационного поиска в Интернете породила целую отрасль, задача которой заключается в том, чтобы помочь пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые инструменты. Условно их можно разделить на поисковые средства справочного типа или просто справочники и поисковые системы в чистом виде.

    Увеличение числа поисковых систем в Интернете обусловило появление «метапоисковых систем». Они дают возможность пользователю одновременно в едином пользовательском интерфейсе, используя индексы обычных поисковых систем, работать с несколькими БД. Пока еще «метапоисковые системы» не позволяют реализовать все возможности отдельных поисковых систем, но в большинстве своем он обладают существенными быстродействием и степенью охвата Web-пространства, что определяет их все более возрастающие значение и популярность.

    Заключение


    Это известная поговорка, что тот, кто владеет информацией, владеет миром. Другое послание стоит больше, чем жизнь.

    Современный мир характеризуется такой интересной тенденцией, как постоянное повышение роли информации.

    Информация - это совокупность информации, подлежащая передаче, хранению, обработке; это мера устранения неопределенности, неосведомленности, незнания об определенном явлении, процессе, событии.

    В прошлом доступ к информации был ограничен отдельными лицами и группами лиц. Однако в современном мире информация стала универсальной. Можно сказать, что общая информатизация является одним из важнейших направлений глобализации.

    Передача информации – очень необходимая вещь для каждого человека и всего человечества в целом. Информатизация общества в настоящее время достигает новых вершин. Это связано с возникновением новых современных информационных технологий, позволяющих человеку увеличивать объемы обрабатываемой и передаваемой информации. Главным предметом обработки и передачи информации является персональный компьютер. Все чаще передача информации между различными организациями или юридическими лицами осуществляется через локальные или глобальные компьютерные сети, что заставляет общество все глубже изучать этапы и способы передачи информации.

    Именно потому, что информация играет ведущую роль, она используется как оружие в современном мире. Информационное противостояние происходит во всех направлениях, потому что кто бы ни владел информацией, он доминирует в мире.

    Список использованных источников




    1. Информатика. Базовый курс: Учебник для вузов/ Под ред. С.В. Симоновича. – СПб.: Питер, 2014. – 640 с.

    2. Информатика. Базовый курс. Учебник для вузов /Под ред. Симоновича С.В. - СПб.: Питер. - 2014. - 640 с.

    3. Практикум по информатике/ А.А.Землянский, Г.А.Кретова, Ю.Р. Стратонович, Е.А. Яшкова; Под ред. А.А.Землянского. – М.: КолосС, 2014. – 384 с.

    4. Рудикова Л.В. Microsoft Excel для студента. – СПб.: БХВ-Петербург, 2014. – 368 с.

    5. Саймон Дж. Анализ данных в Excel. – М.: Издательский дом «Вильямс», 2014. – 528 с.

    6. Семашко Г.Л., Салтыков А.И. Программирование на языке Паскаль - М.: Наука, 2014. - 128 с.

    7. Фандрова Л.П., Шамсутдинова Т.М. Обработка табличных данных средствами электронных таблиц для анализа задач АПК: Учеб. пособие. - Уфа: БГАУ, 2014. - 90 с.

    8. Фаронов В.В. Турбо Паскаль 7.0. Начальный курс. - М.: Нолидж. - 2014. - 576 с.


    написать администратору сайта