лекция по информатике. Информация и информационные системы. Основные понятия и классификации
Скачать 114.79 Kb.
|
2.3 Понятие документальной информационной системыДокументальные ИС – системы работы с документами на естественном языке – публикации и т.д. они обеспечивают анализ данных при неполном, приближенном представлении смысла. Наиболее распространенный тип ДИС – информационно–поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов на естественном языке. Информационный поиск в ИПС - некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определенную информацию, или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы. Поисковый массив – массив элементов информации, в котором производится информационный поиск. Существуют следующие основные виды информационного обеспечения в данных системах: Регламентное обслуживание в форме подготовки и издания обзорных и реферативных информаций, библиографических указателей и т.п., или обслуживание по стандартным запросам; Оповещение отдельных специалистов (абонентов) о текущих публикациях, представляющих для них потенциальный интерес путем избирательного (адресного) распределения информации (ИРИ) по профилям интересов, сформулированных потребителем, или дифференцированного обслуживания руководителей (ДОР) по мере поступления информации, необходимой для принятия решений; Ретроспективный поиск, т.е. отыскание документов, в которых находятся сведения по конкретным запросам, в массиве всех накопленных источников информации, что может осуществляться либо в форме подготовки тематических подборок, либо в оперативном режиме. Имеет место и другая классификация видов информационного обслуживания: по источнику информации, по типам документов, по направленности или адресности, по периодичности или срочности, по способу доведения документов до потребителя, по назначению, цели. Способы реализации видов и форм обслуживания зависят от вида, назначения и способа реализации конкретной ИПС. В современных условиях распространены режимы обслуживания в форме он-лайнового доступа к базам данных автоматизированных ИПС и предоставления информации на СD. Для эффективного информационного обслуживания и навигации необходимо выявить информационные потребности. Поэтому изучение запросов потребителей информации является первоочередной задачей научно – информационной деятельности. Задача эта довольно сложная, т.к. потребители как правило, не умеют четко формулировать свои потребности, и они уточняются по мере работы с получаемой информацией. Прежде всего, каждому документу, вводимому в поисковый массив, ставится в соответствие поисковый образ документа (ПОД), который представляет собой характеристику, отражающую основное смысловое содержание документа. Простейшим ПОД может являться заглавие документа, переписанное в форме перечня входящих слов. Устанавливаются правила включения в ПОД существительных в единственном числе и именительном падеже, глаголов – в неопределенной форме или в виде отглагольных существительных и т.п. правил, общих для формирования ПОД и ПОЗ – поискового образа запроса. Для реализации процедуры описания документов и запросов с помощью ПОД и ПОЗ разрабатывают информационно – поисковые языки (ИПЯ). Для сопоставления ПОД и ПОЗ разрабатывают и применяют различные критерии поиска или критерии смыслового соответствия (КСС). Точность поиска определяется точностью отображения документов и запросов с помощью их поисковых образов и степенью совпадения ПОД и ПОЗ. Поэтому возможна неполнота выдачи документов, либо, наоборот, «поисковый шум», которые представляют собой своеобразную плату за облегчение процедуры информационного поиска. Документальные ИПС в ответ на вводимые в них информационные запросы выдают оригиналы, копии или адреса хранения документов, содержащих требуемую информацию. 2.4 Информационно–поисковые языки документальной информационной системыИнформационно-поисковый аппарат включает применение естественного языка для отображения ПОД и ПОЗ, что связано о значительными трудностями, обусловленными наличием синонимов, омонимов и неоднозначностей использования терминов естественного языка. Поэтому появилась необходимость применения искусственных информационно-поисковых языков - ИПЯ. ИПЯ– является формализованной семантической системой, обеспечивающей передачу (запись) содержания документа в объеме, необходимом для целей поиска. Задача ИПЯ – перевод содержания документа в поисковое предписание или поисковый образ документа и перевод содержания запроса пользователя в поисковый образ запроса (поисковое предписание). Первоначально в качестве составляющих ИПС выделяли: Алфавит (набор буквенных и цифровых символов), Слова – формируемые из алфавита с помощью морфологических правил – морфологии; Словарь перевода, который может состоять из ключевых слов. Он может иметь сложную структуру, представлять собой тезаурус, который может включать в себя и алфавит, и слова, и словосочетания. Правила, отражающие взаимоотношения между словами документа, которые реализуются с помощью правил грамматики – синтаксиса. |