[7 семестр] Расписанные вопросы к экзамену. Закономерностей. 4 Понятия информационный объект, информационное взаимодействие
Скачать 0.84 Mb.
|
Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.Этапы поиска: 1) определение темы запроса, ее локализация в предметной области и формализация на уровне понятий основной и смежных областей, а также идентификация ресурса. 2)формирование, структурное и лексическое адаптирование выражения запроса, где система предоставляет вспомогательные информационные объекты (словари, тезаурусы, шаблоны и т. д.); 3)отбор документов с помощью одного из механизмов поиска по критерию, адекватному степени неопределенности информационной потребности, система предоставляет выбор механизма поиска или автоматически с помощью лексикографических словарей и проблемно-ориентированных тезаурусов нормирует и расширяет лексику запроса; 4)формирование и управление выдачей найденных документов, где система обеспечивает масштабирование пространства представления выданных документов, а также сортировку и рубрицирование или ранжирование по некоторому формальному критерию соответствия; 5)оценку результата поиска на уровне отдельного документа, где система обеспечивает возможность фиксировать значение степени соответствия запросу пользователя и использование лексики документов для непосредственной модификации выражения запроса; 6) итоговую оценку результатов поиска на уровне всего запроса или отдельных предложений с точки зрения принятия решения о завершении поискового процесса, где система позволяет количественно оценивать динамику выдач и обеспечивает возможность выборочного обращения к результатам отдельных этапов поиска или формирования проблемно-ориентированных словарей; 7) развитие процесса поиска по технологии реформулирования запроса по обратной связи по релевантности или использование каких-либо других ресурсов, например, ассоциированных БД вторичной или справочной информации, где роль системы - адекватное информирование о такого рода возможностях. 25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.Любое состояние объекта характеризуется набором атрибутов, имеющих значения в этот момент времени. Записываются они в виде записи – совокупности формализованных элементов данных. В контексте задач поиска можно сказать, что значение атрибута идентифицирует объект (можно использовать значение атрибута в качестве поискового признака). Фактографические данные можно непосредственно интерпретировать (без дополнительных комментариев). При этом способ идентификации данных через атрибуты плохо подходит для слабо структурированной информации (=связанной с объектами, имеющими умозрительную природу: категориями, понятиями, знаковыми системами). В этом случае объекты определяются опосредованно, через другие объекты, используя естественные или искусственные языки (пример – язык математики). Ключ, идентифицирующий запись единственным образом – первичный. Ключ, идентифицирующий группу записей – вторичный.Сцепленный ключ – состоящий из нескольких элементов данных.Ключ может храниться и составе записи или отдельно. Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.Вторичный ключ можно использовать, организовав инвертированный список. Каждому значению вторичного ключа будут соответствовать несколько первичных. Пример:
Недостаток индекса – он занимает дополнительную память и его надо обновлять при изменении (добавлении, удалении) записей. Инвертированный список может быть построен для любого (в т.ч. и составного) ключа. В задачах поиска существуют два способа организации данных. Первый – прямая организация массива (сначала первичные ключи, потом вторичные), второй – инвертированный список. Первый способ удобен для поиска по условию «каковы свойства указанного объекта?», а второй – «какие объекты обладают этим свойством?». В [какой то книге какого то мартина] приводится такая типология простых (атомарных) запросов: 1). А(Е) = ? Каково значение атрибута А для объекта Е? 2). А(?) = V Какие объекты имеют значение атрибута равное V? 3). ?(Е) = V Какие атрибуты объекта Е имеют значение равное V? 4). ?(Е) = ? Какие значения атрибутов имеет объект Е? 5). А(?) = ? Какие значения имеет атрибут А в наборе? 6). ?(?) = V Какие атрибуты объектов набора имеют значение равное V? В запросах типов 2, 3, 6 вместо = могут быть использованы другие операторы сравнения (>,<, не равно или другие). Запросы типа 1 выполняются поиском по «прямому» массиву: доступ к записи производится по первичному ключу. Запросы типа 2 выполняются поиском по инвертированному списку: доступ к записи(ям) производится по указателю, выбираемому из списка по значению вторичного ключа. Ответом в этих случаях будет значение атрибута или идентификатора. Запросы типа 3 имеют ответом имя атрибута. Запросы типа 2, 5, 6 относятся к нескольким атрибутам, и в этом случае могут быть построены несколько индексов, облегчающих поиск по этим ключам. Для обработки запросов 2-го типа есть три типа архитектур доступа: Системы с вторичными индексами – записи расположены в соответствии с последовательностью значений первичного ключа. Системы частично инвертированных файлов – произвольная последовательность. Первичный индекс отсутствует. Системы полностью инвертированных файлов – хранение значений разных элементов данных в разных файлах. Для ускорения поиска два набора индексов – индекс экземпляров (значений ключей) и индекс данных (инвертированный список). Такая организация характерна для документальных ИС. |