[7 семестр] Расписанные вопросы к экзамену. Закономерностей. 4 Понятия информационный объект, информационное взаимодействие
Скачать 0.84 Mb.
|
21. Понятие стратегии и технологии поиска информации.Стратегия поиска - общий план (концепция) поведения пользователя для выражения и удовлетворения информационной потребности. План обусловлен характером цели и типом поиска, архитектурой БД, а также методами и средствами поиска(см.ниже) конкретной АИПС. Выбор стратегии в общем случае – оптимизационная задача. На практике это достижение компромисса между практическими потребностями и возможностями имеющихся средств. С точки зрения способа задания условия соответствия информационной потребности информационным ресурсам говорят о 2-х стратегиях: вербальной и кластерной. Вербальная –аналог функционального задания. Традиционная стратегия, ее поддерживают большинство промышленных АИПС. Отличительная черта - обязательное построение завершенного, логически и синтаксически правильного выражения, посредством которого может быть получена выдача формально релевантных запросу документов. Кластерная – отражает особенности перечислительного способа.Обобщающает понятие "документ"(или совокупность документов) до уровня запроса. Подход основывается на предположении, что документ, его фрагмент или группа документов могут рассматриваться не только как результат поиска, но и как некоторый поисковый образ. Технологии, поддерживающие кластерные стратегии, в значительной мере позволяют сократить объем просматриваемой при поиске информации.Это происходит за счет определения на основе знаний пользователя групп документов для эффективной идентификации его потребностей. Связь стратегии и типа поисковой задачи: каждому типу поиска соответствует свой тип запроса, форма его выражения, характер результата. Вербальные стратегии ориентированы на структурные методы построения запроса.Это когда ищущему известен аналог или предмет поиска хорошо определен в предметной области. Кластерные стратегии тяготеют к построению собирательного образа части предметной области, границы которой или предопределены при создании БД или определяются в процессе поиска. Технология поиска –последовательности использования в процессе взаимодействия пользователя с системой отдельных средств поиска для получения устойчивого и эффективного конечного и промежуточных результатов. Поисковые технологии унифицированы и оптимизированы в рамках конкретной АИПС. Технологии поиска объединяют два процесса: -процесс объявления пользователем информационной потребности; -процесс построения системой информационного массива. Информационный массив - множество документов, выдаваемых пользователю в ответ на поисковое требование. Технология генерации выдачи определяется архитектурой программного и информационного обеспечения конкретной системы. Выделяются два класса систем: диалоговые и пакетные. Диалоговые ориентированы на работу в реальном масштабе времени, а условие отбора по одному запросу соотносится со всеми поисковыми образами документов Пакетные:каждый поисковый образ документа (при поступлении в систему) соотносится с поисковыми образами всех запросов. Выражение запроса: непосредственного набор булевоподобного выражения; формирование булевоподобного выражения с помощью “конструктора запросов” форматно-ориентированные формы генерации “запроса по образцу”. Методы поиска – совокупность моделей и алгоритмов реализации отдельных технологических этапов (таких, как построение ПОЗ, сопоставление ПОД и ПОЗ, расширение или реформулирование запросов и.т.д) Средства поиска – комплекс ИПЯ и языков определения/управления данными, а также средства управления. Языки обеспечивают представление и структурно-семантические преобразования основных и технологических объектов:словарей, документов, совокупностей результатов поиска. Средства управления обеспечивают доступ к функциям конкретной АИПС (с помощью пользовательского интерфейса). 22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов. Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации. Поиск информации – одна из основных функций ИТ. Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Особенности поиска: сравниваются не сами объекты, а поисковые образы сам процесс поиска является неодноактным и многоитерационным Алгоритм поиска: -выборка очередного объекта из массива для выполнения сравнения с запрашиваемым; -процесс сравнения; -принятие решения о соответствии; -переход к следующему объекту или завершение процесса. Выделяют два вида поиска: -поиск целостного объекта (выдается весь документ) -поиск информации по содержанию (некоторой части содержания) Технология поиска может осуществляться по массиву двух видов: -с прямой организацией – документы расположены в произвольном порядке (по мере занесения) -с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником) Критерий смыслового соответствия(или критерий выдачи)– это правило, позволяющее решать вопрос о выдаче или не выдаче документа при организации поиска. КСС-основа алгоритма поиска информации в ИПС. Виды КСС: условие выдачи – полное вхождение ПОЗ в ПОД, т.е документ выдается, если множество дескрипторов, образующее ПОЗ полностью входит в множество дескрипторов, содержащихся в ПОД Документ выдается, если ПОД и ПОЗ совпадают частично. Если для каждого дескриптора запроса в ПОД встретился либо сам дескриптор, либо дескриптор, связанный с ним (базисными отношениями) С учетом весовых коэффициентов. Каждому информативному слову в запросе приписывается весовой коэфф.Весовые коэфф-ы в ПОЗ определяются пользователем и нормируются.Документ выдастся, если сумма весовых коэффициентов совпавших дескрипторов больше заранее установленной величины. С учетом синтаксических отношений.(такие, как объединение, пересечение). Теоретико-множественное представление. Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах. Систему можно отобразить в виде совокупности разнородных множеств и отношений между ними. Множества могут задаваться: Перечислением, например {ai}, где i=1…n Путем указания некоторого характеристического свойства А, например «множество натуральных чисел» В основе теоретико-множественных преобразований лежит принцип перехода от одного способа задания множества к другому: А= В множестве м.б вделены подмножества. Пустое множество-то, в котором на данный момент нет ни одного элемента. При использовании теоретико-множественных представлений можно вводить отношения: Множество А, дополнение множества А, объединение А и В, пересечение( на диаграммах Эйлера-Венна) 23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления. Обрабатываемые (преобразуемые) объекты (в частности и сама среда) имеют преимущественно абстрактную природу (идеальное, а не материальное происхождение). Для процесса постановки–решения задачи (как ситуации определенного выбора) характерно наличие следующих четырех компонентов: - субъект, осуществляющий выбор; - среда решения – принятые в качестве рабочих понятия, гипотезы, законы, парадигмы и т.п.; - доступные средства решения и практических действий; - возможные результаты. Типы информационных компонентов (сообщений): − фактографическая информация, фиксирующуая ситуацию (состояние взаимодействия системы со средой) как результат преобразования; − систематическую информацию, определяющую прагматические условия (принципы, законы, критерии) применения преобразования и/или построения системы. для систем управления информационными потоками (информационной деятельности) – это метаинформация: тезаурусы, классификаторы и т.д. 24.Уровневая модель информационного взаимодействия "Пользователь - АИПС". Основные этапы (общая схема) поиска информации. Начало поиска Формирование запроса Поиск Просмотр Оценка Удовлетворительно? Завершение поиска Реформулировка запроса да нет Первый уровень взаимодействия - это взаимодействие когнитивного уровня человека-оператора и поверхностного уровня компьютерной системы (интерфейса). Второй уровень - взаимодействие когнитивного уровня человека-оператора и уровня процессов и задач. |