Михайлова_НИР. Научных знаний
Скачать 445.42 Kb.
|
Цифровые библиотекиЦифровые библиотеки решают те же задачи поиска и хранения контента, что и электронныебиблиотеки, но существенно расширяют свою функциональность и определение своего контента. Во-первых, контент библиотеки становится мультимедийным. Это значит, что значениями атрибутов ее информационных объектов теперь могут выступать различные мультимедийные объекты, которые доступны для просмотра средствами самой цифровой библиотеки. В качестве мультимедийных объектов могут выступать совокупность аудио, видео, фото и текстовых материалов. Во-вторых расширяется функциональность за счет решения некоторых задач интеграции как метаданных, так и медийных объектов из внешних источников, доступных по сети. При этом формальное определение представляет собой уже набор объектов Множество Fдополняется функциями вида g:(X,a1,…,aj)→Out,где Out ⊂ R(X) и Out ⊂ R, где X – внешний источник, а множество объектов R(X) может быть описано набором атрибутов (a1,…,ak). Функции gпредназначены для решения вопросов интеграции данных из внешних библиотек. Семантические цифровые библиотекиСемантическиецифровыебиблиотекиявляются следующим этапом в эволюции библиотек и обязаны своей популярностью семантическим технологиям, которые в значительной степени повлияли на переосмысление понятия контента библиотеки и послужили толчком для расширения и улучшения функциональности библиотек. В таких библиотеках данные лучше структурированы, выделены связи между ними, улучшается поиск, появляется возможность интегрировать данные различных типов. Обеспечивается интероперабельность с другими системами, не обязательно являющимися библиотеками, так как основной задачей семантических технологий является предоставление метаданных в машиночитаемом формате. Формально семантическая цифровая библиотека – это Важную роль в определении семантических библиотек при описании их контента играют онтологии. Онтология модели контента фактически задается <R,A, I >, где множество R выступает как множество понятий онтологии, множество атрибутов A также содержит подмножество отношений между понятиями, а I –задает множество функций интерпретации, заданных на понятиях и отношениях. Таким образом, множества R, A, I задает описание структуры контента библиотеки. Основные свойства семантических библиотекОсновным свойством семантических библиотек является возможность структурирования их разнообразного контента и возможность связывания данных из разных источников, что в свою очередь, несомненно, отражается на качестве данных контента. Выделим основные свойства семантической библиотеки, которые, на наш взгляд, являются определяющими для рассматриваемой системы: семантическая библиотека представляет собой интеграционный узел для разных источников данных, которые обогащают и пополняют ее набор данных; контент библиотеки описывается на семантическом уровне, что позволяет достичь лучшего взаимодействия между источниками данных; контент библиотеки может иметь разную степень гранулярности структуры в зависимости от рассматриваемых начальных условий при построении библиотеки; семантическое описание контента и его уровень гранулярности не зависят от технических характеристик реализации информационной системы библиотеки и могут определяться вне зависимости от конкретной реализации; понятийное описание контента библиотеки поддерживается его тезаурусом, который ограничивает предметную область ресурсов библиотеки терминологически. Информационные системы в контексте семантических библиотек. Общая терминология Выделив выше модель контента семантической библиотеки и ее основные характеристики, мы отделили определяющее понятие контента семантической библиотеки от понятия реализующей библиотеку информационной системы [12, 63, 66, 116]. Такой подход позволяет наращивать функциональность системы, добавлять новые подсистемы или изменять уже имеющиеся при неизменных остальных частях. Информационная система IS задается набором подсистем F для решения задач обработки ее контента С, IS= (F,С). Тогда информационная система представляется как организация совокупности своих подсистем F = U Fiи своего контента С. Каждая из этих подсистем описывается своей предметной онтологией и тогда можно представить онтологиюинформационнойсистемыOnISинтеграцией онтологий ее подсистем и онтологии ее контента OnIS = OnF UOnС, где OnF = U OnFi- объединение онтологий подсистем, OnС = Каждый вид деятельности, поддерживаемый в рамках информационной системы, обеспечивается ее отдельной подсистемой. При разработке каждой подсистемы выделяются задачи, решаемые данной подсистемой, определяются набор и структуры данных, определяется набор пользовательских интерфейсов и граф навигации по ним. При этом набор и структура данных подсистемы определяются без привязки к конкретной предметной области. При интеграции с онтологией контента онтология подсистемы уточняется за счет встраивания понятий контента как подклассов ее понятий данных. Такой подход к интеграции онтологий носит уточняющий характер и направлен с одной стороны на расширение онтологии информационной подсистемы, а с другой стороны ограничивает ее применение рамками заданной предметной области. Приведем основные виды задач, реализующиеся в информационной системе, предназначенной для конструирования семантической библиотеки: описание контента информационной системы; реализация задач интеграции данных из внешних источников; поддержка коллекций; поиск и навигация по объектам системы; поддержка пользователей. Разбиение на подсистемы не является единственно возможным. Границы подсистем не могут быть строго определены. В системе существует область общих определяющих понятий, которые рассматриваются как принадлежащие нескольким подсистемам, в зависимости от того, какие процессы выполняются в конкретной подсистеме. Так или иначе, каждая из этих систем взаимодействует с понятиями, определяющими контент этой библиотеки. Например, в перечисленных подсистемах можно рассматривать как единую подсистему реализации задач интеграции данных из внешних и внутренних источников. С другой стороны, из подсистемы качества можно выделить отдельно систему выявления дубликатов. Это деление диктуется конкретной реализацией. Научная информация как контент семантической библиотекиПостроение обобщенной модели научной предметной области представляет подход, который делает упор на выделении таких метаданных, которые позволяют проектировать конкретные структуры данных для различных научных предметных областей и выявить общие подходы к управлению этими данными и их обработке [48, 66, 67, 71, 72, 101, 114, 134, 135]. Это позволит построить общую модель научных знаний, в рамках которой могут интегрироваться различные источники данных. Такой подход позволяет структурировать и связать различные ресурсы, извлечь из них и контекстуализировать разнообразные данные, превращая их в знания. С использованием обобщенной модели возможна реализация модели контента семантических библиотек, способной гибко настраиваться под запросы предметной области. Одной из целей обобщенного подхода является упрощение доступа и восприятия больших и сложно структурированных объемов информации пользователем [136]. Этот подход не является оптимальным для всех задач, решаемых в рамках некоторой научной предметной области, но, по крайней мере, позволяет структурировать имеющиеся знания на формальном уровне для дальнейшего использования. Критерии научности информации строго не определены и на этот счет существуют различные точки зрения. Научная информация, по ГОСТ 7.0-99 [14],: логически организованная информация, получаемая в процессе научного познания и отображающая явления и законы природы, общества и мышления. Опираясь на это определение, можно выделить несколько основных свойств, которыми в совокупности обладает научная информация: истинность, интерсубъективность и системность [15, 16]. Мы не будем претендовать на то, что знания о предметной области, описанные в соответствии с нашими предложениями, являются всеобъемлющими. Оценивать - задача экспертов, наша же задача - предоставить удобный инструмент для анализа имеющейся информации. Критерий интерсубъективности говорит о том, что у всех исследователей, изучавших одну и ту же предметную область в одних и тех же условиях, получится один и тот же результат. Мы хотим предложить такую модель организации информации о предметной области, которая является общезначимой для всех исследователей. Системность научной информации подразумевает опору на исследование разнообразных зависимостей. Спецификой такой информации является четкая структура организации научных данных в иерархические структуры, пронизанные горизонтальными связями. Как следствие, соответствие этим основным критериям обеспечивает достаточно однозначную интерпретацию научного знания различными исследователями. Основная проблема представления научной информации состоит в сложности используемых понятий и отношений между ними, и, что самое главное, они подвержены более частому изменению структур данных, что неизбежно приводит к необходимости внесения существенных доработок в уже имеющиеся решения. Говоря о научной информации, имеет смысл разделять понятия научных данных и научных ресурсов в рамках научных предметных областей. |