Михайлова_НИР. Научных знаний
Скачать 445.42 Kb.
|
Построение онтологии семантической библиотеки научного пространства знанийОписание онтологии научного пространства знаний может быть представлено с точки зрения двух ортогональных подходов: вводятся термины, характерные для рассматриваемой научной предметной области, соединенные различными связями как иерархическими, так и горизонтальными; вводится набор определений, который на более абстрактном уровне описывает множества объектов научной предметной области, фактически задавая структуру их описания и отношений между ними. В различных исследованиях в обоих случаях говорят или о построении тезауруса предметной области, или о построении онтологии предметной области. Но это два совершенно разных подхода к описанию предметной области, которые не являются при этом взаимоисключающими. Такой подход, с одной стороны, позволяет отдельно сконцентрироваться только на типах информационных ресурсов библиотеки, которые являются ресурсами пространства знаний, и описать основные понятия, характерные для этой предметной области. С другой стороны, говоря о тезаурусе, будем иметь в виду набор понятий и терминов, которые обеспечивают терминологическую поддержку понятий онтологии предметной области. Исходя из вышесказанного, тезаурус пространства знаний – это полный систематизированный набор терминов о какой-либо области знаний и больше относящийся к лексике, используемой в конкретной области, тогда как онтология описывает ресурсы предметной области и их взаимосвязи. Для каждой предметной области набор ресурсов может отличаться как по формату, так и по набору самих ресурсов. Онтология научного пространства знаний — это сложная многоуровневая система понятий, описывающих ресурсы и объекты предметной области, концептов, терминов и связей между ними, характеризующаяся открытой иерархической и динамичной структуризацией и служащая как для хранения знаний и их структуризации, так и для добычи новых. Построение многоуровневой онтологической модели научной предметной областиДля возможности построения онтологии научного пространства знаний необходимо придерживаться следующей последовательности шагов при конструировании семантической библиотеки в рамках предложенного подхода. На основе введенной модели задается набор информационных ресурсов, используемых в библиотеке. Для этого необходимо представить описания содержимого будущей библиотеки в терминах предложенной модели. Осуществляется окончательная настройка структуры тезауруса. На базе определенных классов согласно определению задаются используемые связи между терминами, расширяется при необходимости описание термина, определяются связи с ресурсами системы. Для выбора семантических меток можно использовать дополнительные словари по предметной области или оставить возможность их доопределения позднее. Наполнение онтологии данными согласно описанию модели пространства знаний заданных на первых трех этапах. После выполнения последовательности шагов 1 – 3, мы фактически получаем упрощеннуюмодель предметной области, описанную в терминах введенной выше онтологии семантической библиотеки. При этом если новые введенные понятия являются на первом уровне экземплярами обозначенных ресурсов, то при наполнении библиотеки мы используем их в качестве классов для описания данных. Рассмотрение экземпляров в качестве классов называют метамоделированием. И хотя даже прямая семантика языка онтологий OWL2, используемого для описания онтологий, не позволяет такого метамоделирования, это ограничение в языке обходится с помощью синтаксического трюка известного под название punning. Это означает, что когда идентификатор экземпляра встречается в аксиоме класса, то он рассматривается как класс, а когда этот же идентификатор встречается в отдельном утверждении, то рассматривается как экземпляр. Итак, выполняя описание конкретной предметной области в терминах предложенной ниже онтологии семантической библиотеки, мы фактически конструируем трехуровневую онтологию, в которой экземпляры первого уровня - это высокоуровневые понятия, на втором уровне мы описываем понятия конкретной предметной области как экземпляры в терминах первого уровня и используем их как определения классов на третьем уровне при заполнении онтологии данными. Базовые понятия сущностей предметной области В соответствии с определениями, рассмотренными в этой и предыдущей главе, были введены основные классы онтологии. Указываемая при описании определения класса таблица его свойств устроена следующим образом: В столбце «Название» указывается название свойства и в скобках его XML-идентификатор (т.н. квалифицированное имя элемента – префикс пространства имен и локальное имя после двоеточия); этот идентификатор используется при описании данных. Он также определяет URI элемента в соответствии с его пространством имен. В столбце «Комментарий» указывается текстовое пояснение смысла свойства и, возможно, формата его значений. Могут указываться также такие характеристики OWL-свойства, как суперсвойство и обратное отношение. В столбце «Тип значений» приводится указание требуемого типа значений свойства: примитивного типа (строка, число, дата или другие допустимые в RDF типы данных XML Schema), либо некоторого класса (в таком случае – это ссылка, либо двустороннее отношение), определенного в данной схеме или в одной из схем, от которых она зависит. После указания типа значений в том же столбце указывается допустимое количество значений свойства – мощность свойства: [0..*] означает «от 0 до бесконечности» – свойство является множественным и необязательным для указания (факультативным). [1..*] означает «от 1 до бесконечности» – свойство является множественным и обязательным для указания. [0..1] означает «от 0 до 1» – свойство допускает не более одного значения, является необязательным для указания (факультативным). [1..1] означает «ровно 1» – свойство допускает ровно одно значение, является обязательным для указания. Были введены следующие суперклассы для разделения используемых классов: ClassWithURI– группирует классы, экземпляры которых представляют собой уникально-идентифицируемые объекты.
ClassWithoutURI– соответственно группирует классы экземпляры которых не представляют собой уникально-идентифицируемые объекты. SecureClass– группирует классы, используемые для определения прав доступа к сущностям описываемой предметной области. Далее, исходя из определения контента, вводятся классы: InformationResource(информационный ресурс библиотеки), который содержит общую информацию о типе ресурса, название, URI и информацию об используемом наборе атрибутов для описания структуры ресурса. Суперклассы: Уникально-идентифицируемый объект (lb:ClassWithURI)
|