Главная страница
Навигация по странице:

  • Семантические

  • Информационные системы в контексте семантических

  • Михайлова_НИР. Научных знаний


    Скачать 445.42 Kb.
    НазваниеНаучных знаний
    Дата16.05.2021
    Размер445.42 Kb.
    Формат файлаdocx
    Имя файлаМихайлова_НИР.docx
    ТипРеферат
    #205686
    страница6 из 21
    1   2   3   4   5   6   7   8   9   ...   21

    Цифровые библиотеки


    Цифровые библиотеки решают те же задачи поиска и хранения контента, что и электронныебиблиотеки, но существенно расширяют свою функциональность и определение своего контента. Во-первых, контент библиотеки становится мультимедийным. Это значит, что значениями атрибутов ее информационных объектов теперь могут выступать различные мультимедийные объекты, которые доступны для просмотра средствами самой цифровой библиотеки. В качестве мультимедийных объектов могут выступать совокупность аудио, видео, фото и текстовых материалов. Во-вторых расширяется функциональность за счет решения некоторых задач интеграции как метаданных, так и медийных объектов из внешних источников, доступных по сети.

    При этом формальное определение представляет собой уже набор объектов R,A,Mul>, где F,R,Aопределяются, так же, как и в определении электронных библиотек. Mulпредставляет собой множество доступных мультимедийных объектов и r(ai) (MulUL*).

    Множество Fдополняется функциями вида g:(X,a1,,aj)Out,где Out R(X) и Out R, где X – внешний источник, а множество объектов R(X) может быть описано набором атрибутов (a1,,ak). Функции gпредназначены для решения вопросов интеграции данных из внешних библиотек.
        1. Семантические цифровые библиотеки


    Семантическиецифровыебиблиотекиявляются следующим этапом в эволюции библиотек и обязаны своей популярностью семантическим технологиям, которые в значительной степени повлияли на переосмысление понятия контента библиотеки и послужили толчком для расширения и улучшения функциональности библиотек. В таких библиотеках данные лучше структурированы, выделены связи между ними, улучшается поиск, появляется возможность интегрировать данные различных типов. Обеспечивается интероперабельность с другими системами, не обязательно являющимися библиотеками, так как основной задачей семантических технологий является предоставление метаданных в машиночитаемом формате.

    Формально семантическая цифровая библиотека – это , где F, Aопределяются так же как и в определении цифровыхбиблиотек. Контент библиотеки R=R1UR2U…URsпредставляет собой множество типов информационных ресурсов системы, для каждого их которых определен свой набор атрибутов (ai1,,aik). Такое определение не означает исключение мультимедийных объектов, а подчеркивает обыденность мультимедийных объектов в семантических библиотеках. То есть M R, и должно пониматься как добавление нового типа контента «мультимедийный объект»в библиотеку со своим набором атрибутов и отношений, каждый объект которого является абстрактным представлением реального объекта из множества M. Значения атрибутов c(aij) (L*UR).L*, как и прежде содержит область значений строковых атрибутов из A. Φзадает множество условий, накладываемых на представление контента, которое может, например, содержать ограничения, накладываемые на форматы значений r(aij).

    Важную роль в определении семантических библиотек при описании их контента играют онтологии. Онтология модели контента фактически задается <R,A, I >, где множество R выступает как множество понятий онтологии, множество атрибутов A также содержит подмножество отношений между понятиями, а I –задает множество функций интерпретации, заданных на понятиях и отношениях.

    Таким образом, множества R, A, I задает описание структуры контента библиотеки.
      1. Основные свойства семантических библиотек


    Основным свойством семантических библиотек является возможность структурирования их разнообразного контента и возможность связывания данных из разных источников, что в свою очередь, несомненно, отражается на качестве данных контента.

    Выделим основные свойства семантической библиотеки, которые, на наш взгляд, являются определяющими для рассматриваемой системы:

    • семантическая библиотека представляет собой интеграционный узел для разных источников данных, которые обогащают и пополняют ее набор данных;

    • контент библиотеки описывается на семантическом уровне, что позволяет достичь лучшего взаимодействия между источниками данных;

    • контент библиотеки может иметь разную степень гранулярности структуры в зависимости от рассматриваемых начальных условий при построении библиотеки;

    • семантическое описание контента и его уровень гранулярности не зависят от технических характеристик реализации информационной системы библиотеки и могут определяться вне зависимости от конкретной реализации;

    • понятийное описание контента библиотеки поддерживается его тезаурусом, который ограничивает предметную область ресурсов библиотеки терминологически.

      1. Информационные системы в контексте семантических библиотек. Общая терминология

    Выделив выше модель контента семантической библиотеки и ее основные характеристики, мы отделили определяющее понятие контента семантической библиотеки от понятия реализующей библиотеку информационной системы [12, 63, 66, 116]. Такой подход позволяет наращивать функциональность системы, добавлять новые подсистемы или изменять уже имеющиеся при неизменных остальных частях.

    Информационная система IS задается набором подсистем F для решения задач обработки ее контента С, IS= (F,С). Тогда информационная система представляется как организация совокупности своих подсистем F = U Fiи своего контента С. Каждая из этих подсистем описывается своей предметной онтологией и тогда можно представить онтологиюинформационнойсистемыOnISинтеграцией онтологий ее подсистем и онтологии ее контента OnIS = OnF UOnС, где OnF = U OnFi- объединение онтологий подсистем, OnС = онтология контента. При описании онтологий информационных систем и ее модулей обычно опираются на абстрактные онтологии высокого уровня, определяя ее ключевые сущности [1, 13].

    Каждый вид деятельности, поддерживаемый в рамках информационной системы, обеспечивается ее отдельной подсистемой. При разработке каждой подсистемы выделяются задачи, решаемые данной подсистемой, определяются набор и структуры данных, определяется набор пользовательских интерфейсов и граф навигации по ним. При этом набор и структура данных подсистемы определяются без привязки к конкретной предметной области. При интеграции с онтологией контента онтология подсистемы уточняется за счет встраивания понятий контента как подклассов ее понятий данных. Такой подход к интеграции онтологий носит уточняющий характер и направлен с одной стороны на расширение онтологии информационной подсистемы, а с другой стороны ограничивает ее применение рамками заданной предметной области.

    Приведем основные виды задач, реализующиеся в информационной системе, предназначенной для конструирования семантической библиотеки:

    • описание контента информационной системы;

    • реализация задач интеграции данных из внешних источников;

    • поддержка коллекций;

    • поиск и навигация по объектам системы;

    • поддержка пользователей.

    Разбиение на подсистемы не является единственно возможным. Границы подсистем не могут быть строго определены. В системе существует область общих определяющих понятий, которые рассматриваются как принадлежащие нескольким подсистемам, в зависимости от того, какие процессы выполняются в конкретной подсистеме. Так или иначе, каждая из этих систем взаимодействует с понятиями, определяющими контент этой библиотеки. Например, в перечисленных подсистемах можно рассматривать как единую подсистему реализации задач интеграции данных из внешних и внутренних источников. С другой стороны, из подсистемы качества можно выделить отдельно систему выявления дубликатов. Это деление диктуется конкретной реализацией.
      1. Научная информация как контент семантической библиотеки


    Построение обобщенной модели научной предметной области представляет подход, который делает упор на выделении таких метаданных, которые позволяют проектировать конкретные структуры данных для различных научных предметных областей и выявить общие подходы к управлению этими данными и их обработке [48, 66, 67, 71, 72, 101, 114, 134, 135]. Это позволит построить общую модель научных знаний, в рамках которой могут интегрироваться различные источники данных. Такой подход позволяет структурировать и связать различные ресурсы, извлечь из них и контекстуализировать разнообразные данные, превращая их в знания.

    С использованием обобщенной модели возможна реализация модели контента семантических библиотек, способной гибко настраиваться под запросы предметной области. Одной из целей обобщенного подхода является упрощение доступа и восприятия больших и сложно структурированных объемов информации пользователем [136]. Этот подход не является оптимальным для всех задач, решаемых в рамках некоторой научной предметной области, но, по крайней мере, позволяет структурировать имеющиеся знания на формальном уровне для дальнейшего использования.

    Критерии научности информации строго не определены и на этот счет существуют различные точки зрения. Научная информация, по ГОСТ 7.0-99 [14],: логически организованная информация, получаемая в процессе научного познания и отображающая явления и законы природы, общества и мышления. Опираясь на это определение, можно выделить несколько основных свойств, которыми в совокупности обладает научная информация: истинность, интерсубъективность и системность [15, 16].

    Мы не будем претендовать на то, что знания о предметной области, описанные в соответствии с нашими предложениями, являются всеобъемлющими. Оценивать - задача экспертов, наша же задача - предоставить удобный инструмент для анализа имеющейся информации.

    Критерий интерсубъективности говорит о том, что у всех исследователей, изучавших одну и ту же предметную область в одних и тех же условиях, получится один и тот же результат. Мы хотим предложить такую модель организации информации о предметной области, которая является общезначимой для всех исследователей.

    Системность научной информации подразумевает опору на исследование разнообразных зависимостей. Спецификой такой информации является четкая структура организации научных данных в иерархические структуры, пронизанные горизонтальными связями. Как следствие, соответствие этим основным критериям обеспечивает достаточно однозначную интерпретацию научного знания различными исследователями.

    Основная проблема представления научной информации состоит в сложности используемых понятий и отношений между ними, и, что самое главное, они подвержены более частому изменению структур данных, что неизбежно приводит к необходимости внесения существенных доработок в уже имеющиеся решения.

    Говоря о научной информации, имеет смысл разделять понятия научных данных и научных ресурсов в рамках научных предметных областей.
        1. 1   2   3   4   5   6   7   8   9   ...   21


    написать администратору сайта