Главная страница
Навигация по странице:

  • Информационно-поисковая система (ИПС)

  • . Поисковый образ документа (ПОД)

  • Релевантность

  • 6.2. Понятие системы управления электронными документами (СУД).

  • Проектирование ЭСУД. Проектирование электронных систем управления документооборотом


    Скачать 1.24 Mb.
    НазваниеПроектирование электронных систем управления документооборотом
    АнкорПроектирование ЭСУД.pdf
    Дата30.04.2018
    Размер1.24 Mb.
    Формат файлаpdf
    Имя файлаПроектирование ЭСУД.pdf
    ТипУчебное пособие
    #18719
    КатегорияЭкономика. Финансы
    страница6 из 12
    1   2   3   4   5   6   7   8   9   ...   12
    ТЕМА 6. ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    6.1. Понятие информационно-поисковой системы (ИПС).
    Состав компонент и технология работы с ИПС
    В работе современных предприятий важную роль играют его информационные ре- сурсы, под которыми можно понимать проектную документацию, переписку с партнера- ми, внутренние приказы и распоряжения, финансовые данные и другие документы, кото- рые служат основой для принятия новых решений и используются в процессах управле- ния предприятием. И если для хранения структурированных данных можно применять специализированные информационные системы (типа бухгалтерской или торговой систе- мы или системы планового отдела), основанные, на использовании СУБД, то для неструк- турированных данных нужны системы общего назначения – электронные архивы, рабо- тающие на принципах информационно-поисковой системы.
    Информационно-поисковая система (ИПС) – это система, предназначенная для хранения и поиска документов с текстовой, графической, табличной информацией по ат- рибутам, ключевым словам документа и содержанию в какой-либо предметной области.
    Выделяют ИПС двух типов: фактографические и документографические системы.
    ИПС фактографического типа предназначены для хранения и поиска фактов, показателей, характеристик каких-либо объектов или процессов (например, сведения о работниках, о предприятиях, акционерах и т.д.).
    Документографические ИПС отличаются тем, что объектом хранения и поиска в этих системах служат документы, отчеты, рефераты, обзоры, журналы, книги и т.д. Сценарий по- иска документа при помощи ИПС обычно сводится к вводу запроса на поиск, состоящего из одного или нескольких слов, после чего предъявляется список имен найденных документов.
    Пользователь может открыть любой из найденных документов и если поисковая система по- зволяет, вхождения искомых слов в документе выделяются – «подсвечиваются».
    Можно выделить следующие особенности организации и функционирования до- кументографической ИПС, отличающие ее от систем управления базами структуриро- ванных данных:
    • Документы могут храниться на бумаге, микрографических носителях или су- ществовать в электронных форматах. Микрографические форматы включают микрофильмы, микрофиши, слайды и другие микроформы, производимые раз- нообразными документными камерами. Электронные форматы еще многочис- леннее, они включают документы, подготовленные в текстовых процессорах, системах электронной почты и других компьютерных программах, оцифрован- ные изображения прошедших сканирование документов и проч. При этом предполагается обязательное хранение как электронных копий документов, так и их бумажных оригиналов.
    • Если документы занимают большой объем и полные электронные копии выда- вать на просмотр или хранить не возможно, то для таких документов создают и хранят электронные адреса их хранения.
    • Поиск осуществляется нахождением документа по двум принципам: по атри-
    бутам документа – дате создания, размеру, автору и пр. и по его содержанию
    (тексту). Обычно поиск по содержанию документа выполняется двумя спосо- бами: по ключевым словам и по всему тексту, который называют полнотек-
    стовым, подчеркивая тем самым, что для поиска используется весь текст до- кумента, а не только его реквизиты.

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    64
    • Для поиска документов создают и хранят их поисковые образы. Поисковый
    образ документа (ПОД) – совокупность кодов ведущих ключевых слов (деск- рипторов), которые описывают смысл, содержание документа.
    • Ключевые слова и их коды хранятся в специальном словаре – тезаурусе.
    • Для того, чтобы осуществлять поиск документов, нужно создать информаци-
    онно-поисковый язык (ИПЯ), всоставкоторого входит тезаурус и граммати- ка языка, т.е. совокупность правил задания множества высказываний на мно- жестве ключевых слов.
    • Чтобы отыскать документ, нужно создать с помощью ИПЯ поисковый образ
    запроса (ПОЗ), который представляет собой совокупность закодированных ключевых слов, описывающие те документы, которые нужно найти.
    Схема взаимодействия компонент ИПС представлена на рис. 6.1.
    Рис 6.1. Схема взаимодействия компонент ИПС
    ИПС состоит из следующих обеспечивающих подсистем:
    • лингвистическое обеспечение, включающее в свой состав информационно- поисковый язык;
    • техническое обеспечение системы, включающее ЭВМ и устройства создания, хранения, чтения и размножения копий на бумажных носителях, в микрофор- матах и в электронной форме;
    • информационное обеспечение, состоящее из БД документов (БД Док.), адресов
    (БД Адр.) и БД поисковых образов документов (БД ПОД) и списков дескрип- торов и их кодов – тезауруса;
    • программное обеспечение.
    ИПЯ-Тезаурус
    Поисковый образ документа (ПОД)
    Поисковый образ запроса (ПОЗ)
    БД
    ПОД
    ПОЗ
    ПОД
    Документ
    Запрос
    БДДок. и БДАд
    БДА

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    65
    Программное обеспечение ИПС предназначено для автоматизации следующих ос- новных функций, которые должна выполнять эта система:
    • составления, кодирования и загрузки базы данных ПОД;
    • загрузки БД документов и их адресов хранения;
    • составления, кодирования ПОЗ;
    • выполнение операции поиска и выдачи ответа на запрос в виде документа или адресов хранения документов на экран ЭВМ, на бумагу, в файл;
    • актуализация баз данных ПОД, документов и адресов;
    • актуализация тезауруса;
    • выдача справок.
    Рассмотрим основные понятия, употребляемые в сфере поиска документов.
    Релевантность – степень соответствия найденного документа запросу. Найденный по запросу документ может иметь отношение к запросу, т.е. содержать нужную (искомую) информацию, а может и не иметь никакого отношения. В первом случае документ называ- ется релевантным (по-английски relevant – «относящийся к делу»), во втором – нереле-
    вантным, или шумовым.
    Как правило, в любой поисковой системе по запросу выдается несколько (чаще много) найденных документов. Многие из них могут повествовать не о том. И наоборот, некоторые важные, релевантные, документы могут быть пропущены при поиске. Ясно, что количество тех и других определяет качество поиска, которое можно определить дос- таточно точно. Основными понятиями в мире поисковых средств являются идеи точности иполноты поиска.
    Точность поиска (Т) определяется тем, какая часть информации, выданная в ответ на запрос, является релевантной, т.е. относящейся к этому запросу и является параметром, показывающим, какова доля релевантных документов в общем числе найденных. Этот по- казатель рассчитывается по формуле:
    V
    н
    рел
    Т = ------------ * 100%,
    V
    н
    об
    где V
    н
    рел – количество найденных документов, релевантных запросу;
    V
    н
    об
    – общее количество найденных докумнетов.
    Если, например, все выданные по запросу документы относятся к делу, то точность равна 100%; если, напротив, все документы шумовые, то точность поиска равна нулю.
    Полнота поиска (П)дополнительный параметр, показывающий, какова доля (или процент) найденных релевантных документов в общем количестве релевантных докумен- тов, т.е. характеризуется соотношением между всей релевантной информацией, имеющейся в базе, и той ее частью, которая включена в ответ и рассчитывается по формуле:
    V
    н
    рел
    П = --------------- * 100,
    V
    об
    рел
    где V
    н
    рел –
    количество найденных документов, релевантных запросу;
    V
    об
    рел
    – общее количество документов, релевантных запросу, хранящихся в системе.
    Если в области поиска на самом деле имеется 100 документов, содержащих нуж- ную информацию, а по запросу найдено из них всего 30, то полнота поиска равна 30%.

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    66
    Кроме этого при оценке поисковых систем учитывается, с какими типами данных может работать та или иная система, в какой форме представляются результаты поиска и какой уровень подготовки пользователей необходим для работы в этой системе.
    Следует отметить, что точность поиска и его полнота зависят не только от свойств поисковой системы, но и от правильности построения конкретного запроса, а также от субъективного представления пользователя о том, какая нужна ему информация. Если стоит проблема оценки нескольких систем и выбора наиболее эффективной, можно вы- числить средние значения полноты и точности рассматриваемых конкретных систем, про- тестировав их на эталонной базе документов.
    Индексация документов (т.е. составление ПОД), котораяозначает предварительную подготовку текстов для поиска и применяется главным образом для ускорения поиска; как правило, текстовые базы данных, предназначенные для многократного поиска, обрабаты- вают заранее, составляя так называемый индекс (ПОД). При индексации поисковая система составляет списки слов, встречающихся в тексте, и приписывает каждому слову его код – координаты в тексте (чаще всего номер документа и номер слова в документе). При поиске слово ищется в индексе, и по найденным координатам выдаются нужные документы. Если слов в запросе несколько, над их координатами производится операция пересечения. В том случае, если множество документов пополняется, приходится пополнять и индекс.
    Единица поиска – это квант текста, в пределах которого в данной поисковой сис- теме осуществляется поиск, от величины которого зависит показатель точности поиска, величина шума и время ответа на запрос. Единицей поиска может быть документ, пред- ложение или абзац.
    В технологии использования ИПС можно выделить три группы операций:
    • операции, связанные с получением поисковых образов документов (ПОД), опи- сывающих содержание документов и загрузкой их в базу данных (БД ПОД), а также загрузкой самих документов или их адресов хранения в БДДок и БДАдр.;
    • операции составления поисковых образов запроса (ПОЗ) с использованием те- зауруса, поиска и выдачи результатов на просмотр и отбор или файл или на пе- чать найденных документов или списка адресов;
    • операции ведения информационно-поисковой системы, включающие актуали- зацию БД ПОД, БДДок., БДАдр. и тезауруса вследствие возникновения и необ- ходимости пополнения памяти системы новыми документами или ключевыми словами.
    В состав операций ведения ИПС входит также процедура выдачи справок о работе системы, о ее структуре, методах поиска и классах и видах хранимых документах.
    6.2. Понятие системы управления электронными документами (СУД).
    Проблемы организации СУД
    На большинстве современных предприятий, где ведется активная работа с различ- ными документами, рано или поздно встает проблема ввода, систематизации, обработки и безопасного хранения значительных объемов информации. Договора, приказы, деловая переписка, финансовая, проектная и другие виды документации беспорядочно накапли- ваются на рабочих столах сотрудников или в файловых системах их компьютеров, затруд- няя поиск информации, коллективную работу над документами, их согласование и со- блюдение конфиденциальности. Поэтому, требуется некое средство автоматизации, кото- рое могло бы организовать не только хранение и поиск документов, но обеспечить высо- кую эффективность работы с документами в масштабах всей организации.

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    67
    Для решения этой задачи используется специальное программное обеспечение, ра- ботающее на принципах ИПС – системы управления электронными документами
    (СУД). В ряде изданий для их обозначения употребляются термины DMS (Document
    Management Systems).
    Система управления документами должна автоматизировать работу с документами практически на всех этапах, начиная от разработки и кончая удалением из архива, а также иметь возможность настройки на различные специфические участки работы, в том числе и технологические (например, разработка проектно-конструкторской документации).
    Основными задачами, для решения которых предназначаетсяСУД в дополнении к тем, которые реализуются средствами ИПС, являются следующие:
    • создание и ведение единого электронного архива, способного аккумулировать данные любых типов, которые систематизируются с помощью гибко настраи- ваемых классификаторов документов и тематических иерархий проектов или па- пок;
    • обеспечение быстрого и удобного поиска информации с возможностью немед- ленного вызова документа на редактирование в привычной для пользователя программе;
    • ограничение возможности каждого конкретного пользователя по просмотру и модификации документов, обеспечивая необходимый уровень безопасности;
    • обеспечение работы с несколькими версиями одного и того же документа, вы- писки документа для обработки вне системы и возврат его в библиотеку, а так- же экспорт и импорт документов;
    • повышение надежности (целостности) хранения данных;
    • обеспечение быстрого времени отклика электронной архивной системы вне за- висимости от объемов хранящихся в ней данных и прозрачного доступа к ин- формации, расположенной в различных территориально-разнесенных подраз- делениях предприятия;
    • обеспечение коллективной обработки документов и их согласования.
    С точки зрения пользователя, СУД предназначена для выполнения следующих
    функций:
    • объединениеразрозненных приложений, используемых в организации для об- работки данных, в единую информационную систему, что дает унифицирован- ный и простой, а потому эффективный способ манипулирования документами;
    • индексациядокументов;
    • хранение и поиск документов;
    • автоматическое реферирование документов;
    • осуществление нумерации версий документов;
    • обеспечение многоуровневой системы защиты информации;
    • администрирование учета и архивирования;
    • работа с разнообразными формами документов;
    • поддержка произвольных взаимосвязей между документами;
    • автоматический переводпоискового запроса на другой язык;
    • выдача и возврат документов библиотечного типа.
    Организация СУД на предприятии связана с необходимостью решения ряда про-
    блем, основными из которых являются следующие:
    • выбор архитектуры системы (локальная организация или сетевая);
    • выбор типа носителей для организации физического хранения документов;

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    68
    • обеспечение надежности хранения;
    • выбор системы методов поиска хранимой в СУД информации.
    Выше были отмечены недостатки организации хранения больших объемов инфор- мации с использованием архитектуры «файл-сервер», поэтому для решения поставленных задач и проблем наиболее перспективным является выбор варианта архитектуры интег- рированных систем управления документами – «клиент-сервер», который существенно уве- личивают эффективность работы пользователей, поскольку системы данного класса обес- печивают не только быстрый поиск необходимых пользователям документов, но и помо- гают им организовывать и совместно использовать информацию. И, что особенно важно,
    СУД создают удобную для пользователя структуру представления всей информации, хра- нящейся в сети. Создатель документа будет избавлен от необходимости каждый раз приду- мывать, где его хранить, как защищать и какие права на него предоставлять коллегам.
    Системы управления документами должны решать проблему с управлением боль- шими объемами документов на следующих принципах:
    1. Управление должно осуществляться над электронными документами, созданными в разных прикладных программах для персональных компьютеров, таких как: тексто- вые процессоры, электронные таблицы, электронная почта.
    2. Замена концепции имен документов их регистрационными карточками, содержащими расширенную информацию (поисковый образ документа), используемую для их поис- ка и управления. СУД автоматически заполняет часть полей карточки, остальную ин- формацию пользователь может быстро ввести самостоятельно. Карточки имеют на- страиваемую форму.
    3. Обеспечение пользователей мощными функциями поиска по информации карточек.
    Они хранятся в SQL-базах данных, поэтому CУД может поддерживать работу с очень большим количеством карточек и использоваться как в небольших рабочих группах, так и крупных организациях.
    4. Снабжение документов текстовым индексом, который позволяет искать их по контек- сту. Индекс обновляется после внесения в документ изменений.
    5. Гарантирование тесной интеграции с основными приложениями. Команды File New,
    File Open, File Save, File Save As и File Close в этих системах используются для того, чтобы сделать для пользователя эту интеграцию максимально простой (например, но- вая карточка генерируется при выполнении команды File New; окно File Open заме- няется специальным экраном поиска; при выполнении команды File Save документ автоматически пополняет СУД; File Save As позволяет создать новую карточку или новую версию старой карточки документа; File Close сохраняет карточку, так что те- перь пользователи СУД могут получать к нему доступ).
    6. Защита документов обеспечивается соответствующими расширенными функциями проверки пароля, прав доступа к документу, полю или операций над полем.
    7. Контроль версий и ведение истории работы с документами.
    8. Поддержка мобильных пользователей, предоставляя им возможности выписки и воз- врата документов.
    9. Интегрированные СУД связывают карточки документов с их физическими файлами на сетевом сервере – пользователи имеют дело уже с ними, а не с именами файлов и сложными путями к директориям. Основные преимущества интегрированных СУД состоят в том, что сохраняются приложения, установленные в компаниях, они берут на себя определенные функции прикладных программ и просты в применении.
    10. Создание систем управления документами в сетевой среде, что обусловлено следую- щими тенденциями:

    ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДОКУМЕНТАМИ
    69
    • С помощью приложений для персональных компьютеров производится боль- шое количество документов, в связи с чем концепция «безбумажной техноло- гии управления» становится актуальной.
    • Сетевые СУД – системы масштабируемые. Благодаря тому, что карточки до- кументов хранятся в SQL-базах данных, СУД пригодны как для единиц, так и для десятков и даже десятков сотен пользователей. Большинство СУД поддер- живают различные серверы баз данных (стандарт ODBC позволяет использо- вать SQL-базы данных различных производителей), поэтому выбрать наиболее оптимальную по функциональным возможностям и цене систему несложно.
    • Производители приложений обеспечивают интеграцию своих продуктов с
    СУД, используя стандарт Open Document Management API (ODMA), что пре- доставляет производителям СУД возможность легко использовать новые при- кладные программы.
    • Продолжают совершенствоваться характеристики сетевых серверов и клиент- ских компьютеров, а цены, в свою очередь, по мере появления все более мощ- ных компьютеров снижаются.
    После того как определены задачи и архитектура СУД и известно, какого рода данные придется хранить и искать, должна решаться проблема
    1   2   3   4   5   6   7   8   9   ...   12


    написать администратору сайта