Главная страница

В документационном обеспечении управления


Скачать 249.54 Kb.
НазваниеВ документационном обеспечении управления
Дата26.02.2023
Размер249.54 Kb.
Формат файлаdocx
Имя файла_Akhmetova_Informatsionnyye_tekhnologii_v_dokumentatsionnom_obes.docx
ТипДокументы
#956491
страница27 из 42
1   ...   23   24   25   26   27   28   29   30   ...   42

Автоматизированные информационно-поисковые системы и создание научно-справочного аппарата



Важнейшим направлением информатизации архивного дела является создание автоматизированных информационно-поисковых систем. Авто- матизированный НСА (АНСА) архива представляет собой совокупность описаний документов, помещенных в базы данных, автоматизированных средств поиска информации и представления результатов поиска.

Если в 1970-1980-е гг. создавались АИПС на отдельные тематиче- ские комплексы, требовавшие огромных затрат, то на современном этапе информационные технологии становятся действенным инструментом со- здания НСА архива.

По сведениям Росархива, тематические базы данных на наиболее ис- пользуемые комплексы документов ведутся в архивах 35 субъектов РФ, охватывая 65 % архивов.

Особенно распространены автоматизированные архивные каталоги. Среди федеральных архивов электронные каталоги ведут ГАРФ, РГАЭ, РГАЛИ, РГАКФД, РГА НТД и др. Базы данных постепенно вытесняют традиционную технологию каталогизации. Интеграция информационных ресурсов архивов в мировое киберпространство ведет к тому, что архив- ные информационно-поисковые справочники публикуются в глобальной сети Интернет (особенно путеводители). Ведутся как внутриархивные, так и межархивные базы данных. Перспектива создания единой автоматизиро- ванной информационно-поисковой архивной системы России благодаря сетевым технологиям становится реальностью. Поисковые системы непре- рывно совершенствуются благодаря созданию полнотекстовых баз данных, использованию технологии гипертекста.

В этих условиях становится крайне важной задача стандартизации и унификации форматов описания, лингвистического обеспечения АИПС. Лингвистическое обеспечение автоматизированного НСА представляет собой совокупность рубрикаторов, классификаторов, словарей ключевых слов, систематизированных по группам («тематика», «география», «персо- налии»), тезаурусов. Вместе с тем в настоящее время отсутствуют единые классификаторы документной информации в архивном деле. «Схема единой классификации документной информации в систематических ката- логах государственных архивов СССР» (1978 г. – советского периода и 1983 г. – дореволюционного периода) и «Рубрикатор АСНТИ по докумен- там ГАФ СССР» (1980 г.) устарели и не отражают содержание современ-

ных документов. С 2002 г. ВНИИДАД начата разработка Единого класси- фикатора документной информации (ЕКДИ).

Общеотраслевой классификатор должен обладать следующими чер-

тами:

    • многоаспектностью, широким охватом тематики документов;

    • универсальностью классификатора, построением рубрик по от-

раслям человеческой деятельности независимо от даты создания и места хранения документов;

    • унификацией классификации в пределах всего Архивного фонда

РФ;


  • неглубокой иерархией классификационных делений, включающей

три уровня: отдел, подотдел, раздел.

В настоящее время общеотраслевые программы «Архивный фонд» и

«Фондовый каталог» создают возможность ведения отдельного классифи- катора каждым архивом или единого классификатора архивами субъекта федерации. В программе «Архивный фонд» предусмотрена возможность систематизации фондов с помощью создания иерархического рубрикатора из пяти уровней (до 99 рубрик на каждом уровне).

Проблема унификации архивного описания в связи с созданием ин- формационно-поисковых баз данных, в том числе в Интернете, уже не- сколько лет успешно решается международным сообществом архивистов. С этой целью создаются международные стандарты и связанные с ними форматы описания.

Под стандартом в данном случае понимается свод общих правил ар- хивного описания, под форматом  конкретный искусственный информа- ционно-поисковый язык со своим синтаксисом и лексикой, используемый в поисковых системах. Как правило, стандарт ориентирован на использо- вание синтаксиса конкретного ИПЯ. С 1993 г. в качестве общего эталона архивного описания предлагалось семейство стандартов MARC (UNI MARC, US MARC), разработанных Библиотекой конгресса США и ис- пользуемых в качестве стандартов библиографического описания. Для ар- хивных справочников стандарт был апробирован, в частности, при созда- нии электронного описания архива Ватикана.

С 1994 г. архивное описание регулируется международным стандар- том #G0ISAD (G) (#G0International Standard Archival Description), утвер- жденным Международным советом архивов (МСА). В основе данного стандарта лежит принцип многоуровнего описания, предполагающий опи- сание от общего к частному, раскрывающий иерархию комплексов доку- ментов.

При этом очень важно давать информацию, относящуюся именно к данному уровню описания, избегая повторяемости данных на разных уровнях. Стандарт был использован при составлении «Основных правил

работы государственных архивов» (2002 г.), раздел 7 «Описание архивных документов и научно-справочный аппарат к документам архива».

В 1998 г. консорциум сети Web (WWW) утвердил в качестве стан- дарта описания документов три информационно-поисковых языка, приня- тых библиотекой конгресса США и обществом американских архивистов:

  1. XML (eXtensible Markup Language)  формат, представляющий собой расширенный язык маркировки, разновидность формата SYML для использования в Интернете;

  2. EAD (Encoded Archival Description) – стандарт, совокупность пра- вил «кодированного архивного описания», т.е. создания электронного НСА, также основанный на синтаксисе метаязыка SGML (Standart Genera- lized Markup Language);

  3. DDT (Document Type Definition)  «определение типа документа». Правила структурированного описания документа (главы, секции, разделы, темы) при сохранении единообразной логической структуры описания, со- зданные еще в 1933 г. для архивного НСА.

Информационно-поисковые базы данных можно разделить на доку- ментальные и фактографические АИПС. В настоящее время преобладают документальные АИПС, выдающие в качестве ответа на запрос ссылочные данные об архивных документах. К фактографическим АИПС, выдающим в ответ на запрос конкретные сведения, можно отнести автоматизирован- ные справочники памятных дат, биографические справочники, справочни- ки учреждений.

Например, в Российском государственном военном архиве (РГВА) с 1993 г. ведутся автоматизированные именные каталоги «Начкомсостав РККА», БД по участникам белогвардейских формирований, НКВД. В Российском государственном архиве экономики (РГАЭ) существует ана- логичная БД «Личный состав ВСНХ» (на основе ведомственных картотек). Автоматизированный справочник учреждений ведется в Российском госу- дарственном архиве социально-политической истории (РГАСПИ) («Выс- шие органы власти в период Великой отечественной войны») и ВНИИДАД («Государственные церковные учреждения, сословные органы, органы местного самоуправления: документация, должности, чины звания. XV- XVIII вв.»). Как правило, подобные базы данных без ссылок на документы служат для подготовки к изданию соответствующих справочников. БД

«Изодокументы» (каталог иллюстраций по материалам периодической пе- чати) в ГА Астраханской области служит для подготовки выставок.

По полноте охвата информации БД разделяются на межархивные и внутриархивные (внутрифондовые, межфондовые). Создание межархив- ных БД требует большой организационной работы по согласованию фор- матов, лексического обеспечения, организации сбора данных, поэтому в настоящее время они немногочисленны. К этой категории можно отнести

созданные еще в 1980-е гг. межархивные тематические каталоги АИПС

«Победа Великой октябрьской революции и борьба за установление и упрочение советской власти», «История памятников архитектуры и градо- строительства Москвы, Ленинграда и пригородов», которые во второй по- ловине 1990-х гг. были успешно конвертированы специалистами РНИЦКД в формат СУБД CDS ISIS, что сделало возможным их ведение на ПЭВМ. Каталог «История памятников архитектуры и градостроительства» в настоящее время существует в Интернет-версии и размещен на сайте РГА НТД.

Внутриархивные БД можно разделить по видам справочников:

    • электронные путеводители и краткие справочники по архивам;

    • электронные обзоры (тематические, фондовые);

    • электронные описи;

    • электронные каталоги (систематические, предметно-тематические, именные, географические, по истории госучреждений, административно- территориального деления, объектные, патентные и др.);

    • электронные указатели, картотеки (предметно-тематические,

именные, географические, личного состава и др.);

    • перечни документов (тематические);

    • интегрированные информационно-поисковые БД иерархической структуры, сочетающие в себе функции различных видов справочников.

Особую группу АИПС составляют полнотекстовые базы данных, включающие в себя непосредственно текст или изображение документа графическом формате).

Именно АИПС архивы стремятся поместить в Интернете. Особенно полно в глобальной сети представлены путеводители. Рассмотрим подроб- нее каждый из видов автоматизированных справочников. Электронные пу- теводители создаются как для автоматизированного поиска информации, так и для подготовки к изданию (в традиционной форме) текста путеводи- теля. Базы данных позволяют собрать воедино и выверить для публикации сведения о фондах в масштабах архива.

Так, например, в ГАРФ было создано 8 БД. («Фонды ГАРФ по исто- рии Российской империи XIX – нач. XX в.»  586 записей; «Фонды ГА РФ по истории 1922-1991 гг.»  443 записи) с целью подготовки к изданию многотомного путеводителя по ГА РФ. Первый том путеводителя по фон- дам Российской империи размещен на сайте архива (garf.narod.ru). Для ав- томатизированного поиска информации в архиве была создана БД с упро- щенным набором полей «Перечень фондов ГА РФ», включающая 3042 за- писи. В РГАЭ для подготовки к изданию краткого справочника по фондам с 1991 г. создавались БД «Сведения, включенные в первый том справочни- ка фондов»; «Сведения, включенные во второй том справочника фондов»;

БД по личным фондам, «Сведения, включенные в указатель названий учреждений к справочнику фондов» (всего 9500 записей).

Помимо путеводителей по фондам архива, в электронном виде со- здаются тематические и межархивные путеводители и краткие справочни- ки). Базой для создания межархивных путеводителей служит БД «АЦФК» Росархива, в которую вливаются данные, введенные в государственных и муниципальных архивах. Тенденцией последних лет стал стремительный рост количества путеводителей по архивам, опубликованных в Интернете. Так, с 2000 г. в рунете было опубликовано 39 путеводителей, кратких справочников и списков фондов (11  на сайте «Архиве России»); 20 путе- водителей по государственным архивам на других сайтах, два путеводите- ля по отделам рукописей музеев, два – по архивам общественных органи- заций, один – по архиву научного учреждения).

В настоящее время архивы стремятся к созданию интегрированных поисковых систем, в которые поэтапно можно было бы ввести описи (начиная с нуждающихся в переработке и усовершенствовании) и посте- пенно создать банк данных по описям всех фондов архива. Одной из пер- вых программ такого рода стала созданная в начале 1990-х гг. в ЦХИДК (РГВА) БД «Опись». В ГАРФ с 1997 г. создается, непрерывно пополняясь, БД «ОПИСЬ-ДЕЛО».

В результате создана и функционирует информационно-поисковая система, которой можно воспользоваться в читальном зале архива, она также пригодна для работы в локальной сети. Закончена работа по созда- нию информационно-поисковой системы «Электронные описи ГА РФ он- лайн» для использования в Интернете, ее размещение намечено на первый квартал 2004 г. Достаточно перспективным представляется опыт корпора- ции «Электронный архив» (Москва) по освоению технологии, которую представители фирмы назвали «реконверсией». Технология заключается в переводе традиционных архивных справочников (прежде всего описей, а также каталогов и других видов НСА) в электронную форму. Технология включает в себя несколько этапов: «бережное» сканирование описей с по- мощью бесконтактных планетарных «книжных» сканеров; поточная опе- раторская обработка имиджей, формирование полей баз данных; загрузка записей в базу данных и получение электронного справочника. Корпора- ция сотрудничает с ГАРФ, РГАСПИ, РГА НТД, АП РФ, Главархивом г. Москвы и другими учреждениями. К сожалению, описи довольно слабо представлены в Интернете. Причины этого, скорее всего, в том, что обще- принятый формат HTML не подходит для описи, в отличие от путеводите- лей и обзоров. Слишком трудоемко и бессмысленно форматирование таб- личной формы описи. Описи, как и каталоги, должны представлять собой базы данных, а создание таких БД в глобальной сети требует высококва- лифицированного программирования.

Тем не менее среди реализованных проектов можно назвать БД «По- сольские книги России к XV  началу XVIII в.» (РГАДА); БД по фонду Войскового хозяйственного правления Сибирского казачьего войска; Опись дел архивного фонда «Народный Комиссариат просвещения АССР Немцев Поволжья, г. Энгельс» и др.

Среди архивных баз данных представлены и электронные реестры описей.

Электронные каталоги  наиболее распространенный вид архивных БД. Так же, как и традиционные, электронные каталоги создаются различ- ных видов  именные, географические, предметно-тематические, система- тические. Тематические базы данных (каталоги, указатели, картотеки) со- здаются по фондам, которые активно используются исследователями.

Среди каталогов, опубликованных в Интернете, можно выделить проект Национального архива республики Карелия «Архивная мозаика культуры Карелии в Интернет», предусматривающий публикацию не- скольких каталогов на сайте архива («Российские деятели культуры и Ка- релия»; «Личные архивы деятелей культуры Карелии»; «Культурное наследие духовных учреждений»; «Культура Карелии в фотографиях») и аннотированного перечня документов Национального архива о деятельно- сти иностранцев и иностранных переселенцев в Карелии.

Таким образом, электронные каталоги в архивах не только много- численны, но и разнообразны. В связи с этим встает проблема объединения их в интегрированные базы данных – общеархивные именные и система- тические каталоги.

Особую разновидность электронного НСА составляют полнотексто- вые базы данных, включающие тексты или оцифрованные изображения архивных документов. Большинство таких БД создаются по фотодокумен- там архива. К этой разновидности относятся БД «Коллекция фотодокумен- тов РГА НТД» (содержит изображения 3 тыс. фотографий); ЦГАКФФД СПб (12281 фотодокументов и 1734 персоналии); фотокаталоги ЦДНИ Удмурдской республики; ГАПО; Государственного архива Новосибирской области (изображения 1044 фотографий и аннотации к ним); Государ- ственного архива Ярославской области.

Одна из первых действительно полнотекстовых БД, предусматрива- ющих возможность поиска по тексту документа, была создана в Централь- ном архиве общественных движений Москвы (ЦАОДМ) БД «Обще- ственно-политические партии и движения». Гипертекстовая поисковая си- стема включала в себя описания листовок, плакатов, протоколов съездов и конференций, программ и уставов политических партий и движений, а также тексты законодательства об общественных организациях, хроник ИТАР-ТАСС, программных документов партий и движений.

На наш взгляд, в создании БД с доступом к тексту документов – бу- дущее в развитии поисковых систем. Ведь в этом случае устраняется неиз- бежная субъективность и неполнота вторичной документной информации (НСА), поскольку между пользователем ретроспективной документной информации и текстом нет посредников. Основным препятствием для со- здания таких систем является, на наш взгляд, отсутствие качественных программ оптического распознавания символов для кириллических тек- стов, позволяющих осуществлять ввод в БД больших массивов докумен- тов. Наиболее масштабными проектами в области создания полнотексто- вых БД на сегодняшний день являются «Электронный каталог докумен- тальных фильмов РГАКФД» (версия для CD-ROM и Интернета) и «Архив Коминтерна» (РГАСПИ) – для ЛВС и СD-ROM.

Перспективными направлениями развития электронного НСА можно назвать рост числа АИПС, размещенных в Интернете, выпуск справочни- ков на CD-ROM, а также создание интегрированных поисковых систем, соединяющих в себе описания документов на уровне фонда, описи, дела, документа. Такого рода справочники создаются как на общеотраслевом уровне, так и в отдельных архивах.

Комплексные поисковые системы создаются путем интеграции раз- личных баз данных в отдельных архивах. Среди них можно назвать: под- систему «Научно-справочный аппарат» Главархива г. Москвы (формиро- вание межфондовых и межархивных справочников на уровне фонда, опи- си, дела, документа); программы «Госархив» и «Райгорархив» в Государ- ственном архиве Пермской области и архивных отделах (тематический поиск на уровне фонда, описи, дела); единую ИПС «Электронный архив» ГАРФ, в основе которой лежит идея многоуровневого описания (фонд  опись  дело  документ); программу «Каисса» («Электронный каталог» РГА КФД), электронный каталог РГАЛИ.

      1. 1   ...   23   24   25   26   27   28   29   30   ...   42


написать администратору сайта