АБИС лекции. Вопрос 1. Понятие автоматизации библиотек Однозначной трактовки понятия автоматизация
Скачать 315 Kb.
|
Вопрос №21. MARC Версиями формата MARC являются UNIMARC, MARC21, USMARC. MARC был разработан Библиотекой Конгресса США (1965-66гг.). Основной целью было поддержание автоматизированной обработки данных. В Великобритании велась работа в том же направлении. С 70-х гг. появляется много версий национальных форматов на базе MARC, направленных на учёт правил каталогизации конкретной страны. Во второй половине 90-х гг. появляется ряд форматов в странах бывшего СССР: RUSMARC, BELMARC, UKMARC. Эти национальные форматы были созданы на основе UNIMARC. Национальные форматы представления библиографических данных являются несовместимыми между собой, поэтому ИФЛА разработала специальную версию UNIMARC. Он создан для международного обмена информацией между национальными библиографическими службами. Этот формат стал посредником между национальными версиями MARC-формата. Вышло пособие по применению UNIMARCа в 1987г. В нём были представлены правила заполнения полей, а также правила работы с форматами в целом. В нём была отражена возможность использования форматов в качестве моделей для обработки файлов. В 1991г. применительно к нему был разработан соответствующий формат UNIMARC AUTHORITIES. Начиная с 80-х гг. большинство стран Западной Европы разработали свои национальные форматы на основе MARC и дополнили их своими специфическими элементами. Вопрос №22. BELMARC BELMARC-формат начал разрабатываться с 1997г. в рамках создания новой информационной компьютерной сети и по заданию фонда информатизации. Была собрана группа специалистов из крупнейших библиотек страны и Бел. гос. университета культуры. Группу возглавляла Ильина. BELMARC версии 2003г. распространился на документы (книги, брошюры, сериальные издания, диссертации, ноты, аудиоматериалы, стандарты, патенты, электронные ресурсы), были созданы соответствующие руководства на все виды документов. BELMARC выступает в качестве средства: 1) создания эталона электронного описания национального документа с учётом международных требований и условий, при которых допускается отклонение от этого эталона; 2) отражения в электронной форме сведений о крупнейших библиотеках Беларуси – сохранения этих сведений в сводном электронном каталоге и предоставление возможности многоаспектного поиска; 3) организация единой технологии национальной корпоративной каталогизации, создание электронных библиографических записей по принципу единовременной обработки и многоразового использования; 4) подготовка качественных национальных библиографических продуктов, а также продвижение их на международный рынок; 5) информационное взаимодействие библиотек и информационных учреждений Беларуси, а также для взаимодействия в рамках мирового информационного пространства. BELMARC содержит не все поля UNIMARC. Вопрос №23. Структурные элементы формата Вопрос №24. Лингвистическое обеспечение АБИС Хохлова. Информатика. – Минск, 2003. Лингвистическое обеспечение – представляет собой широкий комплекс языковых средств, которые необходимы для обработки и поддержки в рамках действия информационно-поискового языка (ИПЯ). При помощи этого обеспечения документы и запросы обрабатываются, а информационно-поисковые языки используются и поддерживаются при помощи определённых средств. Лингвистическое обеспечение является основой функционирования АБИС. С помощью лингвистического обеспечения решаются следующие задачи: 1) обработка всех видов вводимых в систему документов и запросов с необходимой полнотой и точностью; 2) систематизация документального потока и формирование информационных массивов; 3) документально-фактографический поиск в соответствующих БД; 4) обеспечение совместимости АБИС; 5) содействие подготовке разнообразных библиографических и информационных изданий с их автоматической рубрикацией, орфографическим контролем, переводом и т.д.; 6) автоматическая обработка документов и записей, автоматическое ведение отдельных видов лингвистической обработки. Виды ИПЯ, которые выступают в качестве средств лингвистического обеспечения АБИС: – язык обработки библиотечно-библиографических данных; – классификационные языки; – дескрипторные языки; – язык авторитетных файлов; – объектно-признаковые языки; – язык орфографического контроля и транслитерации; – языки запросов и манипуляции данными. Вывод по Лингвистическому обеспечению (ЛО) АБИС будет успешно функционировать, если будут иметься в наличии следующие средства ЛО: 1) Методики индексирования документов, вводимых в системы запросов при помощи всех ИПЯ, которые входят в комплекс ЛО. 2) Лингвистические процессоры – машинные программы для осуществления автоматической обработки данных. Они осуществляю транслитерацию данных с природного языка на ИПЯ. 3) Лингвистические банки данных (БнД) – совокупность массивов словарей для контроля за лексикой языков и средства их поддержки. Лексика классификационных языков представлена в таблицах и словарях, а дескрипторных языков – в информационных тезаурусах. Лингвистические БнД включают также списки специальной лингвистической информации (основ словоформ, грамматики, окончаний и т.д.), а также конвертеры для перевода. 4) Документация по ЛО, которая регламентирует процесс создания, ведения и использования языковых средств и средств поддержки. 5) Служба создания и ведения языковых средств как на уровне небольших библиотек, так и на национальном уровне. Вопрос №25. Информационно-поисковый язык ИПЯ – это искусственный язык, предназначенный для формализованного описания документов, данных, отдельных понятий и терминов и для осуществления их поиска в информационных массивах АБИС. ИПЯ – формализованная лексика природного языка, предназначенная для: 1) ликвидации излишеств и недостатков природного языка; 2) для осуществления информационного поиска; 3) для ликвидации синонимии и омонимии; 4) для достижения однозначности информационного поиска. Виды ИПЯ, которые выступают в качестве средств лингвистического обеспечения АБИС: – язык обработки библиотечно-библиографических данных; – классификационные языки; – дескрипторные языки; – язык авторитетных файлов; – объектно-признаковые языки; – язык орфографического контроля и транслитерации; – языки запросов и манипуляции данными. Вопрос №26. Язык обработки библиотечно-библиографических данных Используется для автоматического ввода-вывода, сохранения и поиска библиографической информации. Представляет собой набор средств для построения и использования библиографического описания документа, которое является одним из компонентов библиографической записи. В разных АБИС используются разные языки обработки библиотечно-библиографических данных, что связано с принятой в конкретной стране или библиотеке системой или набором элементов библиографического описания. При осуществлении информационного обмена необходимо поэтому придерживаться международных стандартов. В частности ИСБД и дополнений к нему. Вопрос №27. Классификационный язык Этот язык основывается на принципе предкоординации. Это значит, что словарный состав ИПЯ предназначен для проведения процесса индексирования. Такие ИПЯ содержат классификацию отраслей знаний и могут быть перечислительными (например, алфавитно-предметные и иерархические). В современных АБИС наиболее распространены следующие классификационные ИПЯ: 1) ГРНТИ (Государственный российский классификатор научно-технической информации); 2) Предметный рубрикатор Библиотеки Конгресса США; 3) УДК, ББК, ДКД. Лучшие АБИС поддерживают одновременно несколько ИПЯ. ГРНТИ – один из наиболее важных классификационных языков, который поддерживает и обеспечивает совместимость АБИС. При помощи ГРНТИ можно определить тематический охват, который соответствует определённой библиотеке или службе НТИ. Можно осуществить формирование информационных массивов, систематизацию материалов. Важнейшей функцией ГРНТИ является совмещение АБИС и АИС. Основной частью ГРНТИ является классификационная таблица, которая содержит перечисление кодов, наименование рубрик в порядке возрастания кодов, а также справочно-ссылочный аппарат. Существует АПУ для входа в рубрикатор. Организация и ведение ГРНТИ предусматривает наличие государственного машиночитаемого эталона-рубрикатора. ГРНТИ постоянно обновляется и корректируется. УДК широко распространена по всему миру, в т.ч. и в Беларуси. Очень удобен для АБИС, потому что существует его электронная версия, которая готовится и обновляется Государственной научно-технической библиотекой России. Существует и машиночитаемый вариант ББК, разработанный Государственной библиотекой России, которая и поставляет этот вариант на информационный рынок. Электронный вариант ББК включает текстовый файл, который состоит из записей в формате RUSMARC, а также текстовый файл в формате USMARC. Файл для делений таблиц ББК загружен в АРМ систематизатор Российской государственной библиотеки. Десятичная классификация Дьюи – самая распространённая в мире, является международной и используется во всех АБИС США, Канады и т.д. До 1929г. использовалась в бывшем СССР. Сейчас активно переводится на русский язык для распространения в России. Классификация является средством информационного обеспечения и совместимости АБИС. Существует рынок унифицированных информационных систем, которые можно приобрести у поставщиков с условием последующего платного обновления: - УДК с АПУ; - Справочник по УДК; - ГРНТИ с АПУ; - Классификатор Библиотеки Конгресса США; - Десятичная классификация Дьюи с АПУ; - Таблицы соответствия УДК и классификации Дьюи. Вопрос №28. Предметные рубрики Конгресса США Предметный рубрикатор Библиотеки Конгресса США ведётся с 1914г., постоянно пополняется, имеет печатную и электронную формы. В Беларуси в НББ ведётся работа по объединению рубрикаторов НББ, отраслевых библиотек и Библиотеки Конгресса США. Многие АБИС поддерживают как русскоязычную, так и англоязычную формы этого рубрикатора. Вопрос №29. Дескрипторные языки Дескрипторные языки предназначены для представления предметного содержания документов и запросов для ввода в систему. Лексической единицей дескрипторного ИПЯ является дескриптор. При индексировании дескриптор выбирается не из обрабатываемых текстов, а из словаря. Дескриптор отличается от ключевых слов тем, что его значение однозначно. При помощи дескрипторного языка можно осуществлять углубленное индексирование и многоаспектный тематический поиск. Дескрипторный язык является одним из самых эффективных средств АБИС. Совокупность дескрипторных статей по определённой отрасли знаний или теме составляет информационно-поисковый тезаурус. Тезаурус – перечисление дескрипторов, между которыми установлены определённые отношения, которые могут быть сильными или слабыми. Составление дескрипторных тезаурусов очень сложный и финансово затратный процесс. Именно поэтому вместо того, чтобы составлять национальные дескрипторные тезаурусы в Беларуси пользуются зарубежными. Например Российский научно-медицинский рубрикатор и ИРБИС используются в Беларуси. Российский научно-медицинский рубрикатор пользуется рубрикатором, созданным на базе американского тезауруса по медицине MECH. MECH состоит из следующих языковых средств: заглавие, географическое заглавие, основные характеристики, вторичные дескрипторы, термины вне тезауруса и входящие термины. Заголовок – главный предметный заголовок и используется в качестве рубрикатора при библиографическом поиске. Географический заголовок включает термины, которые используются в специальных библиографических указателях. Термины вне тезауруса введены в словарь для удобного построения классификационных схем, они не используются при индексировании и выполнении запросов. Вторичные предметные рубрики используются при автоматизированном поиске. Обязательные характеристики представляют собой фиксированные значения на наличие или отсутствие которых проверяется каждый документ. Подзаголовки служат для уточнения смысла дескрипторов при помощи указания области его использования. Входящие термины ссылаются на соответствующие им дескрипторы и обеспечивают эффективный поиск при замене дескрипторов. Тезаурус MECH имеет сложную иерархическую структуру, постоянно развивается и уточняется, поиск на русском и английском языках. В БелСХБ используется тезаурус “AGROVOG”, также встроены ИРБИС. Электронная версия используется в БД «Агрис». Вопрос №30. Язык авторитетных файлов Широко используются в современных АБИС для унификации элементов библиографических записей. Изначально разработкой авторитетных файлов занимались ЮНЕСКО и ИФЛА. В 1977 г. они поручили библиографическим организациям и библиографам мира вести национально-нормативные файлы актов. С 1979 г. действовала группа, которая разрабатывала соответствующий формат UNIMARC / AUTHORITIES. Нормативный файл представляет собой описание исходных элементов документа, среди которых: заголовок, включает имя наименования организации, темы предмета, названия произведения и т.д. Кроме этого из этих данных можно получить все варианты заголовка, сведения об изданиях, международный стандартный номер. Авторитетные файлы создаются в разных странах обычно централизованным путем. Создание авторитетных файлов, предназначенных для:
В нормативных записях об индивидуальном авторе, даже фиксируются формы его имени, годы его жизни и варианты написания. Система нормативных файлов поддерживается соответствующими коммуникационными форматами. Система авторитетных файлов включает в себя следующие наиболее распространенные файлы:
Вопрос №31. Национальная система авторитетных файлов Создание национальной системы авторитетных данных требует совместных усилий на национальном и международных уровнях. В государственной программе «Электронная Беларусь» есть специальная запись относительно создания авторитетных файлов с соответствующим бюджетом финансирования. Существуют также международные проекты по совместным разработкам авторитетных файлов. Существует англо-американский проект AUTHOR (Библиотеки Конгресса США и Британской национальной библиотеки) Совместный проект библиотеки Конгресса и Российской национальной библиотеки по установленным соответственным между предметными рубрикаторами этих библиотек, что даст возможность создать соответственный интерфейс системы для поиска по предметным рубрикам на различных языках. Существует международная программа «COBRA» этот проект объединяет 5 национальных библиотек (Бельгия, Испания, Португалия, Франция, Великобритания). Целью программы является создание общеевропейского электронного каталога. Идея создания международной БД авторитетных файлов заключается в том, что каждое национальное библиографическое агентство создает доступные через интернет авторитетные файлы. Для этого используются сервер ИФЛА. Для этих файлов ИФЛА предлагает международный стандартный номер нормативных данных (ISADN). К международным проектам помимо стран их организовавших могут со временем присоединиться и другие страны. |