Метод управления данными в задаче построения компьютерной информационной технологии цифрового сбора, обработки и анализа данных
Скачать 160.21 Kb.
|
Г.В. Дорохина, Д.А. Гаркуша МЕТОД УПРАВЛЕНИЯ ДАННЫМИ В ЗАДАЧЕ ПОСТРОЕНИЯ КОМПЬЮТЕРНОЙ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ ЦИФРОВОГО СБОРА, ОБРАБОТКИ И АНАЛИЗА ДАННЫХ Институт проблем искусственного интеллекта, г. Донецк, sgv_iai@mail.ru, dmitrii.garkusha.97@mail.ru Введение Цифровой портрет государства – часть цифровой экономики. Он формируется из статистических наблюдений, плановых мониторингов и разовых запросов, логистических и других данных. Современные ин- струменты поддержки принятия управленческих решений требуют, что- бы данные, сохраняемые в процессе работы объектов управления, были оцифрованы, структурированы и интегрированы в онтологическую мо- дель государственных данных. ГУ «Институт проблем искусственного интеллекта» выполняет ра- боты по автоматизации сбора отчетности Государственной службой статистики Донецкой Народной Республики (Госстат ДНР). В настоя- щее время проходят апробации программного обеспечения для ввода отчетов респондентов по шести формам отчетности. Данные отчетов вносятся в базу данных (БД), сами отчеты имеют визуальное представ- ление в виде печатных документов на бланках установленного образца. Требования Госстат ДНР по развитию системы: 1) обеспечить для респондентов возможность предоставления отчетов в электронном виде по всем формам отчетности; 2) добавление новых форм отчетности или корректировка существующих (изменение перечня показателей; изме- нение внешнего вида бланка) должны производиться без обращения к разработчикам (т.е. без изменений БД и программы). Актуальной является разработка метода управления данными, поз- воляющего решить описанную проблему. Метод управления данными Необходимо разработать метод управления данными, позволяю- щий единообразно выполнять сбор, обработку и анализ данных отчетов независимо вида отчета (формы отчетности). Разработанный метод основан на применении методов программ- ной инженерии в сочетании с онтологиями, парадигмой автоматного программирования [1] и принципа «шаблонизации» [2]. Он включает в себя: архитектуру данных, автоматизацию поведения сущностей ин- формационной системы (личный кабинет респондента, форма отчетно- сти, отчет и др.), методику подготовки формы отчетности к интеграции в программное обеспечение, способ ввода данных отчетов [3], способ генерации печатных документов [4]. Архитектура данных. Предложено (см. рис. 1) традиционным спо- собом хранить реестр респондентов, реестр форм отчетности (Forms), реестр отчетов (таблица с общими для всех отчетов данными – RespondentForms). Для хранения данных отчетов, специфичных для конкретной формы отчетности, предложено дополнить БД реестром по- казателей (Characteristics), а значения показателей отчетов всех форм отчетности хранить в едином потоке данных (DataFlow). Такой подход позволит не изменять БД при изменении перечня или содержимого форм отчетности. Фрагмент структуры БД, которая обеспечит такую возможность, приведен на рис. 1. На рис. 1 таблицы и поля, добавлен- ные в БД, обозначены курсивом и выравниванием по правому краю (только поля), добавленные в БД. Рис. 1. Фрагмент БД для хранения данных отчетов в одном потоке Особенности предложенной организация хранения данных отчетов (рис. 1) позволяют: 1) единообразно собирать, хранить, извлекать, обра- батывать значения показателей любых отчетов; 2) естественным обра- зом деперсонифицируют значения потока данных (определить принад- лежность значения конкретному показателю отчету, респонденту можно только через таблицу DataFlowInd – т.е. для разграничения доступа к потоку данных достаточно выполнить разграничение доступа к таблице DataFlowInd). Методика подготовки формы отчетности к интеграции в про- граммное обеспечение состоит в следующем. Каждому показателю формы отчетности присваивают уникальный символьный идентифика- тор. Добавляют показатели в онтологическую модель предметной обла- сти. Создают человекозаполняемый машиночитаемый шаблон отчета и машиночитаемое описание шаблона отчета [3], шаблон печатного доку- мента [4]. Создают форму отчетности, задают её названия (полное, со- кращенное), периодичность и загружают подготовленные шаблоны и файлы разъяснений по заполнению отчетов по данной форме отчетно- сти. Заполняют календарь подачи формы отчетности. Через интерфейс администратора информационной системы проверяют корректность функционирования системы после интеграции формы отчетности. Вво- дят форму отчетности в эксплуатацию. Заключение Новый метод за счет предложенной архитектуры данных, мето- дики подготовки формы отчетности к интеграции в программное обеспечение, способа ввода данных отчетов, способа генерации печат- ных документов позволяет хранить и обрабатывать данные различных отчетов в едином деперсонифицированном потоке данных с простым механизмом разграничения доступа. За счет интеграции показателей отчетов в онтологическую модель предметной области обеспечивается связанность, сопоставимость, однозначная интерпретируемость дан- ных из разных отчетов. Практическая значимость состоит в сокраще- нии трудозатрат на добавление новых форм отчетности или корректи- ровка существующих, выполнении этих операций без изменений БД и программы. Поликарпова, Н.И. Автоматное программирование / Н.И. Поликарпова, А.А. Шалыто. – Санкт-Петербург: Питер, 2009. – 176 с. Дорохина, Г.В. Формализованные онтологии и задача построения компь- ютерной информационной технологии цифрового сбора, обработки и ана- лиза данных / Г.В. Дорохина // Искусственный интеллект: теоретические аспекты и практическое применение: сборник тезисов Международного круглого стола. – 2020. – С. 229–234. Дорохина, Г.В. Организация подсистемы ввода и хранения данных в за- даче цифрового сбора, обработки и анализа данных / Г.В. Дорохина, Д.А. Гаркуша, О.И. Мартынов, С.А. Грабарчук // Искусственный интел- лект: теоретические аспекты и практическое применение (ИИ-2021): сборник тезисов Донецкого международного круглого стола (в печати). Рубан, О.И. Модуль генерации печатных документов для информационных систем / О.И. Рубан, Е.Н. Лазаренко, Г.В. Дорохина // Искусственный ин- теллект: теоретические аспекты и практическое применение (ИИ-2021)»: сборник тезисов Донецкого международного круглого стола (в печати). |