ЧИСЛЕННАЯ ОЦЕНКА КАЧЕСТВА ДАННЫХ ПРИ ВЗАИМОДЕЙСТВИИ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ В ИНТЕРЕСАХ ОБЕСПЕЧЕНИЯ ИХ ИНТЕРОПЕРАБЕЛЬН. СТАТЬЯ В ЭРУ ФОМИН. Численная оценка качества данных при взаимодействии
Скачать 0.72 Mb.
|
УДК 681.142 ББК 32.97 ЧИСЛЕННАЯ ОЦЕНКА КАЧЕСТВА ДАННЫХ ПРИ ВЗАИМОДЕЙСТВИИ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ В ИНТЕРЕСАХ ОБЕСПЕЧЕНИЯ ИХ ИНТЕРОПЕРАБЕЛЬНОСТИ ФоминИ.А, кандидат технических наук, начальник лаборатории. ФГБУ «3 ЦНИИ» Минобороны России, 107564, Россия, г. Москва, Погонный проезд, 10, fomin-for- job@yamdex.ru, +7(915)475-35-43 Олейников А.Я., доктор технических наук, профессор, заслуженный деятель науки РФ, ФГБУН «ИРЭ им. Котельникова РАН»,125009, Россия, г. Москва, ул Моховая, д.11,стр.7,olein39@gmail.com,+7 (916)371-12-86/ Аннотация: Активное внедрение автоматизации в различных областях человеческой деятельности приводит к появлению множества разнородных информационно-управляющих систем, структура и функционал которых зачастую сильно зависят от контекста конкретной области применения. Необходимость организации взаимодействия разнородных информационных систем вызывает проблему интероперабельности и определяет актуальность разработки инструментов численной оценки качества данных при таком взаимодействии. Статья разработана в рамках проекта РФФИ № 19-07-00774 Ключевые слова: интероперабельность, сетецентризм, взаимодействие информационных систем, информационно-вычислительные процессы, качество данных, оценка качества данных, имитационное моделирование В последние годы в нашей стране идет активное внедрение автоматизации процессов во многих сферах человеческой деятельности. Внедрение информационно- управляющих систем, автоматизация бизнес-процессов являются важными направлениями научно-технического развития общества. Автоматизация ведет к повышению производительности труда за счет сокращения временных и ресурсных затрат и освобождения человека из производственного процесса, а также к повышению конкурентоспособности за счет качества принимаемых решений и оперативности управления[1]. В настоящее время многие предприятия в различных сферах деятельности стремятся осуществить автоматизацию своих бизнес-процессов, что приводит к появлению множества разнородных информационно-управляющих систем, структура и функционал которых зачастую сильно зависят от контекста конкретной области применения. Кроме того разнородные ИУС имеют различный уровень технологичности, разную архитектуру построения, уникальные форматы хранения данных и прочие различия[3]. Такое положение дел создает предпосылки перехода к сетецентрическому принципу управления, однако создает проблему интероперабельности. Несмотря на это, независимо от области функционирования конкретной информационно-управляющей системы (ИУС) в ней протекает два основных вида процессов: - информационные (связанные со сбором, обработкой и доведением данных); - управления (связанные в генерацией и доведением управляющих воздействий). Общей целью функционирования различных информационно-управляющих систем является повышение оперативности, устойчивости и непрерывности управления технологическими (и другими) процессами, а также повышение качества принимаемых управленческих решений[4]. Таким образом можно выделить ряд общих задач функционирования большинства ИУС: - ускорение выполнения процессов сбора, обработки и доведения данных; - предоставление должностным лицам, принимающим решения, полных, актуальных по содержанию и безошибочных данных о состоянии объектов управления и условий их функционирования. - снижение трудозатрат лиц, принимающих решения, на выполнение функций управления и рутинных операций по сбору, обработке и доведению данных и выработке решений; - повышение оперативности управления и выполнения процессов в целом; - повышение степени обоснованности принимаемых решений на основе повышения качества исходных данных; - сокращение времени реакции объекта управления на различные значимые события. На рисунке 1 представлена структурно-функциональная схема информационно- управляющей системы предприятия. Рисунок 1 Информационно-управляющая система предприятия В современных условиях любое предприятие практически не может существовать автономно и имеет множество связей (производственных, финансовых и пр.) с другими предприятиями, банками, государственными органами, иногда научными организациями и другими субъектами из самых различных сфер деятельности. Такие связи, зачастую возникающие и исчезающие в процессе функционирования предприятия, формируют и изменяют информационные потребности, удовлетворяемые соответствующими информационными системами, и определяют необходимость организации их взаимодействия и перехода к сетецентрическому принципу управления. Взаимодействие информационных систем в общем виде сводится к обмену данными, необходимыми для выполнения функций управления, то есть данными с заданными характеристиками качества. Под качеством данных будем понимать набор потребительских свойств информации, таких как полнота, актуальность, точность, безошибочность и пр. Потеря качества информации в процессе ее сбора, обработки, доведения (предоставления доступа) и использования возникает под действием множества факторов различной природы. Данные могут быть не предоставлены потребителю из-за различий в архитектуре построения взаимодействующих ИУС, по причине не согласованности форматов хранения и интерфейсов доступа, выхода из строя или перегрузки оборудования, сбоев программного обеспечения и прочих причин. Иногда информация может терять актуальность из-за динамики производственных (прочих) процессов, в ходе сбора, обработки и доведения в элементы данных могут вноситься ошибки (особенно, если в процесс включен пользователь). Иными словами, информация, которой располагают пользователи в результате совместного функционирования различных информационных систем, почти всегда в определенной степени не будет соответствовать реальному положению дел. На рисунке 2 приведена иллюстрация информационного взаимодействия различных систем. Информационная система производства Информационная система энергетической компании Информационная система гос. органа ПРОИЗВОДСТВО ЭНЕРГЕТИКА ГОС. ОРГАНЫ Данные о производстве Данные об энергетике Данные от гос. органов Информационные потребности Информационные потребности Информационные потребности ВЗИМОДЕЙСТВИЕ РАЗЛИЧНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ ПРОЦЕССЫ ФУНКЦИОНИРОВАНИЯ (изменение значений имеющихся данных) актуальные и безошибочные данные устаревшие данные отсутствующие данные Имеющиеся данные Имеющиеся данные Имеющиеся данные данные с ошибками ( искаженные) Рисунок 2 Результат взаимодействия разнородных информационных систем Проблемы обеспечения качества данных при совместном функционировании нескольких ИУС в основном кроются в двух взаимосвязанных областях: - обеспечение интероперабельности систем (способности двух и более информационных систем обмениваться информацией и использовать ее)[2,3]; - обеспечение эффективности систем (выбор такого набора системно-технических и архитектурных решений, который будет обеспечивать достижение цели функционирования при наименьших ресурсных и временных затратах). Следует учитывать, что степень автоматизации различных информационных систем разниться от «ручной» пересылки сообщений между абонентами до сервис- ориентированной архитектуры построения, а на различных уровнях построения систем могут применяться самые разные технологии и стандарты. На рисунке 3 представлена иллюстрация различных форм организации информационного взаимодействия. Рисунок 3 Формы организации информационного взаимодействия систем и различные архитектурные решения Таким образом, при построении новой ИУС или в ходе модернизации имеющейся закономерно встает проблема анализа и синтеза системы или ее составной части. Из всех доступных решений по ее построению необходимо выбрать и реализовать такой набор, который в первую очередь обеспечит высокое качество используемых данных, исходя из контекста предметной области, набора систем и сервисов, предполагаемых к взаимодействию, а так же требований, предъявляемых заказчиком. Вопросам обеспечения качества выходной информации в АСУ посвящено значительное количество работ отечественных и зарубежных авторов. Вопросам проектирования и испытаний АСУ посвящены основополагающие труды Липаева В.В. и Шаракшанэ А.С. Существенный вклад в обеспечение качества выходной информации в АСУ внесли Костогрызов А.И., Щербина А.М., Балыбердин В.А., Киселев В.Д. и другие авторы. В отечественной практике создания информационно-управляющих систем в настоящее время существует и используется ряд нормативных документов на уровне стандартов, определяющих различные положения по оценке качества функционирования информационных процессов. Прежде всего, сюда следует отнести ГОСТ РВ 51987-02 Информационная технология. Комплекс стандартов на автоматизированные системы. Требования и показатели качества функционирования информационных систем. Общие положения. В рамках работ Международной организации по стандартизации (ISO) была разработана и в настоящее время рекомендована для использования серия стандартов обеспечения качества систем и программных средств SQuaRE[17-20]. С точки зрения отображения тематики настоящей работы наибольший интерес представляют следующие стандарты данной серии: ГОСТ Р ИСО/МЭК 25010: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества систем и программных продуктов; ГОСТ Р ИСО/МЭК 25012: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества данных; ГОСТ Р ИСО/МЭК 25024: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Измерение качества данных; Отталкиваясь от основных положений предыдущих стандартов, ISO/IEC 250nn больше внимания уделяет таким важным аспектам как определение и формирование набора метрик для измерения качества функционирования информационных систем и данных, что особенно важно, при оценке специализированных информационно- управляющих систем. Кроме того существует ГОСТ Р 55062-2012 Информационные технологии. Системы промышленной автоматизации их интеграция. Интероперабельность. Основные положения. Данный стандарт определяет единый подход к обеспечению интероперабельности для систем самого широкого класса и масштаба. Руководствуясь требованиями указанных стандартов, сформируем модель качества совместного функционирования нескольких разнородных информационных систем, состоящую из наиболее критичных показателей[3]. Следует оговориться, что данная модель качества носит абстрактный характер и не привязана к конкретной предметной области. Исходя из особенностей совместного функционирования метрики данной модели могут быть дополнены теми или иными показателями, а сама модель качества целыми метриками, такими например, как надежность[5,6]. Качество данных при взаимодействии - полнота данных - актуальность данных - безошибочность данных - согласованность значений данных Интероперабельность - сетевая готовность - доступность Производительность - временные характеристики - использование ресурсов Рисунок 4 Модель качества взаимодействия разнородных информационных систем (вариант) С целью проведения своего рода микроанализа качества данных, что особенно важно при оценке взаимодействия разнородных информационных систем, приведем пример определения показателей качества данных в ИУС, учитывая, что качество данных будет меняться с течением времени. Полнота данных[7,8]: F полн Q,α,j = I Q,α,j E Q,α , 0 ≤ F полн Q,α,j ≤ 1 (1) где I Q,α,j – количество атрибутов данных категории α, имеющихся в базе данных (БД) Q-й ИУС на j-ом интервале постоянства; E Q,α – количество атрибутов данных категории α, необходимых на Q-й ИУС для выполнения функций управления. Фактически отражает информационные потребности по α-й категории данных соответствующих категорий пользователей. Актуальность данных[7,8]: F актQ,α,j = I акт Q,α,j I Q,α,j , 0 ≤ F акт Q,α,j ≤ 1 (2) где I акт,Q,α,j – количество атрибутов данных категории α, на Q-й ИУС, сохранивших актуальность на j-ом интервале постоянства; где I Q,α,j – количество атрибутов данных категории α, имеющихся в БД Q-й ИУС на j-ом интервале постоянства. Временные параметры совместного функционирования ИУС обстановки характеризуются математическим ожиданием и дисперсией времени выполнения соответствующих процедур {D}, состоящих из совокупности элементарных операций. Математическое ожидание времени выполнения процедуры D будет характеризовать величина: T D ̅̅̅ = 1 n D ∑ T D,i n D i=1 Дисперсия времени выполнения процедуры D будет характеризоваться величиной: S D 2 ̅̅̅ = 1 n D − 1 ∑(T D,i n D i=1 −T D,i+1 ) 2 где T D,i – время выполнения i-й реализации процедуры D обработки сообщения данных; n D – количество реализаций процедуры D на интервале 0,T. Ресурсные издержки функционирования процессов совместного функционирования ИУС характеризуются коэффициентами загрузки ресурсов и средними значениями длин очередей требований к ресурсам. Значения этих показателей определяются из выражений: К загр r = 1 T ∑ q ij τ j J j=1 L r = 1 T ∑ l ij τ j J j=1 где: T – общее время совместного функционирования систем; J – количество интервалов постоянства на отрезке [0,T]; q ij – число занятых каналов i-го элемента на j-м интервале постоянства; τ j – продолжительность j-го интервала постоянства; l ij – значение длины очереди у i-го элемента на j-м интервале постоянства. Учитывая сложность аналитического описания совместного функционирования нескольких ИУС, для оценки численных значений выбранных показателей предлагается способ имитационного моделирования при реализации имитационной модели путем синтеза объектного, дискретно-событийного и системно-динамического подходов. Это обусловлено тем, что многообразие факторов, влияющих на качество данных сложно оценить в рамках одного подхода к моделированию систем. Синтез подходов к моделированию направлен на анализ факторов, имеющих различную природу и выявления тех из них, которые являются сдерживающими по отношению к информационно-управляющим процессам. Для выявления сдерживающих факторов и достижения высокой точности определения численных значений показателей качества данных предлагается на одной шкале времени имитировать как управляемые (производственные и прочие) процессы, определяющие изменения условно-реальных значений контролируемых параметров, так и информационно-управляющих процессов, включающих работу пользователей, программных средств и передачу данных по сети. Это дает возможность производить сравнение условно-реальных значений контролируемых параметров и значения атрибутов данных, имеющихся на автоматизированных рабочих местах различных ИУС на каждом шаге моделирования, что в свою очередь позволяет отслеживать динамику качества данных по категориям в ходе совместного функционирования ИУС. На рисунке 5 представлена укрупненная схема построения комплексной имитационной модели. СИСТЕМА ПАРАМЕТРОВ ВЗАИМОДЕЙСТВУЮЩИХ ИС БЛОК МОДЕЛИРОВАНИЯ ДИНАМИКИ ПРОИЗВОДСТВЕННЫХ (ПРОЧИХ) ПРОЦЕССОВ БЛОК МОДЕЛИРОВАНИЯ ИНФОРМАЦИОННО УПРАВЛЯЮЩИХ ПРОЦЕССОВ БЛОК УПРАВЛЕНИЯ МОДЕЛИ БЛОК ОБРАБОТКИ СТАТИСТИКИ Рисунок 5 Структурная схема комплексной имитационной модели взаимодействия ИУС Для наиболее адекватного моделирования информационных процессов при построении модели будем руководствоваться следующими положениями: - на входы системы поступает некоторое число нестационарных потоков требований, определяемых событиями динамики изменения обстановки; - каждое требование характеризуется набором конкретных атрибутов данных и их значениями; - порядок обслуживания каждого поступившего требования определяется его типом и описывается направленным графом без контуров и петель. Оно состоит в последовательном и параллельном выполнении определенных операций элементами системы или группами элементов в заданном сочетании; - требования обладают одинаковыми и разными приоритетами в обслуживании, в системе действуют абсолютные и относительные приоритеты; - для каждого типа требований существует допустимое время нахождения (выполнения) его в системе (старение информации, останов процесса), после истечения которого, оно считается не обслуженным; - обслуживающими элементами системы являются пользователи, технические устройства, программные средства; - время выполнения операций случайное и определяется на основе законов распределения; - часть элементов системы могут иметь несколько однотипных каналов обслуживания. В процессе функционирования системы ее элементы выходят из строя и восстанавливаются. Для каждого из объектов управления, находящихся под контролем 𝑄 𝑛 ИУС может быть задана модель эксплуатации в виде конечного автомата, определяющего порядок и правила изменения его состояний и в ходе функционирования. Переходы между блоками конечных автоматов изменяют значения контролируемых ИУС параметров. Пример конечного автомата, определяющий динамику «поведения» объекта управления, представлен на рисунке 6. состояние 1 состояние 2 состояние 3.1 состояние 3.2 состояние 3.3 сост. 4 состояние 3.4 Рисунок 6 – Конечный автомат поведения объекта, формализующего объект управления Потоки требований представляют совокупность поступающих в систему (или формируемых внутри нее) и нуждающихся в обслуживании различных сообщений. Обслуживание требований состоит в отработке системой (должностными лицами, программными и техническими средствами) содержащихся в них сведений в порядке, определенном алгоритмами и техническим состоянием ИУС в момент наступления события, требующего реакции от. При этом сообщение (требование) характеризуется множеством атрибутов данных, содержащихся в нем. Обработка требования связана с последовательной передачей данных, их обработкой и представлением пользователям некоторого объема информации. Объем передаваемой, обрабатываемой и доводимой информации зависит от типа события и учитывается при моделировании. Динамика поведения системы на интервале [0,Т] обуславливается параметрами самой системы и потоками событий изменения вектора контролируемых параметров. Состояние системы в каждый момент времени может быть однозначно определено, если известно множество обслуживаемых заявок, множество поступивших и ожидающих обслуживания заявок и состояние каждого элемента системы. Элементы системы могут находиться в одном из трех состояний: занятом, свободном, неработоспособном. Каждое поступающее в систему требование проходит несколько этапов обработки (прием, отображение, анализ, принятие решения, отработка команды и т.д.). Последовательность и привлекаемые для обработки средства различны и зависят от типа требования. Время выполнения этапа обработки (элементарно операции в составе графа) определяется специальной функцией. Закон распределения времени выполнения зависит от типа операции. В исследуемой системе будем рассматривать два основных типа элементарных операций: операции, выполняемые пользователями; операции, выполняемые системой передачи данных. Времена выполнения операций, связанных с работой пользователей и взаимодействием человек-машина будут определяться на основе закона β-распределения с параметрами, значения которых получены в ходе натурных экспериментов в ходе предварительных и государственных испытаний опытных образцов КСАУ[Октябрьский Ю.П., Биатлон, Триатлон]. где x x при x при x x q p B x q p B q p , 0 , 0 0 , 1 0 ) 1 ( ) , ( 1 ) , , ( 1 1 𝐵(𝑝, 𝑞, 𝑥) = ∫ 𝑥 𝑝−1 (1 − 𝑥) 𝑞−1 𝑑𝑥 ∞ 0 Вид функции зависит от показателей p и q. Варьируя этими значениями можно получить различные степени асимметрии плотности распределения. Для практических целей наиболее подходящими являются распределения при 1 Времена выполнения операций передачи сообщений по каналам связи может быть определено на основе закона распределения Эрланга с параметрами распределения, учитывающими пропускную способность и текущую загруженность каналов связи, а также объем передаваемого сообщения. Пример модели выполнения процедуры представлен на рисунке 6 Рисунок 6 – Модель выполнения процедуры обработки и доведения данных Предложенный подход к построению модели позволяет проводить варьирование значениями параметров взаимодействующих систем или идеализацию их значений в ходе моделирования от опыта к опыту. Это относится как к отдельным факторам, так и к их группам. Таким образом предложенный подход на основе имитационного моделирования позволяет численно оценить достигаемый уровень качества данных при взаимодействии разнородных информационных систем с учетом контекста предметной области и условий функционирования, особенностей построения сетецентрических ИУС, их способности к взаимодействию, а также структурных и функциональных параметров. Литература 1. Костогрызов А.И., Степанов П.В. Инновационное управление качеством и рисками в жизненном цикле систем формационных систем / - М.: Изд-во ВПК, 2008. - 404 с. 2 ГОСТ Р 55062-2012 Информационные технологии. Системы промышленной автоматизации их интеграция. Интероперабельность. Основные положения. 3. Батоврин В.К., Гуляев Ю.В., Олейников А.Я. Обеспечение интероперабельности – основная тенденция в развитии открытых систем. – М.: РАН, Информационные технологии и вычислительные системы, 2009. – №5. – С. 7-15. 4. Костогрызов А.И., Щербина М.А. Основы оценки, обеспечения и повышения качества выходной информации в АСУ организационного типа, Москва-1994, изд. «ВПК», 277 с 5. ГОСТ Р ИСО/МЭК 25000: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Руководство по SQuaRE; 6. ГОСТ Р ИСО/МЭК 25010: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества систем и программных продуктов; 7. ГОСТ Р ИСО/МЭК 25012: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества данных; 8. ГОСТ Р ИСО/МЭК 25024: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Измерение качества данных; |