Главная страница
Навигация по странице:

  • Ключевые слова

  • Качество данных при взаимодействии - полнота данных- актуальность данных- безошибочность данных- согласованность значений данныхИнтероперабельность

  • Производительность

  • ЧИСЛЕННАЯ ОЦЕНКА КАЧЕСТВА ДАННЫХ ПРИ ВЗАИМОДЕЙСТВИИ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ В ИНТЕРЕСАХ ОБЕСПЕЧЕНИЯ ИХ ИНТЕРОПЕРАБЕЛЬН. СТАТЬЯ В ЭРУ ФОМИН. Численная оценка качества данных при взаимодействии


    Скачать 0.72 Mb.
    НазваниеЧисленная оценка качества данных при взаимодействии
    АнкорЧИСЛЕННАЯ ОЦЕНКА КАЧЕСТВА ДАННЫХ ПРИ ВЗАИМОДЕЙСТВИИ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ В ИНТЕРЕСАХ ОБЕСПЕЧЕНИЯ ИХ ИНТЕРОПЕРАБЕЛЬН
    Дата23.09.2021
    Размер0.72 Mb.
    Формат файлаpdf
    Имя файлаСТАТЬЯ В ЭРУ ФОМИН.pdf
    ТипДокументы
    #236021

    УДК 681.142
    ББК 32.97
    ЧИСЛЕННАЯ ОЦЕНКА КАЧЕСТВА ДАННЫХ ПРИ ВЗАИМОДЕЙСТВИИ
    РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ В ИНТЕРЕСАХ
    ОБЕСПЕЧЕНИЯ ИХ ИНТЕРОПЕРАБЕЛЬНОСТИ
    ФоминИ.А, кандидат технических наук, начальник лаборатории. ФГБУ «3 ЦНИИ»
    Минобороны России, 107564, Россия, г. Москва, Погонный проезд, 10, fomin-for-
    job@yamdex.ru, +7(915)475-35-43
    Олейников А.Я., доктор технических наук, профессор, заслуженный деятель науки
    РФ, ФГБУН «ИРЭ им. Котельникова РАН»,125009, Россия, г. Москва, ул Моховая,
    д.11,стр.7,olein39@gmail.com,+7 (916)371-12-86/
    Аннотация: Активное внедрение автоматизации в различных областях
    человеческой деятельности приводит к появлению множества разнородных
    информационно-управляющих систем, структура и функционал которых зачастую
    сильно зависят от контекста конкретной области применения. Необходимость
    организации взаимодействия разнородных информационных систем вызывает проблему
    интероперабельности и определяет актуальность разработки инструментов численной
    оценки качества данных при таком взаимодействии. Статья разработана в рамках
    проекта РФФИ № 19-07-00774
    Ключевые
    слова: интероперабельность, сетецентризм, взаимодействие информационных систем, информационно-вычислительные процессы, качество данных, оценка качества данных, имитационное моделирование
    В последние годы в нашей стране идет активное внедрение автоматизации процессов во многих сферах человеческой деятельности. Внедрение информационно- управляющих систем, автоматизация бизнес-процессов являются важными направлениями научно-технического развития общества. Автоматизация ведет к повышению производительности труда за счет сокращения временных и ресурсных затрат и освобождения человека из производственного процесса, а также к повышению конкурентоспособности за счет качества принимаемых решений и оперативности управления[1].
    В настоящее время многие предприятия в различных сферах деятельности стремятся осуществить автоматизацию своих бизнес-процессов, что приводит к появлению множества разнородных информационно-управляющих систем, структура и функционал которых зачастую сильно зависят от контекста конкретной области применения. Кроме того разнородные ИУС имеют различный уровень технологичности, разную архитектуру построения, уникальные форматы хранения данных и прочие различия[3]. Такое положение дел создает предпосылки перехода к сетецентрическому принципу управления, однако создает проблему интероперабельности.

    Несмотря на это, независимо от области функционирования конкретной информационно-управляющей системы (ИУС) в ней протекает два основных вида процессов:
    - информационные (связанные со сбором, обработкой и доведением данных);
    - управления (связанные в генерацией и доведением управляющих воздействий).
    Общей целью функционирования различных информационно-управляющих систем является повышение оперативности, устойчивости и непрерывности управления технологическими (и другими) процессами, а также повышение качества принимаемых управленческих решений[4].
    Таким образом можно выделить ряд общих задач функционирования большинства
    ИУС:
    - ускорение выполнения процессов сбора, обработки и доведения данных;
    - предоставление должностным лицам, принимающим решения, полных, актуальных по содержанию и безошибочных данных о состоянии объектов управления и условий их функционирования.
    - снижение трудозатрат лиц, принимающих решения, на выполнение функций управления и рутинных операций по сбору, обработке и доведению данных и выработке решений;
    - повышение оперативности управления и выполнения процессов в целом;
    - повышение степени обоснованности принимаемых решений на основе повышения качества исходных данных;
    - сокращение времени реакции объекта управления на различные значимые события.
    На рисунке 1 представлена структурно-функциональная схема информационно- управляющей системы предприятия.
    Рисунок 1 Информационно-управляющая система предприятия

    В современных условиях любое предприятие практически не может существовать автономно и имеет множество связей (производственных, финансовых и пр.) с другими предприятиями, банками, государственными органами, иногда научными организациями и другими субъектами из самых различных сфер деятельности. Такие связи, зачастую возникающие и исчезающие в процессе функционирования предприятия, формируют и изменяют информационные потребности, удовлетворяемые соответствующими информационными системами, и определяют необходимость организации их взаимодействия и перехода к сетецентрическому принципу управления.
    Взаимодействие информационных систем в общем виде сводится к обмену данными, необходимыми для выполнения функций управления, то есть данными с заданными характеристиками качества. Под качеством данных будем понимать набор потребительских свойств информации, таких как полнота, актуальность, точность, безошибочность и пр.
    Потеря качества информации в процессе ее сбора, обработки, доведения
    (предоставления доступа) и использования возникает под действием множества факторов различной природы. Данные могут быть не предоставлены потребителю из-за различий в архитектуре построения взаимодействующих ИУС, по причине не согласованности форматов хранения и интерфейсов доступа, выхода из строя или перегрузки оборудования, сбоев программного обеспечения и прочих причин. Иногда информация может терять актуальность из-за динамики производственных (прочих) процессов, в ходе сбора, обработки и доведения в элементы данных могут вноситься ошибки (особенно, если в процесс включен пользователь). Иными словами, информация, которой располагают пользователи в результате совместного функционирования различных информационных систем, почти всегда в определенной степени не будет соответствовать реальному положению дел. На рисунке 2 приведена иллюстрация информационного взаимодействия различных систем.
    Информационная система производства
    Информационная система энергетической компании
    Информационная система гос. органа
    ПРОИЗВОДСТВО
    ЭНЕРГЕТИКА
    ГОС. ОРГАНЫ
    Данные о производстве
    Данные об энергетике
    Данные от гос. органов
    Информационные потребности
    Информационные потребности
    Информационные потребности
    ВЗИМОДЕЙСТВИЕ РАЗЛИЧНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
    ПРОЦЕССЫ ФУНКЦИОНИРОВАНИЯ (изменение значений имеющихся данных)
    актуальные и безошибочные данные устаревшие данные отсутствующие данные
    Имеющиеся данные
    Имеющиеся данные
    Имеющиеся данные данные с ошибками
    (
    искаженные)
    Рисунок 2 Результат взаимодействия разнородных информационных систем

    Проблемы обеспечения качества данных при совместном функционировании нескольких ИУС в основном кроются в двух взаимосвязанных областях:
    - обеспечение интероперабельности систем (способности двух и более информационных систем обмениваться информацией и использовать ее)[2,3];
    - обеспечение эффективности систем (выбор такого набора системно-технических и архитектурных решений, который будет обеспечивать достижение цели функционирования при наименьших ресурсных и временных затратах).
    Следует учитывать, что степень автоматизации различных информационных систем разниться от «ручной» пересылки сообщений между абонентами до сервис- ориентированной архитектуры построения, а на различных уровнях построения систем могут применяться самые разные технологии и стандарты. На рисунке 3 представлена иллюстрация различных форм организации информационного взаимодействия.
    Рисунок 3 Формы организации информационного взаимодействия систем и различные архитектурные решения
    Таким образом, при построении новой ИУС или в ходе модернизации имеющейся закономерно встает проблема анализа и синтеза системы или ее составной части. Из всех доступных решений по ее построению необходимо выбрать и реализовать такой набор, который в первую очередь обеспечит высокое качество используемых данных, исходя из контекста предметной области, набора систем и сервисов, предполагаемых к взаимодействию, а так же требований, предъявляемых заказчиком.
    Вопросам обеспечения качества выходной информации в АСУ посвящено значительное количество работ отечественных и зарубежных авторов. Вопросам проектирования и испытаний АСУ посвящены основополагающие труды Липаева В.В. и
    Шаракшанэ А.С. Существенный вклад в обеспечение качества выходной информации в
    АСУ внесли Костогрызов А.И., Щербина А.М., Балыбердин В.А., Киселев В.Д. и другие авторы.
    В отечественной практике создания информационно-управляющих систем в настоящее время существует и используется ряд нормативных документов на уровне стандартов, определяющих различные положения по оценке качества функционирования информационных процессов. Прежде всего, сюда следует отнести ГОСТ РВ 51987-02

    Информационная технология. Комплекс стандартов на автоматизированные системы.
    Требования и показатели качества функционирования информационных систем. Общие положения.
    В рамках работ Международной организации по стандартизации (ISO) была разработана и в настоящее время рекомендована для использования серия стандартов обеспечения качества систем и программных средств SQuaRE[17-20]. С точки зрения отображения тематики настоящей работы наибольший интерес представляют следующие стандарты данной серии:
    ГОСТ Р ИСО/МЭК 25010: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества систем и программных продуктов;
    ГОСТ Р ИСО/МЭК 25012: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества данных;
    ГОСТ Р ИСО/МЭК 25024: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Измерение качества данных;
    Отталкиваясь от основных положений предыдущих стандартов, ISO/IEC 250nn больше внимания уделяет таким важным аспектам как определение и формирование набора метрик для измерения качества функционирования информационных систем и данных, что особенно важно, при оценке специализированных информационно- управляющих систем.
    Кроме того существует ГОСТ Р 55062-2012 Информационные технологии.
    Системы промышленной автоматизации их интеграция. Интероперабельность. Основные положения. Данный стандарт определяет единый подход к обеспечению интероперабельности для систем самого широкого класса и масштаба.
    Руководствуясь требованиями указанных стандартов, сформируем модель качества совместного функционирования нескольких разнородных информационных систем, состоящую из наиболее критичных показателей[3]. Следует оговориться, что данная модель качества носит абстрактный характер и не привязана к конкретной предметной области. Исходя из особенностей совместного функционирования метрики данной модели могут быть дополнены теми или иными показателями, а сама модель качества целыми метриками, такими например, как надежность[5,6].
    Качество данных при взаимодействии
    - полнота данных
    - актуальность данных
    - безошибочность данных
    - согласованность значений данных
    Интероперабельность
    - сетевая готовность
    - доступность
    Производительность
    - временные характеристики
    - использование ресурсов
    Рисунок 4 Модель качества взаимодействия разнородных информационных систем
    (вариант)

    С целью проведения своего рода микроанализа качества данных, что особенно важно при оценке взаимодействия разнородных информационных систем, приведем пример определения показателей качества данных в ИУС, учитывая, что качество данных будет меняться с течением времени.
    Полнота данных[7,8]:
    F
    полн Q,α,j
    =
    I
    Q,α,j
    E
    Q,α
    , 0 ≤ F
    полн Q,α,j
    ≤ 1 (1) где
    I
    Q,α,j
    – количество атрибутов данных категории α, имеющихся в базе данных
    (БД) Q-й ИУС на j-ом интервале постоянства;
    E
    Q,α
    – количество атрибутов данных категории α, необходимых на Q-й ИУС для выполнения функций управления. Фактически отражает информационные потребности по
    α-й категории данных соответствующих категорий пользователей.
    Актуальность данных[7,8]:
    F
    актQ,α,j
    =
    I
    акт Q,α,j
    I
    Q,α,j
    , 0 ≤ F
    акт Q,α,j
    ≤ 1 (2) где
    I
    акт,Q,α,j
    – количество атрибутов данных категории α, на Q-й ИУС, сохранивших актуальность на j-ом интервале постоянства; где
    I
    Q,α,j
    – количество атрибутов данных категории α, имеющихся в БД Q-й ИУС на j-ом интервале постоянства.
    Временные параметры совместного функционирования ИУС обстановки характеризуются математическим ожиданием и дисперсией времени выполнения соответствующих процедур {D}, состоящих из совокупности элементарных операций.
    Математическое ожидание времени выполнения процедуры
    D будет характеризовать величина:
    T
    D
    ̅̅̅ =
    1
    n
    D
    ∑ T
    D,i n
    D
    i=1
    Дисперсия времени выполнения процедуры D будет характеризоваться величиной:
    S
    D
    2
    ̅̅̅ =
    1
    n
    D
    − 1
    ∑(T
    D,i n
    D
    i=1
    −T
    D,i+1
    )
    2
    где
    T
    D,i
    – время выполнения i-й реализации процедуры D обработки сообщения данных; n
    D
    – количество реализаций процедуры D на интервале 0,T.
    Ресурсные издержки функционирования процессов совместного функционирования ИУС характеризуются коэффициентами загрузки ресурсов и средними значениями длин очередей требований к ресурсам. Значения этих показателей определяются из выражений:
    К
    загр r
    =
    1
    T
    ∑ q ij
    τ
    j
    J
    j=1
    L
    r
    =
    1
    T
    ∑ l ij
    τ
    j
    J
    j=1
    где:
    T – общее время совместного функционирования систем;

    J – количество интервалов постоянства на отрезке [0,T]; q
    ij
    – число занятых каналов i-го элемента на j-м интервале постоянства;
    τ
    j
    – продолжительность j-го интервала постоянства; l
    ij
    – значение длины очереди у i-го элемента на j-м интервале постоянства.
    Учитывая сложность аналитического описания совместного функционирования нескольких ИУС, для оценки численных значений выбранных показателей предлагается способ имитационного моделирования при реализации имитационной модели путем синтеза объектного, дискретно-событийного и системно-динамического подходов. Это обусловлено тем, что многообразие факторов, влияющих на качество данных сложно оценить в рамках одного подхода к моделированию систем. Синтез подходов к моделированию направлен на анализ факторов, имеющих различную природу и выявления тех из них, которые являются сдерживающими по отношению к информационно-управляющим процессам.
    Для выявления сдерживающих факторов и достижения высокой точности определения численных значений показателей качества данных предлагается на одной шкале времени имитировать как управляемые (производственные и прочие) процессы, определяющие изменения условно-реальных значений контролируемых параметров, так и информационно-управляющих процессов, включающих работу пользователей, программных средств и передачу данных по сети. Это дает возможность производить сравнение условно-реальных значений контролируемых параметров и значения атрибутов данных, имеющихся на автоматизированных рабочих местах различных ИУС на каждом шаге моделирования, что в свою очередь позволяет отслеживать динамику качества данных по категориям в ходе совместного функционирования ИУС. На рисунке 5 представлена укрупненная схема построения комплексной имитационной модели.
    СИСТЕМА ПАРАМЕТРОВ
    ВЗАИМОДЕЙСТВУЮЩИХ
    ИС
    БЛОК МОДЕЛИРОВАНИЯ ДИНАМИКИ
    ПРОИЗВОДСТВЕННЫХ (ПРОЧИХ)
    ПРОЦЕССОВ
    БЛОК МОДЕЛИРОВАНИЯ ИНФОРМАЦИОННО
    УПРАВЛЯЮЩИХ ПРОЦЕССОВ
    БЛОК
    УПРАВЛЕНИЯ
    МОДЕЛИ
    БЛОК ОБРАБОТКИ
    СТАТИСТИКИ
    Рисунок 5 Структурная схема комплексной имитационной модели взаимодействия
    ИУС
    Для наиболее адекватного моделирования информационных процессов при построении модели будем руководствоваться следующими положениями:

    - на входы системы поступает некоторое число нестационарных потоков требований, определяемых событиями динамики изменения обстановки;
    - каждое требование характеризуется набором конкретных атрибутов данных и их значениями;
    - порядок обслуживания каждого поступившего требования определяется его типом и описывается направленным графом без контуров и петель. Оно состоит в последовательном и параллельном выполнении определенных операций элементами системы или группами элементов в заданном сочетании;
    - требования обладают одинаковыми и разными приоритетами в обслуживании, в системе действуют абсолютные и относительные приоритеты;
    - для каждого типа требований существует допустимое время нахождения
    (выполнения) его в системе (старение информации, останов процесса), после истечения которого, оно считается не обслуженным;
    - обслуживающими элементами системы являются пользователи, технические устройства, программные средства;
    - время выполнения операций случайное и определяется на основе законов распределения;
    - часть элементов системы могут иметь несколько однотипных каналов обслуживания. В процессе функционирования системы ее элементы выходят из строя и восстанавливаются.
    Для каждого из объектов управления, находящихся под контролем
    𝑄
    𝑛
    ИУС может быть задана модель эксплуатации в виде конечного автомата, определяющего порядок и правила изменения его состояний и в ходе функционирования. Переходы между блоками конечных автоматов изменяют значения контролируемых ИУС параметров. Пример конечного автомата, определяющий динамику «поведения» объекта управления, представлен на рисунке 6. состояние 1
    состояние 2
    состояние 3.1
    состояние 3.2
    состояние 3.3
    сост. 4
    состояние 3.4
    Рисунок 6 – Конечный автомат поведения объекта, формализующего объект управления

    Потоки требований представляют совокупность поступающих в систему (или формируемых внутри нее) и нуждающихся в обслуживании различных сообщений.
    Обслуживание требований состоит в отработке системой (должностными лицами, программными и техническими средствами) содержащихся в них сведений в порядке, определенном алгоритмами и техническим состоянием ИУС в момент наступления события, требующего реакции от. При этом сообщение (требование) характеризуется множеством атрибутов данных, содержащихся в нем.
    Обработка требования связана с последовательной передачей данных, их обработкой и представлением пользователям некоторого объема информации. Объем передаваемой, обрабатываемой и доводимой информации зависит от типа события и учитывается при моделировании.
    Динамика поведения системы на интервале [0,Т] обуславливается параметрами самой системы и потоками событий изменения вектора контролируемых параметров.
    Состояние системы в каждый момент времени может быть однозначно определено, если известно множество обслуживаемых заявок, множество поступивших и ожидающих обслуживания заявок и состояние каждого элемента системы. Элементы системы могут находиться в одном из трех состояний: занятом, свободном, неработоспособном.
    Каждое поступающее в систему требование проходит несколько этапов обработки
    (прием, отображение, анализ, принятие решения, отработка команды и т.д.).
    Последовательность и привлекаемые для обработки средства различны и зависят от типа требования.
    Время выполнения этапа обработки (элементарно операции в составе графа) определяется специальной функцией. Закон распределения времени выполнения зависит от типа операции. В исследуемой системе будем рассматривать два основных типа элементарных операций: операции, выполняемые пользователями; операции, выполняемые системой передачи данных.
    Времена выполнения операций, связанных с работой пользователей и взаимодействием человек-машина будут определяться на основе закона β-распределения с параметрами, значения которых получены в ходе натурных экспериментов в ходе предварительных и государственных испытаний опытных образцов КСАУ[Октябрьский
    Ю.П., Биатлон, Триатлон].
    где
    x
    x
    при
    x
    при
    x
    x
    q
    p
    B
    x
    q
    p
    B
    q
    p
    ,
    0
    ,
    0 0
    ,
    1 0
    )
    1
    (
    )
    ,
    (
    1
    )
    ,
    ,
    (
    1 1
    











    𝐵(𝑝, 𝑞, 𝑥) = ∫ 𝑥
    𝑝−1
    (1 − 𝑥)
    𝑞−1
    𝑑𝑥

    0
    Вид функции зависит от показателей p и q. Варьируя этими значениями можно получить различные степени асимметрии плотности распределения. Для практических целей наиболее подходящими являются распределения при 1
    Времена выполнения операций передачи сообщений по каналам связи может быть определено на основе закона распределения Эрланга с параметрами распределения, учитывающими пропускную способность и текущую загруженность каналов связи, а также объем передаваемого сообщения. Пример модели выполнения процедуры представлен на рисунке 6

    Рисунок 6 – Модель выполнения процедуры обработки и доведения данных
    Предложенный подход к построению модели позволяет проводить варьирование значениями параметров взаимодействующих систем или идеализацию их значений в ходе моделирования от опыта к опыту. Это относится как к отдельным факторам, так и к их группам.
    Таким образом предложенный подход на основе имитационного моделирования позволяет численно оценить достигаемый уровень качества данных при взаимодействии разнородных информационных систем с учетом контекста предметной области и условий функционирования, особенностей построения сетецентрических ИУС, их способности к взаимодействию, а также структурных и функциональных параметров.
    Литература
    1. Костогрызов А.И., Степанов П.В. Инновационное управление качеством и рисками в жизненном цикле систем формационных систем / - М.: Изд-во ВПК, 2008. - 404 с.
    2 ГОСТ Р 55062-2012 Информационные технологии. Системы промышленной автоматизации их интеграция. Интероперабельность. Основные положения.
    3. Батоврин В.К., Гуляев Ю.В., Олейников А.Я. Обеспечение интероперабельности
    – основная тенденция в развитии открытых систем. – М.: РАН, Информационные технологии и вычислительные системы, 2009. – №5. – С. 7-15.
    4. Костогрызов А.И., Щербина М.А. Основы оценки, обеспечения и повышения качества выходной информации в АСУ организационного типа, Москва-1994, изд. «ВПК»,
    277 с
    5. ГОСТ Р ИСО/МЭК 25000: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Руководство по SQuaRE;
    6. ГОСТ Р ИСО/МЭК 25010: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества систем и программных продуктов;
    7. ГОСТ Р ИСО/МЭК 25012: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Модели качества данных;
    8. ГОСТ Р ИСО/МЭК 25024: – Системная и программная инженерия. Требования и оценка качества систем и программных средств (SQuaRE).Измерение качества данных;


    написать администратору сайта