ФККПІ_2020_122_КозаченкоАМ. Методи та засоби управління інформаційною безпекою в умовах невизначеності впливу дестабілізуючих факторів
Скачать 1.67 Mb.
|
1.3. Аналіз взаємного впливу дестабілізуючих факторів один на одного і на стійкість функціонування систем Під стійкістю функціонування системи розуміється її спроможність виконувати покладені функції з заданими показниками якості в умовах впливу внутрішніх та зовнішніх дестабілізуючих факторів. Взаємний вплив дестабілізуючих факторів один на одного і на стійкість функціонування систем має складну природу. До зовнішніх дестабілізуючих факторів, які знижують стійкість функціонування, можна віднести наступні: аварійні і віялові відключення електроживлення; інтерференція та багатопроменевість (стосовно безпроводових мереж); віруси й хакерські атаки. До внутрішніх дестабілізуючих факторів, що знижують стійкість функціонування систем, відносять: 26 збої і відмови технічних засобів; помилки в програмному забезпеченні; невдалі архітектурні рішення; нестиковки через різнотипність характеристик встановленого обладнання, неврахованих на стадіях проектування і розгортання; конфлікти і тупики через некоректний розподіл системних ресурсів, деяких обраних механізмів організації інформаційно-обчислювальних процесів, архітектурних особливостей компонентів систем. Врахування взаємного впливу дестабілізуючих факторів є вельми нетривіальною задачею. Найбільш доступним та придатним для практичного застосування є статистичний підхід 61,62 , зокрема, кореляційно-регресійний аналіз. Загальне призначення множинної регресії полягає в аналізі зв'язку між кількома незалежними змінними (званими також регресорами) і залежної змінної. Технічні показники функціонування мережі, як правило, представляються таблицями статистичних даних: 1 1 1 1 1 2 1 2 1 2 1 2 j j j j k k k k y y y i y N x x x i x N x x x i x N x x x i x N Статистичні дані представляють собою вибірку деякої реалізації значень випадкових величин: - i -а реалізація чисельного значення результату , 1,2, , i y i N ; - j -а реалізація чисельного значення j -го фактора 1,2, , j x j N Використання статистичних даних дозволяє домагатися оптимальних результатів, керуючи величинами факторів, або прогнозувати можливу величину результату при сформованих значеннях факторів. 27 Оцінювання проводиться за спостереженнями за входом (рядки матриці спостережень X ) і виходом (елементи вектора відгуків y ). Між випадковою величиною результату і випадковою величиною фактора є стохастична (випадкова) залежність, тобто існує кореляційний взаємозв’язок. У загальному випадку, процедура побудови множинної регресії полягає в оцінюванні параметрів лінійного рівняння. Функціональна залежність результату від факторів представляється рівнянням регресії 1 1 11 12 1 0 2 2 21 22 2 1 3 3 31 32 3 2 1 2 1 1 1 1 n n n m m m m mn n y E y x x x y E y x x x y E y x x x y E y x x x E або те ж саме в компактному вигляді: E y X В якості основних характеристик статистичного зв'язку зазвичай використовують матриці коефіцієнтів множинної кореляції і системи рівнянь множинної лінійної або поліноміальної регресії [66]. Крім того, для автоматизації вимірювань і розрахунків необхідно вибрати метод апроксимації кривих повторюваності змін KPIs. Найбільш гнучкими і точними методами є апроксимація поліномами по мінімуму середнього квадрата помилки [61,62] або апроксимації Паде [46]. Розглянемо процес прогнозу параметрів мережі як завдання передбачення k- ї змінної k Y , k 1, N по M змінним 1 2 m X , m , , ,M ; m k . У загальному випадку M N . При 1 m маємо рівняння лінійної або поліноміальної регресії незалежної змінної m X на залежну змінну k Y , при 1 m маємо систему рівнянь множинної регресії змінних 1 2 , , , m X X X на k Y . (Мається на увазі функціональна, 28 а не статистична залежність.) У розглянутій задачі незалежні змінні 1 2 , , , m X X X - це випадкові величини, які не обов'язково є статистично незалежними. Змінну k Y апроксимуємо функцією регресії , що містить оцінки KPIs й невідомі коефіцієнти. Рівняння моделі лінійної регресії незалежних змінних 1 2 , , , m X X X на залежну змінну k Y запишемо в наступному вигляді: 0 1 1 k k k mk m Y a a X a X , (1.1) де - помилка апроксимації. Нехай 1 1 j j X X . Тоді можна записати рівняння поліноміальної регресії у вигляді 2 0 1 1 2 1 1 m k k k k mk Y a a X a X a X (1.2) Параметри моделі регресії оцінюються за вибіркою обсягу, взятої з деякою генеральної сукупності. Теоретично генеральна сукупність має нескінченний об'єм або є весь набір даних, який існує в принципі. Вибірка формується таким чином. За результатами тесту функціонування мережі фіксуємо першу вибірку незалежних змінних 11 12 1 , , , m X X X і розраховуємо залежну змінну 1 Y . Потім фіксуємо другу вибірку незалежних змінних 21 22 2m X ,X , ,X і розраховуємо залежну змінну. Продовжуємо процедуру до отримання N змінних. Отримуємо вибірку з спостережень 1 11 12 1 2 21 22 2 1 2 : , , , , : , , , , , : , , , m m N N N Nm Y X X X Y X X X Y X X X Система рівнянь множинної лінійної регресії набуває вигляду: 1 01 11 11 1 1 1 2 02 12 21 2 2 2 0 1 1 0 1 1 m m m m k k k k mk km k N N N N mN Nm N Y a a X a X Y a a X a X Y a a X a X Y a a X a X , (1.3) де 0 1 , , , , 1, k k mk a a a k N - невідомі коефіцієнти; 29 1 2 k N , , , , , - випадкові помилки, які логічно вважати нормальними однаково розподіленими з параметрами 2 0, Для отримання оцінок за методом найменших квадратів необхідно мінімізувати суму k S квадратів відхилень в кожній точці. Найкраще наближення відповідає мінімальній величині виразу 2 0 1 1 1 N k k k k k mk km k S Y a a X a X (1.4) Величина k S є мірою помилки, пов'язаної з прив'язкою наявних даних до обраної моделі регресії. Мінімум k S досягається диференціюванням останнього виразу за коефіцієнтами 0 1 , , , , 1, k k mk a a a k N , прирівнюванням відповідних похідних нулю і розв’язанням системи рівнянь відносно 0 1 , , , k k mk a a a Отримуємо систему рівнянь для оцінки частинних коефіцієнтів регресії: 1 01 11 1 11 1 2 02 12 2 21 2 0 1 1 0 1 1 m m m m k k k mk k km N N N mN N Nm Y X X Y X X Y X X Y X X (1.5) Тут 0 1 , , , k k mk - оцінки для 0 1 , , , k k mk a a a Оцінки є незміщеними і ефективними, тобто мають мінімальну дисперсію для вибірки 1 2 , , , m X X X серед всіх лінійних оцінок для прогнозування змінних , 1, k Y k N Регресійні коефіцієнти представляють вклади кожної незалежної змінної в прогнозування залежної змінної. Для відбору остаточного рівняння регресії зазвичай використовують два протилежних критерії. 30 Щоб зробити рівняння корисним для передбачення, спостерігач повинен прагнути включити в модель по можливості більше незалежних змінних з тим, щоб можна було більш надійно визначити прогнозовані величини. Через витрати, пов'язані з отриманням інформації при великій її кількості і подальшою перевіркою, необхідно прагнути, щоб рівняння включало якнайменше незалежних змінних. Введемо поняття відсутніх значень. При використанні одновимірних за своєю природою методів аналізу (наприклад, t -критерію 65 ) найбільш розумний спосіб дії полягає у видаленні з вибірки елементів з відсутнім значенням X (аналізованої змінної). Однак ситуація змінюється при використанні істотно багатовимірних методів аналізу, тобто коли для кожного елемента вибірки є p спостережуваних змінних 1 2 , , , p X X X . Тепер, якщо елемент вибірки має відсутнє значення, скажімо, для змінної 1 X , видалення цього елемента вибірки з аналізу не є необхідним, оскільки воно призводить до втрати інформації про змінних, що доставляється цим елементом. Так як множинний лінійний регресійний аналіз, так само як і інші багатовимірні процедури засновані на векторі середніх m і матриці коваріацій S, можна залишити цей елемент у вибірці і використовувати наявні в ньому виміри для обчислення оцінок вектора середніх x і матриці коваріацій Уявімо систему рівнянь моделі множинної лінійної регресії (1.3) в матричної формі: Y XB Ε , (1.6) де 11 1m 21 2m N1 Nm 1 X X 1 X X 1 X X X - так звана матриця плану. Для регресійній моделі, по суті, це матриця незалежних змінних, доповнена першим стовпцем вагових коефіцієнтів поточних спостережень; 31 T 0 1 m , , B - вектор параметрів рівняння регресії; T 1 2 N , , , Ε - вектор помилок оцінювання, що має багатовимірний гаусівський розподіл з нульовим вектором математичних сподівань і матрицею дисперсій виду 2 I ; I - одинична матриця; Т - символ транспонування. Тоді рівняння (1.4) можна представити в матричному вигляді як T S Y XB Y XB (1.7) Вектор оцінок за методом найменших квадратів є рішення системи нормальних рівнянь X X B XY , (1.8) розв'язок якої має вигляд 1 B X X XY (1.9) З урахуванням того, що матриця дисперсій вектора помилок оцінювання описується виразом 2 I , кореляційна матриця вектора B дорівнює 1 2 B R X X Відзначимо також, що при збільшенні кореляції між різними ключовими показниками ефективності матриця X X буде мати діагонально-домінантну структуру, тобто діагональні елементи будуть превалювати над сумами елементів за відповідними рядками. При цьому процедури пошуку рішення рівнянь (1.6) і (1.7) спрощуються. Очевидно, в даному випадку простіше замість оптимальної оцінки як вихідної величини, яка визначається матричних рівнянням, шукати оптимальну оцінку як рішення двоїстого йому різницевого рівняння. Коефіцієнти різницевого рівняння визначаються статистикою спостережень і перешкод і в загальному випадку є змінними величинами, залежними від часу. Перевагою такого підходу є те, що якщо навіть не вдається отримати аналітичний розв'язок різницевого рівняння, то завжди можна отримати його чисельне рішення на обчислювальній 32 машині. Більш того, рішення можна отримувати в реальному масштабі часу з урахуванням знову одержуваної інформації про зміни параметрів спостережень і перешкод. Слідуючи [67], побудуємо ітераційний алгоритм розв'язання рівняння (1.6) у вигляді k k 1 k FB X X G Y E X B , (1.10) де F та G – матричні множники, визначники яких не дорівнюють нулю, або ненульові скалярні множники. Ці множники вибираються таким чином, щоб забезпечити максимальну швидкість збіжності без втрати стійкості алгоритму (1.10). Для оптимального вибору значень F та G можна застосувати до рівняння (1.10) операцію z - перетворення 1 z 1 z z FB X G Y E X B , (1.11) і обчислити корені характеристичного рівняння, які повинні бути по модулю менше одиниці. Тоді загальний розв'язок рівняння (1.11) при необмеженому зростанні числа ітерацій k асимптотично сходиться до точного рішення рівняння (1.6). Швидкість збіжності залежить від величини максимального по модулю кореня характеристичного рівняння. Задаючись величиною модуля відносної помилки рішення, можна оцінити потрібне число ітерацій як локальну або нелокальну характеристику ефективності пошуку рішення. Конкретизуючи чисельні значення результату , 1,2, , i y i N , проаналізуємо ключові показники ефективності інформаційно-комунікаційних мереж. Ключовими параметрами є затримка передачі, пропускна здатність, втрати пакетів і рівень безпеки. Ці параметри мають найбільший вплив на результуючу якість сервісу. В роботі [48] відзначається, що число KPIs, які обирають для 33 аналізу, має бути мінімальним, причому у всіх випадках недоцільно брати більше 20 таких показників. Ці міркування враховані при завданні набору KPIs. У якості параметрів задачі, що оптимізуються, обрано такі: - затримка передачі ; - пропускна здатність C p ; - втрати пакетів при передачі даних L p ; - рівень безпеки та захисту даних при передачі по мережі sp D ; - якість Web-сервісу; - якість передачі аудіо (звукові файли, звичайна й IP-телефонія); - швидкість і надійність обміну файлами по протоколу FTP; - швидкість і надійність роботи електронної пошти (E-mail); - якість передачі відео. Розглянуто гіпотетичну мережу WLAN IEEE 802.11n, дані для розрахунку параметрів якої взяті з роботи [48]. Для розрахунків використовувалася програма множинного кореляційного аналізу, наведена в [66] і модифікована для даної задачі. У табл. 1 наведені частинні коефіцієнти кореляції параметрів, що оптимізуються. За цими коефіцієнтами кореляції в подальшому з використанням рівнянь (1.1) – (1.3) можна розраховувати частинні коефіцієнти регресії. Таблиця 1 Коефіцієнти взаємної кореляції параметрів, що оптимізуються 34 Між основними ключовими параметрами виявляється сильна кореляція. Це пояснюється тим, що вони дають значний вплив на вимоги до якості сервісу. Виняток становить електронна пошта, оскільки, на відміну від потокового аудіо, відео, Web-сервісу і передачі файлів по протоколу FTP, для неї не критичні ні смуга пропускання каналу, ні затримка доставки. Однак необхідно відзначити, що параметр D sp - рівень безпеки та захисту даних є критичним практично для всіх представлених параметрів, оскільки навіть для таких видів еластичного трафіку, як електронна пошта, захист даних є невід'ємною вимогою забезпечення якості сервісу QoS. Результати кореляційного аналізу служать також ключовим індикатором моніторингу та регулювання потокових даних і Web-сервісу. Це необхідно для забезпечення безпечної передачі інформації по мережі, прогнозування і запобігання перевантажень контрольованого мережевого фрагмента. Таким чином, поточний моніторинг і управління рівнем безпеки в мережі, які є невід'ємною частиною завдання загального управління якістю сервісу, можна 35 успішно здійснювати статистичними методами, зокрема, методом кореляційно- регресійного аналізу. Крім того, необхідно відзначити, що повністю скомпільована програма розрахунків займає в пам'яті обчислювального пристрою від 80 до 500 кілобайт в залежності від масштабу мережі і обсягу оброблюваної вибірки. Оскільки в даний час практично будь-який мережевий вузол, по суті, являє собою спеціалізований обчислювач або навіть багатопроцесорну систему, завдання апаратурної реалізації запропонованого методу може вирішуватися порівняно просто. Розглянемо тепер різні методи оцінювання та (або, що еквівалентно, матриці кореляцій |