Магистерская работа. Магистерская курсач. Вдосконалення методу апроксимації даних
Скачать 1.66 Mb.
|
Об’єктом дослідження є процес апроксимації даних вимірювань в системах багатокласової діагностики. 14 Предметом дослідження є вдосконалення існуючих алгоритмів апроксимації даних, підвищення їх точності за рахунок попереднього використання інтерполяційних алгоритмів. Методи дослідження – математичне моделювання процесів у програмному середовищі пакета MATLAB для дослідження використання інтерполяційних алгоритмів при апроксимації даних вимірювань в системах багатокласової діагностики. Наукова новизна дисертації полягає в наступному: вдосконалено метод апроксимації даних за рахунок розбиття початкового сигналу на відрізки рівної довжини, коригування апроксимованих даних на стиках сусідніх відрізків, а також вибору (за допомогою порівняння коефіцієнта детермінації) найкращого поліному (з першого по п’ятий порядок) для апроксимації; вдосконалено метод апроксимації даних за рахунок використання алгоритмів інтерполяції для коригування довжини початкового сигналу. Практичне значення отриманих результатів визначається розробкою алгоритмічного та програмного забезпечення на основі розроблених методик, рекомендацій та математичних моделей, які можуть застосовуватись у складових блоках систем багатокласової діагностики. Розроблено рекомендації щодо ефективного використання розробленого програмного забезпечення в системах багатокласової діагностики. Можливе впровадження результатів у навчальний процес або наукову тему. Апробація результатів дисертації відбулася на наступних конференціях: новые направления развития приборостроения, БНТУ, приборостроительный факультет, Минск, 2017; погляд у майбутнє приладобудування, КПІ ім. Ігоря Сікорського, приладобудівний факультет, Київ, 2017; VIII Міжнародна Антарктична конференція, присвячена 25-річчю приєднання України до Договору про Антарктику, КПІ ім. Ігоря Сікорського, Київ, 2017. 15 Публікації. За матеріалами дисертації було отримано два авторських свідоцтва України на комп’ютерні програми, опубліковано 3 тези доповідей на науково-практичних конференціях та 3 статті у фахових виданнях України. 16 РОЗДІЛ 1 ОГЛЯД СТАНУ ПРОБЛЕМИ В якості основного інструментарію більшості завдань [1], пов'язаних з моніторингом та діагностикою складних будівельних та інженерних об’єктів, моделюванням процесів геофізичного, економічного і технічного характеру, використовуються регресійні методики апроксимації даних вимірювань. При цьому вибір оптимальної формули представлення даних, як емпіричної моделі процесу, відіграє визначальну роль, але є непростим завданням. Особливо ці труднощі характерні для степеневих і показникових нелінійних, аперіодичних і квазіперіодичних коливальних і інших складних видів функції. Часто в діагностиці виникає необхідність отримувати рішення математичних задач у числовій формі. При цьому для багатьох задач відомо тільки про існування рішення, але не існує кінцевої формули [2]. Тому постає завдання перетворення однієї форми задання функціональної залежності в іншу – перетворення табличної форми задання даних (результатів вимірювань) в аналітичну (побудова математичної моделі) [1]. Навіть при наявності такої аналітичної формули, її використання для дослідження специфічних випадків стану об’єкта може виявитися неефективним. Нарешті, завжди існує необхідність вирішувати і такі математичні завдання, для яких строгі докази існування рішення на даний момент відсутні [2]. У всіх цих випадках використовуються методи наближеного, у першу чергу чисельного, рішення. Як правило, алгоритми наближеного рішення базуються на тому, що вихідна математична задача замінюється деякою більш простою або частіше послідовністю більш простих завдань. Вирішення цих більш простих завдань трактується як наближене рішення задачі вихідної. Тобто, фактично використовується деяка модель вихідної задачі (апроксимація). Одним з важливих етапів вивчення явища за допомогою його математичної моделі, яка являє собою апроксимацію виміряних даних, що описують дане 17 явище, є з'ясування того, чи задовольняє прийнята гіпотетична модель критерію практики, тобто з'ясування питання про те чи узгоджуються результати спостережень з теоретичними наслідками моделі в межах точності спостережень. У зв'язку з цим необхідна перевірка на адекватність (відповідність властивостям реального об'єкта) даної математичної моделі, причому точність моделі (апроксимації) повинна бути більше точності спостережень (похибка моделі повинна бути меншою, ніж похибка спостережень). Точність вимірювання – характеристика вимірювання, що показує ступінь приближення його результатів до істинного значення вимірюваної величини. Завдання апроксимації встає досить часто перед дослідниками і інженерами в різних областях науки і техніки. Області, де можна застосувати ті чи інші методи вирішення завдань наближення функцій і сигналів досить широкі і різноманітні [3]. Вони використовуються при виконанні математичних розрахунків, математичного моделювання; при проектуванні комунікаційного обладнання, систем технічного зору, високоякісного звуковідтворювального та медичного обладнання; застосовуються в економіці та соціології, а також у технічній діагностиці. У зв’язку з цим основними завданнями апроксимації даних у всіх вище перерахованих випадках є: знаходження математичного опису для дискретних даних, тобто встановлення залежності між виміряними відліками сигналів для подальшого прогнозування можливих значень виміряної величини у майбутньому; відновлення втрачених даних при передачі сигналів через наявність опору в електричному дроті або втрата пакетів при передачі через оптичні лінії зв’язку; відновлення вихідних даних у процесі кодування та декодування сигналів; розпізнавання зображень та їх покращення; відновлення при архівації та стисненні даних. Отже, метою використання апроксимації у більшості випадків є відновлення втрачених вихідних даних, але в технічній діагностиці насамперед важливо спрогнозувати поведінку вимірюваного параметру у майбутньому для оцінки залишкового ресурсу. Проте в більшості технічних систем задача прогнозування є невирішеною, оскільки існуючий математичний апарат та 18 алгоритми апроксимації у деяких випадках виявляються неефективними і не дозволяють знайти аналітичний опис виміряної величини з достатньою швидкодією та точністю. Тому розробка нових підходів до апроксимації даних вимірювань є надзвичайно важливою і актуальною задачею при прогнозуванні в системах багатокласової діагностики. 1.1 Апроксимація даних вимірювань У наш час завдання апроксимації є актуальною темою практично для кожного технічного завдання. Від вибору виду апроксимації значною мірою залежать кількісні характеристики і якісні властивості опису досліджуваних об'єктів. Апроксимація (від лат. Approximo – наближаюся) – заміна одного представлення даних на інше [4]. Апроксимація дозволяє досліджувати числові характеристики і якісні властивості об'єкта, зводячи завдання до вивчення більш простих або більш зручних об'єктів (наприклад, таких, характеристики яких легко обчислюються або властивості яких вже відомі). Як правило, характеристики багатьох складних процесів та явищ отримують експериментально, набагато рідше вдається знайти їх теоретично. Для вивчення процесів, необхідно, насамперед, відобразити характеристики в математичній формі, придатній для розрахунків [5]. Простим і досить точним способом являється представлення характеристики у вигляді таблиці. Цей спосіб зручний для аналізу процесів за допомогою електронно обчислювальної машини (ЕОМ), аргумент і функція створюють в запам’ятовуючому пристрої двовимірний масив чисел. У ряді випадків характеристика реальних процесів і явищ мають складний вигляд і представляються у вигляді графіків. Дуже часто безпосереднє застосування експериментальних даних у формі таблиць та графіків виявляється незручним, і дані прагнуть описати за допомогою простих аналітичних відношень, які хоча б якісно відображають 19 характер розглянутих залежностей [6]. У даному випадку необхідно вирішити задачу апроксимації, тобто замінити складну функцію (побудовану по експериментальним даним) наближеними аналітичними виразами. Таким чином, якщо дослідження повинне проводитись не числовими, а аналітичними методами, то необхідно підібрати таку апроксимуючу функцію, яка буде доволі простою, але відображатиме всі важливі особливості експериментально отриманої характеристики з достатнім ступенем точності [5]. Загальна задача апроксимації включає в себе два самостійних завдання [6,7]: 1) вибір класу апроксимуючої функції, яка найбільш точно описує вихідні дані; 2) визначення значень постійних коефіцієнтів, що входять в апроксимуючу функцію (визначення коефіцієнтів апроксимації). Для вибору класу апроксимуючої функції, необхідно дотримуватись наступних вимог [7]: 1) простота функції (у сенсі математичних операцій і реалізації на ЕОМ); 2) достатня точність (похибка апроксимації повинна бути одного порядку з розкидом параметрів характеристик окремих реалізацій в ансамблі реалізацій); 3) наочність, яка дозволяє судити про зміну коефіцієнтів апроксимації при зміні характеристик процесу; 4) ясність розуміння процесів в явищі і виявленні властивостей і характеристик, що представляють інтерес у конкретному випадку. Таким чином, функцію, яка апроксимує деяку характеристику, обирають або виходячи з фізичних уявлень про досліджуваний процес, або чисто формально, ґрунтуючись на зовнішній схожості характеристики з графічним зображенням тієї чи іншої функції [5]. Вимоги, які пред'являються до апроксимуючої функції, є суперечливими: забезпечуючи гарну якість наближення, вона повинна бути відносно простою і зручною для подальшого використання [8]. 20 Аналітичні вирази, апроксимуючі характеристики процесів, для підвищення точності і достовірності аналізу повинні якомога точніше описувати хід реальних характеристик. Однак підвищення точності апроксимації призводить, як правило, до ускладнення апроксимуючих виразів, при цьому стає не можливим точне визначення значень коефіцієнтів, що входять у ці вирази, а аналіз процесів, де застосовуються ці вирази проходить з деякою похибкою [6]. У зв'язку з тим, що характеристики різних реалізацій (ансамблю реалізацій) процесу відрізняються один від одного за рахунок розкиду параметрів по реалізаціям і похибці вимірювань, недоцільно прагнути отримати апроксимуючі вирази, точність яких значно перевищує точність визначення окремих параметрів і межі їх розкиду по ансамблю реалізацій. Таким чином, при вирішенні задачі апроксимації так само, як і при вирішенні будь-якої задачі, пов'язаної з вибором розрахункової моделі, необхідно йти на компроміс між точністю і складністю моделі [6]. Застосування апроксимації функцій досить різноманітне: знаходження математичного опису для дискретних даних, тобто встановлення залежності між виміряними відліками сигналів для подальшого прогнозування можливих значень виміряної величини у майбутньому; відновлення втрачених даних при передачі сигналів через наявність опору в електричному дроті або втрата пакетів при передачі через оптичні лінії зв’язку; відновлення вихідних даних в процесі кодування та декодування сигналів; розпізнавання зображень та їх покращення; відновлення при архівації та стисненні даних. Також, досить актуальною задачею є розробка нових підходів до апроксимації даних вимірювань при прогнозуванні в системах багатокласової діагностики. 1.2 Багатокласова діагностика Технічна діагностика – галузь знань, що охоплює теорію, методи і засоби визначення технічного стану об’єкта чи системи [9]. Основним завданням 21 технічного діагностування є забезпечення безпеки, функціональної надійності та ефективності роботи технічного об'єкта. Багатокласова діагностика відбувається на базі попереднього аналізу певних параметрів досліджуваного об’єкту. До кожного з цих параметрів відносяться певні ознаки. А також у кожного з них є якийсь клас, який можна передбачити за даними ознаками. Наприклад, нехай для діагностування працездатності виділено три класи: I. Допустиме значення параметру. II. Граничне значення параметру. III. Недопустиме значення параметру. У залежності від значення параметру, його відносять до певного класу. Але виникає проблема – деякі параметри можуть розподілятись не тільки до одного класу. Тобто одна частина ознак підходить до одного класу, а інша частина – до другого. Постає задача побудови вирішальної функції, яка по вектору ознак параметра буде вказувати, до якого класу він належить [10]. У більшості випадків необхідна так звана навчальна вибірка. Це набір прикладів, за допомогою яких точно відомо які параметри входять у клас. На основі цієї навчальної вибірки ми можемо побудувати вирішальну функцію, похибка якої мінімальна. Для реалізації цієї задачі в наш час використовують нейронні мережі. Це автоматичні системи, які мають здатність до навчання [11]. В якості параметрів можуть виступати різні за своєю природою об'єкти: символи тексту, зображення, зразки звуків і т. д. При навчанні мережі пропонуються різні зразки параметрів із зазначенням того, до якого класу вони відносяться. Зразок, як правило, представляється як вектор значень ознак. При цьому сукупність усіх ознак повинна однозначно визначати клас, до якого належить зразок. Після закінчення навчання мережі, їй можна пред'являти невідомі раніше параметри і отримувати відповідь про належність до певного класу. Нейронні мережі з їх чудовою здатністю знаходити зміст у складних або неточних даних можуть 22 використовуватися для отримання шаблонів і виявлення тенденцій, які занадто складні, щоб їх помітили люди або інші комп'ютерні методи. Навчену нейронну мережу можна розглядати як «експерта» у категорії інформації, яку надано для аналізу. Потім цього «експерта» можна використовувати для створення прогнозів [12]. Нейронні мережі використовують інший підхід до вирішення проблем, ніж звичайні комп'ютери. У звичайних комп'ютерах використовується алгоритмічний підхід, тобто комп'ютер виконує набір інструкцій для вирішення проблеми. Відомо, що комп'ютери не можуть вирішити проблему, якщо не будуть відмічені конкретні кроки, які комп'ютер повинен виконати. Це обмежує можливості вирішення проблем на звичайних комп'ютерах, проблемами, які ми вже розуміємо і вміємо вирішити. Нейронні мережі обробляють інформацію подібним чином у людському мозку. Мережа складається з великої кількості високо взаємопов'язаних елементів обробки (нейронів), що працюють паралельно для вирішення конкретної проблеми. Нейронні мережі навчаються на прикладі. Вони не можуть бути запрограмовані для виконання конкретного завдання. Недоліком є те, що мережа сама по собі виявляє, як вирішити проблему, тобто її операції можуть бути непередбачуваними [12]. Нейронні мережі можуть навчатися у будь-яких функцій, що дозволяє уникнути використання складного математичного апарату, а використання нелінійних функцій активації дозволяє вирішувати завдання з нелінійностями [13,14]. Нейронні мережі можуть застосовуватися: 1) для класифікації образів – вказівка приналежності вхідного образу (мовного сигналу, рукописного символу), представленого вектором ознак до певних класів; 2) для апроксимації функцій – знаходження оцінки невідомої функції; 3) для прогнозу – передбачення поведінки функції в деякий майбутній момент; 23 4) для оптимізації – знаходження рішення, що задовольняє систему обмежень, і максимізує або мінімізує цільову функцію; 5) для керування – розрахунок такого впливу, при якому система слідує по бажаній траєкторії. Однією з найбільш чудових властивостей нейронних мереж є здатність апроксимувати і, більш того, бути універсальними апроксиматорами. За допомогою нейронних мереж можна апроксимувати як завгодно точно безперервні функції багатьох змінних [15]. У кінці 1980-х років американським математиком В. Крейновічем була доведена узагальнена апроксимаційна теорема: за допомогою лінійних операцій і каскадного з'єднання можна з довільного нелінійного елемента отримати пристрій, який обчислює будь-яку безперервну функцію з деякою наперед заданою точністю. Це означає, що нелінійна характеристика нейрона може бути довільною: від сигмоїдальної до довільного хвильового пакета, синуса або многочлена. Від вибору нелінійної функції може залежати складність конкретної мережі, але з будь-якою нелінійністю мережа залишається універсальним апроксиматором і при правильному виборі структури може досить точно апроксимувати отримані дані. Таким чином, на основі нейронних мереж, виникає новий клас систем – системи багатокласової діагностики. Багатокласова діагностика широко використовується у вимірювальних системах, де важливу роль відіграє прогнозування технічного стану різноманітних об’єктів або їх найбільш відповідальних частин. Для здійснення прогнозування вихідний сигнал має містити тренд або математичну модель певного типу. Якщо відсутня очевидна аналітична залежність у виміряних даних, можна її наближено встановити за допомогою апроксимації. У наш час існує велика кількість методів апроксимації виміряних даних, які відрізняються сферою використання та формою кривих, які можна описати з їх допомогою. Тому необхідно провести огляд основних та найбільш використовуваних методів. 24 1.3 Огляд існуючих методів апроксимації даних При виборі апроксимації слід виходити з конкретного завдання дослідження [16]. Зазвичай, чим простіше рівняння використовується для апроксимації, тим більш приблизним буде отриманий опис залежності. Тому важливо враховувати, наскільки істотні і чим зумовлені відхилення конкретних значень від отриманого тренду. При описі залежності емпірично визначених значень можна досягти і набагато більшої точності, використовуючи якесь складніше, багатопараметричне рівняння. Однак немає ніякого сенсу прагнути передати випадкові відхилення величин, в конкретних рядах емпіричних даних, з максимальною точністю. Набагато важливіше визначити загальну закономірність, яка в даному випадку найбільш логічно і з прийнятною точністю виражається саме двопараметричним рівнянням статичної функції. Таким чином, вибираючи метод апроксимації, дослідник завжди йде на компроміс: вирішує, чи в даному випадку доцільно і доречно «пожертвувати» деталями і, відповідно, наскільки узагальнено слід описати залежність зіставлюваних змінних. Поряд з виявленням закономірностей, замаскованих випадковими відхиленнями емпіричних даних від загальної закономірності, апроксимація дозволяє також вирішувати багато інших важливих завдань: формалізувати знайдену залежність; знайти невідомі значення залежної змінної шляхом інтерполяції або, якщо це допустимо, екстраполяції. Умовно апроксимацію можна розділити на два види (рис.1.1) [17]: 1) сувора теорія математичної апроксимації; 2) фізична (технічна) апроксимація. Сувора теорія математичної апроксимації включає в себе наступні методи апроксимації [17]: 1) поліномами (многочленами); 2) сплайнами; 3) відрізками ряду Фур'є; 4) поліномами по ортогональним многочленам; 25 Рисунок 1.1 – Класифікація методів апроксимації експериментальних даних і побудова моделей 26 5) власними функціями крайових задач. Сувора теорія математичної апроксимації будується як фундаментальна, глобальна теорія апроксимації, яка для вирішення поточних прикладних практичних завдань може і не знадобитися. Це може статися внаслідок або втрати з плином часу актуальності розв'язуваної задачі, або складності теорії (апроксимуючої функції), або великої кількості коефіцієнтів апроксимації. Менш строга апроксимація – фізична (технічна) апроксимація або математична модель фізичного явища, процесу (фізичної моделі), технічного пристрою (його характеристик), сигналу (його параметрів), середовища, матерії, тощо. Фізична (технічна) апроксимація включає в себе безліч способів апроксимації і апроксимуючих функцій, які обирають виходячи з конкретно поставленого фізичного (технічного) завдання. Таким чином, за допомогою фізичної (технічної) апроксимації оперативно вирішується широке коло завдань, актуальних на даний момент часу, пов'язаних з конкретними проблемами і питаннями прикладного (технічного) характеру. Визначення коефіцієнтів апроксимації тісно пов'язане з необхідною точністю [13]. Точність визначається критеріями наближення, зазвичай застосовують критерії рівномірного, середньоквадратичного і інтерполяційного (точкового наближення). Якщо число заданих точок перевищує число визначених коефіцієнтів апроксимації, то можна використовувати метод найменших квадратів, при якому середньоквадратична помилка мінімальна. Метод найменших квадратів застосовується, коли необхідна висока точність апроксимації, вимагає громіздких обчислень, але має конструктивний підхід для аналітичного визначення коефіцієнтів моделі (апроксимації) [6]. Метод найменших квадратів забезпечує найменшу суму квадратів відхилень значень апроксимуючої функції від значень вихідної функції в довільному числі точок, не пов'язаному з числом невідомих коефіцієнтів. Слід зазначити, що точність аналітичного уявлення досліджуваного явища буде тим вище, чим точніше модель, що описує дане явище. Очевидні вимоги, що пред'являються до вибору моделі явища при однаковій точності моделі – 27 найменша кількість коефіцієнтів моделі та її простота, виконання даних вимог сприяє зменшенню систематичної помилки [19] та часу обробки [20] експериментальних даних. Точність апроксимації можна підвищити за рахунок попереднього використання алгоритмів інтерполяції для отримання більшої кількості відліків. 1.4 |