ПСАБПП. Вступ у предмет. Поняття бізнесупроцесів та їх автоматизація
Скачать 1.23 Mb.
|
аналіз купівельного кошика призначений для виявлення товарів, які покупці намагаються купувати разом. Знання груп товарів, які здебільшого придбаються спільно, дає можливість виробити стратегію створення запасів товарів і їх розміщення в торговому залі; — дослідження тимчасових шаблонів допомагає торговим підприємствам приймати рішення про створення товарних запасів. Воно дає змогу дати відповідь, наприклад, на питання, через який найбільш імовірний термін покупець портативного CD-плейєра звернеться з метою купівлі нових батарейок; — створення прогнозних моделей дає можливість торговим підприємствам розпізнавати характер потреб різних категорій клієнтів з відповідною поведінкою, наприклад, покупців товарів відомих дизайнерів і тих, хто реагують на розпродаж. Ці знання необхідні для розробки точно спрямованих, економічних заходів з просування товарів на ринку. У банківській справі Data Mining може допомогти виявити шахрайство з кредитними картками аналізом попередніх транзакцій, які згодом виявилися шахрайськими. Банк може виявити деякі стереотипи такого шахрайства. Наприклад, можна встановити, що одним із попереджувальних сигналів служать багаточисельні транзакції в магазинах комп’ютерної техніки впродовж короткого періоду. Отримані знання банк може використати для заборони підтвердження трансакції, що збігається зі стереотипом шахрайства, без попередньої співбесіди з покупцем. У виробництві товарів можна враховувати вимоги кожного окремого клієнта, маючи можливість прогнозування популярності відповідних характеристик і знання того, які характеристики здебільшого замовляються разом. Методи Data Mining дають змогу виявляти п’ять стандартних типів закономірностей: асоціація, послідовність, класифікація, кластеризація, прогнозування. Асоціація має місце в тому разі, якщо кілька подій зв’язані одна з одною, тобто є подібність, структурна близькість, наприклад, дослідження, проведене в супермаркеті, показує, що 70 % покупців солоних горішків беруть також і пиво, а за наявності знижки на такий комплект пиво купують у 25 % випадків. Маючи інформацію про подібні асоціації, менеджери можуть легко оцінити, наскільки дієвою є надана знижка. Про послідовність говорять, якщо існує ланцюжок пов’язаних у часі подій. Так, наприклад, після переїзду до нової квартири у 50 % випадків упродовж місяця купують нову кухонну плиту, а в межах двох-трьох тижнів 65 % новоселів придбають новий холодильник. За допомогою класифікації виявляють ознаки, що характеризують групу, до якої належить той чи інший об’єкт. Це робиться за допомогою аналізу вже класифікованих об’єктів і формулювання деякого набору правил. Використовується, наприклад, під час оцінювання ризиків у разі видачі кредитів. Кластеризація відрізняється від класифікації тим, що самі групи заздалегідь не створені. За допомогою кластеризації засоби Data Mining самостійно виокремлюють різноманітні однорідні групи даних. Використовується для сегментації ринків і замовників. Базою для відомих систем прогнозування в Data Mining служить історична інформація, що зберігається в сховищах даних. Якщо є можливість побудувати математичну модель і знайти шаблони, що © Тернопільський національний технічний університет ім. І. Пулюя © Марущак П.О. Мова: English | Українська | More.. адекватно відображають динаміку процесів, то є ймовірність, що з їх допомогою можна передбачити й поведінку системи в майбутньому. 9.4. Технологія створення складних систем за допомогою реінжинірингу Термін «реінжиніринг бізнес-процесів» (BPR — business process reengineering) виник трохи більше десяти років тому. У 1990 р. в одній із перших робіт М. Хаммера (президента консалтингової фірми Hammer and Company , що працювала в галузі інформаційних технологій), присвяченій реінжинірингу бізнес-процесів [20], а потім у виданій спільно з Д. Чампі книзі «Реінжиніринг корпорації: Маніфест революції в бізнесі» [10], яка згодом стала бестселером, було проголошено такі гасла: 1. «Реконструюйте роботи не автоматизуючи, а спрощуючи або вилучаючи». 2. «Використовуйте комп’ютери не лише для автоматизації, а й для реконструкції існуючих бізнес- процесів». Пізніше, у 1993 р. було введено і сам термін BPR, а замість старого СРІ (Continues Process Improvement) — безперервне поліпшення бізнес-процесів — М. Хаммер запропонував радикальніший спосіб реконструкції управління діяльністю. Ціль BPR — досягти гнучкішої реакції підприємства на зміни вимог споживачів або на прогноз таких змін у разі зниження витрат усіх видів. Поштовхом для запровадження реінжинірингу стали істотні зміни ринкового середовища, в основі яких лежали два головні моменти: 1. Перегляд підходів до виконання ділових операцій з урахуванням досягнутих технологій. Причому переважна орієнтація на самі сучасні технології. 2. Орієнтація не на функціональну структуру організації, а на ділові процесі, в яких вона бере участь під час виробництва необхідного споживачу продукту. Саме ці два моменти є головними в переході від традиційної функціонально-орієнтованої організації до процесно-орієнтованої, яка підготовлена еволюційним розвитком теорії побудови організацій. У зазначених роботах реінжиніринг автори визначають як фундаментальне переусвідомлення і радикальне перепроектування бізнес-процесів для досягнення істотних поліпшень у таких головних для сучасного бізнесу показниках результативності, як витрати, якість, рівень обслуговування та оперативність. Під поняттям «фундаментальне переусвідомлення» слід розуміти те, що в процесі здійснення реінжинірингу підприємець повинен ставити на порядок денних основоположні питання, що торкаються його компанії та характеру її діяльності, а під поняттям «радикальне перепроектування» — проведення не косметичних змін або перетасовки вже існуючих систем, а рішучу відмову від усього застарілого. Основні принципи реінжинірингу такі: — організовувати досягнення результатів, а не вирішенняокремих, хоч і важливих завдань; доручити виконання процесу тим хто використовує його результат; Корисно Новини сервера ЕН Статистика ЕНК Рейтинг студентів в СЕН Контакти ТНТУ в Facebook Web- сторінка університету Центр електронного навчання Зворотний зв'язок Інформація Перші кроки в системі електронного навчання Правила користування Офіційні документи СЕН Powered by © ATutor ®. About ATutor Моя стартова сторінка / Проєктування систем автоматизації бізнес-процесів підприємств / Домашня курсу / 1.10 Лекція 10 ЕЛЕКТРОННЕ НАВЧАННЯ В ТНТУ Проєктування систем автоматизації бізнес-процесів пі... Пошта Пошук 17:19 | Турчин Святослав Іванович | Вихід Тиражування даних у корпоративних інформаційних системах 10.1. Поняття технології тиражування даних На сучасному етапі розвитку комп’ютерних технологій ідея організації єдиного інформаційного середовища корпорації чи великого підприємництва на принципах розподіленого оброблення даних стає дедалі популярнішою. Перехід до таких принципів нині здійснюється в усьому комп’ютерному світі, який водночас передбачає заміну дорогих і недостатньо гнучких централізованих систем на базі великих ЕОМ (mainfrane), або малопотужних і слабко інтегрованих систем на базі персональних комп’ютерів, і пов’язаний з розв’язанням низки концептуальних проблем, а саме організації узгодження даних, розміщених на різних фізично розподілених вузлах. Зауважимо, що використання сучасними корпораціями технології «клієнт-сервер» робить актуальною проблему доступу до віддалених баз даних і комбінування інформації з двох або більше фізично розподілених вузлів інформаційної системи. Нагадаємо, що під розподіленою розуміють базу даних, яка включає в себе фрагменти локальних БД, розміщених на різних вузлах розподіленої системи. Вона передбачає фізичний розподіл даних з метою розміщення кожного фрагмента розподіленої бази даних на тому місці, де він переважно буде оброблятися, а отже — зменшення часу доступу до даних для локальних клієнтів. При цьому вся робота з розподіленою БД проходить так, немов це просто локальна БД, її розподіленості користувач не помічає. Розподілені БД обслуговуються в більшості багатокористувацьких СУБД сервером розподілених баз даних (STAR). Оброблення розподілених даних здійснюється за допомогою механізму двофазової фіксації транзакції. Транзакція розподіленої БД включає в себе декілька локальних транзакцій, кожна з яких або фіксується, або переривається. Розподілена трансакція фіксується в тому разі, коли зафіксовані всі локальні транзакції, що є її складовими. Якщо хоч одну з них було перервано, то має бути перервано й розподілену транзакцію. Для того щоб урахувати ці вимоги в сучасних СУБД, передбачено так званий протокол дворазової фіксації транзакції (two — phase commit protocol — 2PC). Перша фаза починається, коли клієнт виконує оператор фіксації (СОММІТ). Сервер розподіленої БД посилає повідомлення «підготуватися до фіксації» (PREPARE TO COMMIT) усім серверам локальних БД, які виконують транзакцію. Після підготовки до фіксації вони залишаються в стані готовності й очікують від сервера розподіленої БД команди фіксації. Якщо хоча б один сервер локальної БД не відгукнувся на повідомлення через різні причини (апаратна чи програмна помилка), то сервер розподіленої БД відкриває локальні транзакції на всіх вузлах, включаючи й ті, які підготувалися до фіксації та сповістили його про це. Виконання другої фази розпочинається з того, що сервер розподіленої БД посилає команду СОММІТ серверам на всіх вузлах, що виконують транзакцію. Виконуючи команду, вони фіксують зміни, досягнуті в процесі виконання розподіленої трансакції. Це гарантує одночасне синхронне завершення (вдале чи невдале) розподіленої транзакції на всіх вузлах, що беруть у ній участь. Основною вадою технології фізичного розподілення даних є жорсткі вимоги до швидкості та надійності каналів зв’язку. Незважаючи на те, що в останні роки становище з каналами оперативного зв’язку дещо поліпшилось, вони не задовольняють потреб корпоративних систем, розподілених на значній території. У технології STAR серйозних проблем з фіксацією розподілених трансакцій не виникає, якщо розподілена транзакція зачіпає два-три вузли мережі з локальними БД. Зовсім інша ситуація виникає, коли база даних розподілена на десятках територіально віддалених вузлів, а кількість клієнтів, які одночасно працюють у розподіленому середовищі, сягає кількох десятків. У цьому разі ймовірність того, що розподілена трансакція буде зафіксована в прийнятому часовому інтервалі, стає дуже малою. Час реакції системи може виявитись неприпустимо великим навіть у разі простого читання даних. Захоплення всіх необхідних даних на всіх серверах може надовго заблокувати доступи до них. Крім того, використання у структурі мережі координуючого вузла пов’язане з додатковою небезпекою, оскільки вихід його з ладу призведе до блокування даних, зачеплених транзакцією, допоки його не буде відновлено. За таких умов оброблення розподілених даних практично неможливе, що й відбувається в багатьох випадках на практиці. Подолати ці труднощі значною мірою допомагає нова технологія оброблення даних, яка спирається на принцип тиражування даних. Її принципова відмінність від технології STAR — це відмова від ведення розподілених даних у 1.10 Лекція 10 Меню загальноприйнятому розумінні. Ідея полягає в тому, що кожна база даних (як для СУБД, так і для багатьох клієнтів, що з нею працюють) завжди є локальною. Локально розміщуються дані, необхідні в певному вузлі розподіленої системи, локально завершуються всі трансакції, які не потребують складних механізмів і перевірок протоколу 2 PС. Ця ідея знайшла своє втілення в сучасних версіях реляційних СУБД таких провідних розробників, як INGRES, Subase, Informix, Oracle. У них передбачено можливість тиражування всіх змін у кількох БД. Під тиражуванням даних слід розуміти процес формування відтворення численних копій даних на одному або кількох вузлах мережі. Тиражування можна визначити як альтернативу мережевій версії оброблення даних (технології розподілених баз даних), призначену для узгодженості роботи клієнтів, розміщених на значних відстанях один від одного. Функції тиражування даних покладено на спеціальний компонент СУБД — сервер тиражування даних, який називають реплікатором (replicator). Його завданням є забезпечення ідентичності даних у базах даних, що приймають (target clatabase), даним у вихідній (початковій) БД. Після роботи клієнтів окремо один від одного спеціальна програма (сервер реплікації) виконує суміщення результатів їхньої роботи на загальних базах даних. У загальному вигляді процес тиражування виглядає так: 1. Ідентичні копії баз даних розподіляються між клієнтами, які працюють з базами. 2. Кожен клієнт працює зі своєю копією баз, вносячи до неї зміни й доповнення. 3. Наприкінці сеансу роботи на робочому місці клієнта формується його файл тиражування, який містить зміни, що їх вніс до баз даних цей клієнт. 4. На сервері реплікацій виконується злиття цих файлів і усунення можливих конфліктів. 5. Після цього формується файл тиражування сервера, який містить зміни баз даних від початку сеансу роботи до поточного моменту. Оброблення цього файла клієнтом має привести до отримання баз даних, які містять результати роботи всіх клієнтів. 6. Файл тиражування сервера розсилається всім клієнтам. Кожен клієнт зупиняє свої дії до початку поточного сеансу й обробляє спеціальною процедурою файл тиражування сервера. 7. Наступний сеанс роботи починається з кроку 2. Застосування технології тиражування даних надає можливість корпоративним користувачам мати доступ до необхідної їм поточної інформації з будь-якого автоматизованого робочого місця та в будь-який час. Крім того, ця технологія надає користувачу низку переваг: — підвищення працездатності системи у разі перевантаженості центральних ресурсів; — підвищення ступеня готовності даних, а відтак і оперативності в оброблення інформації; — зниження навантаження на центральний вузол; — передача лише операцій, що змінюють дані, а не всіх операцій доступу до віддалених даних (як у технології STAR), дає змогу значно зменшити мережевий трафік, що дуже важливо в разі низької швидкодії каналів зв’язку; — значно зменшується час реакції системи. У цій технології зі сторони вихідної бази даних реплікатор є процесом, ініційованим одним користувачем, у той час як у фізично розподіленому середовищі з кожним локальним сервером баз даних працюють всі користувачі розподіленої системи, конкуруючи за ресурси один з одним, що не зменшує часу реакції системи; — тиражування даних цілком прозоре для прикладної програми. Виокремлюють два типи тиражування даних — синхронне та асинхронне. У разі синхронного тиражування дані, що тиражуються, оновлюються одночасно зі змінами вихідних (початкових) даних. Під час синхронного тиражування синхронізованість даних захи-щається двохфазним протоколом фіксації. Після того, як сервер здійснить оновлення даних, він відсилає підтвердження до вхідної бази даних та очікує команди про завершення трансакції. Незважаючи на те, що синхронне тиражування є досить ефективним методом для прикладних систем, що потребують синхронізації, воно має й вади: синхронізація досягається за рахунок втрати «готовності» даних (на період тиражування користувач не має доступу до даних) та зниження продуктивності системи. Асинхронне тиражування — це метод, за якого цільова база даних модифікується не одночасно з вихідною базою, а з деякою затримкою. Затримка в оновленні даних на локальних вузлах може бути в діапазоні від кількох секунд до кількох годин залежно від конфігурації мережі. Але в результаті дані будуть синхронізовані на всіх вузлах мережі. Суть механізму асинхронного тиражування даних полягає в тому, що оброблення даних виконується локально, а розподілені дані копіюються на той сервер, де вони мають використовуватися. За такого методу підтримки логічної цілісності розподіленої бази даних має місце деяка розсинхронізація стану локальних баз даних у часі, тобто зміна стану однієї локальної бази даних відстає від зміни другої локальної бази в часі. При цьому асинхронне тиражування дозволяє локальне оброблення запитів у разі відсутності доступу до вузла. Якщо один із серверів системи, що потребує оновлення даних, виходить із ладу, то система продовжує працювати з іншими, при цьому оновлення даних на сервері після його ремонту здійсниться автоматично, тобто помилка на одному вузлі глобальної мережі не вплине на роботу решти вузлів. Отже, синхронне тиражування гарантує узгодження даних за рахунок зниження «готовності» системи, а асинхронне тиражування дає змогу максимально збільшити «готовність» даних, але потребує ретельної розробки методів узгодженості даних і розв’язання конфліктних ситуацій, що виникають під час оновлення даних. У разі асинхронного тиражування необхідно розв’язати питання належності даних. Належність даних — це поняття, що визначає, за яким вузлом мережі закріплені конкретні дані, які він має можливість оновлювати. За допомогою належності даних у разі потреби визначаються та розв’язуються конфліктні ситуації, що виникають під час оновлення даних. 10.2. Моделі тиражування даних Як уже зазначалося, тиражування даних дає змогу максимально наблизити дані й обчислювальні ресурси до їх користувачів. За рахунок цього можна зменшити час реакції обчислювальної системи на запит користувачів, а деякі елементи зробити цілком автономними. Однак у розподіленій обчислювальній системі часто виникає проблема узгодженості даних, які зберігаються на різних комп’ютерах і в різних базах даних. Для розв’язання цієї проблеми в кожному конкретному випадку використовують відповідні моделі тиражування даних, які інтегровані в сучасні СУБД. Використання тієї чи іншої моделі на практиці залежить від завдань, які вирішуються в інформаційній системі. Наприклад, до механізму тиражування даних у системі замовлення і продажу залізничних квитків будуть висунуті зовсім інші вимоги, ніж до аналогічних механізмів у системі управління торговельною мережею супермаркету. Під час продажу залізничних квитків, після бронювання чи продажу хоча б одного квитка система повинна якнайшвидше розповсюдити цю інформацію на всі свої вузли для уникнення дублювання продажу. А це означає, що основною вимогою до такої системи є цілісність і несуперечливість даних. Програмне забезпечення для торговельних офісів супермаркету має дозволяти деякий час працювати автономно, а потім синхронізувати свої дані з центральною базою даних супермаркету. У цьому разі можливість автономної роботи важливіша несуперечності даних, що забезпечує асинхронне тиражування. У разі продажу залізничних квитків доцільне синхронне тиражування. Отже, механізм тиражування має забезпечити або цілісність даних у різних частинах розподіленої системи, або їх автономну роботу. Цілісність даних і незалежність від центральної СУБД — дві основні характеристиками їх тиражування. Розглянемо основні моделі тиражування даних, з-поміж яких найпоширеніші такі: миттєві копії, змінні миттєві копії, модель з рівноправними вузлами та гібридна конфігурація. |