Главная страница
Навигация по странице:

  • 2) терм А ос В

  • 6. Операція проектування

  • ХV. ОРГАНІЗАЦІЯ ЗБЕРЕЖЕННЯ ДАНИХ У ГІС 15.1. Загальні відомості про збереження даних у ГІС Організація даних – процес зведення різнорідних даних і моделей у

  • Проект у ГІС – спеціальний файл, де знаходиться організована

  • 15.2. Типи файлів бази даних

  • 15.2.1. Невпорядковані файли Невпорядковані файли (списки) є найпростішою структурою

  • 15.2.2. Послідовно впорядковані файли

  • Рис. 15.1.

  • 15.2.3. Індексовані файли

  • Рис. 15.3.

  • Зацерковний В.І. та ін. ГІС та бази даних. І бази даних


    Скачать 31.1 Mb.
    НазваниеІ бази даних
    АнкорЗацерковний В.І. та ін. ГІС та бази даних.pdf
    Дата06.02.2018
    Размер31.1 Mb.
    Формат файлаpdf
    Имя файлаЗацерковний В.І. та ін. ГІС та бази даних.pdf
    ТипКнига
    #15245
    страница44 из 49
    1   ...   41   42   43   44   45   46   47   48   49

    1) терм А ос а, де А – ім’я певного атрибута, що приймає значення з домену D,
    а – константа, взята з того ж домену D,
    оп – одна з припустимих для цього домену D операція порівняння;
    2) терм А ос В, де А, В – імена деяких θ - порівнюваних атрибутів, тобто атрибутів, що приймають значення з одного і того же домену D. Тоді результатом операцій вибору або фільтрації, заданій на відношення R у вигляді булевського виразу, визначеного на атрибутах відношення R, називається відношення R[α], що включає ті кортежі з вихідного відношення, для яких
    істинна умова вибору або фільтрації.
     



     

    "
    "
    2
    True
    r
    R
    r
    r
    r
    R






    Операція фільтрації є однією з основних при роботі з реляційною моделлю даних. Умова α може бути будь-якої складності.

    438
    6. Операція проектування
    Нехай R – відношення;


    n
    R
    A
    A
    A
    S
    ,...,
    ,
    2 1

    – схема відношень R
    1
    , позначена через підмножини: [A
    j
    ]; B

    {A
    j
    }. Нехай при цьому В
    1
    – множина атрибутів з множини {A
    j
    }, що не увійшли в В. Якщо:


    k
    i
    i
    i
    A
    A
    A
    B
    ,...,
    ,
    2 1

    ,


    k
    j
    j
    j
    A
    A
    A
    B
    ,...,
    ,
    2 1
    1

    і
    k
    ij
    k
    i
    k
    i
    i
    i
    A
    a
    a
    a
    a
    r


    
    ,
    ,...,
    ,
    2 1
    , то
     
    m
    j
    m
    j
    m
    j
    j
    j
    A
    a
    a
    a
    a
    s
    B
    r


    
    ,
    ,...,
    ,
    ,
    2 1
    Проекція відношень R на набір атрибутів В, що позначається R[B], називається відношення зі схеми, що відповідає набору атрибутів В:
    S
    R[B]
    =B, що містить кортежі, отримувані з кортежів вихідного відношення
    R шляхом видалення їх значень, що не належать атрибутам з набору В:
    R[B]={r[B]}.
    За визначенням відношень усі дублюючі кортежі видаляються з резуль- туючого відношення. Операція проектування (вертикального вибору) дозво- ляє одержувати тільки потрібні характеристики об’єкта моделювання. Най- частіше операція проектування використовується як проміжний крок в операціях горизонтального вибору або фільтрації. Крім того, вона викорис- товується самостійно на заключному етапі одержання відповіді на запит.
    7. Умовне з’єднання
    На відміну від унарних операцій фільтрації і проектування, ця операція є бінарною (беруть участь 2 відношення, а результатом є одне).
    Нехай R={r}, Q ={q} – вихідні відношення; S
    R
    і S
    Q
    – відповідно схеми відношень R і Q:


    k
    R
    A
    A
    A
    S
    ,...,
    ,
    2 1

    ;


    m
    Q
    B
    B
    B
    S
    ,...,
    ,
    2 1

    , де A
    i
    і B
    j
    імена атрибутів у схемах відношень.
    При цьому вважаємо, що задані набори атрибутів А і В: А

    {A
    i
    }
    i=1,k; B

    {B
    j
    } j=1,m. І ці набори складаються з θ - порівнюваних атри- бутів. Тоді з’єднанням R і Q за умови β буде підмножина декартового добутку від R і Q, кортежі якого задовольняють умову β, яка розгля- дається як одночасне виконання умов:
    1) r · A
    i
    θ
    i
    B
    i
    : i =1, k, де k – кількість атрибутів, що входять в набори А і В,
    θ
    i
    конкретна операція порівняння;

    439 2) A
    i
    θ
    i
    B
    i
    D, де θ
    i
    – i-й предикат порівняння, що визначається з множини припустимих на домені D операцій порівняння.
     






    k
    i
    True
    B
    q
    AQ
    r
    q
    r
    q
    r
    Q
    R
    ,
    1
    ,
    "
    "
    ,
    ;
    ;




    .
    8. Операція ділення
    Нехай є два відношення R і Т відповідно до схем:


    k
    R
    A
    A
    A
    S
    ,...,
    ,
    2 1

    ;


    m
    T
    B
    B
    B
    S
    ,...,
    ,
    2 1

    , де A і B – набори атрибутів цих відношень однакової довжини без повторень:
    R
    S
    A
    ;
    T
    S
    B
    Атрибути А
    1
    – атрибути з R, що не ввійшли в множину А.
    Перетинання множин:

    1
    A
    A
    Ø,
    R
    S
    A
    A

    1

    Проекції R[A] і T[B] сумісні за об’єднанням, тобто мають еквівалентні схеми S
    R[A]

    S
    T[B].
    Тоді
    операція ділення ставить у відповідність відношенням R і Т відношення Q:


    T
    B
    A
    R
    Q
    :

    , кортежі якого є тими елементами проекції R[A
    1
    ], для яких і T[B] входить у побудовану для них множину образів:



     
     

     


     
    R
    y
    r
    A
    R
    y
    y
    B
    T
    A
    R
    r
    r
    T
    B
    A
    R







    ,
    :
    1
    Операція ділення достатньо складна для абстрактного подання, вона може бути заміненою послідовністю інших операцій за допомогою визначення послідовності проміжних запитів, які приведуть до кінцевого результату.

    440
    ХV. ОРГАНІЗАЦІЯ ЗБЕРЕЖЕННЯ
    ДАНИХ У ГІС
    15.1. Загальні відомості про збереження даних у ГІС
    Організація даних – процес зведення різнорідних даних і моделей у
    єдину логічно несуперечливу модель, яку в подальшому можна буде ефек-
    тивно застосовувати в різних технологіях аналізу та управління [19].
    Зібрані дані можуть зберігатися у вигляді наборів або файлів. Крім того, при зведенні дані можуть організовувати пов’язані сукупності, які називають моделями. Для того щоб різнорідні дані й моделі можна було опрацьовувати в одній системі, вони повинні бути упорядковані й зведені до єдиної інформаційної моделі, де будуть доповнювати одне одного.
    Результатом організації даних є створення такої інформаційної моделі, яка дозволяє організувати ефективне збереження в базі даних і ефективну обробку в інформаційних системах та різних технологіях.
    Організація даних надає геоданим якісно нові властивості. Саме організація даних дозволяє використовувати геодані при розв’язку широ- кого кола прикладних задач управління, аналізу, логістики, планування, проектування, прогнозування, використання ресурсів, моніторингу тощо.
    Вихідна та попередньо опрацьована інформація включає велику кількість параметрів, деякі з яких можуть дублювати один одного. Змен- шення кількості геоданих про реальні об’єкти досягається застосуванням моделей, що зберігають основні властивості об’єктів дослідження і які не містять другорядних властивостей.
    Однією з особливостей збору даних у геоінформатиці є те, що ви- хідні дані можуть мати не тільки різні розмірності, але й вимірюватися в різних шкалах.
    Організація даних у геоінформатиці створює умови для зведення даних різної розмірності та шкал вимірів у єдине середовище та їх спільний аналіз.
    У процесі організації даних усе розмаїття вхідної інформації – про об’єкти, їх характеристики, про форми і зв’язки між об’єктами, різні описові відомості – перетворюються на набори моделей. При обробці даних в ГІТ використовують інформаційні моделі. Інтегрована інформаційна модель становить сукупність простих моделей. Для ефективної обробки даних ця сукупність повинна певним чином бути оптимізована. Це завдання розв’язується шляхом організації даних. Вибір того або іншого способу організації даних в ГІС, в першу чергу саме тієї або іншої моделі даних, має ключове значення.

    441
    Вибір моделі даних напряму визначає більшість функціональних можливостей створюваної ГІС, оскільки деякі функції або просто немож- ливо реалізувати для певних типів організації даних, або вони забез- печуються досить складними маніпуляціями.
    Організація даних в ГІС напряму визначає і застосовність тих або ін- ших технологій введення даних. Тією ж мірою від неї залежить досяжна просторова точність подання графічної частини інформації, можливість отримання якісного картографічного матеріалу й організації контролю якості карт.
    Значною мірою спосіб організації даних у ГІС визначає також до- сяжну швидкодію системи, наприклад, при виконанні запиту або візуа- лізації на екрані. Можливість працювати з великими об’ємами даних або з точними даними по великих територіях також пов’язана зі способами та формами організації даних. Зручність редагування й оновлення даних, можливості організації багатокористувацької роботи в режимі редагуван- ня, створення розподілених по мережі баз даних – це все також пов’язане, в першу чергу, з організацією даних і вже у другу – з конкретним програмним забезпеченням [25].
    На підставі викладеного можна виділити наступні завдання системної організації даних у ГІС:
    1) перетворення інформації як описових відомостей;
    2) зведення множини геоданих до єдиної інтегрованої інформацій- ної моделі;
    3) класифікація вихідних даних і моделей при перетворенні їх на
    інтегровану модель;
    4) ідентифікація даних у процесі перетворення даних на інтегровану модель, чим забезпечується збереження їх індивідуальності;
    5) встановлення додаткових зв’язків між геоданими на основі їх
    інтеграції;
    6) уніфікація вихідних даних і створення можливості обробки й аналізу даних, виміряних у різних шкалах і з різними розмірностями, в
    єдиній системі;
    7) створення бази для розв’язання основного завдання геоінформа- тики – встановлення просторових відношень між просторовими процеса- ми, об’єктами, явищами та їх характеристиками.
    Просторова (картографічна) інформація – основа інформаційного блоку ГІС, тому способи її формалізації є найважливішою складовою частиною ГІС. Як відомо, просторова інформація ГІС складається з
    метричної частини, яка описує позиційні властивості об’єктів (процесів, явищ), та атрибутивної частини (змістові (семантичні, тематичні)) харак- теристики. Робочим середовищем при роботі з просторовою інформацією
    є проект.

    442
    Проект у ГІС – спеціальний файл, де знаходиться організована
    певним чином просторова інформація.
    Банк даних (БнД, databank, data bank) – інформаційна система
    централізованого збереження і колективного використання даних, що
    містить сукупність баз даних, СКБД та комплекс прикладних програм.
    БнД називають локальним (local databank), якщо він міститься в
    одному обчислювальному центрі (ОЦ) або на одному комп’ютері, і
    розподіленим (distributed databank), коли сукупність локальних БнД
    поєднується за допомогою мережевих серверів у систему.
    Сукупність просторової й атрибутивної інформації про конк-
    ретну територію утворює картографічний банк даних. Картографічні банки даних іменуються також банками цифрових карт (БЦК).
    15.2. Типи файлів бази даних
    Організована у вигляді бази даних просторова інформація в ГІС, складається з файлів у таких можливих формах: прості списки (невпоряд-
    ковані файли), упорядковані послідовні файли та індексовані файли.
    15.2.1. Невпорядковані файли
    Невпорядковані файли (списки) є найпростішою структурою,
    яка реалізує неупорядкований масив записів. Прикладом невпоряд- кованих файлів можуть слугувати записи у записній книжці, сукупність карт у картотеці, у тому разі, коли записи занотовуються до записної книжки або картотеки у певній послідовності (рис. 15.1) [15].
    Єдиною перевагою такої структури файлу даних є те, що новий запис занотовується в кінець файлу.
    Наявність такої картотеки дозволяє здійснити пошук будь-якого
    імені (атрибута), однак відсутність упорядкування карток робить процес пошуку досить тривалим, особливо у випадках, коли база даних включає велику кількість записів.
    Наприклад, якщо для вибірки однієї картки потрібна одна секунда, а кількість карток становить 200 000, то пошук у середньому займе
    [Burroggh, 1983]:
    годин
    n
    7 27 2
    )
    1 200000
    (
    2
    )
    1
    (






    ,
    де τ – кількість операцій;
    n – кількість карток, що підлягає перебиранню.
    Таким чином, для наведеного прикладу і даного розміру файлу
    (картотеки) пошук потрібної інформації може складати майже 28 годин.

    443
    15.2.2. Послідовно впорядковані файли
    Послідовно впорядковані файли (ordered sequential files) мають певний ключ (літери або цифри), згідно з яким відбувається пошук даних
    (рис. 15.2) [15].
    Рис. 15.1. Приклад невпорядкованого
    масиву даних
    Рис. 15.2. Приклад послідовно
    впорядкованого масиву даних,
    де сортування виконується з
    використанням алфавіту
    Зазвичай, для пошуку використовується дихотомія (пошук даних поділом файлу навпіл). Пошук починається поділом усього масиву записів на дві частини і вибіркою запису в середині. Якщо точка поділу виявляється тією, що потрібна, то процедура пошуку вважається закінченою. Якщо необхідний запис знаходиться раніше обраної точки, то спочатку викону-
    ється операція з першою половиною, якщо після – то з другою половиною.
    Використання дихотомії не передбачає перегляду значної частини файлу. Середня кількість операцій у цій стратегії становить:
    τ = log2(n+1).
    Для попереднього прикладу час пошуку становить трохи більше
    2 годин, замість попередніх 28 [15].
    15.2.3. Індексовані файли
    У вищенаведених прикладах записи ідентифікувались і порівню- вались за ключовим атрибутом – літерою, словом або ознакою. Стратегія пошуку була заснована на значеннях самих атрибутів. Оскільки в ГІС кожному об’єкту привласнюються певні семантичні характеристики
    (атрибути), то й пошук елементів здійснюється з певним набором атрибутів.

    444
    Кожний просторовий об’єкт ГІС може описуватись великою кіль- кістю атрибутів, а сортування або пошук можна виконувати тільки одним способом. Тобто, якщо за одним атрибутом можна застосувати швидкий пошук поділу навпіл, то для всіх інших атрибутів доведеться виконувати виснажливий послідовний пошук. Потрібно знайти якийсь вихід, бо інакше доведеться пересортовувати файл для кожного запиту.
    Вихід існує при застосуванні зовнішнього індексу, який будується таким чином: з вихідного файлу в новий копіюються значення одного атрибута для всіх записів разом із розташуванням цих записів. Тобто кожний запис у новому файлі складається зі значення атрибута й адреси запису у вихідному файлі, з якого це значення було взяте. Потім упоряд- ковуються записи нового файлу, згідно зі значенням атрибута. Щоб знайти записи із заданим значенням атрибута у новому файлі, можна використати поділ навпіл. Знайшовши потрібні записи в індексному файлі, отримаємо адреси вихідного файлу, за яким можна отримати всі атрибути об’єктів.
    Таким чином, для пошуку певних даних в основному файлі використовується додатковий індексний файл, що називається зовнішнім
    індексом, а сам вихідний файл стає індексованим. Це надає можливість вносити до індексованого файлу декілька атрибутів, значення яких дозволяють організувати пошук (рис. 15.3).
    Використання зовнішнього індексу передбачає три умови:
    – по-перше, потрібно знати заздалегідь критерії, за якими буде виконуватись пошук;
    – по-друге, посилання на всі додавання у вихідний файл повинні поміщатись у відповідні місця індексних файлів, не порушуючи їх упорядкованості;
    – по-третє, якщо не буде передбачений з якихось причин певний критерій пошуку, то доведеться використовувати послідовний перебір для отримання потрібної інформації [15].
    Рис. 15.3. Індексована структура даних

    445
    15.3. Принципи організації даних у ГІС
    Просторова організація інформації в ГІС застосовується на практиці у різних модифікаціях і поєднаннях [22; 42; 43; 45; 47; 55]. Існує два підходи до організації просторових даних у ГІС – пошаровий (layer), який
    іноді називають класичним, та об’єктно орієнтований.
    Зважаючи на те, що сучасні ГІС, як правило, є динамічними система- ми, виникає потреба коректної організації інформації в часовому інтервалі.
    Характеристика і визначення часу спричиняють найбільші проблеми. Часто важливим є відносний, а не абсолютний час спостереження (тобто послі- довність, у якій виникають явища). У цьому разі необхідний результат досягається впорядкуванням даних, а не фіксацією абсолютного часу.
    ГІС дає змогу реалізувати ретроспективне відновлення динаміки просторових процесів у вигляді створення динамічних рядів і карт розпо- ділу. Для цього необхідне визначення раціональної глибини ретроспекції і вибору оптимального кроку дискретизації даних (часової розрізненості системи). Крок дискретизації в часі може відрізнятися на багато порядків
    (в десятки і сотні разів) для різних типів даних і мати обмеження, пов’яза- ні як з інструментальною частотою спостережень, так і з природним ходом процесів. Тому необхідна така просторова організація даних, яка б перед- бачала можливість різної розрізненості (реалізованої в побудові регуляр- них ієрархічних мереж), – ієрархічна система часової розрізненості [86].
    1   ...   41   42   43   44   45   46   47   48   49


    написать администратору сайта