Главная страница
Навигация по странице:

  • Один до одного Один до багатьох Багато до багатьох Співробітник Посада заміщує заміщує – обов’язковий зв’язок

  • Модальність

  • Елемент – найменша одиниця структури даних.

  • Поліклініки Організація Жителі Квартири РЕУ (ремонтно-експлуатаційне управління)

  • 11.3. Даталогічні моделі

  • Рис. 11.13.

  • Фактографічні моделі даних

  • Поле даних – мінімальна, неподільна одиниця даних, що доступ

  • Тип сегмента – це поіменована сукупність типів елементів

  • Ключем називається набір елементів даних, які однозначно

  • Зацерковний В.І. та ін. ГІС та бази даних. І бази даних


    Скачать 31.1 Mb.
    НазваниеІ бази даних
    АнкорЗацерковний В.І. та ін. ГІС та бази даних.pdf
    Дата06.02.2018
    Размер31.1 Mb.
    Формат файлаpdf
    Имя файлаЗацерковний В.І. та ін. ГІС та бази даних.pdf
    ТипКнига
    #15245
    страница37 из 49
    1   ...   33   34   35   36   37   38   39   40   ...   49
    Рис. 11.10. Типи зв’язків
    Зв’язок типу "багато до багатьох" означає, що кожен екземпляр першої сутності може бути пов’язаний з декількома екземплярами іншої сутності, і кожен примірник іншої сутності може бути пов’язаний з де- кількома примірниками першої сутності. Тип зв’язку "багато до бага-
    тьох є тимчасовим типом зв’язку, який припустимий на ранніх етапах
    Один до одного
    Один до багатьох
    Багато до багатьох
    Співробітник
    Посада
    заміщує
    заміщує
    обов’язковий зв’язок
    факультативний зв’язок

    375
    розробки моделі. Надалі цей тип зв’язку повинен бути замінений двома зв’язками типу "один до багатьох" шляхом створення проміжної сутності.
    Кожен зв’язок може мати одну з двох модальностей
    42
    зв’язку
    (рис. 11.11):
    Рис. 11.11. Типи модальностей зв’язку
    Модальність "може" означає, що екземпляр однієї сутності може бути пов’язаний з одним або кількома екземплярами іншої сутності, а може бути й не пов’язаний з жодним екземпляром.
    Модальність "повинен" означає, що примірник однієї сутності зобо- в’язаний бути пов’язаний не менш ніж з одним примірником іншої сутності.
    Зв’язок може мати різну модальність з різних кінців (рис. 11.11).
    Описаний графічний синтаксис дозволяє однозначно читати діагра- ми, користуючись наступною схемою побудови фраз:
    <Кожен примірник
    СУТНОСТІ
    1>
    <Модальні
    ЗВ’ЯЗКИ>
    <НАЙМЕНУВАННЯ
    ЗВ’ЯЗКУ>
    <ТИП
    ЗВ’ЯЗКУ>
    <примірник
    СУТНОСТІ 2>
    Кожен зв’язок може бути прочитаний як зліва направо, так і справа наліво. Зв’язок на рис. 11.8 можна читати зліва направо: "кожен
    співробітник може мати декілька дітей", справа наліво: "кожна дитина
    зобов’язана належати рівно одному співробітнику".
    Простота і наочність подання концептуальних схем баз даних у моделі "сутність – зв’язок" стали причиною її широкого поширення й популярності серед розробників баз даних.
    Діаграма Бахмана – це орієнтований граф, вершини якого відповіда- ють групам (типам записів), а дуги – груповим відношенням (рис. 11.12).
    Тут запис типу Поліклініка є власником записів типу Мешканець, і вони зв’язані груповим відношенням диспансеризація. Запис типу
    Організація також є власником записів типу Мешканець, і вони зв’язані груповим відношенням працюють. Записи типу РЕУ і типу Мешканець є власниками записів типу Квартира з відношенням відповідно обслуго-
    вують і проживають. Таким чином, запис одного й того ж типу може бути членом одного відношенням і власником іншого.
    42
    Модальність (від лат. modus – розмір, спосіб, образ) у різних предметних сферах – категорія, що характеризує спосіб дії або відношення до дії.
    Може
    Повинен

    376
    Рис. 11.12. Приклад діаграми Бахмана
    для фрагмента БД "Місто"
    Організація моделі даних у СКБД мережевого типу визначається в термінах: елемент, агрегат, запис, групове відношення, БД.
    Елемент – найменша одиниця структури даних.
    Агрегат – іменована сукупність елементів або інших агрегатів.
    Запис – агрегат, який не входить до складу жодного іншого
    агрегату і становить основну одиницю обробки БД.
    Тип запису визначається складом її елементів.
    Групове відношення – ієрархічне відношення між записами двох
    типів.
    Записи одного типу є власниками відношення, іншого підлеглими.
    Мережева модель даних підтримує БД мережевої структури. В мережевій моделі даних припускаються такі операції над об’єктами:
    Запам’ятати – заносить новий запис і автоматично включає в групове відношення з відповідною підпорядкованістю.
    Вкл. в групове відношення – дозволяє зв’язати підпорядкований запис, що відповідає запису-власнику.
    Переключити – змінює запис-власника в тому ж груповому відношенні.
    Обновити – змінює значення елементів запису, перед оновленням відповідний запис повинен буди витягнутий.
    Витягнути, Видалити, Виключити з групового відношення – розриває зв’язок між записом-власником і підпорядкованим.
    Особливості обробки даних у мережевих моделях:
    1. Основна одиниця обробки – запис.
    2. Обробка може починатись з будь-якого запису, незалежно від її розташування в структурі.
    3. Від конкретного запису можливий перехід як до запису запису- власника, так і до підпорядкованого запису.
    Поліклініки
    Організація
    Жителі
    Квартири
    РЕУ
    (ремонтно-експлуатаційне
    управління)
    диспансеризація працюють проживають обслуговують

    377
    11.3. Даталогічні моделі
    На етапі даталогічного проектування розробляється перехід від інфо- логічної моделі до логічної (комп’ютерно орієнтованої), яка підтримується засобами конкретної СКБД. Процес переходу називається відображенням.
    На етапі даталогічного проектування необхідно вибрати тип СКБД і конкретну СКБД.
    Основними чинниками, які впливають на даталогічне проектування з боку СКБД, є:
    1. Тип логічної моделі, яку підтримують вибрані СКБД.
    2. Особливості фізичної організації даних, вибраних СКБД.
    3. Кількісні обмеження, які накладає СКБД.
    4. Тип обчислювального середовища, в якому може працювати
    СКБД і необхідні обчислювальні ресурси.
    5. Документування, і вартість реалізації.
    Даталогічні моделі поділяються на документальні і фактографічні
    (рис. 11.13).
    Рис. 11.13. Приклад діаграми Бахмана
    для фрагмента БД "Місто"
    Документальні моделі даних відповідають представленню слабо структурованої інформації, яка орієнтована головним чином на вільні формати документів, наприклад, тексти природної мови або з гіпертекс- тової розмітки. Документальні моделі класифікують на орієнтовані на
    формат документа, дескрипторні і тезаурусні моделі.
    Моделі, орієнтовані на формат документа. Пов’язані передусім зі стандартною мовою розмітки документів – SGML (Standart Generalised
    Markup Language), яка була затверджена ISO як стандарт ще в 80-х рр.
    Даталогічні моделі
    Моделі представлення фактографічної інформації
    Моделі представлення документальної інформації
    Об’єктно- орієнтовані
    Теоретико- графові
    Теоретико- множинні
    Інвертована організація
    Пряма організація
    Ієрархічні
    Мережеві
    Реляційні
    Бінарних відношень
    Схемно- визначальна структура
    Контекстно- визначальна структура

    378
    ХХ ст. Ця мова призначена для створення інших мов розмітки, визначає припустимий набір тегів
    43
    (посилань), їх атрибути і внутрішню структуру документа. Контроль за правильністю використання тегів здійснюється за допомогою спеціального набору правил, які називаються DTD-описами і використовуються програмою клієнта при розборці документа. Для кожного класу документів визначається свій набір правил, що описує гра- матику відповідної мови розмітки. За допомогою SGML можна описувати структуровані дані, організовувати інформацію, що міститься в документах, подавати цю інформацію в певному стандартизованому форматі. Але зважаючи на свою складність, SGML використовувалась головним чином для опису синтаксису інших мов (найбільш відомою з яких є HTML), і невелика кількість додатків працювали з SGML-документами напряму.
    HTML виявилася набагато простішою і зручнішою за мову SGML і дозволяє визначати оформлення елементів документа та має певний обмежений набір інструкцій – тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML у першу чергу призначені для керу- вання процесом виведення змісту документа на екрані програми-клієнта, визначаючи при цьому спосіб представлення документа, але не його структуру. Елементом гіпертекстової бази даних, що описується HTML, виступає текстовий файл, який може легко передаватись по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом і величезна кількість користувачів має можливість використовувати можливості цієї мови для оформлення своїх документів, безумовно, вплинули на зростання популярності HTML і зробили її сьогодні головним механізмом представлення інформації в Інтернеті.
    Однак сьогодні HTML вже не задовольняє певною мірою вимоги, що висуваються сучасними розробниками до мов подібного роду. Тому
    їй на зміну була запропонована нова мова гіпертекстової розмітки, потужна, гнучка і, одночасно з цим, зручна мова XML.
    XML (Extensible Markup Language) – це мова розмітки, яка описує цілий клас об’єктів даних, що називаються XML-документами. Вона вико- ристовується як засіб для опису граматики інших мов і контролю за правильністю складання документів. Тобто сама по собі XML не містить жодних тегів, призначених для розмітки, вона просто визначає порядок їх створення.
    Тезаурусні моделі засновані на принципі організації словників, міс- тять певні мовні конструкції і принципи їх взаємодії в заданій граматиці.
    Ці моделі досить широко й ефективно використовуються в системах- перекладачах, особливо багатомовних.
    43
    Теги розмітки – спеціальні команди для розміщення на екрані тексту, графіки, відео і аудіо- фрагментів, а також команди, що слугують для зв’язку з іншими HTML-документами та
    інтернет-ресурсами.

    379
    Дескрипторні моделі – найпростіші документальні моделі, що широко застосовувались на ранніх стадіях використання документальних баз даних.
    У цих моделях кожному документу призначався дескриптор
    44
    , який опису- вав документ за певними ключовими характеристиками. Цей дескриптор мав жорстку структуру і описував документ відповідно до тих характерис- тик, які вимагались для роботи з документами в базі даних, що розробля- лась. Наприклад, для БД, що містила опис патентів, дескриптор включав назву області, до якої відносився патент, номер патенту, дату видачі патен- ту і ще низку ключових параметрів, які заповнювались для кожного патенту. Обробка інформації в таких базах даних велась виключно за дескрипторами, тобто за тими параметрами, які характеризували патент, а не сам текст патенту
    Фактографічні моделі даних описують процеси чи об’єкти, що ха- рактеризують який-небудь факт чи подію. Такі дані подаються в структу- рованому вигляді; над ними можна виконувати різноманітні допустимі операції.
    Фактографічні моделі даних на відміну від документальних моде- лей відповідають представленню про структуровану інформацію. До таких моделей відносяться моделі даних на основі інвертованих списків, теоретико-графові і теоретико-множинні моделі даних, а також об’єктно- орієнтовані моделі даних.
    Моделі даних на основі інвертованих файлів. У 60-х рр. ХХ ст. з’я- вились СКБД на основі інвертованих файлів, які відрізнялись простотою організації і наявністю мов маніпулювання даними.
    БД, заснована на застосуванні інвертованих файлів, є найпростішою
    і становить набір файлів, доступ до яких здійснюється за допомогою про- грам, у яких чітко прописано, в яких позиціях у файлі знаходиться необ- хідна інформація. Наприклад, якщо основний файл містить поля: "ім’я",
    "по батькові", "прізвище", "номер відділу", "номер кімнати", то, упо- рядкувавши цей файл за першими трьома полями, можна легко знаходити для кожного співробітника відділ, де він працює, або кімнату, де знаходи- ться його робоче місце. Однак, щоб отримати список усіх співробітників якогось відділу, таке упорядкування буде марним. Хоча можна інверту- вати список, упорядкувавши його за відділами. Аналогічно, якщо виникне потреба визначення всіх співробітників, які працюють у певній кімнаті, то можна побудувати ще одне упорядкування – за номерами кімнат.
    Недоліком такого підходу є те, що він не задовольняє моделі
    ANSI/SPARC, оскільки і логічна і фізична структура збереження даних
    44
    Дескриптор (лат. descriptor – що описує) – лексична одиниця (слово, словосполучення)
    інформаційно-пошукової мови, яка виражає основний зміст певного тексту. Використо- вується при інформаційному пошуку документів в інформаційно-пошукових системах.

    380
    прихована в програмі. У міру розширення системи зростає кількість фай- лів і програм, які обробляються, що призводить до дублювання даних.
    При цьому безпека системи забезпечується лише на рівні операційної системи, що призводить до зниження ефективності роботи.
    До числа найбільш відомих і типових представників таких систем від- носяться Datacom/DB компанії Applied Data Research, Inc. (ADR), орієнтова- на на використання на машинах основного класу фірми IBM, і Adabas компанії Software AG.
    Організація доступу до даних на основі інвертованих списків використовується практично в усіх сучасних реляційних СКБД, але в цих системах користувачі не мають безпосереднього доступу до інвертованих списків (індексів).
    База даних, організована за допомогою інвертованих списків, схожа на реляційну БД, але з тією відмінністю, що збережені таблиці і шляхи доступу до них видні користувачам. При цьому:
    – рядки таблиць упорядковані системою в певній фізичній послідовності;
    – фізична упорядкованість рядків усіх таблиць може визначатися і для усієї БД (так робиться, наприклад, в Datacom/DB);
    – для кожної таблиці можна визначити довільне число ключів по- шуку, для яких будуються індекси. Ці індекси автоматично підтримують- ся системою, але явно видні користувачам.
    Теоретико-графові моделі даних є ранніми моделями даних, що стали домінувати в галузі проектування баз даних, починаючи з 70-х рр. ХХ ст.
    Перша версія ієрархічної моделі даних з’явилась у 1968 р. Простота організації, наявність заздалегідь заданих зв’язків між сутностями, схожість з фізичними моделями даних дозволяли домогтися прийнятної продуктив- ності ієрархічних СКБД на повільних комп’ютерах з малим об’ємом пам’яті.
    Ієрархічні БД підтримують деревоподібну організацію інформації
    (рис. 11.14).
    Рис. 11.14. Приклад ієрархічної моделі даних

    381
    Зв’язки між записами виражаються у вигляді відношень "предок – на- щадок", а у кожного запису є рівно один батьківський запис. Це допомагає підтримувати посилальну цілісність. Коли запис видаляється з дерева, всі її нащадки також повинні бути видалені. Проте, якщо дані не мають дерево- подібної структури, то виникають складнощі при побудові бази даних.
    Ієрархічна структура даних є найпростішою серед усіх даталогічних моделей і
    визначається ієрархічною впорядкованістю своїх компонентів
    (або вузлів).
    Ієрархічна структура передбачає:
     кожний вузол на більш низькому рівні пов’язується тільки з одним вузлом, що знаходиться на більш високому рівні, тобто кожен вузол має не більше одного "батька" – старшого за ієрархією вузла;

    ієрархічне дерево має тільки один вузол, не підпорядкований жод- ному іншому вузлу і який знаходиться на найвищому верхньому – першому рівні;
     до кожного вузла бази даних існує тільки один ієрархічний шлях від кореневого вузла.
    Ієрархічна модель даних будується за принципом ієрархії типів об’єк- тів, тобто один тип об’єкта визначається головним, а інші, що перебувають на більш низьких рівнях ієрархії – підпорядкованими. В теорії графів така структура називається коренем дерева.
    Між головним і підпорядкованими об’єктами встановлюється зв’язок "один до багатьох".
    Кількість дерев у базі даних визначається кількістю кореневих записів.
    Орієнтація на кореневому дереві визначається або від коріння, або до коріння (рис. 11.15).
    Рис. 11.15. Узагальнений вигляд деревоподібної структури
    Верхній вузол називається кореневим вузлом. Він може мати нуль чи декілька дочірніх вузлів, які, у свою чергу, також можуть мати нуль чи
    Кореневий вузол
    Дуга чи ребро
    Дочірні вузли
    Корінь піддерева
    Піддерево

    382
    декілька дочірніх вузлів. У результаті цього подібна структура може бути визначена рекурсивно. Всі вузли дерева, за винятком кореня, повинні мати батьківський вузол. Довільна частина дерева, що виходить з одного вузла (окрім кореня дерева), називається піддеревом. Якщо до верхівки не заходить жодне ребро, дерево стає орієнтованим.
    Основними інформаційними одиницями ієрархічної структури БД є
    сегмент і поле.
    Поле даних – мінімальна, неподільна одиниця даних, що доступ-
    на користувачу за допомогою СКБД.
    Сегмент називається записом, при цьому визначаються 2 поняття:
    тип сегмента або тип запису; екземпляр сегмента або екземпляр запису.
    Тип сегмента – це поіменована сукупність типів елементів
    даних, що в нього входять.
    Екземпляр сегмента – конкретні значення полів або елементів
    даних, що входять до нього.
    Кожний тип сегмента в рамках моделі утворює певний набір одно- рідних записів. Для можливості розрізнення окремих записів в одному наборі кожен тип сегмента повинен мати ключ або набір ключових атрибутів (полів, елементів даних).
    Ключем називається набір елементів даних, які однозначно
    ідентифікують екземпляр сегмента.
    При цьому вважають, що спрямовані ребра графів відбивають ієрар- хічні зв’язки між сегментами кожного екземпляра. Тип сегмента, що пере- буває на найвищому рівні ієрархії, називається логічно вихідним по відно- шенню до типів сегментів, які з’єднані з даними, спрямовані ієрархічно ребрами.
    При роботі з узагальненою деревоподібною структурою використову- ються два методи доступу до всіх вузлів (типів записів) усередині дерева.
    Перший метод починається з доступу до кореня з наступним обробленням всього дерева та доступом до піддерев у порядку зліва направо. Це прямий
    порядок обходу дерева. Другий метод починається із доступу до найнижчих вузлів з поступовим висхідним переходом від одного піддерева до другого зліва направо та із завершенням обробки в корені. Цей метод називають
    зворотним порядком обходу дерева.
    До переваг ієрархічної моделі даних відносять простоту організації, наявність заздалегідь заданих зв’язків між сутностями, подібність з фізичними моделями даних. Це дозволило домогтися прийнятної продук- тивності ієрархічних СКБД на повільних ЕОМ того часу з доволі обмеженими обсягами пам’яті.
    Але якщо дані не мали деревоподібної структури, то виникало безліч труднощів при побудові ієрархічної моделі й бажанні домогтися потрібної продуктивності.

    383
    До недоліків ієрархічної моделі треба віднести її громіздкість для оброблення інформації з достатньо складними логічними зв’язками, а також складність її розуміння для звичайного користувача.
    Приклади ієрархічних СКБД:
    1) IMS (Information Management System) фірми IBM (перша версія
    1968 р.);
    2) TDMS (Time-Shared Data Management System) компанії Development
    Corporation;
    3) Mark IV Multi-Access Retrieval System компанії Control Data
    Corporation;
    4) System 2000 виробництва SAS-Institute;
    5) сервери каталогів, такі як LDAP і Active Directory (допускають чітке подання у вигляді дерева);
    6) реєстр операційної системи Windows, що побудований за прин- ципом ієрархічної БД. Google App Engine Datastore API тощо.
    Мережеві моделі також створювались для малоресурсних комп’юте- рів. Мережева модель розширює ієрархічну модель, дозволяючи групувати зв’язки між записами в множині. З логічної точки зору зв’язок – це не сам запис. Зв’язки лише висловлюють відношення між записами. Як і в ієрар- хічній моделі, зв’язки ведуть від батьківського запису до дочірнього, але в цьому разі підтримується множинне спадкування (рис. 11.16).
    1   ...   33   34   35   36   37   38   39   40   ...   49


    написать администратору сайта