Главная страница
Навигация по странице:

  • Параметр Властивості, що піддаються оцінці в будь-якій формі (якісній або кількісній) Статистична сукупність

  • Дискретна випадкова величина

  • Вибірка(вибіркова сукупність)

  • Варіанта Числове значення досліджуваної ознаки; складова варіаційного ряду Середня величина

  • Середньоарифметич­на величина

  • Середнє квадратичне відхилення ()

  • Коефіцієнт варіації С v

  • Помилка репрезентативності

  • Закон розподілу випадкових величин

  • Біноміальний розподіл (розподіл Бернуллі)

  • Нормальний закон розподілу (Гаусса)

  • Розподіл

  • Розподіл Ст’юдента (Госсета)

  • Кількість ступенів свободи 95% 99% 99,9%

  • Х і Швидкість кровоточу мл/с

  • Контрольна група Дослідна група

  • Зміст модуль I. Основи інформаційних технологій в системі охорони здоровя. Обробка та аналіз медикобіологічних даних 4


    Скачать 4.71 Mb.
    НазваниеЗміст модуль I. Основи інформаційних технологій в системі охорони здоровя. Обробка та аналіз медикобіологічних даних 4
    АнкорMed_Informatika_navch_pos.doc
    Дата10.03.2017
    Размер4.71 Mb.
    Формат файлаdoc
    Имя файлаMed_Informatika_navch_pos.doc
    ТипДокументы
    #3627
    страница7 из 16
    1   2   3   4   5   6   7   8   9   10   ...   16

    Методи біостатистики


    Конкретні цілі заняття: інтерпретувати типи даних, етапи статистичного аналізу даних, види розподілів, етапи перевірки гіпотез;
    демонструвати вміння використовувати статистичні методи обробки медико-біологічних даних.

    Основні поняття теми

    Параметр, статистична сукупність, випадкова величина, дискретна випадкова величина, неперервна випадкова величина, генеральна сукупність, вибірка (вибіркова сукупність), варіаційний ряд, варіанта, мода, медіана, середнє арифметичне, середнє квадратичне відхилення, помилка репрезентативності, закони розподілу випадкових величин.

    Короткі теоретичні відомості



    1. Основні поняття, методи і формули біостатистики


    Параметр

    Властивості, що піддаються оцінці в будь-якій формі (якісній або кількісній)

    Статистична сукупність

    Група, що складається з великої кількості відносно однорідних елементів (об’єктів), узятих разом у певних межах часу або простору

    Випадкова величина

    Величина, яка в результаті експерименту, що може бути повторений за незмінних умов велику кількість разів, може набути значень х1, х2,..., хn.

    Види випадкових величин:



    Дискретна випадкова величина

    Величина, яка може набувати скінченну кількість значень

    Неперервна випадкова величина

    Величина, яка може набувати будь-яких числових значень у даному інтервалі значень

    Генеральна сукупність

    Сукупність, що складається з усіх одиниць спостереження, що можуть бути до неї віднесені відповідно до мети дослідження

    Вибірка
    (вибіркова сукупність)


    Частина генеральної сукупності, за властивостями якої судять про генеральну сукупність.

    Вимоги до вибіркової сукупності:



    Варіаційний ряд

    Сукупність значень вивченого в певному експерименті або спостереженні параметра, проранжованих за величинами (зростання або спадання)

    Варіанта

    Числове значення досліджуваної ознаки; складова варіаційного ряду

    Середня величина

    Узагальнююча числова характеристика якісно однорідних величин, яка характеризує одним числом усю статистичну сукупність за однією ознакою



    Мода

    Значення, найпоширеніше в серії спостережень

    Медіана

    Значення, що поділяє розподіл на дві рівні частини, центральне або середнє значення серії спостережень, упорядкованих за зростанням або спаданням

    Середньоарифметич­на величина

    Середня величина, яка розраховується за формулою: (1)

    Частота (р)

    Абсолютна чисельність окремих варіант у сукупності, що вказує на поширеність цієї варіанти у варіаційному ряду.

    Види варіаційного ряду відповідно до значення частоти:



    Середнє квадратичне відхилення ()

    Величина, яка характеризує ступінь розсіювання варіаційного ряду навколо середньої величини: (2)

    Коефіцієнт варіації Сv

    Величина, необхідна для порівняння ступеня розмаїтості ознак, виражених у різноманітних одиницях виміру. Обраховується за формулою: (3)

    Помилка репрезентативності

    Найважливіша статистична величина, необхідна для оцінки достовірності результатів дослідження: (4)

    Закон розподілу випадкових величин

    Функціональна залежність між значеннями випадкових величин та ймовірностями, з якими вони набувають цих значень.

    Закони розподілу випадкових величин:



    Біноміальний розподіл (розподіл Бернуллі)

    Дискретна випадкова величина х, яка може набувати тільки цілих невід’ємних значень з імовірностями m=0, 1, ..., n, де р – імовірність появи події в кожному випробуванні, m – кількість сприятливих подій, n – загальна кількість випробувань, q=1–p, , називається розподіленою за біноміальним законом з математичним сподіванням np та дисперсією npq.

    Закон Бернуллі використовують тоді, коли необхідно знайти імовірність появи випадкової події, яка реалізується рівно m з серії n випробувань.

    Біноміальному закону розподілу підпорядковуються випадкові події, такі, як кількість викликів швидкої допомоги за певний проміжок часу, черги до лікаря в поліклініці, епідемії тощо

    Розподіл Пуассона

    Дискретна випадкова величина Х, яка може набувати тільки цілих невід’ємних значень з імовірностями

    , називається розподіленою за законом Пуассона з математичним сподіванням і дисперсією , де . Розподіл Пуассона як граничний біноміальний використовується при розв’язуванні задач надійності медичного обладнання та апаратури, поширення епідемії, викликів до хворого дільничних лікарів та інших задач масового обслуговування

    Нормальний закон розподілу (Гаусса)

    У біології та медицині найчастіше розглядають випадкові величини, які мають нормальний закон розподілу: частоту дихання, частоту серцевих скорочень, динаміку росту популяції тощо. Стандартним нормальним розподілом називають розподіл з нульовим математичним сподіванням і одиничною дисперсією, щільність розподілу якого має наступний вигляд:



    Розподіл

    Нехай незалежні випадкові величини х1, х2,..., хn розподілені за нормальним законом з mc=0 та =1. Закон розподілу випадкової величини називається «хі-квадрат» розподілом з n ступенями вільності (кількість незалежних координат). Зі збільшенням ступенів вільності розподіл наближається до нормального

    Розподіл Ст’юдента (Госсета)

    Нехай х, у – незалежні випадкові величини, причому х розподілено за нормальним законом з параметрами (0;1), у – за законом з n ступенями вільності. Тоді розподіл випадкової величини називається законом Ст’юдента з n ступенями вільності або
    t-розподілом.

    При збільшенні ступенів вільності розподіл Ст’юдента наближається до нормального


    2. Комп’ютерна технологія аналізу результатів

    2.1. Оцінка вірогідності результатів прямих вимірювань

    Суть цього методу полягає в тому, що за знайденими значеннями Хсер і σ деякої вибірки встановлюють інтервал, у якому з певною імовірністю міститься значення деякого параметра всієї генеральної сукупності.

    Імовірність Р, визнана достатньою для певного висновку про досліджуваний параметр генеральної сукупності на основі вибіркових показників, називається надійною.

    Вибір того чи іншого значення надійної імовірності здійснюють на основі практичних міркувань і тієї відповідальності, з якою роблять висновки про параметри генеральної сукупності. У медицині при особливо відповідальних експериментах вибирають Рнад=99,9%, у решті випадків – Рнад=95%.

    Алгоритм оцінки вірогідності результатів прямих вимірювань.

      1. Знаходження за формулою [1] середного арифметичного результатів вимірювання досліджуваної вибірки.

      2. Знаходження за формулою [2] середнього квадратичного відхилення окремого результату вимірювання.

      3. Знаходження за формулою [4] стандартної похибки.

      4. Обчислення точності безпосереднього вимірювання Δm за формулою:

    Δm = mtP,ν,

    де tP,ν – коефіцієнт нормованих відхилень (коефіцієнт Ст’юдента), залежний від кількості степенів свободи ν=n-1, і вибраної надійної ймовірності над=99,9%, Рнад=99%, Рнад=95%).

    Коефіцієнт Ст’юдента знаходимо за таблицею 1.

    ν

    Р

    ν

    Р

    0,95

    0,99

    0,999

    0,95

    0,99

    0,999

    1

    12,706

    63,657

    636,619

    18

    2,103

    2,878

    3,922

    2

    4,303

    9,925

    31,598

    19

    2,093

    2,861

    3,883

    3

    3,182

    5,841

    12,941

    20

    2,086

    2,845

    3,850

    4

    2,776

    4,604

    8,610

    21

    2,080

    2,831

    3,819

    5

    2,571

    4,032

    6,859

    22

    2,074

    2,819

    3,792

    6

    2,447

    3,707

    5,959

    23

    2,069

    2,807

    3,767

    7

    2,365

    3,499

    5,405

    24

    2,064

    2,797

    3,745

    8

    2,306

    3,355

    5,041

    25

    2,060

    2,787

    3,725

    9

    2,262

    3,250

    4,781

    26

    2,056

    2,779

    3,707

    10

    2,228

    3,169

    4,587

    27

    2,052

    2,771

    3,690

    11

    2,201

    3,106

    4,487

    28

    2,048

    2,763

    3,674

    12

    2,179

    3,055

    4,318

    29

    2,045

    2,756

    3,659

    13

    2,160

    3,012

    4,221

    30

    2,042

    2,750

    3,646

    14

    2,145

    2,977

    4,140

    40

    2,021

    2,704

    3,551

    15

    2,131

    2,947

    4,073

    60

    2,000

    2,660

    3,460

    16

    2,120

    2,921

    4,015

    120

    1,980

    2,617

    3,373

    17

    2,110

    2,898

    3,965
















      5. Знаходження точного значення вимірюваної величини:

    Х = Х сер ± Δm.

    Цей вираз означає, що шукане значення досліджуваного параметра генеральної сукупності з вибраною надійною імовірністю не виходить за межі інтервалу: Хсер – Δm< Х <Хсер + Δm.

    В MS Excel для оцінки вірогідності результатів прямих вимірювань існує вбудована функція ДОВЕРИТ.

    2.2. Оцінка вірогідності відмінностей дослідження двох незалежних вибірок

    Маємо дві групи вимірювань: дослідну х1, х2, . . . , хn та контрольну у1, у2, . . ., уn, де n1 – кількість вимірювань 1-ї групи, n2 – кількість вимірювань 2-ї групи. Використовуючи цей метод, можна встановити, чи спричинені відмінності двох незалежних вибірок випадковим фактором, чи якою-небудь зовнішньою дією (зокрема лікувальною).

    Алгоритм оцінки вірогідності відмінностей дослідження двох незалежних вибірок

    1. Знаходження середнього арифметичного значення контрольної та дослідної груп.

    2. Знаходження середнього квадратичного відхилення окремих вимірювань у групах.

    3. Визначення помилок репрезентативності цих груп.

    4. Знаходження абсолютного значення середніх арифметичних дослідної та контрольної груп:

    .

    5. Обчислення середньої похибки різниці.

    .

    6. Визначення критерію вірогідності різниці:

    .

    7. Знаходження кількості ступенів свободи:

    ν =n1+n2 - 2.

    8. Знаходження за таблицею кількості ступенів свободи ν (див. нижче) значення трьох стандартних критеріїв Ст’юдента (tst), відповідних трьом програмам вірогідності (95%, 99%, 99,9%).

    Кількість ступенів свободи

    95%

    99%

    99,9%

    Кількість ступенів свободи

    95%

    99%

    99,9%

    1

    12,7

    63,7

    637,0

    13

    2,2

    3,0

    4,2

    2

    4,3

    9,9

    31,6

    14-15

    2,1

    3,0

    4,1

    3

    3,2

    5,8

    12,9

    16-17

    2,1

    2,9

    4,0

    4

    2,8

    4,6

    8,6

    18-20

    2,1

    2,8

    3,9

    5

    2,6

    4,0

    6,9

    21-24

    2,1

    2,8

    3,8

    6

    2,4

    3,7

    6,0

    25-28

    2,1

    2,8

    3,7

    7

    2,3

    3,5

    5,4

    29-30

    2,1

    2,7

    3,7

    8

    2,3

    3,4

    5,0

    31-34

    2,0

    2,7

    3,7

    9

    2,3

    3,3

    4,8

    35-42

    2,0

    2,7

    3,6

    10

    2,2

    3,2

    4,6

    43-62

    2,0

    2,7

    3,5

    11

    2,2

    3,1

    4,4

    63-175

    2,0

    2,6

    3,4

    12

    2,2

    3,1

    4,3

    176

    2,2

    2,6

    3,3


    9. Порівняння критерію вірогідності td знайденими значеннями (tst95%, tst99%, tst99,9%).

    Якщо td< tst95%, то вибіркова різниця ненадійна, тобто відмінності у вибірках випадкові.

    Якщо tst95% ≤ tdtst99%, то вибіркова різниця надійна з імовірністю 95%.

    Якщо tdtst99,9%, то вибіркова різниця надійна з імовірністю 99,9%.

    Цей алгоритм реалізовано в Пакеті аналізу MS Excel (Сервис/Анализданных/Двухвыборочный t-тест с одинаковыми дисперсиями – для вибірок з однаковими дисперсіями, та Сервис/Анализ данных/Двухвыборочный t-тест с разными дисперсиями – для вибірок з різними дисперсіями).

    2.3. Кореляційний аналіз двох випадкових ознак

    Цей метод застосовують для встановлення зв’язку між двома ознаками та з метою визначити його вірогідність. При цьому ми маємо виміри двох ознак:

    1-а ознака – х1, х2, . . . , хn;

    2-а ознака – у1, у2, . . . , уn,.

    Треба встановити, чи існує зв’язок між змінними ознак х і у, і якщо існує, то яка його вірогідність.

    Алгоритм кореляційного аналізу двох випадкових ознак

    1. Знаходження середнього арифметичного значення ознак.

    2. Обчислення відхилення кожного значення х від хсер:

    , ,. . ., .

    3. Обчислення відхилення кожного значення у від усер:

    , ,. . ., .

    4. Обчислення суми добутку відхилень:

    .

    5. Обчислення максимальної суми:

    .

    6. Знаходження коефіцієнта кореляції r:

    .

    7. Визначення глибини кореляційного зв’язку за критеріями, навединими нижче:

    r <0,6

    Лінійний взаємозв’язок виявити не вдалося

    0,6<r <0,8

    Існує лінійний взаємозв’язок

    0,8< r <0,95

    Висока ступінь лінійного взаємозв’язку

    r >0,95

    Існує практично лінійний зв’язок

    8. Обчислення середньої похибки коефіцієнта кореляції:

    .

    9. Обчислення критерію вірогідності коефіцієнта кореляції:

    .

    10. Визначення стандартних значень критеріїв Ст’юдента відповідно трьом програмам вірогідності (95%, 99%, 99,9%) за допомогою таблиці для кількості ступенів свободи (див. вище) ν=2n-2.

    11. Порівняння коефіцієнтів вірогідності коефіцієнта кореляції стандартними значеннями критеріїв Ст’юдента. Висновок про вірогідність коефіцієнта кореляції.

    В MS Excel для обчислення цього параметру існує вбудована функція КОРРЕЛ.

    Практичні завдання


    Завдання 1. Обчислення основних статистичних характеристик вибірок.

    Визначити середнє арифметичне, середнє квадратичне відхилення, помилку репрезентативності, моду та медіану результатів вимірювання швидкості кровотоку 10 пацієнтів до наркозу.


    Хі

    Швидкість кровоточу мл/с

    Х1

    11,2

    Х2

    11,0

    Х3

    10,9

    Х4

    11,22

    Х5

    11,4

    Х6

    11,0

    Х7

    11,1

    Х8

    11,3

    Х9

    11,2

    Х10

    11,301

    Хсер




    σ




    m




    Мода




    Медіана




    Завдання 2. Оцінка вірогідності результатів прямих вимірювань.

    Оцінити вірогідність безпосередніх вимірювань швидкості кровотоку 10 пацієнтів до наркозу, використовуючи дані із завдання 1.

    Завдання виконати в два способи:

    1) Методом безпосереднього обчислення за поданим вище алгоритмом;

    2) Використовуючи вбудовані функції MS Excel.

    Інтерпретуйте отримані результати.

    Завдання 3. Оцінка вірогідності відмінностей дослідження двох незалежних вибірок.

    Було проведено дослідження дії магнітних полів низької частоти на карциному Герена на четвертий день захворювання (результати досліджень в таблиці:


    Контрольна група

    Дослідна група

    0,027

    0,075

    0,036

    0,4

    0,1

    0,08

    0,12

    0,105

    0,32

    0,075

    0,45

    0,12

    0,049

    0,06

    0,105

    0,075

    В першому стовпчику подані результати інтактної групи, а в другому стовпчику – розмір новоутворення пухлини на яку діяли магнітні поля низької частоти.

    Перевірити ефективність впливу магнітних полів на новоутворення пухлини карциноми Герена.

    Завдання виконати двома способами:

    1. Безпосередніми обчисленнями за поданим вище алгоритмом;

    2. Використовуючи Пакет аналізу MS Excel.

    Алгоритм виконання завдання використовуючи Пакет аналізу MS Excel.

    1. Обчислити дисперсії вибірок. Порівняти отримані значення дисперсій.

    2. Виконати команду Сервис/Анализ данных/Двухвыборочный t-тест с разными дисперсиями.

    В діалоговому вікні Анализ данных вказати Интервал переменной1, тобто ввести посилання на перший діапазон даних, що аналізуються, і, містить перший стовпчик даних. Аналогічно, вказати Интервал переменной 2. Вказати Выходной диапазон, тобто ввести посилання на комірку, в яку будуть виведені результати.

    3. Інтерпретація результатів аналізу.

    У вихідний діапазон будуть виведені: середнє, дисперсія, та число дослідів для кожної змінної, різниця середніх, df (число ступенів вільності), P(T<=t) одностороннє, t критичне одностороннє, P(T<=t) двостороннє, t критичне двостороннє.
    Завдання 4. Оцінка вірогідності відмінностей дослідження двох незалежних вибірок.

    На лабораторних щурах проводили дослідження на ембріотоксичність. Результати досліджень подані в таблиці.


    Контрольна група

    Дослідна група

    1,85

    2,27

    1,87

    2,09

    1,87

    2,09

    2,3

    2,41

    2,52

    2,31

    1,89

    2,17

    2,37

    2

    1,7

    2,1

    1,7

    2,02

    1,94




    В першому стовпчику подана маса плоду тварин інтактної групи, в другому – маса плоду тварин, яким в порожнину шлунку вводили 0,6% масляного розчину  – токоферолу ацетату з 1 по 10 день вагітності у розрахунку 15мг/кг.

    Перевірити доцільність введення масляного розчину  – токоферолу ацетату з 1 по 10 день вагітності (гіпотезу рівності середніх при різних об’ємах вибірки).

    Завдання 5. Кореляційний аналіз двох випадкових ознак Оцінка вірогідності результатів прямих вимірювань.

    В таблиці наведені результати спостережень частоти серцевих скорочень і частоти дихання у групі хворих з певною патологією:


    ЧСС

    120

    84

    105

    92

    113

    90

    80

    72

    98

    102

    95

    ЧД

    20

    15

    18

    16

    19

    16

    15

    12

    18

    20

    17

    Необхідно визначити, чи існує взаємозв’язок між частотою серцевих скорочень та частотою дихання при досліджуваній патології.

    Завдання виконати використовуючи вбудовану функцію КОРРЕЛ MS Excel.

    Алгоритм виконання завдання використовуючи Пакет аналізу MS Excel

    1. Ввести дані до таблиці.

    2. Обчислити значення коефіцієнта кореляції між вибірками.

    3. В комірку вставляємо функцію КОРРЕЛ, що викликається наступним чином Мастер функций/Статистические.

    В поле Массив 1 вводимо дані першої вибірки, в поле Массив 2 – другої.

    4. Визначити ступінь залежності між частотою дихання і частотою серцевих скорочень.
    Завдання 6. Кореляційний аналіз двох випадкових ознак.

    Визначити, чи існує взаємозв’язок між народжуваністю та смертністю (кількість на 1000 осіб) в м. Одеса, зробити висновки щодо ступеню стохастичного зв’язку. Результати досліджень подані в таблиці:


    Роки

    Народжуваність

    Смертність

    1990

    7,2

    11,8

    1991

    7,6

    10,9

    1992

    8,1

    13,1

    1993

    8,5

    12,4

    1994

    9,1

    15,2

    1995

    9,3

    12,5

    1996

    7,4

    13,5

    1997

    6,6

    17,4

    1998

    7,1

    17,2

    1999

    7,0

    15,9

    2000

    6,6

    14,2



    Тестові завдання для самоконтролю



    1. В результаті експерименту, що може бути повторений велику кількість разів, отримані значення х1, х2,..., хn, які називають:

    • вибіркою

    • випадковою величиною

    • варіаційним рядом

    • законом розподілу

    2. Дискретною випадковою називається величина, яка приймає значення:

    • з замкненого інтервалу [0;n]

    • з відкритого інтервалу (0; n)

    • з напівзамкненого інтервалу зліва або справа

    • кінцеву кількість значень х1, х2,..., хn

    3. Величина, котра може приймати будь-які числові значення в даному інтервалі значень називається:

    • дискретною випадковою величиною

    • неперервною випадковою величиною

    • випадковою величиною

    • параметром розподілу випадкової величини

    4. Функціональна залежність між значеннями випадкових величин та ймовірностями з якими вони приймають ці значення називають:

    • щільністю розподілу

    • гістограмою розподілу

    • медіаною розподілу

    • законом розподілу

    5. Властивості, що підлягають оцінці в будь-якій формі називаються:

    • змінними

    • системою властивостей

    • параметрами

    • варіантою

    6. Статистичною сукупністю можна назвати:

    • контингент студентів, які закінчили медичний університет

    • контингент дітей віком до 2 років

    • контингент хворих, що знаходяться у даний момент часу на лікуванні у стаціонарі

    • контингент хворих на туберкульоз віком 30-50 р.

    7. Якому закону розподілу підпорядковуються випадкові події такі, як число викликів швидкої допомоги за певний проміжок часу, черги до лікаря в поліклініці, епідемії?

    • Госсета

    • Біноміальному

    • Пуассона

    • Гаусса

    8. Група призовників, що пройшли медичне обстеження у військкоматі протягом року є:

    • статистичною сукупністю

    • генеральною сукупністю

    9. Набір значень (х12,...,хn) випадкової величини Х, котрі отримані в результаті п дослідів, називається:

    • вибіркою об’єму n

    • генеральною сукупністю

    • дискретною випадковою

    • розподілом випадкової величини

    10. Репрезентативною називається вибіркова сукупність, яка:

    • містить більшу частину елементів генеральної сукупності

    • містить всі елементи генеральної сукупності

    • правильно подає генеральну сукупність

    11. Припущення, котрі відносяться до виду розподілу випадкової величини або окремих його параметрів є:

    • функцією розподілу

    • щільністю розподілу

    • статистичною гіпотезою

    • параметрами розподілу

    12. Дано вибіркову сукупність: {115; 115; 115; 120; 120; 120; 120; 120; 125}. Визначити моду.

    • 115

    • 120

    • 125

    13. Дано вибіркову сукупність: {115; 115; 115; 120; 120; 120; 120; 120; 125}. Визначити моду.

    • 115

    • 120

    • 125

    14. Ймовірність з якою може бути відхилена нульова гіпотеза, коли вона є вірною, називається:

    • рівень значущості

    • похибкою експерименту

    • довірчою ймовірністю

    15. При проведенні досліджень необхідно забезпечити наступні вимоги до вибірки:

    • структурну відповідність

    • однорідність

    • репрезентативність

    • співпадання умов спостережень

    16. Значення коефіцієнта кореляції може змінюватися від

    • [-1;1)

    • (-1;1)

    • [-1;1]

    • (-1;1]

    17. Що характеризує абсолютне значення коефіцієнта кореляції стохастичного взаємозв’язку між випадковими величинами:

    • силу та напрям

    • напрям та щільність

    • розсіювання та напрям

    • силу та щільність

    18. Знак коефіцієнта кореляції вказує

    • на щільність кореляції

    • на напрям стохастичного зв’язку

    • на силу стохастичного зв’язку

    • на ступінь розсіювання між випадковими величинами



    1   2   3   4   5   6   7   8   9   10   ...   16


    написать администратору сайта