Главная страница
Навигация по странице:

  • N = l*n ; 3. Корегуючий фактор: C = (  X ) 2 /N

  • Cy =  X 2 – C

  • F = S 2 v /S 2 z

  • Лабораторна робота № 9-10 Тема

  • Лабораторна робота № 11 Тема

  • Sr = 1-r 2 /n-2, де: r – коефіцієнт кореляції; n-2 – число ступенів свободи. Критерій достовірності коефіцієнта кореляції: t r

  • Лабораторна №13 Тема: Визначення коефіцієнта множинної лінійної кореляції Основні відомості.

  • ЛАБ 1. Лабораторна робота 1 Тема Сукупність і вибірка. Статистичні характеристики якісної мінливості Загальні


    Скачать 318.09 Kb.
    НазваниеЛабораторна робота 1 Тема Сукупність і вибірка. Статистичні характеристики якісної мінливості Загальні
    АнкорЛАБ 1.pdf
    Дата29.01.2017
    Размер318.09 Kb.
    Формат файлаpdf
    Имя файлаЛАБ 1.pdf
    ТипЛабораторна робота
    #1001
    страница3 из 3
    1   2   3
    Тема: Основи дисперсійного аналізу
    Загальні відомості

    Дисперсійний аналіз розробив та ввів у практику досліджень англійсь- кий вчений Р. Фішер. Дисперсійний аналіз широко використовується для планування експерименту і статистичної обробки його даних.
    При дисперсійному аналізі одночасно обробляють дані декількох вибірок (варіантів), які складають єдиний статистичний комплекс оформлений в вигляді спеціальної робочої таблиці. Структура статичного комплексу і його послідуючий аналіз визначається схемою і методикою експерименту.
    Суть дисперсійного аналізу полягає в тому, що розподіляють загальну суму квадратів відхилень та загальне число ступенів свободи на частини – компоненти, які відповідають структурі експерименту та оцінці значимості дії і взаємодії факторів, що вивчаються.
    За допомогою дисперсійного аналізу встановлюються вибіркові показники зв’язку факторів
    і результативних ознак достатніх для розповсюдження отриманих із вибірки висновків на всю генеральну сукупність фактів. Такий аналіз також використовуть для вивчення якісних ознак. Великою перевагою методу є його пристосованість до отримання висновків на обмежених за чисельністю сукупностях.
    Загальна мета використання дисперсійного аналізу полягає у вивченні зв’язків між причинами та їхніми наслідками, між факторами і результатами
    їхньої дії і взаємодії.
    В основі дисперсійного аналізу лежить положення, що дослід достовірний лише в тому випадку, якщо розсіювання між варіантами його більше ніж між повтореннями одного варіанту.
    Основним завданням дисперсійного аналізу є визначення частки впливу різних факторів окремо і в загальному на зміну вивчаємої ознаки.
    В досліді мінливість поділяночних варіантів обумовлена трьома факторами:
    1. – дією досліджувального фактора (сорти, гібриди, строки сівби, густота та
    ін.) – це розсіювання по варіантам;
    2. – родючість ґрунту кожного повторення (систематична помилка) – це розсіювання по повторенням;
    3. – випадковими причинами (неточність вимірів, неоднорідність родючості
    ґрунту в межах повторень, індивідуальна мінливість рослин) – це залишкове розсіювання.
    Після закінчення експерименту отримані дані заносять в таблицю
    (записують значення по варіантам і по повторенням). Потім визначають суми по повторенням Р, варіантам V та загальну суму спостережень

    X
    . Далі вираховують:
    1. Число ступенів свободи: для варіантів v
    v
    = l-1; для повторень v
    p
    = n-1; для похибки v
    z
    = (l-1)*(n-1), де v
    v
    – число ступенів свободи для варіантів; v
    p
    – число ступенів свободи для повторень; v
    z
    – число ступенів свободи для похибки. l – кількість варіантів;
    n – кількість повторень.
    2. Загальне число спостережень ; N = l*n;
    3. Корегуючий фактор: C = (

    X
    )
    2
    /N, де
    С – корегуючий фактор;

    X
    - загальна сума спостережень;
    N – загальне число спостережень.
    4. Загальну суму квадратів: Cy =

    X
    2
    – C, де

    X
    2
    – сума квадратів спостережень;
    С – корегуючий фактор.
    5. Сума квадратів для повторень: Cp =

    p
    2
    /l-C ; де

    p
    - сума повторень; l – кількість варіантів.
    6. Сума квадратів для варіантів: Cv =

    V
    2
    /n – C;

    V
    2
    – сума варіантів.
    7. Сума квадратів для похибки: Cz = Cy – Cv – Cp.
    Діленням певної суми квадратів на число ступенів свободи отримують дисперсію.
    Дисперсія – це розсіювання даних і показників на складові частини.
    Звідси і назва методу – дисперсійний аналіз.
    Найбільш застосовують дисперсію варіантів та дисперсію похибки або залишку.
    S
    2
    v
    =
    1

    l
    Cv
    , де
    S
    2
    v
    – дисперсія для варіантів;
    C
    v
    – сума квадратів для варіантів; l -1 – число ступенів свободи для варіантів.
    S
    2
    z
    =
    )
    1
    (
    *
    )
    1
    (


    n
    l
    Cz
    , де
    S
    2
    z
    – дисперсія для похибки;
    C
    z
    - сума квадратів для похибки;
    (l-1)*(n-1) – число ступенів свободи для похибки.
    Співвідношення цих двох дисперсій є тим основним критерієм, який дає змогу дати загальну оцінку достовірності різниць між середніми арифметичними або загальну оцінку достовірності досліду. Цей критерій називається критерієм Фішера і позначається першою літерою прізвища автора дисперсійного аналізу Фішера, який визначається за формулою:
    F = S
    2
    v
    /S
    2
    z
    , де
    F – критерій Фішера;
    S
    2
    v
    – дисперсія варіантів;
    S
    2
    z
    – дисперсія похибки.

    Обчисливши фактичне значення критерію Фішера (F
    ф
    ) його порівнюють із теоретичним критерієм на певних рівнях значимості. Якщо
    F
    ф
    т
    , то достовірність різниць між середніми арифметичними немає і на цьому перевірка результатів досліджень припиняється. А якщо критерій
    Фішера фактичний дорівнює критерію теоретичному або більший за нього то достовірність різниць між середніми арифметичними доведена. Це означає, що в досліді є одна або декілька пар варіантів, між середніми арифметичними яких є достовірна різниця.
    Тому в таких випадках крім обчислення критерію Фішера треба знаходити найменшу істотну різницю (НІР) та оцінку про точність досліду.
    Найменша істотна різниця характеризує граничну похибку вибіркових середніх при певному числі ступенів свободи.
    НІР вираховують за формулою:
    НІР
    05
    = t
    05
    *Sd;
    НІР
    01
    = t
    01
    *Sd.
    Щоб визначити НІР, необхідно за даними дисперсійного аналізу розрахувати: узагальнену похибку досліду
    2
    х
    s
    s
    n

    ; похибку різниць середніх
    2 2
    d
    s
    s
    n

    . де
    S
    z
    2
    – дисперсія похибки;
    n – кількість повторень
    З цим статистичним показником порівнюють різницю між середніми арифметичними. Якщо d>НІР, то між варіантами доведена достовірність досліду, а якщо навпаки d<НІР, то достовірної різниці немає.
    Висновок про точність досліду роблять наприкінці дисперсійного аналізу на основі числового значення відносної похибки досліду, яку визначають за формулою:
    S
    x,%
    =
    x
    Sx
    *100, де
    S
    x%
    - відносна похибка досліду;
    S
    x
    - похибка досліду;
    x - середня арифметична.
    Лабораторна робота № 8
    Тема: Дисперсійний аналіз однофакторного досліду

    Матеріали та обладнання: ЕОМ, пакет програми «Сигма», вихідні дані для розрахунку.
    Хід роботи
    Потрібно провести дисперсійний аналіз однофакторного досліду. В таблиці 1 містяться дані про урожайність трьох різних сортів озимої пшениці у чотирьохразовій повторності.
    Таблиця 1
    Урожайність озимої пшениці
    Повторності
    Варіанти
    1 2
    3 4
    Сума V
    Середнє
    1 56,6 60,9 52,6 56,3 226,4 56,6 2
    61,8 54,3 53,5 58,8 228,4 57,1 3
    24,1 28,4 25,6 27,2 105,3 26,3
    Сума P
    142,5 143,6 131,7 142,3 560,1 46,7
    Вихідні дані доцільно перетворювати згідно формули Х1 = Х-А, А – умовне число, близько до середньої арифметичної Х = 46,7. Отже, в даному випадку А = 47.
    Таблиця 2
    Таблиця перетворених даних
    Повторності
    Варіанти
    1 2
    3 4
    Сума V
    1 9,6 13,9 5,6 9,3 38,4 2
    14.8 7,3 6,5 11,8 40,4 3
    -22,9
    -18,6
    -21,4
    -19,8
    -82,7
    Сума P
    1,5 2,6
    -9,3 1,3
    -3,9
    Таблиця 3
    Таблиця квадратів перетворених даних

    Повторності
    Варіанти
    1 2
    3 4
    Сума V
    1 92,16 193,23 31,36 86,49 403,22 2
    219,04 53,29 42,25 139,24 453,82 3
    524,41 345,96 457,96 392,04 1720,37
    Сума P
    835,61 592,46 531,57 617,77 2577,41
    Далі визначають
    1. Число ступенів свободи: Uv = 3-1 =2 (для варіантів), Up = 4-1 = 3 (для повторень), Uz = (l-1)x(n-1) = (3-1)х(4-1) = 6 (для похибки).
    2. Загальне число спостережень: N = 3х4 = 12.
    3. Корегуючий фактор С = (-3,9)
    2
    /12 = 1,27.
    4. Загальна сума квадратів Су = 2577,41-1,27 = 2576,14.
    5. Сума квадратів для повторень Ср = (1,5 2
    +2,6 2
    +9,3 2
    +1,3 2
    )/3-1,27 = 31,13.
    6. Сума квадратів для варіантів Cv = (38,4 2
    +40,4 2
    +82,7 2
    )/4-1,27 = 2485,23.
    7. Сума квадратів для похибки Cz = 2576,14-31,13-2485,23 = 59,78.
    Дисперсія – відношення суми квадратів до числа ступенів свободи
    8. Дисперсія для варіантів S
    2
    v
    = 2485,23/3-1 = 1242,62.
    9. Дисперсія для похибки S
    2
    z
    = 59,78/(3-1)х(4-1) = 9,96.
    Критерій Фішера – відношення дисперсії для варіантів до дисперсії для похибки
    10. Фактичне значення критерію Фішера F = 1242,62/9,96 = 124,76.
    Таблиця 4
    Результати дисперсійного аналізу

    Дисперсія
    Сума квадратів
    Ступені свободи
    Середній квадрат
    F
    ф
    F
    т
    Загальна
    2576,14 12-1
    -
    -
    -
    Повторень
    31,13 4-1
    -
    -
    -
    Варіантів
    2485,23 3-1 1242,62 124,76 5,14
    Похибки
    59,78 6
    9,96
    -
    -
    11. Похибка досліду S
    x
    =
    S
    2
    z
    /n =
    9,96/4 = 1,58 12. Відносна похибка досліду S
    %X
    = 1,58/47х100 = 3,4%
    13. Похибка різниці середніх S
    d
    =
    2S
    2
    z
    /n =
    2х9,96/4 = 2,23 14. Найменша істотна різниця НІР = txS
    d
    = 2,45х2,23 = 5,46
    Таблиця 5
    Варіанти
    Середня врожайність
    Відхилення
    1 56,6
    Контроль
    2 57,1
    + 0,5 3
    26.1
    - 30,3
    Висновок: сорт 2 неістотно відрізняється від контролю (0,5<5,46), а сорт 3 має істотно нижчу врожайність (30,3>5,46)
    Контрольні запитання
    Для закріплення теми студенти виконують завдання
    Лабораторна робота № 9-10
    Тема: Дисперсійний аналіз багатофакторного досліду

    Матеріали та обладнання: ЕОМ, пакет програм «Сигма», вихідні дані для розрахунку.
    Хід роботи
    Потрібно провести дисперсійний аналіз двофакторного досліду, результати якого приведені в таблиці 1. (Фактор – А – різні способи основ нового обробітку грунту: а1-оранка, а2-плоскорізний обробіток; Фактор В- різні сорти озимої пшениці).
    Таблиця1
    Забур’яненість посівів озимої пшениці
    Фактори
    Повторність
    А
    В
    1 2
    3 4
    Сума V Середнє в 1 18 12 14 16 60 15,0 в 2 10 12 11 8
    41 10,3 а 1 в 3 8
    9 10 10 37 9,3 в 1 18 19 24 22 83 20,8 в 2 23 25 26 20 94 23,5 а 2 в 3 20 21 20 27 88 22,0 403 16,8
    Далі визначають
    1.Число ступенів свободи: U
    А
    = l
    А
    -1=2-1 (для фактору А); U
    В
    = l
    В
    -1=3-1=2
    (для фактору В); U
    АВ
    = (l
    A
    -1)x(l
    B
    -1) = 1x2=2 (для взаємодії факторів А і В).
    2. Загальне число спостережень: N = l
    A
    xl
    B
    xn =2x3x4= 24.
    3. Корегуючий фактор: C = (

    X)
    2
    /N = 403 2
    /24 = 6767,0.
    4. Загальну суму квадратів: Су =

    Х
    2
    -С = (18 2
    +12 2
    + …+27 2
    )-6767=872.
    5. Суму квадратів для варіантів:
    Cv =

    V
    2
    /n-C = (60 2
    +41 2
    +…+88 2
    )/4-6767 =872.
    6. Суму квадратів для похибки: Cу-Cv = 872-762,8 =109,2.
    Таблиця 2

    Визначення сум головних ефектів та взаємодії
    А в 1
    В 2 в 3
    Сума А а 1 60 41 37 138 а 2 83 84 88 265
    Сума В
    143 135 125 403 7.Сума квадратів для фактору А:
    С
    А
    =

    А
    2
    /(l
    B
    xn)-C = (138 2
    +265 2
    )/(3x4)-6767 = 672,08 8. Сума квадратів для фактору В:
    С
    В
    =

    B
    2
    /(l
    A
    xn)-C = (143 2
    +135 2
    +125 2
    )/(2x4)-6767 = 20,38 9. Сума квадратів для взаємодії факторів А і В:
    C
    AB
    = C
    V
    -C
    A
    -C
    B
    = 762,8-672,08-20,38 = 70,34
    Дисперсія – відношення суми квадратів до числа ступенів свободи
    10. Дисперсія для фактору А: S
    2
    A
    = 672,08/1 = 672,08 11. Дисперсія для фактору В: S
    2
    B
    = 20,38/2 = 10,19 12. Дисперсія для взаємодії фактору А і В: S
    2
    AB
    = 70,34/2=35,17 13. Дисперсія для похибки: S
    2
    Z
    = 109,2/18 =6,07
    Критерій Фішера – відношення дисперсії до дисперсії для похибки
    Фактичне значення критерію Фішера
    14.Для фактору А: F
    ФА
    = 672,08/6,07 = 110,7 15. Для фактору В: F
    ФВ
    = 10,19/6,07 = 1,68 16. Для взаємодії фактору А і В: F
    ФАВ
    = 35,17/6,07 = 5,79
    Таблиця 3

    Результати дисперсійного аналізу
    Дисперсія
    Сума квадратів
    Ступені свободи
    Середній квадрат


    Загальна
    872,00 23
    -
    -
    -
    Фактор А
    672,08 1
    672,08 110,70 4,41
    Фактор В
    20,38 2
    10,19 1,68 3,55
    Взаємодія АВ
    70,34 2
    35,17 5,79 3,55
    Похибки
    109,20 18 6,07
    -
    -
    17. Похибка досліду: S
    x
    =
    6,07/4 =1,23 18. Відносна похибка: S
    x,%
    = 1,23/16,8x100 = 7,3%
    19. Похибка різниці середніх: Sd =
    2xS
    2
    z
    /n =
    2x6,07/4 = 1,74 20. Найменша істотна різниця: НІР = txSd = 2,14x1,74 = 3,7 21. Контрольні запитання
    Для закріплення теми студенти виконують завдання.
    Лабораторна робота № 11

    Тема: Кореляція та регресія
    Матеріали та обладнання: ЕОМ, пакет програми «Сигма», вихідні дані для розрахунку.
    Загальні відомості
    В дослідженнях рідко приходиться мати справу із точними і визначеними функціональними зв’язками, коли кожному значенню ознаки Х відповідає не одне, а декілька можливих значень ознаки У, тобто їх розподіл.
    Такі зв’язки називають кореляційними.
    Для вимірювання тісноти та форми зв’язку використовують спеціальні статистичні методи: кореляцію та регресію.
    По формі кореляція може бути лінійною і криволінійною, за напрямком
    – прямою і зворотною. Лінійна кореляція і регресія ознаки У на ознаку Х показує, як змінюється в середньому величина У при зміні величини Х. Якщо при збільшені ознаки Х величина У в середньому збільшується, то кореляція
    і регресія називається позитивною або прямою, а якщо із збільшенням ознаки
    Х значення ознаки У зменшується то кореляцію і регресію називають негативною або зворотною. Кореляцію і регресію називають простою, якщо вивчається зв'язок між двома ознаками, і множиною, якщо вивчається залежність між трьома і більше ознаками.
    Числовий показник простої лінійної кореляції, який вказує на силу та напрямок зв’язку Х із У називається коефіцієнтом кореляції. Ця величина немає одиниць вимірювання, змінюється в межах від – 1 до + 1. Коефіцієнт кореляції розраховують за формулою:
    r =

    (X-x)(У-у)/

    (Х-х)
    2

    (У-у)
    2
    Якщо коефіцієнт кореляції менше 0,3, то кореляційна залежність між ознаками слабка. Якщо він знаходиться в межах від 0,3 до 0,7, то кореляційна залежність середня, а якщо більше 0,7 – сильна.
    Коли коефіцієнт кореляції дорівнює нулю то між ознаками Х і У немає лінійного зв’язку, але криволінійна залежність може існувати.
    Число, яке показує. в якому напрямку та на яку величину в середньо - му ознака У змінюється при зміні ознаки Х на одиницю вимірювання нази- вається коефіцієнтом регресії. Коефіцієнт регресії розраховують за форму- лою:
    в
    ух
    =

    (Х-х)(У-у)/

    (Х-х)
    2
    Для оцінки надійності коефіцієнта кореляції вираховують його похиб- ку та критерій достовірності.
    Похибка коефіцієнта кореляції:
    Sr =
    1-r
    2
    /n-2,
    де: r – коефіцієнт кореляції; n-2 – число ступенів свободи.
    Критерій достовірності коефіцієнта кореляції:
    t
    r
    = r/Sr,
    де: Sr – похибка коефіцієнта кореляції
    Якщо t rф
    >t rт
    , то кореляційний зв'язок суттєвий, а коли t rф
    – то не суттєвий
    Кореляційний та регресійний аналіз
    Хід роботи
    Потрібно встановити зв'язок між ознаками Х (відносна вологість грун- ту) та У (липкість)
    Результати спостережень

    Х,%
    У,г/см
    2
    Х
    2
    У
    2
    ХУ
    1 32,7 1,7 1069,29 2,89 55,59 2
    38,9 1,8 1513,21 3,24 70,02 3
    42,5 1,9 1806,25 3,61 80,75 4
    44,3 2,3 1962,49 5,29 101,89 5
    49,8 3,0 2480,04 9,00 149,40 6
    52,7 3,8 2777,29 14,44 200,26 сума
    260,9 14,5 11608,57 38,47 657,91
    Допоміжні величини:

    (Х-х)
    2
    =

    Х
    2
    -(

    Х )
    2
    /n = 11608,57-(260,9)
    2
    /6 = 355,77

    (У-у)
    2
    =

    У
    2
    -(

    У )
    2
    /n = 38,47-(14,5)
    2
    /6 = 3,43

    (Х-х)(У-у) =

    ХУ-(

    Х

    У )/n = 657,91-(260,9x14,5)/6 = 27,4
    Коефіцієнт кореляції: r = 27,4/
    355,77x3,43 = 0,78
    Коефіцієнт регресії: в
    ух
    = 27,4/355,77 = 0,08
    Похибка коефіцієнта кореляції:
    Sr =
    1-0,78 2
    /6-2 = 0,31
    Критерій достовірності коефіцієнта кореляції: t

    = 0,78/0,31 = 2,44 t
    rт05
    = 0,811
    Висновок: кореляційна залежність між ознаками сильна, кореляційний зв'язок суттєвий так, як t rф
    >t rт
    Контрольні запитання
    Для закріплення теми студенти виконують завдання


    Лабораторна №13
    Тема:
    Визначення коефіцієнта множинної
    лінійної кореляції
    Основні відомості.
    Множинний коефіцієнт кореляції трьох змінних – це показник тісного лінійного зв’язку між однією із ознак і сукупністю двох інших ознак.
    Розраховується за формулою:
    R
    yzx
    =r
    2
    xy
    +r yz
    2
    – 2r yx
    *r xz
    *r yz
    /1 – r
    2
    xz
    Ця формула дозволяє розраховувати множинний коефіцієнт кореляції при відомих значеннях парних коефіцієнтів кореляції r xy
    , r xz
    і r yz
    Коефіцієнт R не може бути від’ємним і завжди знаходиться в межах від 0 до 1. При наближення R до одиниці ступінь лінійного зв’язку трьох ознак збільшується.. Між коефіцієнтом множинної кореляції R
    yxz
    і двома коефіцієнтами парної кореляції r yx
    і r yz
    існує наступне співвідношення: кожен з парних коефіцієнтів не може перевищувати по абсолютній величині R
    yxz
    /
    Квадрат коефіцієнта множинної кореляції R
    2
    називають коефіцієнтом множинної детермінації. Він показує частку варіації залежної змінної під впливом досліджуваних факторів.
    Значення множинної кореляції оцінюють по F – критерію
    (критерій істотності)
    F=
    R
    R
    R
    R
    *
    1
    *

    (
    1


    k
    k
    n
    ), де n – об’єм вибірки; k – число ознак.
    Теоретичне значення F – критерію беруть з таблиці, для V
    1
    =K-1 V
    2
    =n-K ступенів свободи і працюючого рівня значимості. Нульова гіпотеза про рівність множинного коефіцієнта кореляції в сукупності нулю приймається, і якщо F
    ср
    < F
    т
    , і відхиляється, якщо F
    ср

    F
    т

    1   2   3


    написать администратору сайта