Главная страница
Навигация по странице:

  • Статистическое заключение

  • 4.0 Дисперсионный анализ

  • 4.1 Схема обработки полученной информации на примере однофакторного, равномерного статистического комплекса

  • Новая методичка статистика. 1 Расчёт основных статистических показателей для выборочных совокупностей


    Скачать 1.22 Mb.
    Название1 Расчёт основных статистических показателей для выборочных совокупностей
    Дата16.02.2018
    Размер1.22 Mb.
    Формат файлаdoc
    Имя файлаНовая методичка статистика.doc
    ТипДокументы
    #36650
    страница8 из 11
    1   2   3   4   5   6   7   8   9   10   11

    3.5. Статистическое сравнение двух выборочных средних

    по t –критерию Стьюдента при неравнозначных выборках
    Если объёмы выборочных совокупностей неравны (выборки неравнозначные), то критерий t- Стьюдента определяется по формуле:

    tф= ,

    где Sd= ,
    d – разность между сравниваемыми средними

    Sdошибка разности средних

    и значение сравниваемых средних выборочных совокупностей

    n1 и n2 –объёмы сравниваемых выборочных совокупностей;

    и - значение стандартного отклонения.

    Пример расчета вспомогательных величин для вычисления t- критерия фактического приведен в таблице 3.5
    Таблица 3.5 Статистическое сравнение двух выборочных средних по t- критерию Стьюдента


    Фамилия

    Объём выборки n, шт.

    Средняя величина

    , cм.

    Стандартное отклонение

    σ, cм.

    t факт

    t 05/01

    Иванов

    100

    24,88

    7,45

    6,23

    1,96/2,58

    Смирнов

    552

    22,02

    4,08




    Sd=
    tф=.

    Фактическое значение t- критерия (t Ф) сравнивается с tSt на1% и 5%-ном уровне значимости.

    t 05/ 01 определяем по приложению учебника, исходя из числа степеней свободы.

    Формула для вычисления числа степеней свободы имеет вид: k = n1 + n2 – 2.

    Для приведенного примера k = 542 + 552 - 2 = 1092, следовательно, t05/ 01 = 1,96/2,58.

    Так как tфакт(6,23) больше t01 , Н0-гипотеза отвергается, следовательно, различия существенные.
    Статистическое заключение

    В результате сравнения выборочной средней Иванова со средней Смирнова делаем заключение о несущественности различий между ними, т.к tф больше t01.

    В курсовой работе произвести сравнительную оценку со средними пятерых студентов и отметить с кем выявлены существенные, а с кем несущественные различия.
    4.0 Дисперсионный анализ
    При исследовании причинно-следственных отношений между явлениями используется дисперсионный анализ. Дисперсионный анализ разработан английским ученым Р. А. Фишером. Он открыл закон распределения отношений средних квадратов отклонений (дисперсий).

    Fф = Sv / Sz,

    где Fф – расчетное значение F- критерия Фишера; Sv – средний квадрат (отклонений) выборочных средних; Sz – средний квадрат всех объектов.

    Эксперимент (опыт) нельзя спланировать, не зная основ дисперсионного анализа. При дисперсионном анализе одновременно обрабатываются данные нескольких выборок. Каждая выборка представляет собой вариант опыта. Вариантов выборок может быть несколько. Желательно вариантами опыта охватить весь диапазон возможных изменений искомого (результирующего) признака. Эти выборки (варианты опыта) составляют единый статистический комплекс.

    Сущность дисперсионного анализа - это расчленение общей в опыте суммы квадратов отклонений и общего числа степеней свободы на части, которые соответствуют структуре эксперимента. При этом оценка значимости взаимодействия изучаемых факторов оценивается по F – критерию Фишера.

    Рассмотрим однофакторный статистический комплекс, который состоит из нескольких независимых выборок - (l) вариантов опыта, в котором общая изменчивость изучаемого признака оценивается дисперсией Cy.

    Cy – общая изменчивость. Она расчленяется на две составляющие:

    Cv– варьирование между выборками (вариантами опыта);

    Cz– варьирование внутри выборок, внутри вариантов.

    Формула изменчивости признака:

    Cy = Cv + Cz ,

    где Cvобусловлена действием изучаемых факторов;

    Cz– характеризует случайное варьирование, т. е. ошибку эксперимента.

    Согласно определению сущности дисперсионного анализа, общее число степеней свободы, равное ν = N1 также делится на части. Первая часть – степени свободы для вариантов: ν = l1. Вторая часть – степень свободы для случайного варьирования: Nl.

    Общая формула числа степеней свободы:

    (N1) = (l1) + (Nl)

    При обработке однофакторных комплексов, когда варианты (выборки) имеют ''n'' организованных повторений, общая сумма квадратов разлагается на три части: Ср – варьирование повторений; Сv – варьирование вариантов; Сz – случайное варьирование.

    Cy = Cp + Cv + Cz

    (N1) = ( n1) + ( l1 ) + ( n1) + ( l1).

    Найдем сумму квадратов отклонений по данным статистического комплекса с '' l '' вариантами и ''n'' повторностями.

    В исходной таблице определяют суммы по повторениям p, по вариантам V и общую сумму всех наблюдений ∑ x.

    Затем вычисляем:

    - общее число наблюдений:N = ∑ n = l × n;

    гдеl– количество вариантов опыта,n – количество повторностей по варианту

    - корректирующий фактор: C = ( ∑ x )2 / N;

    - общая сумма квадратов: Cy = ∑ ( x )2 C;

    - сумма квадратов для повторений: Cp = ( ∑ p2 / l ) – C;

    - сумма квадратов для вариантов: Cv=( ∑ V2 / n) – C;

    - сумма квадратов для ошибки: Сz = Cy- Cv .
    Сумму квадратов отклонений для вариантов Cv и для ошибки Cz делят на соответствующие им степени свободы, т. е. приводят к сравниваемому виду – к одной степени свободы вариаций.

    Получаем два средних квадрата дисперсий:

    - средний квадрат дисперсии вариантов sv2 = Cv/ (l – 1);

    - средний квадрат дисперсии остатка sz2 = Cz / (Nl).

    Оценка значимости воздействия изучаемых факторов осуществляется по F – критерию Фишера:

    Fф = sv2 / sz2.

    Если Fф > F01 , то различия между вариантами существенны. Если Fф < F05 , то различий нет.

    Если F05< Fф < F01, нужно увеличить число повторностей, не увеличивая числа вариант.

    Если Fф ≥ F01 , то приступаем ко второй части анализа – проведем дополнительную оценку существенности частных различий.

    Критерий НСР указывает предельную ошибку для разности двух выборочных средних.

    Если фактическая разность ( d ) между средними по вариантам больше или равна НСР ( d ≥ НСР ), то она существенна ( значима ).

    Если d < НСР – разность между средними не существенна.

    Чтобы определить НСР необходимо по данным дисперсионного анализа вычислить обобщенную ошибку средней по опыту:

    .

    Ошибку разности средних:

    ,

    где S2 – остаточный средний квадрат из таблицы дисперсионного анализа;

    n – число повторностей сравниваемых вариантов.

    Если сравнивают группы вариантов (неодинакового размера) - неравномерные комплексы, ошибку разности вычисляют по формуле:

    .

    Подставляя значения Sd в формулу НСР, получаем:
    НСР05 = t05 × Sd; НСР01 = t01 × Sd; НСР001 = t001 × Sd..
    при этом t05 – это t критерий Стьюдента на 5 % уровне значимости, который берётся по числу степеней свободы дисперсии остатка из учебника.

    В конечном итоге строится таблица с ранжированием вариантов по росту от большего к меньшему.

    После этого сравнивают лучший вариант с применяемым в производстве раньше.
    4.1 Схема обработки полученной информации на примере однофакторного, равномерного статистического комплекса
    Например: Установить значимость различий в формовом разнообразии облепихи крушиновидной на выравненном экофоне (однофакторный дисперсионный анализ).


    Структура опыта:

    1. Объект - облепиха крушиновидная.

    2. Варианты опыта - различные формы облепихи.

    3. Изучаемый признак – урожайность, ц·га-1 .

    4. Комплекс однофакторный, т. к. 1 изучаемый признак.

    5. Комплекс равномерный, т. к. количество повторностей по всем вариантам одинаковое.

    Схема расчета средних по вариантам приведена в таблице 4.1
    Таблица 4.1 Схема расчета по дисперсионному анализу


    Вариант опыта (форма)

    Повторности

    Число наблюдений, n

    Сумма по варианту

    Средняя по варианту

    1

    2

    3

    4

    5

    6

    7

    8

    9

    I Дар Катуни

    30

    27

    28

    29

    30

    28

    30

    27

    28

    9

    257

    28,56

    II Витаминная

    21

    24

    23

    22

    24

    27

    20

    23

    24

    9

    208

    23,11

    III Алтайская

    27

    25

    28

    24

    27

    25

    26

    28

    27

    9

    237

    26,33

    IV Алма-Атинская

    18

    15

    20

    21

    17

    21

    17

    18

    20

    9

    167

    18,56

    V Нижегородская

    40

    38

    37

    39

    40

    37

    39

    41

    38

    9

    349

    38,78































    ∑n = N =

    45

    ∑xi=

    1218

    27,08


    .
    Расчет преобразованных значений и сумм по вариантам приведен в таблице 5.2.
    Таблица 4.2 Таблица преобразованных значений


    Варианты

    x1 = xi – А

    Сумма V

    1

    2

    3

    4

    5

    6

    7

    8

    9

    I Дар Катуни

    3

    0

    1

    2

    3

    1

    3

    0

    1

    14

    II Витаминная

    -6

    -3

    -4

    -5

    -3

    0

    -7

    -4

    -3

    -35

    III Алтайская

    0

    -2

    1

    -3

    0

    -2

    -1

    1

    0

    -6

    IV Алма-Атинская

    -9

    -12

    -7

    -6

    -10

    -6

    -10

    -9

    -7

    -76

    V Нижегородская

    13

    11

    10

    12

    13

    10

    12

    14

    11

    106































    ∑х1= 3


    А – значение варианты (xi), которое имеет близкое значение к среднему,

    , следовательно, А = 27.

    Например: х1 = 30 – 27 = 3 .
    1   2   3   4   5   6   7   8   9   10   11


    написать администратору сайта