Главная страница
Навигация по странице:

  • Задания к разделу 4 для самостоятельного выполнения

  • Концентрация свинца в пробах почв, различных экосистем

  • 5. Взаимосвязь характеристик объектов исследования

  • Проверка статистической значимости коэффициента корреляции.

  • Фрагмент таблицы «Критические значения коэффициента корреляции Пирсона»

  • Фрагмент таблицы «Критические значения коэффициента корреляции Спирмена»

  • Коэффициент линейной корреляции Пирсона.

  • Коэффициент корреляции Спирмена

  • Концентрация свинца в почве на различном удалении от автострады

  • Расчет коэффициента линейной корреляции Пирсона.

  • Расчет разностей ̅ и

  • Расчет ̅ и

  • Пример расчета коэффициента Спирмена.

  • Ранги, присвоенные исследуемым характеристикам

  • Задания к разделу 5 для самостоятельного выполнения

  • Концентрация меди в почве на различном удалении от предприятия- загрязнителя

  • 6. Определение значимости различий выборок объектов исследования

  • Критические значения t-критерия Стьюдента

  • Пример расчета t-критерия Стьюдента для зависимых данных.

  • Методы экологических исследований. Основы статистической обработ. М. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие


    Скачать 5.76 Mb.
    НазваниеМ. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие
    Дата08.12.2022
    Размер5.76 Mb.
    Формат файлаpdf
    Имя файлаМетоды экологических исследований. Основы статистической обработ.pdf
    ТипУчебно-методическое пособие
    #835298
    страница3 из 7
    1   2   3   4   5   6   7
    Упорядоченное представление расчетов

    ̅
    ̅
    ̅
    ̅
    1 2
    3 4
    5 6
    1 147 404,0
    –8120,6 163224,1 2
    151 259,2
    –4173,3 67189,8 3
    152 228,0
    –3443,0 51988,6 4
    156 123,2
    –1367,6 15180,7 5
    157 102,0
    –1030,3 10406,0 6
    157 102,0
    –1030,3 10406,0 7
    161 37,2
    –227,0 1384,6 8
    162 26,0
    –132,7 676,5 9
    162 26,0
    –132,7 676,5 10 163 16,8
    –68,9 282,6 11 164 9,6
    –29,8 92,4 12 165 4,4
    –9,3 19,4 13 166 1,2
    –1,3 1,5 14 166 1,2
    –1,3 1,5 15 167 0,01
    –0,001 0,0001 16 167 0,01
    –0,001 0,0001 17 167 0,01
    –0,001 0,0001 18 168 0,8 0,7 0,7

    28 19 169 3,6 6,9 13,0 20 171 15,2 59,3 231,3 21 171 15,2 59,3 231,3 22 172 24,0 117,6 576,5 23 172 24,0 117,6 576,5 24 173 34,8 205,4 1211,7 25 176 79,2 705,0 6274,2 26 177 98,0 970,3 9606,0 27 178 118,8 1295,0 14115,8 28 182 222,0 3307,9 49288,4 29 183 252,8 4019,7 63912,9 30 191 571,2 13651,9 326280,9
    Далее находим значения ∑
    ̅
    ; ∑
    ̅ и ∑
    ̅
    , которые будут равны соответственно суммам всех значений столбиков
    4, 5 и 6 таблицы 4.3.

    ̅

    ̅

    ̅
    Далее определяем значение стандартного отклонения (Ϭ):

    =9,8.
    Рассчитываем асимметрию (A) подставив все известные значения в формулу (4.1):
    =0,17.
    Рассчитаем эксцесс (E) подставив все известные значения в формулу (4.2):
    Далее вычислим ошибки репрезентативности асимметрии (m
    A
    ) и эксцесса (m
    E
    ) по формулам (4.3) и (4.4) соответственно:

    .

    29

    .
    Так как |
    | и |
    |
    , то распределение близко нормальному.
    В целом, проверка на соответствие закону нормального распределения требует достаточно большого количества вычислений, особенно если выборка состоит из десятков объектов исследования.
    Существующие компьютерные программы, о которых упоминалось ранее, позволяют проверить распределение данных за несколько минут. Поэтому проверка данных на соответствие закону нормального распределения должна осуществляться с большей надежностью не по одному критерию (графическому или расчетному), а по их совокупности.
    Задания к разделу 4 для самостоятельного выполнения
    Произвести расчет асимметрии и эксцесса для данных, представленных в таблице 4.4. По результатам расчетов сделать вывод о соответствии распределения данных нормальному.
    Таблица 4.4
    Концентрация свинца в пробах почв, различных экосистем
    № 1
    2 3
    4 5
    6 7
    8 9
    10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
    P
    b, м
    г/
    кг
    9,3 9,0 9,2 8,5 3,4 2,5 3,3 4,1 6,7 7,2 5,3 5,4 8,1 5,8 9,1 1,5 4,7 6,3 5,2 7,9 4,9 5,8 2,8 3,2 5,3 7,8 7,2 7,3 6,5 5,9

    30
    5. Взаимосвязь характеристик объектов исследования
    Очень часто на практике возникает необходимость узнать связаны ли характеристики каких-либо предметов, объектов или явлений между собой. Для этих целей используется корреляционный анализ, то есть процедура вычисления коэффициентов корреляции.
    В данном разделе будет рассмотрено 2 наиболее широко применяемых коэффициента корреляции: коэффициент линейной корреляции Пирсона [Pearson, 1895] и коэффициент ранговой корреляции Спирмена [Spearman,1904]. В независимости от того, какой коэффициент корреляции используется (так как отличаются только формулы расчета) необходимо руководствоваться следующим порядком действий:
    А. Расчет значения коэффициента корреляции по формуле (5.2)
    (коэффициент Пирсона) или по формуле (5.3) (коэффициент
    Спирмена).
    Б. Сравнение расчетного значения с табличным (таблица 5.1 для коэффициента Пирсона и таблица 5.2 для коэффициента Спирмена).
    Г. Если значение расчетного коэффициента по модулю (без учета знака) равно или выше значений табличного показателя – то рассчитанный коэффициент корреляции является статистически значимым, если наоборот – то рассчитанный коэффициент корреляции не является статистически значимым.
    Д. В зависимости от знака коэффициента корреляции определяют направленность связи (положительная или отрицательная) между характеристиками, в зависимости от значения – силу связи (связь сильная, средняя или слабая).
    Коэффициенты корреляции могут принимать значения от -1 до 1.
    Значения коэффициента корреляции указывают на характер (знак коэффициента) и силу связи (числовое значение) между переменными.
    Сила связи переменных. При значениях коэффициента корреляции по модулю (т.е. без учета знака) равных значениям меньшим 0,5 связь считают слабой (незначительной). В таких случаях, как правило, считают, что связь между характеристиками не выражена

    31 или отсутствует. Если коэффициент корреляции равен или превышает
    0,5, но меньше или равен 0,7 – то связь средняя. При значениях больших 0,7 (до 1,0) – связь сильная. При установлении силы связи на знак (+ или –) коэффициента внимания не обращают.
    Знак коэффициента корреляции указывает на характер взаимосвязи. Если коэффициент корреляции положительный, то увеличение одной характеристики сопровождается увеличением второй характеристики. Если знак отрицательный, то увеличение одного из пары параметров сопровождается уменьшением значений второго.
    Проверка
    статистической
    значимости
    коэффициента
    корреляции.
    Важным условием при вычислении любого коэффициента корреляции является проверка его статистической значимости. В случае если коэффициент корреляции не окажется статистически значимым, его использование для дальнейших работ недопустимо. Для расчета статистической значимости коэффициентов корреляции необходимо использовать специальные стандартные таблицы «Критические значения коэффициента корреляции (Пирсона или Спирмена)». Данные таблицы можно найти в Интернете или в специализированной литературе (таблицы 5.1 и 5.2).
    Таблица 5.1
    Фрагмент таблицы «Критические значения коэффициента корреляции
    Пирсона» [Table of…, 2019]
    Число степеней свободы, k=n–2 при p=0,05 5
    0,75 6
    0,71 7
    0,67 8
    0,63 9
    0,6
    Для использования таблицы 5.1 необходимо рассчитать k – число степеней свободы, значения данного параметра вписаны в столбец 1 таблицы 5.1. k рассчитывается по формуле (5.1).

    32
    , (5.1)
    k – число степеней свободы;
    n – количество объектов исследования.
    Таблица 5.2
    Фрагмент таблицы «Критические значения коэффициента корреляции
    Спирмена» [Суходольский, 1988]
    m при p=0,05 5
    0,94 6
    0,85 7
    0,78 8
    0,72 9
    0,68
    В таблице 5.2 m – это количество объектов исследования. Во втором столбце таблиц 5.1 и 5.2 обозначен уровень статистической значимости
    «p». В большинстве экологических исследований принят уровень статистической значимости равный 5 % (или 0,05). Существуют и более строгие уровни: 1 % (0,01), 0,1 % (0,001) и др. Расчетный коэффициент корреляции считается статистически значимым при соответствующем уровне статистической значимости (например, при p=0,05), если он равен значениям или превышает значения коэффициента из таблицы критических значений.
    Коэффициент линейной корреляции Пирсона. Вычисляется по формуле (5.2).

    ̅
    ̅
    √∑
    ̅

    ̅
    , (5.2) где x
    i
    – конкретные значения переменной X;
    ̅ – среднее арифметическое значение переменной X;
    y
    i
    – конкретные значения переменной Y;
    ̅ – среднее арифметическое значение переменной Y.

    33
    Коэффициент корреляции Спирмена схож с коэффициентом
    Пирсона, как в интерпретации, так и по диапазону значений, которые он принимает. Различия кроются в том, что коэффициент Спирмена рассчитывается не по исходным данных, а по рангам (целым натуральным числам: 1, 2, 3 и т.д.), которые присваиваются исходным значениям в порядке возрастания или убывания. Плюс коэффициента
    Спирмена заключается еще и в том, что ранги можно присваивать и нечисловым параметрам, характеризующимся изменением степени своей интенсивности (цвету, успеваемости студентов, типам населенных пунктов по размеру и др.). Например, у исследователя стоит задача проранжировать концентрацию растворенного в воде различных озер кальция, которая соответствует следующим исходным значениям: 7,8 (первое озеро); 13,2; 14,1; 14,5 и 15,7 мг/л (пятое озеро).
    Ранги целесообразно присвоить исходным значениям следующим образом: 1 (первое озеро), 2, 3, 4 и 5 (пятое озеро). Расчет коэффициента Спирмена производится по формуле (5.3).

    , (5.3) где D
    i
    2
    – квадрат разности рангов пар наблюдений (характеристик);
    m – количество пар рангов наблюдений.
    Для лучшего усвоения материала произведем расчет коэффициентов корреляции на примере (таблица 5.3). Необходимо установить влияет ли удаление от трасы на концентрацию свинца в почве. Пример дан заведомо простой с целью научиться рассчитывать коэффициенты корреляции (числа в таблицах подобраны для удобства расчета «вручную»).
    Таблица 5.3
    Концентрация свинца в почве на различном удалении от автострады

    Расстояние точки опробования от автострады, м
    Концентрация свинца в почве, мг/кг
    1 5
    7,8 2
    11 7,3 3
    16 6,0

    34 4
    21 5,1 5
    24 5,2 6
    29 3,8 7
    32 2,8 8
    36 2,9
    Расчет коэффициента линейной корреляции Пирсона. Итак, произведем расчет коэффициента Пирсона, применив формулу (5.2).
    Сначала необходимо вычислить средние значения характеристик для второго и третьего столбцов таблицы 5.3.
    ̅
    ̅ – среднее арифметическое расстояния точки опробования от автострады.
    ̅
    ̅ – среднее арифметическое концентрации свинца.
    Далее найдем все разности
    ̅ и
    ̅ . Вычисления для удобства запишем в виде таблицы (таблица 5.4).
    Таблица 5.4
    Расчет разностей
    ̅ и
    ̅

    ̅
    ̅
    1 2
    3 4
    5 6
    7 8
    Далее найдем произведение:
    ̅
    ̅ . Вычисления для удобства также будем использовать табличную запись (таблица 5.5).

    35
    Таблица 5.5
    Расчет произведения
    ̅
    ̅

    ̅
    ̅
    1 2
    3 4
    5 6
    7 8
    Найдем сумму ∑
    ̅
    ̅ :

    ̅
    ̅
    Следующим шагом является нахождение
    ̅ и
    ̅
    Вычисления запишем в виде таблицы (таблица 5.6).
    Таблица 5.6
    Расчет
    ̅
    и
    ̅

    ̅
    ̅
    1 2
    3 4
    5 6
    7 8
    Далее найдем ∑
    ̅ и ∑
    ̅
    :

    ̅

    ̅

    36
    Следующий шаг – подставляем все вычисленные значения в формулу (5.2):

    Так как |
    | , то корреляционная связь сильная
    (отрицательная).
    Проверяем статистическую значимость, сравнивая расчетное значение коэффициента корреляции с табличным, используя таблицу
    «Критические значения коэффициента корреляции Пирсона» (таблица
    5.1).
    Для этого сначала вычислим k – число степеней свободы по формуле (5.1):
    .
    Далее найдем табличное значение коэффициента Пирсона при k=6 и уровне статистической значимости p=0,05. Табличный коэффициент
    Пирсона равен 0,71.
    Так как |
    | , то связь является статистически значимой при p=0,05.
    Таким образом, концентрация свинца в почве (в нашем конкретном случае) связана с расстоянием до автотрассы. По мере удаления от трассы концентрация свинца снижается, на что указывает сильная отрицательная статистически значимая связь.
    Пример расчета коэффициента Спирмена. Вычислим для указанного выше примера коэффициент ранговой корреляции
    Спирмена, используя формулу (5.3). Сначала необходимо всем значениям характеристики 1 (расстояние точки опробования от автострады) и характеристики 2 (концентрация свинца в почве) присвоить ранги. Для удобства представления данных будем использовать табличную запись (таблица 5.7). Ранги (это натуральные числа от 1 по возрастающей) в каждом случае присваиваются значениям от меньшего к большему.
    Дальнейшие расчеты осуществляются с применением присвоенных рангов. Далее найдем разность пар рангов и квадрат разности пар рангов
    (таблица 5.8).

    37
    Таблица 5.7
    Ранги, присвоенные исследуемым характеристикам

    Характеристика 1
    Ранги для характеристики
    1
    Характеристика 2
    Ранги для характеристики
    2
    Расстояние точки опробования от автострады, м
    Концентрация свинца в почве, мг/кг
    1 5
    1 7,8 8
    2 11 2
    7,3 7
    3 16 3
    6,0 6
    4 21 4
    5,1 4
    5 24 5
    5,2 5
    6 29 6
    3,8 3
    7 32 7
    2,8 1
    8 36 8
    2,9 2
    Таблица 5.8
    Разность рангов

    Ранги для характеристики 1
    Ранги для характеристики 2 1
    1 8
    49 2
    2 7
    25 3
    3 6
    9 4
    4 4
    0 5
    5 5
    0 6
    6 3
    9 7
    7 1
    36 8
    8 2
    36
    Найдем сумму квадратов разности пар рангов ∑
    :

    Далее подставляем все известные сведения в формулу (5.3):
    Так как |
    | , то корреляционная связь сильная
    (отрицательная).

    38
    Проверяем статистическую значимость сравнивая расчетное значение коэффициента корреляции с табличным, используя таблицу
    «Критические значения коэффициента корреляции Спирмена»
    (таблица 5.2).
    При m=8 в и уровне статистической значимости p=0,05 табличный коэффициент Спирмена равен 0,72.
    Так как |
    | , то связь является статистически значимой при p=0,05.
    Таким образом, концентрация свинца в почве (в нашем конкретном случае) связана с расстоянием до автотрассы. По мере удаления от трассы концентрация свинца снижается, на что указывает сильная отрицательная статистически значимая связь.
    Задания к разделу 5 для самостоятельного выполнения
    По исходным данным (таблица 5.9) рассчитать коэффициент линейной корреляции Пирсона и коэффициент ранговой корреляции
    Спирмена (при уровне статистической значимости p=0,05), сформулировать вывод о характере и силе связи между изучаемыми характеристиками. Сравнить полученные значения коэффициентов
    Пирсона и Спирмена.
    Таблица 5.9
    Концентрация меди в почве на различном удалении от предприятия-
    загрязнителя

    Расстояние точки опробования от предприятия, м
    Cu, мг/кг
    1 20 9
    2 35 7,5 3
    40 7,7 4
    50 6,1 5
    55 5,6 6
    65 4,5 7
    70 4
    8 75 3,5

    39
    6. Определение значимости различий выборок объектов
    исследования
    На практике часто возникает необходимость определить, различаются ли характеристики объектов исследования друг от друга.
    И значимо ли это различие. Одним из наиболее широко используемых расчетных показателей в этой области выступает t-критерий Стьюдента
    [Student, 1908]. Различают 2 t-критерия Стьюдента: критерий для зависимых данных и критерий для независимых данных. Оба этих критерия являются параметрическими, то есть при их вычислении обязательным условием является распределение данных близкое нормальному (смотреть раздел 4).
    t-критерий Стьюдента для зависимых данных необходим для того, чтобы определить значительно ли изменились характеристики объектов исследования после наступления какого-либо события. То есть в данном случае производится сравнение объектов исследования с самими собой. Осуществляется сопоставление их характеристик в начальный момент времени и после проведения над объектами исследования каких-либо манипуляций. Например: можно, таким образом, сравнить средний бал группы студентов до проведения обучающего семинара и после его проведения. Можно сопоставить выбросы предприятий до внедрения очистных установок и выбросы после внедрения таких установок и др.
    T-критерий Стьюдента для зависимых данных рассчитывается по формуле (6.1):
    |
    |√
    , (6.1) где t – t-критерий Стьюдента;
    Md – среднее арифметическое значение разностей показателей
    (измерений до наступления какого-либо события и измерений после наступления события);
    Ϭ
    d
    – стандартное отклонение разностей показателей;

    40
    n – количество объектов исследования в группе (должно быть одинаковым до наступления события и после его наступления).
    После расчета t-критерия по формуле (6.1) необходимо произвести проверку его статистической значимости, сопоставив расчетное значение с табличным. Далее приведен фрагмент таблицы
    «Критических значения t-критерия Стьюдента» (таблица 6.1). Это стандартная таблица, которую можно найти в статистических справочниках или в Интернете. Для определения табличного значения t-критерия (с которым будем сопоставлять расчетное значение) необходимо дополнительно знать еще 2 параметра: число степеней свободы (f) и уровень статистической значимости (p).
    Число степеней свободы для зависимых данных рассчитывается по формуле (6.2):
    , (6.2) где f – число степеней свободы;
    n – количество объектов исследования.
    Уровень статистической значимости задается заранее. Его не нужно отдельно рассчитывать. Для большинства экологических исследований используют p=0,05.
    Вычислив значение f, находим табличный (таблица 6.1, второй столбик) t-критерий Стьюдента при соответствующем уровне значимости (в нашем случае p=0,05).
    Таблица 6.1
    Критические значения t-критерия Стьюдента
    [Values of…, 2019]
    Число степеней свободы, f
    Значение t-критерия Стьюдента при p=0,05 1
    12,706 2
    4,303 3
    3,182 4
    2,776

    41 5
    2,571 6
    2,447 7
    2,365 8
    2,306 9
    2,262 10 2,228 11 2,201 12 2,179 13 2,160 14 2,145 15 2,131 16 2,120 17 2,110
    Если значение расчетного (рассчитанного по формуле (6.1)) t- критерия Стьюдента равны или превышают значения табличные
    (таблица 6.1) – то различия значений объектов исследования значительны (значимы), если наоборот – то различия значений характеристик объектов исследования (до манипуляций над ними и после манипуляций) незначительны.
    Пример расчета t-критерия Стьюдента для зависимых данных.
    Допустим, имеется группа предприятий, на которых была внедрена система очистки выбросов. Данные по выбросам до внедрения фильтров и после приведены в таблице 6.2.
    Таблица 6.2
    1   2   3   4   5   6   7


    написать администратору сайта