Главная страница
Навигация по странице:

  • Методы экологических исследований ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ

  • Авторы: Р.М. Городничев, Л.А. Пестрякова, Л.А. Ушницкая, С.Н. Левина, П.В. Давыдова Рецензенты

  • Методы экологических исследований. Основы статистической обработки данных

  • Среднее арифметическое значение.

  • Медиана ( Me ).

  • Мода ( Mo ).

  • Среднее линейное отклонение ( a )

  • Стандартное отклонение (или среднее квадратическое отклонение) (Ϭ)

  • Значения массы тела взрослых самцов популяции волка

  • Коэффициент вариации ( V ) .

  • Стандартная ошибка среднего ( SD x

  • Задания к разделу 1 для самостоятельного выполнения

  • 2. Индексы биоразнообразия

  • Индекс Шеннона-Уивера H

  • Индекс выравненности Пиелу E

  • Индекс (Мера доминирования C )

  • Индекс разнообразия Симпсона D

  • Индекс видового разнообразия Менхиника D mn

  • Методы экологических исследований. Основы статистической обработ. М. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие


    Скачать 5.76 Mb.
    НазваниеМ. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие
    Дата08.12.2022
    Размер5.76 Mb.
    Формат файлаpdf
    Имя файлаМетоды экологических исследований. Основы статистической обработ.pdf
    ТипУчебно-методическое пособие
    #835298
    страница1 из 7
      1   2   3   4   5   6   7

    Министерство науки и высшего образования Российской Федерации
    Северо-Восточный федеральный университет имени М.К. Аммосова
    Институт естественных наук
    Эколого-географическое отделение
    Методы экологических исследований
    ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
    Учебно-методическое пособие
    Якутск
    2019

    УДК 31:574(075.8)
    ББК 20.080я73
    Утверждено учебно-методическим советом СВФУ
    Авторы:
    Р.М. Городничев, Л.А. Пестрякова, Л.А. Ушницкая,
    С.Н. Левина, П.В. Давыдова
    Рецензенты:
    Ю.И. Трофимцев, д.т.н., ИМИ СВФУ им. М.К. Аммосова (г. Якутск),
    М.М. Черосов, д.б.н., ИБПК СО РАН (г. Якутск)
    Методы экологических исследований. Основы статистической
    обработки данных: учебно-методическое пособие / [Р.М. Городничев и др.]. – Якутск : Издательский дом СВФУ, 2019. – 94 с.
    ISBN 978-5-7513-2737-8
    В учебно-методическом пособии приведены описание, алгоритмы и примеры расчетов широко применяемых методов статистической обработки данных, в том числе основных статистических характеристик, индексов биоразнообразия и таксономического сходства, коэффициентов корреляции, критериев оценки статистической значимости, различий выборок объектов исследований, а также иерархического кластерного анализа.
    Предназначено для студентов бакалавриата и магистратуры направлений
    «Экология и природопользование», «География» и «Биология».
    УДК 31:574(075.8)
    ББК 20.080я73
    ISBN 978-5-7513-2737-8 © Северо-Восточный федеральный университет, 2019

    3
    ОГЛАВЛЕНИЕ
    Предислови…………………………………………………………..……4 1. Элементарные статистические характеристики……………….........6
    Задания к разделу 1 для самостоятельного выполнения………..…12 2. Индексы биоразнообразия………………………………………..…..13
    Задания к разделу 2 для самостоятельного выполнения……..……17 3. Сходство таксономического состава экосистем…………………….17
    Задания к разделу 3 для самостоятельного выполнения…………..21 4. Проверка данных на соответствие закону нормального распределения……………………………………………………………22
    Задания к разделу 4 для самостоятельного выполнения…………..29 5. Взаимосвязь характеристик объектов исследования……………….30
    Задания к разделу 5 для самостоятельного выполнения…………..38 6. Определение значимости различий выборок объектов исследования……………………………………………………………..39
    Задания к разделу 6 для самостоятельного выполнения…………..59 7. Группировка объектов исследования с применением процедур иерархического кластерного анализа…………………………………..61
    Задания к разделу 7 для самостоятельного выполнения…………..89
    Литература………………………………………………………………..91

    4
    Предисловие
    Статистическая обработка данных является универсальным инструментов получения информации о различных процессах и явлениях живой и неживой природы. Различные методы обработки данных, применение персональных компьютеров и специализированного программного обеспечения являются важным условием проведения современных исследований. В настоящее время, применяя статистические методы, можно установить наличие связей характеристик, процессов и явлений, разбивать большие совокупности данных на группы и классы, используя объективные (основанные на математических процедурах) критерии, устанавливать существенность различий признаков групп объектов исследования и многое др.
    Статистические методы позволяют анализировать большие массивы информации, находя смыслы, скрытые от человеческих глаз.
    Использование современных методов статистики и компьютерного оборудования обеспечивает высокую скорость и безошибочность вычислительных процедур, позволяет получить результаты в наглядном виде. Широкий спектр методов обработки информации требует понимания базовых вычислительных процедур и основ статистической обработки данных, на достижение которых направлено данное учебно-методическое пособие.
    Цель учебно-методического пособия – произвести описание основных методов статистической обработки данных, применяемых в экологии.
    Основные задачи:

    произвести теоретический обзор наиболее эффективных и широко применяемых в экологических исследованиях методов статистической обработки данных;

    привести примеры расчетов численных характеристик и алгоритмов действий, лежащих в основе рассматриваемых методов статистической обработки данных;

    привести примеры использования методов статистической обработки данных на практике;

    5

    выработать навыки применения методов статистической обработки данных у обучающихся путем выполнения заданий самостоятельной работы по пройденным темам.
    Все методы статистической обработки данных, приведенные в данной книге, основаны на вычислительных процедурах, которые могут быть реализованы вручную без использования специального оборудования и программного обеспечения. В книге освещены основные элементарные статистические характеристики, индексы биоразнообразия и таксономического сходства, произведено описание простейших процедур проверки данных на соответствие закону нормального распределения, приведены описания расчетов параметрических и непараметрических коэффициентов корреляции и критериев, характеризующих значимость различий характеристик выборок данных. Отдельно рассмотрены процедуры иерархического кластерного анализа, основанные на различных алгоритмах кластеризации.
    Учебно-методическое пособие предназначено для освоения таких дисциплин как: «Методы экологических исследований», «Эколого- аналитическая оценка природных сред» и «Компьютерные технологии и статистические методы в экологии и природопользовании». Методы и алгоритмы, описываемые в книге, необходимы при написании
    (отвечающих требованиям современных образовательных стандартов) курсовых и выпускных квалификационных работ в области наук о
    Жизни, наук о Земле и других направлений, связанных с обработкой численной информации об объектах окружающей среды.
    Данное учебно-методическое пособие предназначено для обучающихся бакалавриата и магистратуры эколого-географического отделения
    Института естественных наук
    Северо-Восточного федерального университета имени М.К. Аммосова, а также может быть использовано студентами и специалистами естественных и гуманитарных направлений других подразделений и организаций.
    Книга предназначена для получения начальных знаний в области статистической обработки данных.

    6
    1.
    Элементарные статистические характеристики
    Данный раздел посвящен наиболее часто используемым при оперировании с численными характеристиками параметрам, которые применяются в качестве исходных элементов большинства статистических анализов.
    1. Среднее
    арифметическое значение. Наиболее широко известный и часто употребляемый параметр «среднее арифметическое значение». Применяется в самых разнообразных случаях, когда нужно получить обобщенное представление о значении какой-либо характеристики. Например, исследователь занимается изучением успеваемости студентов разных групп по математике. Для упрощения процесса сравнения он может вычислить среднее арифметическое значение оценки студентов в каждой из этих групп, и получившиеся значения сопоставить, сделав общий вывод, о том, что студенты одной из групп более успешны.
    Вычисляется среднее арифметическое по формуле (1.1):
    ̅=
    , (1.1) где
    ̅ – среднее арифметическое значение;
    x
    i
    значения рассматриваемой характеристики;
    n – количество объектов исследования.
    Пример: Масса 5 яблок соответственно равна 250, 220, 200, 223 и
    230 г. Среднее арифметическое массы яблок будет рассчитано следующим образом:
    ̅=
    (г).
    2. Медиана (Me). Другая разновидность среднего значения группы объектов исследования – это медиана. Медиана – это такое значение рассматриваемой характеристики, которое расположено посередине вариационного ряда. То есть половина объектов исследования меньше значений медианы, а другая половина – больше. Лучше всего понять, что такое медиана, используя примеры.

    7
    Пример: Вернувшись к предыдущему примеру с яблоками, укажем медиану. Итак, для начала нужно построить вариационный ряд, то есть упорядочить данные в порядке возрастания или убывания. Масса 5 яблок упорядоченная по возрастанию: 200, 220, 223, 230 и 250 г. Здесь значение параметра (масса яблок), расположенное посередине ряда и будет медианой. То есть медиана в данном случае равна 223.
    В случае с нечетным количеством объектов исследования медиана будет найдена как в отмеченном выше примере. Если объектов будет четное количество, то расчет немного усложнится. Предположим, что выборка объектов исследования насчитывает 6 яблок, имеющих массу
    250, 220, 200, 223, 230 и 218 г. Для вычисления медианы строим вариационный ряд. Он будет иметь следующий вид: 200, 218, 220, 223,
    230 и 250. Далее находим значения расположенные в средней части ряда. В нашем случае это 220 и 223. Вычислим среднее арифметическое этих чисел, оно и будет медианой: Me=
    (г).
    3. Мода (Mo). Еще одним типом среднего значения является мода.
    Мода – это наиболее часто повторяющееся значение данных.
    Запомнить смысл данной характеристики очень просто. В жизни модным называют какой-либо часто используемый или «широко распространенный» предмет. Например: модные штаны, модная шляпа и др.
    Пример. Приведен рост нескольких студентов: 175, 155, 163, 155,
    162, 174 см. В данном случае чаще всех повторяется значение 155. Оно и будет являться модой.
    4. Линейное отклонение. В повседневной жизни часто приходится определять положение одного объекта относительно другого.
    Например, стол стоит в 1 м от стены, или школа расположена в 2 км к югу от дома. Как происходит определение этого относительного положения? Мы отмеряем физическое расстояние (линейное отклонение) между конкретными объектами.
    На рисунке 1.1 изображены рекламные щиты, расположенные на разном расстоянии от дома. Для того, чтобы определить расстояние
    (относительное расположение) щита I от щита II, необходимо будет

    8 провести следующую манипуляцию:
    (м). В данном случае мы определили простое отклонение первого объекта от второго.
    Рисунок 1.1. Дом и расположенные на различном удалении от него рекламные щиты
    На практике часто приходится измерять, как сильно значения параметра группы объектов исследования отклонены от среднего арифметического значения. Это необходимо для определения того насколько данные однородны.
    Пример: Определим среднее расстояние рекламных щитов до дома
    (рисунок 1.1):
    ̅=
    ).
    Отметим на вышеприведенном графическом примере высчитанное среднее расстояние щитов от дома (рисунок 1.2).
    Рисунок 1.2. Среднее расстояние рекламных щитов от дома

    9
    Теперь определим, насколько же I, II и III рекламные щиты
    «отклонены» от среднего. Для этого проведем арифметическую манипуляцию аналогичную предыдущей.
    Расстояние (отклонение) I, II и III рекламных щитов от значения среднего расстояния будут определены соответственно:
    ; и
    Теперь высчитаем среднее отклонение щитов от значения среднего расстояния. Для этого применим формулу (1.1) для расчета среднего арифметического значения:
    ̅=
    Ответ 0. Положительные и отрицательные значения при суммировании как бы «компенсируются». В этом случае не получится установить «разброс значений» параметра в большую и меньшую сторону от среднего арифметического. Поэтому для получения значений отклонения от среднего отличных от нуля было принято решение избавиться от отрицательных значений данных. Для этого применены 2 подхода: использование модуля (в формуле среднего линейного отклонения) и возведение в квадрат (в формулах стандартного отклонения и дисперсии).
    5. Среднее линейное отклонение (a) (1.2).
    |
    ̅| |
    ̅| |
    ̅| |
    ̅|
    (1.2) где
    ̅ – среднее арифметическое значение;
    x
    i
    – значения рассматриваемой характеристики;
    n – количество объектов исследования.
    6. Стандартное отклонение (или среднее квадратическое
    отклонение) (Ϭ) – также характеризует разброс значений параметров вокруг среднего арифметического и вычисляется по формуле (1.3), если количество объектов исследования n>30, или по формуле (1.4), если количество объектов исследования n<30.

    ̅
    ̅
    ̅
    ̅
    (1.3)

    10 где
    ̅ – среднее арифметическое значение;
    x
    i
    – значения рассматриваемой характеристики;
    n – количество объектов исследования.

    ̅
    ̅
    ̅
    ̅
    (1.4)
    Стандартное отклонение – наиболее часто используемая мера отклонения значений исследуемой характеристики от среднего арифметического значения. Стандартное отклонение выступает исходным параметров для расчета достаточно большого количества статистических параметров.
    7. Дисперсия. Стандартное отклонение, возведенное в квадрат
    (или стандартное отклонение без извлечения квадратного корня) получило название дисперсия (Ϭ
    2
    ).
    При n>30 рассчитывается по формуле (1.5):
    ̅
    ̅
    ̅
    ̅
    (1.5)
    При n<30 рассчитывается по формуле (1.6):
    ̅
    ̅
    ̅
    ̅
    (1.6)
    Приведем примеры расчетов среднего линейного, стандартного отклонений и дисперсии, используя данные таблицы 1.1.
    Таблица 1.1
    Значения массы тела взрослых самцов популяции волка

    Значения массы тела, кг
    1 42 2
    43 3
    42,5 4
    42,5 5
    43,3

    11 6
    42 7
    44,3 8
    44
    Итак, для начала рассчитаем среднее значение массы тела
    ̅, применив формулу (1.1):
    ̅
    43.
    Далее по формуле (1.2) вычислим среднее линейное отклонение:
    | | | | | | | | | | | |
    | | | |
    0,7.
    Используя формулу (1.4) вычислим стандартное отклонение:

    0,9.
    Применив формулу (1.6) или возведя в квадрат стандартное отклонение, вычислим дисперсию:
    0,81.
    8. Коэффициент вариации (V). Параметр, который показывает какую долю от среднего арифметического значения, выраженную в процентах, составляет стандартное отклонение (1.7).
    ̅
    100%, (1.7) где Ϭ – стандартное отклонение;
    ̅ – среднее арифметическое значение.
    Рассчитаем стандартное отклонение для примера из таблицы 1.1, подставив в формулу (1.7) известные значения Ϭ и
    ̅.
    9. Стандартная ошибка среднего (SD
    x
    ) показывает насколько может отклоняться среднее значение выборки, состоящей из определенного количества объектов исследования (n), извлекаемых из генеральной совокупности (теоретически представленной всем множеством таких объектов) от среднего значения генеральной совокупности (то есть высчитанного по всему множеству объектов).
    Вычисляется по формуле (1.8).

    12

    , (1.8) где Ϭ – стандартное отклонение; n – количество объектов исследования.
    Обычно стандартная ошибка среднего записывается сразу после среднего значения отделяясь от него знаком ±. Запись имеет вид:
    ̅ .
    Рассчитаем стандартную ошибку среднего для примера из таблицы
    1.1, подставив в формулу (1.8) известные значения Ϭ и n.

    0,3.
    Записываем ответ следующим образом: 43±0,3.
    Задания к разделу 1 для самостоятельного выполнения
    1. Произведите расчет среднего арифметического для ряда данных:
    1,5; 2,7; 1,9; 2,3; 4,1; 3,2.
    2. Рассчитайте среднее линейное отклонение для ряда данных: 1,5;
    2,7; 1,9; 2,3; 4,1; 3,2).
    3. Укажите моду в ряде данных: 1; 2; 3; 4; 5; 6; 7; 8 ; 9; 2.
    4. Чему равна медиана ряда данных: 1; 2; 3; 4; 5; 6; 7; 8 ; 9?
    5. Рассчитайте стандартное отклонение для ряда данных: 1,5; 2,7;
    1,9; 2,3; 4,1; 3,2.
    6. Рассчитайте коэффициент вариации для ряда данных: 1,5; 2,7;
    1,9; 2,3; 4,1; 3,2.
    7. Рассчитайте ошибку среднего для ряда данных: 1,5; 2,7; 1,9; 2,3;
    4,1; 3,2.

    13
    2. Индексы биоразнообразия
    Биоразнообразие (биологическое разнообразие) – одно из ключевых понятий современной экологии. Биоразнообразие подразумевает разнородность и многообразие всех форм жизни на разных уровнях ее организации и оценивается путем вычисления разнообразных индексов. Ниже приведены формулы и описание наиболее популярных индексов разнообразия.
    Индекс Шеннона-Уивера H [Shannon, 1948; Shannon, Weaver,
    1949] является одним из наиболее часто используемых индексов разнообразия и вычисляется по формуле (2.1):

    , (2.1) где n
    i
    – общая численность вида или внутривидовой разновидности;
    N – общая численность отмеченных особей.
    Следует отметить, что в формуле данного индекса применяют логарифмы с различным основанием (log
    2
    Х; lg и др.).
    Индекс выравненности Пиелу E [Pielou, 1975]вычисляется на основании индекса Шеннона-Уивера по формуле (2.2):
    , (2.2) где H –индекс Шеннона-Уивера;
    S – число отмеченных в водном объекте видов.
    При вычислении индеса Пиелу применяется логарифм с тем же основанием, что был применен при вычислении индекса Шеннона-
    Уивера.
    Индекс (Мера доминирования C)Симпсона [Simpson, 1949] вычисляется по формуле (2.3):

    ∑ (
    )
    , (2.3)

    14 где C – концентрация доминирования (Мера доминирования
    Симпсона);
    p
    i
    – относительная значимость (доля вида);
    n
    i
    – общая численность особей вида или внутривидовой разновидности;
    N – общая численность отмеченных особей.
    Индекс разнообразия Симпсона D вычисляется по формуле (2.4):
    , (2.4) где C – мера доминирования (индекс Симпсона).
    Индекс Маргалефа d [Margalef, 1958] рассчитывается по формуле
    (2.5):
    , (2.5) где d –индекс видового богатства;
    Sколичество видов и внутривидовых таксонов;
    N – общее количество зафиксированных особей.
    Индекс видового разнообразия Менхиника D
    mn
    [Menhinick, 1964] вычисляется по формуле (2.6):

    , (2.6) где S – количество видов и внутривидовых таксонов;
    N – общее количество зафиксированных особей.
      1   2   3   4   5   6   7


    написать администратору сайта