Методы экологических исследований. Основы статистической обработ. М. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие
Скачать 5.76 Mb.
|
Индекс Животовского µ [Животовский, 1980]рассчитывается по формуле (2.7): (∑ √ ) , (2.7) где p i – относительная значимость (доля вида). Доля редких видов h рассчитывается по формуле (2.8): 15 , (2.8) где µ – индекс Животовского; S – количество видов и внутривидовых таксонов. Все указанные выше индексы характеризуются своими особенностями. Например, такой показатель как индекс Шеннона- Уивера позволяет учитывать одновременно и видовое богатство, и количественные различия между видами. Индекс Пиелу (E) указывает, насколько относительная численность особей при данном количестве видов распределена в сообществе равномерно. Низкие значения показателя свидетельствуют о дисбалансе, демонстрирующем наличие таксонов, резко отличающихся по количеству особей. Мера доминирования Симпсона (индекс Симпсона) позволяет оценить, насколько равномерно распределены доли отдельных таксонов в сообществе. Высокие значения параметра указывают на дисбаланс в пользу численности небольшого количества видов. Мера доминирования принимает большие значения в экосистемах с ярко выраженными доминантами (то есть при наличии видов с большим количеством особей). Индекс Маргалефа характеризуется особенностью: его значения тем выше, чем выше количество видов и ниже количество особей. Низкие значения индекса, свидетельствуют об относительно малом количестве видов на фоне относительно большого количества особей. Особенностями характеризуются и другие индексы разнообразия. Для лучшего понимания того, как рассчитываются индексы, и как они соотносятся друг с другом, приведем пример их расчета. Пример расчета индексов разнообразия. Имеются сведения о количестве особей различных видов диатомовых водорослей (таблица 2.1) в пробе воды озерной экосистемы (для простоты расчета количество видов и количество особей сокращено). Необходимо произвести расчет всех индексов разнообразия. 16 Таблица 2.1 Виды водорослей озера Радуга № Название вида Озеро Радуга 1 Achnanthidium minutissimum (Kütz.) Czarnecki 13 2 Staurosira venter (Ehr.) Cleve & Möller 5 3 Staurosirella pinnata Ehr 9 4 Tabellaria fenestrata (Lungb.) Kutz. 12 5 Tabellaria flocculosa (Roth.) Kutz. 8 1) Рассчитаем индекса Шеннона-Уивера. Сначала произведем расчет N: Подставим имеющиеся данные в формулу (2.1): ( )=1,6. 2) Произведем расчет индекса выравненности Пиелу по формуле (2.2): =0,97. 3) Рассчитаем меру доминирования Симпсона по формуле (2.3): =( ) ( ) ( ) ( ) ( ) 4) Произведем вычисление индекса разнообразия Симпсона по формуле (2.4): =4,6. 5) Рассчитаем индекс Маргалефа по формуле (2.5): 6) Произведем вычисление индекс видового разнообразия Менхиника по формуле (2.6): √ = 0,73. 7) Рассчитаем индекс Животовского по формуле (2.7): =(√ √ √ √ √ ) 4,9. 8) Определим долю редких видов по формуле (2.8): 17 Задания к разделу 2 для самостоятельного выполнения По исходным количественным данным, приведенным в таблице 2.2, произвести расчет всех индексов разнообразия (указанных в разделе 2) для любых 3 озер. Таблица 2.2 Таксономический состав диатомовых водорослей различных озер Название вида О зе ро 1 О зе ро 2 О зе ро 3 О зе ро 4 О зе ро 5 О зе ро 6 О зе ро 7 Achnanthidium minutissimum (Kütz.) Czarnecki 53 12 48 5 3 45 Staurosira venter (Ehr.) Cleve & Möller 48 2 Staurosirella pinnata Ehr 101 45 Tabellaria fenestrata (Lungb.) Kutz. 56 35 Tabellaria flocculosa (Roth.) Kutz. 50 23 212 Navicula cryptocephala Kützing 12 15 56 Pinnularia major (Kützing) Rabenhorst 18 23 5 Gomphonema acuminatum Ehrenberg 23 12 5 45 Eunotia praerupta Ehrenberg 78 45 55 Ellerbeckia arenaria (Moore ex Ralfs) R.M.Crawford 56 35 21 3. Сходство таксономического состава экосистем На практике часто возникает необходимость оценить насколько похожи различные экосистемы по таксономическому составу организмов. Например, исследователь имеет списки видов встречающихся в различных экосистемах и задается вопросом, насколько сильно таксономический состав данных экосистем схож. В 18 этом случае используются коэффициенты таксономического сходства. Существуют различные коэффициенты сходства. Наиболее часто используются несколько из них: коэффициент Жаккара, коэффициент Съеренсена и коэффициент Брея-Кертиса. Все указанные коэффициенты являются парными, то есть рассчитываются по таксономическим спискам пар (2-х) экосистем. Коэффициент Жаккара ( ) вычисляется по формуле (3.1) [Jaccard, 1901]. , (3.1) где a – количество (учтенных) видов первой экосистемы (или пробной площадки, территории, пробы и др.); b – количество видов второй экосистемы; c – количество общих для 1-ой и 2-ой экосистем видов. Коэффициент Серенсена ( ) рассчитывается по формуле (3.2) [Sørensen, 1948]. , (3.2) где обозначения в формуле соответствуют таковым, указанным для коэффициента Жаккара. Коэффициент Брея-Кертиса ( ) рассчитывается по формуле (3.3) [Bray, Curtis, 1957]: ∑ , (3.3) где N a – общая сумма количественных показателей (например, общее количество учтенных особей) первой экосистемы; N b – общая сумма количественных показателей второй экосистемы; ∑ – сумма наименьших значений количественных показателей (для каждого таксона, встреченного в обеих экосистемах, выбирается наименьший количественный показатель, то есть показатель только 19 одной экосистемы. Далее такие минимальные значения всех видов суммируются). Указанные коэффициенты сходства принимают значения от 0 до 1, где 0 – это полное отсутствие таксономического сходства, 1 – это полное сходство. Коэффициенты Жаккара и Серенсена учитывают только факт встречаемости таксонов в экосистемах без учета количественных соотношений между ними. Коэффициент Брея- Кертиса позволяет учитывать не только наличие общих таксонов экосистем, но и количественные соотношения между ними. Для того, чтобы лучше понять, для чего применяются отмеченные выше коэффициенты, как они рассчитываются и чем отличаются, приведем пример. Рассчитаем таксономическое сходство 2-х озерных экосистем (таблица 3.2). Таблица 3.2 Таксономических состав диатомовых водорослей 2-х озерных экосистем № Название таксона (вида) Озеро 1 Озеро 2 1 Achnanthidium minutissimum (Kütz.) Czarnecki 53 12 2 Staurosira venter (Ehr.) Cleve & Möller 48 3 Staurosirella pinnata Ehr 101 4 Tabellaria fenestrata (Lungb.) Kutz. 56 35 5 Tabellaria flocculosa (Roth.) Kutz. 50 6 Navicula cryptocephala Kützing 12 5 7 Pinnularia major (Kützing) Rabenhorst 18 8 Gomphonema acuminatum Ehrenberg 23 24 9 Eunotia praerupta Ehrenberg 78 10 Ellerbeckia arenaria (Moore ex Ralfs) R.M.Crawford 56 3 *В столбцах 3 и 4 указаны количества отмеченных в пробах озер особей Пример расчета коэффициента Жаккара для таблицы 3.2. Из 10 отмеченных в 1-ой экосистеме видов, во второй имеется 5, то есть количество общих видов равно 5. Следовательно расчеты принимают следующий вид: Пример расчета коэффициент Серенсена для таблицы 2: 20 Пример расчета коэффициента Брея-Кертиса. ; ; ∑ Если перед исследователем стоит задача рассчитать таксономическое сходство большого количества экосистем, то для удобства представления информации результаты вычислений заносятся в специальную таблицу «Матрицу таксономического сходства». В первом столбце и первой строчке указанной таблицы записываются названия экосистем (условные обозначения, номера, имена собственные и др.), в остальных ячейках – вычисленные для пар экосистем коэффициенты таксономического сходства. Для лучшего усвоения материала построим условную таблицу таксономического сходства (таблица 3.3). Таблица 3.3 Матрица таксономического сходства 5 условных экосистем Экосистема 1 Экосистема 2 Экосистема 3 Экосистема 4 Экосистема 5 Экосистема 1 1 0,3 0,2 0,15 0,55 Экосистема 2 0,3 1 0,25 0,2 0,4 Экосистема 3 0,2 0,25 1 0,6 0,2 Экосистема 4 0,15 0,2 0,6 1 0,2 Экосистема 5 0,55 0,4 0,2 0,2 1 Таксономическое сходство пар экосистем записано в ячейках, расположенных на пересечении воображаемых перпендикуляров, опускаемых от соответствующих названий. Для одной из экосистем выбирается название из первого столбца матрицы, для второй из первой строчки. Легко обратить внимание, что на пересечении перпендикуляров, проводимых от названий одной и той же экосистемы (например, от «Экосистема 1» из первых столбца и стороки), расположены цифры «1», что свидетельствует о полном сходстве таксономического состава. Таким образом, сходство таксономического 21 состава экосистемы 1 и экосистемы 2, определяемое по таблице 3.3, составляет 0,3; экосистемы 3 и экосистемы 5 – 0,2; экосистемы 4 и экосистемы 2 – 0,2 и т.д. Задания к разделу 3 для самостоятельного выполнения По исходным количественным данным, приведенным в таблице 3.4, произвести расчет всех индексов сходства для 5 учетных площадок. Ориентироваться на пример расчетов, приведенных в разделе 3. Результаты представить в виде матрицы таксономического сходства (смотреть таблицу 3.3). Таблица 3.4 Количество учтенных особей грызунов различных учетных площадок Название вида Уче тн ая пло ща дк а 1 Уче тн ая пло ща дк а 2 Уче тн ая пло ща дк а 3 Уче тн ая пло ща дк а 4 Уче тн ая пло ща дк а 5 Обыкновенная белка 12 25 7 8 Жѐлтый суслик 25 12 Малый суслик 32 12 12 Сурок-байбак 5 Соня-полчок 12 12 14 15 Степная мышовка 20 Лесная мышовка 22 5 7 9 Большой тушканчик 12 22 11 Ондатра 12 12 Обыкновенная полѐвка 17 31 7 Мышь-малютка 22 8 9 Полуденная песчанка 14 11 10 *В столбцах 3-5 указаны количества отмеченных особей 22 4. Проверка данных на соответствие закону нормального распределения В данном разделе приведена краткая обобщенная информация о нормальном распределении данных и наиболее простых способах проверки соответствия данных закону нормального распределения (в идеализированном случае). Раздел позволяет получить только наиболее общие представления «о нормальности». Более подробно с законом нормального распределения можно ознакомиться, применив специализированную учебную литературу [Полякова, Шаброва, 2015; Елисеева, 2011; Калинина, 2013; Гмурман, 2013; Лысенко, Дмитриева, 2013 и др.]. В природе все находится в гармонии. Те или иные признаки каких- либо объектов природы, как правило, проявляются согласно следующему закону: типичными (средними) значениями признака характеризуется большая часть объектов, по мере отклонения от среднего значения признака – количество объектов, характеризующихся такими значениями признаками, постепенно сокращается. Чем больше характеристика объектов отклонена от нормы (от среднего) тем более он уникален. Тем меньше вероятность среди всего многообразия найти данный объект. Простой пример: распределение роста у человека. Большинство людей обладают средним ростом. В то время как люди небольшого роста и высокие люди встречаются значительно реже. Подобным образом обстоит дело и с большинством других признаков у объектов живой и неживой природы. Такое «типичное» распределение данных получило название «нормального». Множество статистических методов основаны на использовании особенностей нормального распределения данных. Такие методы принято называть «параметрическими». К этой группе статистических методов из рассматриваемых в данном пособии относятся: расчет t- критериев Стьюдента и определение значений коэффициента линейной корреляции Пирсона. Для того, чтобы использовать данные методы сначала нужно проверить распределение значений исходных 23 характеристик. В случае, если закон распределения не близок «нормальному», то параметрические методы не могут быть использованы. Методы, для которых соблюдение закона нормального распределения является необязательным, получили название «непараметрические». Непараметрическими методами из рассматриваемых в учебнике являются: t-критерий Уилкоксона; U- критерий Манна-Уитни; коэффициент ранговой корреляции Спирмена и методы кластерного анализа. Как же осуществить проверку данных на соответствие (близость) закону нормального распределения? Существуют различные методы. В целом они могут быть подразделены на 2 группы: графические и расчетные. С использованием современного программного обеспечения и стандартных офисных компьютеров проверка нормальности распределения не составляет большого труда и занимает считанные секунды. В Excel, Statistica, SPSS и других программах существует широкий инструментарий для проверки распределения исследуемых данных: построение графиков распределения (гистограммы, нормальные вероятностные графики, ящичные диаграммы с усами), вычисление формальных критериев (Колмогорова-Смирнова, Шапиро-Уилка) и прочих характеристик распределения. В данном разделе будут рассмотрены наиболее простые методы проверки на нормальность, которые можно применить без использования специализированного программного обеспечения. Графический способ. Среди всего множества методов наиболее распространенным и простым является метод (графический) построения диаграммы распределения данных. Суть метода заключается в том, чтобы имеющиеся значения исследуемых характеристик разбить на ряд равных диапазонов. Далее нужно посчитать количество объектов исследования вошедших в эти диапазоны и построить гистограмму, где по оси OX следует отложить указанные диапазоны значений (в порядке возрастания), а по оси OY количество объектов исследования. Если указанная диаграмма будет иметь колоколообразный вид и будет симметричной (или близкой к 24 таковой), то считают, что распределение близко нормальному. При этом значение среднего арифметического и медианы должны быть также близкими (и моды в идеальных случаях). Такой графический способ применим в тех случаях, когда выборка представлена достаточно большим количеством объектов исследования (от нескольких десятков и больше). Приведем пример графического метода определения соответствия распределения данных закону нормального распределения. Пусть имеются сведения о росте группы людей, состоящей из 30 человек (таблица 4.1). Таблица 4.1 Рост группы людей № 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Р ос т, с м 147 151 152 156 157 157 161 162 162 163 164 165 166 166 167 167 167 168 169 171 171 172 172 173 176 177 178 182 183 191 Рост людей группы варьирует в диапазоне от 147 до 191 см. Произведем разбивку значений роста на удобное количество диапазонов. Указанных диапазонов должно быть достаточное количество, в противном случае диаграммы не дадут представления о характере распределения данных. Оптимальным количеством (на наш взгляд) является 9-15 диапазонов. В случае с таблицей 4.1 удобно использовать диапазон по 5 см. Таким образом, получится 9 диапазонов равной ширины (по 5 см). Производим подсчет количеств объектов исследования (людей) вовлеченных в каждый диапазон. Отобразим полученный результат в виде таблицы 4.2. Таблица 4.2 Группы объектов исследования по значениям роста Группы Частота (количество людей) <150 1 [150;155) 2 [155;160) 3 25 [160;165) 5 [165;170) 8 [170;175) 5 [175;180) 3 [180;185) 2 ≥185 1 Используя данные таблицы 4.2 построим гистограмму (рисунок 4.1). Рисунок 4.1. Гистограмма распределения объектов исследования Гистограмма распределения объектов исследования близка колоколообразной форме, симметрична. Таким образом, распределение близко нормальному. Далее необходимо вычислить среднее арифметическое, медиану и моду. Расчет среднего ( ̅), медианы (Me) и моды (Mo): ̅ =167,1. 26 167 (наиболее часто повторяющееся число). Из расчетов видно, среднее арифметическое, медиана и мода практически равны, что также является одним из косвенных признаков нормального распределения данных. Расчет асимметрии и эксцесса. Для проверки распределения на нормальность также используют метод расчета асимметрии и эксцесса. Для нормального распределения асимметрия и эксцесс равны 0. В реальности имеются некоторые отклонения от 0. Если это отклонение невелико, то можно считать, что распределении близко нормальному. Рассчитывается асимметрия (A) по формуле (4.1): ∑ ̅ , (4.1) где A – асимметрия; x i – значения рассматриваемой характеристики в каждом конкретном случае; ̅ – среднее арифметическое значение; Ϭ – стандартное отклонение; n – количество объектов исследования. Эксцесс (E) рассчитывается по формуле (4.2): ∑ ̅ . (4.2) После расчетов асимметрии и эксцесса полученные их значения сравниваются с показателями, именуемыми ошибками репрезентативности асимметрии (m A ) и эксцесса (m E ), которые вычисляются согласно формулам (4.3) и (4.4). √ . (4.3) √ . (4.4) 27 Если сравниваемые значения асимметрии и эксцесса по модулю (без учета знаков ±) меньше трехкратного значения соответствующих ошибок репрезентативности, то распределение близко нормальному. Если нет – то распределение не соответствует нормальному. Произведем расчеты асимметрии и эксцесса для рассмотренного выше примера. Для использования формул асимметрии и эксцесса необходимо помимо среднего, которое уже рассчитано, вычислить стандартное отклонение (Ϭ). Формулы стандартного отклонения, асимметрии и эксцесса содержат общую часть ̅ . Для того, чтобы облегчить и упорядочить вычисления всех этих параметров воспользуемся табличной формой записи результатов вычислительных процедур (таблица 4.3). Таблица 4.3 150> |