Биоразнообразие 1 ч.. I. Биологическое разнообразие и методы его оценки Введение
![]()
|
5.8. Графический анализ бета-разнообразияГруппирование и классификация выборок является следующим этапом в анализе бета-разнообразия. Эти процедуры выполняются на основе преобразования матриц, каждый элемент которой – это показатель сходства между двумя выборками. 5.8.1. Неориентированные и ориентированные графыДля эффективного выделения скоплений объектов существуют методы сетевого анализа. Сетевой анализ матрицы оценок сходства между объектами заключается в построении некоторых типов графов, т.е. диаграмм, где объекты изображены в виде точек (кружков) – вершин графа, которые соединяются или не соединяются линиями, называемыми ребрами графа. Степень соответствия между объектами отражается в графах или характером взаимного расположения точек, или длиной и другими особенностями линии, соединяющих точки. При анализе матриц сходства обычно используются «неориентированные графы», в которых линии, соединяющие вершины графа, не имеют направления. Реже применяются «ориентированные графы», в которых вершины соединены стрелками. Дендрит – один из типов неориентированного графа. Он может быть двух типов: минимальное древо (матрица включает оценки различий между объектами) или максимальное древо (используются меры сходства). Дендрит – это ломаная линия, которая может ветвиться, но не содержит циклов. Построение дендрита заключается в нахождении для каждого объекта наиболее сходного с ним объекта и соединении их линией. В результате получается ряд отрезков, в том числе и разветвленных. Построить дендрит (рис. 5.8.1) можно с помощью матрицы сходства выборочных совокупностей, например (A–Е), вычисленной на основе индекса сходства Жаккара (табл. 5.8.1). Для этого последовательно соединяем две наиболее сходные выборки Г и Д (0,90) отрезком. Следующая по силе величина сходства 0,85 обнаружена между выборками Г и В. Поэтому выборку В можно присоединить отрезком к уже построенной ветке Д – Г и т. д. Таблица 5.8.1 Матрица сходства выборочных совокупностей
Основной недостаток этого графика – потеря информации, заключенной в матрице оценок сходства, в результате использования только немногих (максимальных для каждого объекта) значений показателя соответствия. ![]() Рис. 5.8.1. Последовательные этапы построения дендрита на основе матрицы сходства выборок 5.8.2. Плеяды ТерентьеваОдним из видов графического анализа сходства выборок может быть построение плеяд Терентьева. Этот тип графика, в отличие от дендрита, учитывает всю матрицу сходства. Плеяды Терентьева (рис. 5.8.2) также можно построить с помощью матрицы фаунистического сходства, вычисленной на основе индекса сходства Жаккара (табл. 5.8.1). Этот тип графика является неориентированным графом. На нем все объекты могут быть соединены линиями, отражающими связи и меру сходства объектов. Толщина или характер линий соответствуют определенному интервалу значений индекса сходства.
Рис. 5.8.2. Один из типов неориентированного графа – плеяд Терентьева, построенный на основе матрицы сходства выборок, где величины индекса сходства: 1 – [0,7: 0.9]; 2 – [0,4; 0,7]; 3 – [0,2: 0,4] Другой графический вариант плеяд Терентьева показывает взаимосвязи между выборками на разных уровнях сходства: 0,8, 0,5 и 0,2 (рис. 5.8.3).
Рис. 5.8.3. Один из типов плеяд Терентьева. Взаимосвязи между объектами показаны на уровнях сходства 0,8. 0,5 и 0,2 На уровне сходства 0,8 есть взаимосвязь между объектами Г и В, Г и Д, а также А и Б. На уровне сходства 0,5 прибавляются взаимосвязи между объектами Д и А, Г и Е, Г и Б, А и Е, Б и Е и т. д. 5.8.3. Дендрограмма (кластерный анализ)Если сравнивать несколько участков, хорошее представление о бета-разнообразии может дать кластерный анализ. Кластерный анализ – один из методов многомерного анализа, сущность которого состоит в иерархической классификации объектов в разделении множества объектов на однородные группы. Графически иерархическая классификация отображается в виде дендрограммы (дерева). Внутри каждой группы, получаемой в результате разбиения объектов на кластеры (группы), объекты более сходны, чем с объектами из других групп. Кластерный анализ начинается с составления матрицы сходства для каждой пары сравниваемых объектов. Затем проводится последовательное объединение объектов в группы по степени их сходства, пока все они не будут включены в одну группу. Поскольку интерпретация результатов кластерного анализа зависит от визуальной оценки дендрограммы, лучше всего использовать этот прием для малых массивов данных. В качестве примера рассмотрим кластеризацию выборок на основе матрицы индексов сходства (табл. 5.8.1). Простейшие методы кластерного анализа, применяемого в биоценологии, биогеографии и числовой таксономии разными авторами, описаны Ю. А. Песенко [1982]. Эти методы могут быть с успехом использованы и в экологических исследованиях при анализе бета-разнообразия.
Рис. 5.8.4. Дендрограмма кластерного анализа шести объектов, построенная методом одиночного присоединения (ближайшего соседа) В наиболее простых случаях процесс группировки начинается с нахождения в матрице индексов сходства пары наиболее сходных объектов. Самыми близкими объектами в примере, рассмотренном в табл. 5.8.1, являются Г и Д (0,90). Эти объекты отображаются на графике двумя соседними точками (рис. 5.8.4). Отходящие от точек параллельные линии соединяются отрезком на уровне величины сходства и объединяются в один кластер. Затем в матрице индексов сходства находится второй по величине индекс сходства. Если он связывает два других, еще не объединенных в группу объекта, то их соединяют так же, как и первые два, но отдельно от них на соответствующем уровне сходства. В нашем примере вторая по силе связь имеется между объектами Г и В (0,85), при этом один из этих объектов уже объединен в кластер. В этом случае присоединение связанного с ним нового объекта может быть произведено тремя разными способами: одиночным, полным и средним присоединением. Одиночное присоединение называют также «методом ближнего соседа». Метод впервые использован Серенсеном в 1948 году. Соединение групп производится по максимальному значению сходства между объектами из каждой группы. Следуя этому методу, объект В присоединяется к объектам ДГ, уже объединенным в кластер. Следующее по величине сходство – между объектами А и Б (0,80). Они объединяются в отдельный кластер на уровне сходства. Следующий шаг – присоединение объекта Е к группе из объединенных ранее объектов ДГВ, так как между объектами Е и Г сходство равно 0,75. На последнем этапе объединяются два сформированных ранее кластера ДГВЕ и АБ в один на уровне 0,60. Результаты объединения показаны на рис. 5.8.4. Полное присоединение называется также «методом дальнего соседа». Метод был впервые предложен Снитом в 1957 году Согласно этому правилу, после формирования кластеров ДГ и АБ к группе АБ присоединяется объект Е, так как минимальное сходство этого объекта с объектами этого кластера равно 0,60. Объект В присоединяется к группе ДГ только на уровне 0,15 (минимальное сходство с каждым из объектов группы). Этот объект нельзя присоединить к кластеру ЕАБ, так как минимальное сходство объекта Е с объектами этой группы всего 0,1. Результаты объединения показаны на рис. 5.8.5. ![]() ![]() Рис. 5.8.5. Дендрограмма кластерного анализа шести объектов, построенная методом полного присоединения (дальнего соседа) С 1 2 3 4 реднее присоединение.Этот метод включает несколько вариантов. Он был предложен в 1958 году Сокалом, Майченером и Олсоном, Миллером одновременно. Один из самых простых вариантов этого вида кластерного анализа заключается в использовании средних арифметических невзвешенных значений сходства присоединенного объекта со всеми объектами группы. Соединяются кластеры, среднее сходство между объектами которых выше. Согласно этому методу, после формирования кластеров ДГ и АБ к группе АБ присоединяется объект Е, так как среднее сходство этого объекта с объектами этого кластера (0,6 + 0,65)/2 = 0,625. Этот объект нельзя присоединить к кластеру В (сходство всего 0,10) или кластеру ДГ (среднее сходство равно 0,50). На следующем шаге к группе ДГ присоединяется объект В, так как среднее сходство его с объектами данного кластера равно 0,5, а с группой ЕАБ – лишь 0,20. Последний шаг – объединение двух групп ДГВ и ЕАБ в один кластер на уровне 0,49, так как эта величина показывает среднюю связь между объектами в двух группах. Результаты объединения показаны на рис. 5.8.6. ![]() ![]() ![]() ![]() ![]() ![]() Рис. 5.8.6. Дендрограмма кластерного анализа шести объектов, построенная методом среднего присоединения Более сложные и разнообразные методы кластерного анализа реализуются с помощью вычислительной техники. Разработано множество статистических пакетов программ, таких как Statgraphics, Statistica, STADIA и другие, которые выполняют кластерный анализ. |