Главная страница

Методы экологических исследований. Основы статистической обработ. М. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие


Скачать 5.76 Mb.
НазваниеМ. К. Аммосова Институт естественных наук Экологогеографическое отделение Методы экологических исследований основы статистической обработки данных учебнометодическое пособие
Дата08.12.2022
Размер5.76 Mb.
Формат файлаpdf
Имя файлаМетоды экологических исследований. Основы статистической обработ.pdf
ТипУчебно-методическое пособие
#835298
страница7 из 7
1   2   3   4   5   6   7
Перерасчет матрицы расстояний после первого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
1
2;3
4
5
6
7
8
9
10
1
0 2,6 11,7 17,9 20,3 57,8 71,2 148,4 165,5
2;3
2,6 0
9,2 15,4 17,7 56,1 68,7 146,2 163,3
4
11,7 9,2 0
6,3 9,1 47,0 59,5 137,4 154,3
5
17,9 15,4 6,3 0
3,2 40,8 53,3 132,2 148,7
6
20,3 17,7 9,1 3,2 0
38,8 51,3 131,2 147,5
7
57,8 56,1 47,0 40,8 38,8 0
12,5 95,7 110,4
8
71,2 68,7 59,5 53,3 51,3 12,5 0
85,6 99,3
9
148,4 146,2 137,4 132,2 131,2 95,7 85,6 0
20,6
10
165,5 163,3 154,3 148,7 147,5 110,4 99,3 20,6 0
Находим в новой матрице расстояний наименьшее расстояние. На втором шаге кластеризации объединяются кластер «2;3» и объект 1
(расстояние 2,6). Производим пересчет расстояний от нового кластера
«2;3;1» до всех оставшихся объектов.
Расчет расстояния от кластера «2;3;1» до остальных объектов будет отличаться от того, как оно рассчитывалось на предыдущем шаге.
Здесь стоит принять во внимание количество объектов, входящих в кластер «2;3». Он состоит из двух объектов: объекта 2 и объекта 3, – что должно быть отражено в расчетах далее.
Расчет расстояния от кластера «2;3;1» до объекта 4:
Расчет расстояния от кластера «2;3;1» до объекта 5:
Расчет расстояния от кластера «2;3;1» до объекта 6:

83
Расчет расстояния от кластера «2;3;1» до объекта 7:
Расчет расстояния от кластера «2;3;1» до объекта 8:
Расчет расстояния от кластера «2;3;1» до объекта 9:
Расчет расстояния от кластера «2;3;1» до объекта 10:
После вычислений произведем составление новой матрицы расстояний (таблица 7.21), где также объединим в кластер наиболее близкорасположенные объекты.
Таблица 7.21
Перерасчет матрицы расстояний после второго шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1
4
5
6
7
8
9
10
2;3;1
0 10,0 16,2 18,6 56,7 69,5 146,9 164
4
10,0 0
6,3 9,1 47,0 59,5 137,4 154,3
5
16,2 6,3 0
3,2 40,8 53,3 132,2 148,7
6
18,6 9,1 3,2 0
38,8 51,3 131,2 147,5
7
56,7 47,0 40,8 38,8 0
12,5 95,7 110,4
8
69,5 59,5 53,3 51,3 12,5 0
85,6 99,3
9
146,9 137,4 132,2 131,2 95,7 85,6 0
20,6
10
164 154,3 148,7 147,5 110,4 99,3 20,6 0
На третьем шаге кластеризации объединяются объекты 5 и 6
(расстояние 3,2).
Произведем расчет расстояний от кластера «5;6» до остальных объектов.
Расчет расстояния от кластера «5;6» до объекта 2;3;1:
Расчет расстояния от кластера «5;6» до объекта 4:

84
Расчет расстояния от кластера «5;6» до объекта 7:
Расчет расстояния от кластера «5;6» до объекта 8:
Расчет расстояния от кластера «5;6» до объекта 9:
Расчет расстояния от кластера «5;6» до объекта 10:
Рассчитанные значения вписываем в новую матрицу расстояний
(таблица 7.22).
Таблица 7.22
Перерасчет матрицы расстояний после третьего шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1
4
5;6
7
8
9
10
2;3;1
0 10,0 17,4 56,7 69,5 146,9 164
4
10,0 0
7,7 47,0 59,5 137,4 154,3
5;6
17,4 7,7 0
39,8 52,3 131,7 148,1
7
56,7 47,0 39,8 0
12,5 95,7 110,4
8
69,5 59,5 52,3 12,5 0
85,6 99,3
9
146,9 137,4 131,7 95,7 85,6 0
20,6
10
164 154,3 148,1 110,4 99,3 20,6 0
На четвертом шаге кластеризации снова объединяем наиболее близкие объекты (кластер 5;6 и объект 4). Производим расчет расстояний от нового кластера «5;6;4» до всех объектов.
Расчет расстояния от кластера «5;6;4;» до объекта 2;3;1:
Расчет расстояния от кластера «5;6;5;» до объекта 7:
Расчет расстояния от кластера «5;6;5;» до объекта 8:

85
Расчет расстояния от кластера «5;6;5;» до объекта 9:
Расчет расстояния от кластера «5;6;5;» до объекта 10:
Рассчитанные значения вписываем в новую матрицу расстояний
(таблица 7.23).
Таблица 7.23
Перерасчет матрицы расстояний после четвертого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1
5;6;4
7
8
9
10
2;3;1
0 14,9 56,7 69,5 146,9 164
5;6;4
14,9 0
42,2 54,7 133,6 150,2
7
56,7 42,2 0
12,5 95,7 110,4
8
69,5 54,7 12,5 0
85,6 99,3
9
146,9 133,6 95,7 85,6 0
20,6
10
164 150,2 110,4 99,3 20,6 0
На пятом шаге кластеризации снова объединяем наиболее близкие объекты (кластеры 7 и 8). Производим расчет расстояний от нового кластера «7;8» до всех объектов из таблицы (таблица 7.23).
Расчет расстояния от кластера «7;8;» до объекта 2;3;1:
Расчет расстояния от кластера «7;8;» до объекта 5;6;4:
Расчет расстояния от кластера «7;8;» до объекта 9:
Расчет расстояния от кластера «7;8;» до объекта 10:
Рассчитанные значения вписываем в новую матрицу расстояний
(таблица 7.24).

86
Таблица 7.24
Перерасчет матрицы расстояний после пятого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1
5;6;4
7;8
9
10
2;3;1
0 14,9 63,1 146,9 164
5;6;4
14,9 0
48,5 133,6 150,2
7;8
63,1 48,5 0
90,7 104,9
9
146,9 133,6 90,7 0
20,6
10
164 150,2 104,9 20,6 0
На шестом шаге кластеризации объединяются кластеры 2;3;1 и 5;6;4
(расстояние 14,9).
Произведем расчет расстояний от кластера «2;3;1;5;6;4» до остальных объектов.
Расчет расстояния от кластера «2;3;1;5;6;4» до объекта 7;8. Так как кластер «2;3;1;5;6;4» состоит из двух субкластеров по 3 объекта, то расчет расстояния будет осуществляться следующим образом:
Расчет расстояния от кластера «2;3;1;5;6;4» до объекта 9:
Расчет расстояния от кластера «2;3;1;5;6;4» до объекта 10:
Рассчитанные значения вписываем в новую матрицу расстояний
(таблица 7.25).
Таблица 7.25
Перерасчет матрицы расстояний после шестого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1;5;6;4
7;8
9
10
2;3;1;5;6;4
0 55,8 140,3 157,1
7;8
55,8 0
90,7 104,9
9
140,3 90,7 0
20,6
10
157,1 104,9 20,6 0

87
На седьмом шаге кластеризации объединяются кластеры 9 и 10
(расстояние 20,6).
Далее необходимо снова произвести расчет расстояний от кластера
«9;10» до остальных объектов.
Расчет расстояния от кластера «9;10;» до кластера «2;3;1;5;6;4»:
Расчет расстояния от кластера «9;10;» до кластера «7;8»:
Рассчитанные значения вписываем в новую матрицу расстояний
(таблица 7.26).
Таблица 7.26
Перерасчет матрицы расстояний после седьмого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1;5;6;4
7;8
9;10
2;3;1;5;6;4
0 55,8 148,7
7;8
55,8 0
97,8
9;10
148,7 97,8 0
На пятом шаге кластеризации снова объединяем наиболее близкие объекты: кластеры «2;3;1;5;6;4» и «7;8». Произведем расчет расстояний от нового кластера «2;3;1;5;6;4;7;8» до кластера «9;10», учитывая, что первый субкластер «2;3;1;5;6;4» состоит из 6 объектов, а второй «7;8» – из 2-х.
Рассчитанное значение впишем в последнюю матрицу расстояний
(таблица 7.27).
Таблица 7.27
Перерасчет матрицы расстояний после восьмого шага кластеризации
методом невзвешенного попарного среднего арифметического
Точки
2;3;1;5;6;4;7;8
9;10
2;3;1;5;6;4;7;8
0 136
9;10
136 0

88
На девятом шаге кластеризации соединяются оставшиеся кластеры:
«2;3;1;5;6;4;7;8» и «9;10». Процесс кластеризации завершен. Теперь снова необходимо построить дендрограмму
– график, демонстрирующий порядок объединения объектов в кластеры и расстояния на котором объекты объединились (рисунок 7.7). Далее на дендрограмме выделяют количество групп объектов исследования в зависимости от целей и задач, стоящих перед исследователями. Одним из способов выделения кластеров является проведение линии разделения кластеров в месте резкого увеличения расстояния объединения кластеров (рисунок 7.8). На рисунке 7.8 показан один из вариантов разделения дендрограммы на отдельные группы.
Рисунок 7.7. Дендрограмма кластеризации методом невзвешенного попарного среднего арифметического
Таким образом, на дендрограмме (рисунок 7.8) произведено выделение трех кластеров. Первый кластер объединяет объекты
1,2,3,4,5,6, второй – 7,8 и третий 9 и 10. Далее производят подробное изучение каждой отдельной группы объектов исследования, сравнение

89 групп между собой и прочие манипуляции, зависящие от целей и задач исследования.
Рисунок 7.8. Дендрограмма кластеризации методом невзвешенного попарного среднего арифметического с выделением групп объектов исследования
Задания к разделу 7 для самостоятельного выполнения
1. Используя данные таблицы 7.28 произвести кластерный анализ методом одиночной связи с построением дендрограммы и выделением кластеров.
Таблица 7.28
Выбросы 5 предприятий, т/год

SO
2
N
x
O
y
CO
z
1 7,5 3
15 2
4,5 4,3 12,2 3
2,4 7,1 10 4
12,5 9,9 13 5
5,5 8,6 14,2

90 2. Используя данные таблицы 7.29 произвести кластерный анализ методом полной связи с построением дендрограммы и выделением кластеров.
Таблица 7.29
Химический состав воды 5 озер зоны тундры
№ pH
Минерализация, мг/л
Кислород, мг/л
1 7,5 50 12 2
4,5 45 7
3 5
47 6,5 4
9,5 35 5,5 5
10 30 5
3. Используя данные таблицы 7.30 произвести кластерный анализ методом невзвешенного попарного среднего арифметического с построением дендрограммы и выделением кластеров.
Таблица 7.30
Характеристики населенных 5 населенных пунктов

Численность насления, тыс. чел.
Площадь, км
2
Площадь зеленых насаждений, км
2 1
7,5 8
9 2
4,5 3
1,5 3
5 5
2 4
15 12 5,5 5
12 10 5

91
Литература
Гмурман, В. Е. Теория вероятностей и математическая статистика: учебное пособие для бакалавров / В. Е. Гмурман. – Москва: Юрайт,
2013. – 479 c.
Елисеева, И. И. Статистика: учебник для вузов / И. И. Елисеева. –
Москва: Издательсво Юрайт, 2011. – 565 с.
Животовский,
Л.
А.
Показатели внутрипопуляционного разнообразия / Л. А. Животовский // Журнал общей биологии. – 1980. –
Т. 41, № 6. – С. 828-836.
Калинина, В. Н. Теория вероятностей и математическая статистика: учебник для бакалавров / В. Н. Калинина. – Москва: Юрайт, 2013. –
472 c.
Лысенко, С. Н. Общая теория статистики: учебное пособие / С. Н.
Лысенко, И. А. Дмитриева. – Москва: ИД ФОРУМ, НИЦ ИНФРА-М,
2013. – 208 c.
Полякова, В. В. Основы теории статистики / В. В. Полякова, Н. В.
Шаброва. – Екатеринбург: Изд-во Уральского университета, 2015. –
148 с.
Суходольский, Г. В. Основы математической статистики для психологов: Учебник / Г. В. Суходольский. – СПб.: Изд-во С.-
Петербургского университета, 1998. – 464 с.
Т-критерий Вилкоксона [Электронный ресурс] // Новый семестр. –
2006-2019. – Режим доступа: https://math.semestr.ru/group/wilcoxon.php.
– (Дата обращения: 08.04.2019).
Billiet, P. Critical Values for the Mann-Whitney U-Test [Electronic resource] / P. Billiet // The Open Door Web Site. – 2003. – Uniform
Resource
Locator: http://www.saburchill.com/IBbiology/downloads/002.pdf. – (Access date:
10.04. 2019).
Bray, J. R. An ordination of upland forest communities of southern
Wisconsin / J. R. Bray, J. T. Curtis // Ecological Monographs. – 1957. –
Vol. 27, № 4. – P. 325-349.

92
Estivill-Castro, V. Why so many clustering algorithms: a position paper /
V. Estivill-Castro // ACM SIGKDD Explorations Newsletter. – 2002. – Vol.
4 (1). – P. 65–75.
Jaccard, P. Distribution de la flore alpine dans le Bassin des Dranses et dans quelques regions voisines / P. Jaccard // Bulletin de la Société
Vaudoise des Sciences Naturelles. – 1901. – Vol. 37. – P. 241-272.
Mann, H. B., Whitney, D. R. On a Test of Whether one of Two Random
Variables is Stochastically Larger than the Other / H. B. Mann, D. R.
Whitney // Annals of Mathematical Statistics. – 1947. – Vol. 18 (1). – P. 50-
60.
Margalef, R. Information theory in ecology / R. Margalef // International
Journal of General Systems. – 1958. – Vol. 3. – P. 36-71.
McQuitty, L. L. Elementary Linkage Analysis for Isolating Orthogonal and Oblique Types and Typal Relevancies / L. L. McQuitty // Educational and Psychological Measurement. – 1957. – Vol. 17. – P. 207-229.
Menhinick, E. F. A Comparison of some species-individuals diversity indices applied to samples of field insects / E. F. Menhinick // Ecology. –
1964. – Vol. 45, № 4. – P. 859-861.
Pearson, K. Notes on Regression and Inheritance in the Case of Two
Parents / K. Pearson // Proceedings of the Royal Society of London, – 1895.
– Vol. 58. – P. 240-242.
Pielou, E. C. Ecological diversity / E. C. Pielou. – New York: Gordon and Breach Science Publisher, 1975. – 165 p.
Shannon, C. E. A mathematical theory of communication / C. E.
Shannon // The Bell System Technical Journal. – 1948. – Vol. 27. – P. 379-
423.
Shannon, C. E. The mathematical theory of communication / C. E.
Shannon, W. Weaver. – Illinois: University of Illinois, 1949. – 125 p.
Simpson, E. H. Measurement of diversity / E. H. Simpson // Nature. –
1949. – Vol. 163. – P. 688.
Sneath, P. H. A. The Applications of Computers to Taxonomy / P. H. A.
Sneath // Journal of General Microbiology. – 1957. – Vol. 17. – P. 201-206.

93
Sokal, R, Michener, C. A statistical method for evaluating systematic relationships / R. Sokal, C. Michener // University of Kansas Science
Bulletin. – 1958. – Vol. 38. P. 1409–1438.
Sørensen, T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on Danish commons. Biologiske Skrifter / Т. Sørensen //
Kongelige Danske Videnskabernes Selskab. – 1948. – Vol. 5, № 4. – P. 1-
34.
Spearman, C. The proof and measurement of association between two things / C. Spearman // The American Journal of Psychology. – 1904. – Vol.
15, № 1. – P. 72-101.
Student. The probable error of a mean / Student // Biometrika. – 1908. –
Vol. 6 (1). – P. 1-25.
Sur la liaison et la division des points d'un ensemble fini / J. Florek, J.
Lukaszewicz, H. Steinhaus, S. Zybrzycki // Colloquia Mathematicae. –
1951. – Vol. 2, № 3-4. – P. 282-285.
Table of Critical Values: Pearson Correlation [Electronic resource] //
Statistics
Solutions .
– 2019. – Uniform Resource Locator: https://www.statisticssolutions.com/ table-of-critical-values-pearson- correlation. – (Access date: 14.05.2019).
Values of the t-distribution (two-tailed) [Electronic resource] //
MedCalc Software bvba.
– 2019. – Uniform Resource Locator: https://www.medcalc.org/manual/t-distribution.php.

(Access date:
14.05.2019).
Wilcoxon, F. Individual Comparisons by Ranking Methods / F.
Wilcoxon // Biometrics Bulletin. – 1945. – Vol. 1, № 6. – P. 80-83.

Учебное издание
Городничев Р.М., Пестрякова Л.А., Ушницкая Л.А. и др.
Методы экологических исследований.
Основы статистической обработки данных
Учебно-методическое пособие
Печатается в авторской редакции
Дизайн обложки: Р.М. Городничев
Подписано в печать 18.06.19. Формат 60х84/16.
Печать цифровая. Печ.л. 4,25. Уч.-изд. 5,3. Тираж 50 экз. Заказ № 231.
Издательский дом Северо-Восточного федерального университета,
677891, г. Якутск, ул. Петровского, 5
Отпечатано с готового оригинал-макета в типографии Издательского дома СВФУ
1   2   3   4   5   6   7


написать администратору сайта