Методическое пособие язык программирования к ф. м н., доцент Мусин Наиль Минбариевич Новомосковск 2015 содержание mind Map 3 Начало работы 5
Скачать 2.89 Mb.
|
|
Регион | Кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам, млн руб. | Основные фонды в экономике (по полной балансовой (учетной) стоимости; на конец года), млн руб. |
Белгородская область | 342,5 | 145787 |
Брянская область | 275,4 | 113415 |
Владимирская область | 112,1 | 129272 |
Воронежская область | 274,5 | 211898 |
Ивановская область | 141,5 | 84550 |
Калужская область | 129 | 105783 |
Костромская область | 50,7 | 83716 |
Курская область | 401,3 | 124453 |
Липецкая область | 125,3 | 129114 |
Московская область | 5814,2 | 659675 |
Орловская область | 58 | 64366 |
Рязанская область | 456,5 | 110379 |
Смоленская область | 192,2 | 125247 |
Тамбовская область | 82,3 | 111642 |
Тверская область | 319,1 | 175833 |
Тульская область | 638,3 | 156543 |
Ярославская область | 727,9 | 185442 |
Москва | 811856,3 | 1384509 |
Республика Карелия | 41 | 90800 |
Республика Коми | 654,1 | 201201 |
Архангельская область | 103,3 | 198340 |
Вологодская область | 2411,2 | 136362 |
Калининградская область | 784,4 | 75707 |
Ленинградская область | 244,7 | 223013 |
Мурманская область | 490,7 | 144824 |
Новгородская область | 221,8 | 65864 |
Псковская область | 163,5 | 74695 |
Санкт–Петербург | 41581 | 412221 |
Республика Адыгея | 60,3 | 47056 |
Республика Дагестан | 469,5 | 134133 |
Республика Ингушетия | 10,5 | 5139 |
Кабардино-Балкарская Республика | 81,7 | 48059 |
Республика Калмыкия | 46,4 | 21677 |
Карачаево-черкесская Республика | 96,4 | 32493 |
Республика Северная Осетия – Алания | 356,5 | 43296 |
Краснодарский край | 2463,5 | 479549 |
Ставропольский край | 278,6 | 205580 |
Астраханская область | 321,9 | 106980 |
Волгоградская область | 782,9 | 206817 |
Ростовская область | 19140 | 299151 |
Республика Башкортостан | 14330,5 | 407013 |
Республика Марий Эл | 52,2 | 95617 |
Республика Мордовия | 304,8 | 70373 |
Республика Татарстан | 9739,4 | 477390 |
Удмуртская Республика | 934,9 | 180173 |
Чувашская Республика | 137,9 | 113170 |
Кировская область | 311 | 148026 |
Нижегородская область | 4833,2 | 294133 |
Оренбургская область | 502,8 | 234022 |
Пензенская область | 383,5 | 123940 |
Пермская область | 1300,9 | 302898 |
Самарская область | 7051,4 | 482883 |
Саратовская область | 1832,9 | 268971 |
Ульяновская область | 1448 | 125943 |
Курганская область | 75,5 | 93139 |
Свердловская область | 10187,3 | 580302 |
Тюменская область | 9666,7 | 1083475 |
Челябинская область | 4805,5 | 404407 |
Республика Алтай | 29,8 | 15278 |
Республика Бурятия | 817,4 | 91700 |
Республика Тыва | 14,8 | 14652 |
Республика Хакасия | 158,8 | 61889 |
Алтайский край | 405,2 | 191413 |
Красноярский край | 1320,6 | 383673 |
Иркутская область | 1053,6 | 339505 |
Кемеровская область | 1435,1 | 313617 |
Новосибирская область | 1682,8 | 302292 |
Омская область | 1774,7 | 190292 |
Томская область | 338 | 149647 |
Читинская область | 57 | 105245 |
Республика Саха (Якутия) | 408 | 220865 |
Приморский край | 1439 | 166236 |
Хабаровский край | 1933,3 | 248304 |
Амурская область | 108,5 | 141651 |
Камчатская область | 661,6 | 62198 |
Магаданская область | 236,8 | 45747 |
Сахалинская область | 247,9 | 97652 |
| Белгородская область | | | Ростовская область |
| Брянская область | | | Республика Башкортостан |
| Владимирская область | | | Республика Марий Эл |
| Воронежская область | | | Республика Мордовия |
| Ивановская область | | | Республика Татарстан |
| Калужская область | | | Удмуртская Республика |
| Костромская область | | | Чувашская Республика |
| Курская область | | | Кировская область |
| Липецкая область | | | Нижегородская область |
| Московская область | | | Оренбургская область |
| Орловская область | | | Пензенская область |
| Рязанская область | | | Пермская область |
| Смоленская область | | | Самарская область |
| Тамбовская область | | | Саратовская область |
| Тверская область | | | Ульяновская область |
| Тульская область | | | Курганская область |
| Ярославская область | | | Свердловская область |
| Москва | | | Тюменская область |
| Республика Карелия | | | Челябинская область |
| Республика Коми | | | Республика Алтай |
| Архангельская область | | | Республика Бурятия |
| Вологодская область | | | Республика Тыва |
| Калининградская область | | | Республика Хакасия |
| Ленинградская область | | | Алтайский край |
| Мурманская область | | | Красноярский край |
| Новгородская область | | | Иркутская область |
| Псковская область | | | Кемеровская область |
| Санкт-Петербург | | | Новосибирская область |
| Республика Адыгея | | | Омская область |
| Республика Дагестан | | | Томская область |
| Республика Ингушетия | | | Читинская область |
| Кабардино-Балкарская Республика | | | Республика Саха (Якутия) |
| Республика Калмыкия | | | Приморский край |
| Карачаево-черкесская Республика | | | Хабаровский край |
| Республика Северная Осетия – Алания | | | Амурская область |
| Краснодарский край | | | Камчатская область |
| Ставропольский край | | | Магаданская область |
| Астраханская область | | | Сахалинская область |
| Волгоградская область | | | |
| x | y |
| 342,5 | 145787 |
| 275,4 | 113415 |
| 112,1 | 129272 |
| 274,5 | 211898 |
| 141,5 | 84550 |
| 129 | 105783 |
| 50,7 | 83716 |
| 401,3 | 124453 |
| 125,3 | 129114 |
| 5814,2 | 659675 |
| 58 | 64366 |
| 456,5 | 110379 |
| 192,2 | 125247 |
| 82,3 | 111642 |
| 319,1 | 175833 |
| 638,3 | 156543 |
| 727,9 | 185442 |
| 811856,3 | 1384509 |
| 41 | 90800 |
| 654,1 | 201201 |
| 103,3 | 198340 |
| 2411,2 | 136362 |
| 784,4 | 75707 |
| 244,7 | 223013 |
| 490,7 | 144824 |
| 221,8 | 65864 |
| 163,5 | 74695 |
| 41581 | 412221 |
| 60,3 | 47056 |
| 469,5 | 134133 |
| 10,5 | 5139 |
| 81,7 | 48059 |
| 46,4 | 21677 |
| 96,4 | 32493 |
| 356,5 | 43296 |
| 2463,5 | 479549 |
| 278,6 | 205580 |
| 321,9 | 106980 |
| 782,9 | 206817 |
| 19140 | 299151 |
| 14330,5 | 407013 |
| 52,2 | 95617 |
| 304,8 | 70373 |
| 9739,4 | 477390 |
| 934,9 | 180173 |
| 137,9 | 113170 |
| 311 | 148026 |
| 4833,2 | 294133 |
| 502,8 | 234022 |
| 383,5 | 123940 |
| 1300,9 | 302898 |
| 7051,4 | 482883 |
| 1832,9 | 268971 |
| 1448 | 125943 |
| 75,5 | 93139 |
| 10187,3 | 580302 |
| 9666,7 | 1083475 |
| 4805,5 | 404407 |
| 29,8 | 15278 |
| 817,4 | 91700 |
| 14,8 | 14652 |
| 158,8 | 61889 |
| 405,2 | 191413 |
| 1320,6 | 383673 |
| 1053,6 | 339505 |
| 1435,1 | 313617 |
| 1682,8 | 302292 |
| 1774,7 | 190292 |
| 338 | 149647 |
| 57 | 105245 |
| 408 | 220865 |
| 1439 | 166236 |
| 1933,3 | 248304 |
| 108,5 | 141651 |
| 661,6 | 62198 |
| 236,8 | 45747 |
| 247,9 | 97652 |
Считываем данные из файла data.txt:
data= read.table("data.txt", head=TRUE)
attach(data)
Поле корреляции (коррелограмму, диаграмму рассеяния) строится автоматически с помощью команды plot(x,y):
В правом верхнем углу мы видим точку, значительно отклоняющуюся от основной группы. Она соответствует данным по региону 18, то есть по Москве. Эту точку следует убрать.
Получается следующее поле корреляции:
Убираем ещё две точки (по Санкт-Петербургу и Тюменской области).
Построенное поле корреляции с довольно отчётливой тенденцией:
Ясно, что зависимость будет скорее квадратичной, но ни в коем случае не показательной и не гиперболической (эти зависимости являются либо строго возрастающими, либо строго убывающими).
Ищем зависимость в виде
lm(formula = y x + I(x^2))
Residuals:
Min 1Q Median 3Q Max
-150565 -51166 -5482 32731 189131
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 97020 10420 9.313 6.21e-14 ***
x 89050 7.588 1.735 2e-16 ***
I(x^2) -0.0043 0.00486 -8.778 6. 04e-13 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 73050 on 71 degrees of freedom
Multiple R-squared: 0.7165, Adjusted R-squared: 0.7085
F-statistic: 89.7 on 2 and 71 DF, p-value: < 2.2e-16
Все коэффициенты a, b и c значимы по критерию Стьюдента на уровне p-value < 0.001; это показывают *** в столбце Coefficients) и сами значения p-value Pr(>|t|): для коэффициента a, для коэффициента b и для коэффициента с.
Уравнение квадратичной регрессии
Среднеквадратичное отклонение (Adjusted R-squared) для данной модели составляет , то есть качество модели достаточно высокое. Значимость среднеквадратичного отклонения подтверждает и высокое значение F-статистики Фишера, равное 89.7, и общий уровень значимости (определяемый по этой статистике): p-value: , что много меньше обычно достаточного на практике значения 0.001.
Рассмотрим для сравнения остальные модели для нашей задачи.
Линейная модель :
> summary(lm(yx))
Call:
lm(formula = y x)
Residuals:
Min 1Q Median 3Q Max
-345935 -66123 -16070 56229 368348
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.370e+05 1.344e+04 10.194 1.30e-15 ***
x 2.655e+01 3.763e+00 7.055 8.75e-10 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 104800 on 72 degrees of freedom
Multiple R-squared: 0.4087, Adjusted R-squared: 0.4005
F-statistic: 49.77 on 1 and 72 DF, p-value: 8.752e-10
Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели неудовлетворительное.
Экспоненциальная модель
> summary(lm(log(y)x))
Call:
lm(formula = log(y) x)
Residuals:
Min 1Q Median 3Q Max
-3.0420 -0.2631 0.1443 0.5378 1.1769
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.159e+01 9.841e-02 117.725 < 2e-16 ***
x 1.293e-04 2.756e-05 4.691 1.26e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7672 on 72 degrees of freedom
Multiple R-squared: 0.2341, Adjusted R-squared: 0.2235
F-statistic: 22.01 on 1 and 72 DF, p-value: 1.259e-05
Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели неудовлетворительное.
Степенная модель
> summary(lm(log(y)log(x)))
Call:
lm(formula = log(y) log(x))
Residuals:
Min 1Q Median 3Q Max
-1.65134 -0.29374 0.06559 0.39976 1.01151
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.17748 0.23953 38.31 <2e-16 ***
log(x) 0.43314 0.03853 11.24 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5281 on 72 degrees of freedom
Multiple R-squared: 0.6371, Adjusted R-squared: 0.632
F-statistic: 126.4 on 1 and 72 DF, p-value: < 2.2e-16
Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели удовлетворительное, но хуже квадратичной модели.
Гиперболическая модель
> t=1/x
> summary(lm(yt))
Call:
lm(formula = y t)
Residuals:
Min 1Q Median 3Q Max
-151500 -76329 -42345 35332 454574
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 205773.84 16239.52 12.671 < 2e-16 ***
t -39.14 10.17 -3.848 0.000255 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 124100 on 72 degrees of freedom
Multiple R-squared: 0.1706, Adjusted R-squared: 0.159
F-statistic: 14.81 on 1 and 72 DF, p-value: 0.0002553
Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели очень плохое.