Главная страница
Навигация по странице:

  • Социально-экономические показатели субъектов РФ на начало 2001 г.

  • Линейная модель

  • Экспоненциальная модель

  • Степенная модель

  • Гиперболическая модель

  • Методическое пособие язык программирования к ф. м н., доцент Мусин Наиль Минбариевич Новомосковск 2015 содержание mind Map 3 Начало работы 5


    Скачать 2.89 Mb.
    НазваниеМетодическое пособие язык программирования к ф. м н., доцент Мусин Наиль Минбариевич Новомосковск 2015 содержание mind Map 3 Начало работы 5
    Дата04.05.2023
    Размер2.89 Mb.
    Формат файлаdoc
    Имя файлаyazyk-programmirovaniya-r.doc
    ТипМетодическое пособие
    #1107449
    страница5 из 7
    1   2   3   4   5   6   7

    if



    switch



    r-файлы



    Последовательность совершенных действий можно сохранить в текстовый файл:



    расширение txt заменить на r (пусть файл назвали xxx.r), открыть файл в Блокноте и отредактировать, в частности, убрать значок ввода >

    Чтобы запустить этот файл, нужно ввести команду source(“xxx.r”)

    Эконометрика




    Однопараметрическая регрессия



    Проведём анализ связи между кредитами, предоставленными предприятиям, организациям, банкам и физическим лицам, млн руб., и основными фондами в экономике (по полной балансовой (учетной) стоимости; на конец 2001 года, по следующим данным:

    Социально-экономические показатели субъектов РФ на начало 2001 г.


    Регион

    Кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам, млн руб.

    Основные фонды в экономике (по полной балансовой (учетной) стоимости; на конец года),

    млн руб.

    Белгородская область

    342,5

    145787

    Брянская область

    275,4

    113415

    Владимирская область

    112,1

    129272

    Воронежская область

    274,5

    211898

    Ивановская область

    141,5

    84550

    Калужская область

    129

    105783

    Костромская область

    50,7

    83716

    Курская область

    401,3

    124453

    Липецкая область

    125,3

    129114

    Московская область

    5814,2

    659675

    Орловская область

    58

    64366

    Рязанская область

    456,5

    110379

    Смоленская область

    192,2

    125247

    Тамбовская область

    82,3

    111642

    Тверская область

    319,1

    175833

    Тульская область

    638,3

    156543

    Ярославская область

    727,9

    185442

    Москва

    811856,3

    1384509

    Республика Карелия

    41

    90800

    Республика Коми

    654,1

    201201

    Архангельская область

    103,3

    198340

    Вологодская область

    2411,2

    136362

    Калининградская область

    784,4

    75707

    Ленинградская область

    244,7

    223013

    Мурманская область

    490,7

    144824

    Новгородская область

    221,8

    65864

    Псковская область

    163,5

    74695

    Санкт–Петербург

    41581

    412221

    Республика Адыгея

    60,3

    47056

    Республика Дагестан

    469,5

    134133

    Республика Ингушетия

    10,5

    5139

    Кабардино-Балкарская Республика

    81,7

    48059

    Республика Калмыкия

    46,4

    21677

    Карачаево-черкесская Республика

    96,4

    32493

    Республика Северная Осетия – Алания

    356,5

    43296

    Краснодарский край

    2463,5

    479549

    Ставропольский край

    278,6

    205580

    Астраханская область

    321,9

    106980

    Волгоградская область

    782,9

    206817

    Ростовская область

    19140

    299151

    Республика Башкортостан

    14330,5

    407013

    Республика Марий Эл

    52,2

    95617

    Республика Мордовия

    304,8

    70373

    Республика Татарстан

    9739,4

    477390

    Удмуртская Республика

    934,9

    180173

    Чувашская Республика

    137,9

    113170

    Кировская область

    311

    148026

    Нижегородская область

    4833,2

    294133

    Оренбургская область

    502,8

    234022

    Пензенская область

    383,5

    123940

    Пермская область

    1300,9

    302898

    Самарская область

    7051,4

    482883

    Саратовская область

    1832,9

    268971

    Ульяновская область

    1448

    125943

    Курганская область

    75,5

    93139

    Свердловская область

    10187,3

    580302

    Тюменская область

    9666,7

    1083475

    Челябинская область

    4805,5

    404407

    Республика Алтай

    29,8

    15278

    Республика Бурятия

    817,4

    91700

    Республика Тыва

    14,8

    14652

    Республика Хакасия

    158,8

    61889

    Алтайский край

    405,2

    191413

    Красноярский край

    1320,6

    383673

    Иркутская область

    1053,6

    339505

    Кемеровская область

    1435,1

    313617

    Новосибирская область

    1682,8

    302292

    Омская область

    1774,7

    190292

    Томская область

    338

    149647

    Читинская область

    57

    105245

    Республика Саха (Якутия)

    408

    220865

    Приморский край

    1439

    166236

    Хабаровский край

    1933,3

    248304

    Амурская область

    108,5

    141651

    Камчатская область

    661,6

    62198

    Магаданская область

    236,8

    45747

    Сахалинская область

    247,9

    97652


    Источник данных: Регионы России. 2000. – М., 2001 г.

    Для удобства работы составим отдельную таблицу, в которой регионы будут перенумерованы:




    Белгородская область






    Ростовская область



    Брянская область






    Республика Башкортостан



    Владимирская область






    Республика Марий Эл



    Воронежская область






    Республика Мордовия



    Ивановская область






    Республика Татарстан



    Калужская область






    Удмуртская Республика



    Костромская область






    Чувашская Республика



    Курская область






    Кировская область



    Липецкая область






    Нижегородская область



    Московская область






    Оренбургская область



    Орловская область






    Пензенская область



    Рязанская область






    Пермская область



    Смоленская область






    Самарская область



    Тамбовская область






    Саратовская область



    Тверская область






    Ульяновская область



    Тульская область






    Курганская область



    Ярославская область






    Свердловская область



    Москва






    Тюменская область



    Республика Карелия






    Челябинская область



    Республика Коми






    Республика Алтай



    Архангельская область






    Республика Бурятия



    Вологодская область






    Республика Тыва



    Калининградская область






    Республика Хакасия



    Ленинградская область






    Алтайский край



    Мурманская область






    Красноярский край



    Новгородская область






    Иркутская область



    Псковская область






    Кемеровская область



    Санкт-Петербург






    Новосибирская область



    Республика Адыгея






    Омская область



    Республика Дагестан






    Томская область



    Республика Ингушетия






    Читинская область



    Кабардино-Балкарская Республика






    Республика Саха (Якутия)



    Республика Калмыкия






    Приморский край



    Карачаево-черкесская Республика






    Хабаровский край



    Республика Северная Осетия – Алания






    Амурская область



    Краснодарский край






    Камчатская область



    Ставропольский край






    Магаданская область



    Астраханская область






    Сахалинская область



    Волгоградская область










    Из исходной таблицы удалим столбец с названиями регионов, далее произведём над ней следующие преобразования.

    В таблицу с данными введём следующие обозначения переменных:

    x - кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам, млн руб.

    y - основные фонды в экономике (по полной балансовой (учетной) стоимости; на конец года), млн руб.

    Получим следующую таблицу, которую сохраним в текстовом файле data.txt в рабочей папке среды R:





    x

    y



    342,5

    145787



    275,4

    113415



    112,1

    129272



    274,5

    211898



    141,5

    84550



    129

    105783



    50,7

    83716



    401,3

    124453



    125,3

    129114



    5814,2

    659675



    58

    64366



    456,5

    110379



    192,2

    125247



    82,3

    111642



    319,1

    175833



    638,3

    156543



    727,9

    185442



    811856,3

    1384509



    41

    90800



    654,1

    201201



    103,3

    198340



    2411,2

    136362



    784,4

    75707



    244,7

    223013



    490,7

    144824



    221,8

    65864



    163,5

    74695



    41581

    412221



    60,3

    47056



    469,5

    134133



    10,5

    5139



    81,7

    48059



    46,4

    21677



    96,4

    32493



    356,5

    43296



    2463,5

    479549



    278,6

    205580



    321,9

    106980



    782,9

    206817



    19140

    299151



    14330,5

    407013



    52,2

    95617



    304,8

    70373



    9739,4

    477390



    934,9

    180173



    137,9

    113170



    311

    148026



    4833,2

    294133



    502,8

    234022



    383,5

    123940



    1300,9

    302898



    7051,4

    482883



    1832,9

    268971



    1448

    125943



    75,5

    93139



    10187,3

    580302



    9666,7

    1083475



    4805,5

    404407



    29,8

    15278



    817,4

    91700



    14,8

    14652



    158,8

    61889



    405,2

    191413



    1320,6

    383673



    1053,6

    339505



    1435,1

    313617



    1682,8

    302292



    1774,7

    190292



    338

    149647



    57

    105245



    408

    220865



    1439

    166236



    1933,3

    248304



    108,5

    141651



    661,6

    62198



    236,8

    45747



    247,9

    97652

    Считываем данные из файла data.txt:

    data= read.table("data.txt", head=TRUE)

    attach(data)

    Поле корреляции (коррелограмму, диаграмму рассеяния) строится автоматически с помощью команды plot(x,y):



    В правом верхнем углу мы видим точку, значительно отклоняющуюся от основной группы. Она соответствует данным по региону 18, то есть по Москве. Эту точку следует убрать.

    Получается следующее поле корреляции:



    Убираем ещё две точки (по Санкт-Петербургу и Тюменской области).

    Построенное поле корреляции с довольно отчётливой тенденцией:



    Ясно, что зависимость будет скорее квадратичной, но ни в коем случае не показательной и не гиперболической (эти зависимости являются либо строго возрастающими, либо строго убывающими).

    Ищем зависимость в виде



    lm(formula = y x + I(x^2))

    Residuals:

    Min 1Q Median 3Q Max

    -150565 -51166 -5482 32731 189131

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 97020 10420 9.313 6.21e-14 ***

    x 89050 7.588 1.735 2e-16 ***

    I(x^2) -0.0043 0.00486 -8.778 6. 04e-13 ***

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 73050 on 71 degrees of freedom

    Multiple R-squared: 0.7165, Adjusted R-squared: 0.7085

    F-statistic: 89.7 on 2 and 71 DF, p-value: < 2.2e-16

    Все коэффициенты a, b и c значимы по критерию Стьюдента на уровне p-value < 0.001; это показывают *** в столбце Coefficients) и сами значения p-value Pr(>|t|): для коэффициента a, для коэффициента b и для коэффициента с.

    Уравнение квадратичной регрессии

    Среднеквадратичное отклонение (Adjusted R-squared) для данной модели составляет , то есть качество модели достаточно высокое. Значимость среднеквадратичного отклонения подтверждает и высокое значение F-статистики Фишера, равное 89.7, и общий уровень значимости (определяемый по этой статистике): p-value: , что много меньше обычно достаточного на практике значения 0.001.

    Рассмотрим для сравнения остальные модели для нашей задачи.

    Линейная модель :

    > summary(lm(yx))

    Call:

    lm(formula = y x)
    Residuals:

    Min 1Q Median 3Q Max

    -345935 -66123 -16070 56229 368348

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 1.370e+05 1.344e+04 10.194 1.30e-15 ***

    x 2.655e+01 3.763e+00 7.055 8.75e-10 ***

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 104800 on 72 degrees of freedom

    Multiple R-squared: 0.4087, Adjusted R-squared: 0.4005

    F-statistic: 49.77 on 1 and 72 DF, p-value: 8.752e-10

    Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели неудовлетворительное.

    Экспоненциальная модель

    > summary(lm(log(y)x))

    Call:

    lm(formula = log(y) x)
    Residuals:

    Min 1Q Median 3Q Max

    -3.0420 -0.2631 0.1443 0.5378 1.1769

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 1.159e+01 9.841e-02 117.725 < 2e-16 ***

    x 1.293e-04 2.756e-05 4.691 1.26e-05 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    Residual standard error: 0.7672 on 72 degrees of freedom

    Multiple R-squared: 0.2341, Adjusted R-squared: 0.2235

    F-statistic: 22.01 on 1 and 72 DF, p-value: 1.259e-05
    Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели неудовлетворительное.

    Степенная модель

    > summary(lm(log(y)log(x)))

    Call:

    lm(formula = log(y) log(x))

    Residuals:

    Min 1Q Median 3Q Max

    -1.65134 -0.29374 0.06559 0.39976 1.01151

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 9.17748 0.23953 38.31 <2e-16 ***

    log(x) 0.43314 0.03853 11.24 <2e-16 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 0.5281 on 72 degrees of freedom

    Multiple R-squared: 0.6371, Adjusted R-squared: 0.632

    F-statistic: 126.4 on 1 and 72 DF, p-value: < 2.2e-16
    Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели удовлетворительное, но хуже квадратичной модели.

    Гиперболическая модель

    > t=1/x

    > summary(lm(yt))

    Call:

    lm(formula = y t)
    Residuals:

    Min 1Q Median 3Q Max

    -151500 -76329 -42345 35332 454574

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 205773.84 16239.52 12.671 < 2e-16 ***

    t -39.14 10.17 -3.848 0.000255 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 124100 on 72 degrees of freedom

    Multiple R-squared: 0.1706, Adjusted R-squared: 0.159

    F-statistic: 14.81 on 1 and 72 DF, p-value: 0.0002553
    Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели очень плохое.
    1   2   3   4   5   6   7


    написать администратору сайта