Главная страница
Навигация по странице:

  • Линейная модель

  • Экспоненциальная модель

  • Степенная модель

  • Гиперболическая модель

  • Методическое пособие язык программирования к ф. м н., доцент Мусин Наиль Минбариевич Новомосковск 2015 содержание mind Map 3 Начало работы 5


    Скачать 2.89 Mb.
    НазваниеМетодическое пособие язык программирования к ф. м н., доцент Мусин Наиль Минбариевич Новомосковск 2015 содержание mind Map 3 Начало работы 5
    Дата04.05.2023
    Размер2.89 Mb.
    Формат файлаdoc
    Имя файлаyazyk-programmirovaniya-r.doc
    ТипМетодическое пособие
    #1107449
    страница7 из 7
    1   2   3   4   5   6   7

    Временны́е ряды


    Исследуем динамику числа предприятий в Российской Федерации в 1995–2003 гг. на примере данных о Дальневосточном федеральном округе.

    ЧИСЛО ПРЕДПРИЯТИЙ И ОРГАНИЗАЦИЙ































    (на конец года)































     

    1990

    1995

    1996

    1997

    1998

    1999

    2000

    2001

    2002

    2003

    ДФО

    16804

    114026

    124008

    129957

    133223

    138165

    143186

    149239

    157128

    167184

    Республика Саха
    (Якутия)

    2820

    16536

    17455

    17999

    17978

    18304

    19341

    20260

    21409

    23914

    Пpимоpский кpай

    3776

    33521

    36318

    37826

    38259

    39764

    41144

    44404

    47822

    50502




    Хабаpовский кpай

    3386

    20799

    23036

    25030

    26386

    28310

    29480

    30957

    33355

    36396

    Амуpская область

    2575

    12272

    13272

    13499

    13453

    13674

    14033

    14330

    14674

    15124

    Камчатская область

    1082

    8114

    8916

    9534

    10131

    10767

    11460

    12177

    12192

    12672

    Магаданская
    область

    1548

    7465

    8019

    8379

    8686

    9030

    9390

    9738

    9967

    10149

    Сахалинская
    область

    1617

    11448

    12895

    13675

    14231

    13968

    13801

    12689

    12862

    13150

    Еврейская АО

    ...

    2745

    2881

    2732

    2750

    2870

    2973

    3077

    3244

    3499

    Чукотский АО

    ...

    1126

    1216

    1283

    1349

    1478

    1564

    1607

    1603

    1778

    Для удобства обработки данных выделим список территориальных единиц отдельно и далее будем работать с их номерами по списку.

    Республика Саха (Якутия)



    Пpимоpский кpай



    Хабаpовский кpай



    Амуpская область



    Камчатская область



    Магаданская область



    Сахалинская область



    Еврейская автономная область



    Чукотский автономный округ









    1995

    1996

    1997

    1998

    1999

    2000

    2001

    2002

    2003



    16536

    17455

    17999

    17978

    18304

    19341

    20260

    21409

    23914



    33521

    36318

    37826

    38259

    39764

    41144

    44404

    47822

    50502



    20799

    23036

    25030

    26386

    28310

    29480

    30957

    33355

    36396



    12272

    13272

    13499

    13453

    13674

    14033

    14330

    14674

    15124



    8114

    8916

    9534

    10131

    10767

    11460

    12177

    12192

    12672



    7465

    8019

    8379

    8686

    9030

    9390

    9738

    9967

    10149



    11448

    12895

    13675

    14231

    13968

    13801

    12689

    12862

    13150



    2745

    2881

    2732

    2750

    2870

    2973

    3077

    3244

    3499



    1126

    1216

    1283

    1349

    1478

    1564

    1607

    1603

    1778


    Создадим матрицу процентов:

    > proc = matrix(nrow =9, ncol = 9)

    >for (k in 1:9){proc[,k]=data[,k]/sum(data[,k])*100}

    >proc=round(proc,2)

    > proc
    [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]

    [1,] 14.50 14.08 13.85 13.49 13.25 13.51 13.58 13.63 14.30

    [2,] 29.40 29.29 29.11 28.72 28.78 28.73 29.75 30.44 30.21

    [3,] 18.24 18.58 19.26 19.81 20.49 20.59 20.74 21.23 21.77

    [4,] 10.76 10.70 10.39 10.10 9.90 9.80 9.60 9.34 9.05

    [5,] 7.12 7.19 7.34 7.60 7.79 8.00 8.16 7.76 7.58

    [6,] 6.55 6.47 6.45 6.52 6.54 6.56 6.53 6.34 6.07

    [7,] 10.04 10.40 10.52 10.68 10.11 9.64 8.50 8.19 7.87

    [8,] 2.41 2.32 2.10 2.06 2.08 2.08 2.06 2.06 2.09

    [9,] 0.99 0.98 0.99 1.01 1.07 1.09 1.08 1.02 1.06





    7.25

    7.04

    6.92

    6.75

    6.62

    6.75

    6.79

    6.81

    7.15



    14.70

    14.64

    14.55

    14.36

    14.39

    14.37

    14.88

    15.22

    15.10



    9.12

    9.29

    9.63

    9.90

    10.24

    10.29

    10.37

    10.61

    10.89



    5.38

    5.35

    5.19

    5.05

    4.95

    4.90

    4.80

    4.67

    4.52



    3.56

    3.59

    3.67

    3.80

    3.90

    4.00

    4.08

    3.88

    3.79



    3.27

    3.23

    3.22

    3.26

    3.27

    3.28

    3.26

    3.17

    3.04



    5.02

    5.20

    5.26

    5.34

    5.05

    4.82

    4.25

    4.09

    3.93



    1.20

    1.16

    1.05

    1.03

    1.04

    1.04

    1.03

    1.03

    1.05



    0.49

    0.49

    0.49

    0.51

    0.53

    0.55

    0.54

    0.51

    0.53



    Формируем матрицу процентов для региона в целом:
    > years=c(1995:2003)

    > region=c(1:9)

    > for (k in 1:9){region[k]=sum(data[,k])/sum(data)*100}

    > region

    [1] 9.08 9.87 10.35 10.61 11.00 11.40 11.88 12.51 13.31

    > plot(years, region)


    Доля малых предприятий в Дальневосточном федеральном округе монотонно увеличивается.

    Рассмотрим возможные модели для нашей задачи.

    Линейная модель :

    > summary(lm(regionyears))

    Call:

    lm(formula = region years)

    Residuals:

    Min 1Q Median 3Q Max

    -0.19039 -0.11956 -0.03672 0.19228 0.28511

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) -944.74294 49.40579 -19.12 2.66e-07 ***

    years 0.47817 0.02472 19.35 2.46e-07 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 0.1914 on 7 degrees of freedom

    Multiple R-squared: 0.9816, Adjusted R-squared: 0.979

    F-statistic: 374.3 on 1 and 7 DF, p-value: 2.457e-07

    Мера определенности (Multiple R-squared) для линейной модели составляет , качество модели высокое.

    Уравнение имеет вид

    region = -944.74 + 0.47817∙years

    Экспоненциальная модель

    > summary(lm(log(region)years))

    Call:

    lm(formula = log(region) years)

    Residuals:

    Min 1Q Median 3Q Max

    -0.023117 -0.011279 -0.003857 0.014203 0.021515

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) -83.835347 4.185390 -20.03 1.93e-07 ***

    years 0.043140 0.002094 20.60 1.59e-07 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 0.01622 on 7 degrees of freedom

    Multiple R-squared: 0.9838, Adjusted R-squared: 0.9815

    F-statistic: 424.5 on 1 and 7 DF, p-value: 1.592e-07
    Мера определенности (Multiple R-squared) для линейной модели составляет , качество модели высокое.

    Уравнение

    Степенная модель

    > summary(lm(log(region)log(years)))

    Call:

    lm(formula = log(region) log(years))

    Residuals:

    Min 1Q Median 3Q Max

    -0.023016 -0.011340 -0.003928 0.014304 0.021486

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) -653.034 31.810 -20.53 1.63e-07 ***

    log(years) 86.237 4.185 20.61 1.59e-07 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    Residual standard error: 0.01622 on 7 degrees of freedom

    Multiple R-squared: 0.9838, Adjusted R-squared: 0.9815

    F-statistic: 424.6 on 1 and 7 DF, p-value: 1.592e-07
    Мера определенности (Multiple R-squared) для линейной модели составляет , качество модели высокое.

    Уравнение

    Гиперболическая модель

    Call:

    lm(formula = region t)

    Residuals:

    Min 1Q Median 3Q Max

    -0.19171 -0.11745 -0.03606 0.19274 0.28747

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 9.669e+02 4.958e+01 19.50 2.33e-07 ***

    t -1.911e+06 9.912e+04 -19.28 2.52e-07 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 0.1921 on 7 degrees of freedom

    Multiple R-squared: 0.9815, Adjusted R-squared: 0.9789

    F-statistic: 371.6 on 1 and 7 DF, p-value: 2.52e-07
    Среднеквадратичное отклонение (Adjusted R-squared) для линейной модели составляет , качество модели высокое.

    Уравнение
    Все модели имеют высокое качество.

    Наибольшее значение меры определенности имеет экспоненциальная зависимость, что дает основание рекомендовать именно ее для задач прогнозирования.

    Заключение


    В пособии рассмотрены конструкции самого́ языка R, которые были отобраны в результате практической обработки большого количества данных и необходимость в которых выявляется в первую очередь.

    Как возникает необходимость в других конструкциях, продемонстрирована в пособии на примере решения СЛАУ и построении моделей в эконометрике.

    Язык R можно с успехом применять в дальнейшем при изучении таких дисциплин, как численные методы, уравнения математической физики.

    Особый интерес представляет построение баз данных. Эта тема не является предметом данного пособия, но особая эффективность и изящество конструкций языка R может быть продемонстрирована в курсах, посвященных СУБД. Первоначальные сведения об этом можно найти в [1].

    Использованные источники





    1. А.Б.Шипунов. Е.М. Балдин. П.А. Волкова. А.И. Коробейников. С.А. Назарова. С.В. Петров. В.Г. Суфиянов. – Наглядная статистика. Используем  ! – М.: ДМК-Пресс. 2014.

    2. Дьяконов А.Г. Справочник по базовым командам языка R. - http://alexanderdyakonov.narod.ru/upR.pdf

    Скачано с www.znanio.ru



    1   2   3   4   5   6   7


    написать администратору сайта