Главная страница
Навигация по странице:

  • Проверка исходных данных на мультиколлинеарность

  • Построение регрессионной модели и ее интерпретация I

  • Множественная регрессия. лабораторная работа множ. регр. Анализ в ms excel 2 вариант Голосова Дарья бин31оз Результативный признак Y2 фактическая стоимость введенной в отчетном год


    Скачать 94.14 Kb.
    НазваниеАнализ в ms excel 2 вариант Голосова Дарья бин31оз Результативный признак Y2 фактическая стоимость введенной в отчетном год
    АнкорМножественная регрессия
    Дата17.05.2022
    Размер94.14 Kb.
    Формат файлаdocx
    Имя файлалабораторная работа множ. регр.docx
    ТипОтчет
    #535376

    МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ В MS EXCEL

    2 вариант

    Выполнила: Голосова Дарья БИН-31оз

    Результативный признак:

    Y2 - фактическая стоимость введенной в отчетном году жилой площади для застройщика, тыс. руб.;
    Факторные признаки:
    Y1 - ввод общей площади жилых домов, кв.м.;

    Y3 - общая стоимость реализуемых инвестиционных проектов, тыс. руб.;

    Y4 - стоимость работ, выполненных с начала реализации инветиционных проектов, тыс. руб.;

    X5 - ввод квартир, ед.;

    Х6 - общая площадь жилых домов в незавершенном строительстве, кв. м.;
    Исследуем на основе множественной регрессионной модели зависимость результативного признака от рассматриваемых факторных признаков.
    Исходные данные:

    Y2

    Y1

    Y3

    Y4

    X5

    X6

    1135,0

    347,0

    18558,0

    8314,0

    8

    7933,0

    2135,0

    379,0

    17472,0

    6123,0

    6

    6328,0

    5100,0

    1658,0

    52000,0

    34653,0

    32

    11350,0

    2387,0

    838,0

    56860,0

    26098,7

    17

    14215,0

    7048,0

    1134,0

    39697,0

    13649,0

    9

    9967,0

    4300,0

    1018,0

    45000,0

    16130,0

    14

    3325,0

    9936,0

    3700,0

    18215,0

    2517,0

    68

    3644,0

    5870,0

    1342,0

    29482,4

    3225,5

    15

    5171,0

    11551,0

    3775,0

    16801,0

    11184,0

    63

    3208,0

    1357,0

    460,0

    12647,0

    6281,0

    5

    8475,0

    4044,0

    1311,0

    13001,0

    11425,0

    27

    9337,0

    3709,0

    2231,0

    42013,0

    25132,0

    27

    11895,0

    4820,0

    2028,0

    40000,0

    23968,0

    19

    9915,0

    6997,0

    4166,0

    22000,0

    834,0

    40

    7193,0

    3465,0

    1415,0

    39481,0

    12426,0

    22

    10907,6

    3786,0

    1488,4

    39972,0

    27852,0

    26

    11903,0

    7602,0

    4532,0

    25781,0

    19711,0

    51

    10985,0

    6975,0

    3767,0

    24000,0

    23014,0

    51

    9998,0

    3755,0

    1721,0

    19570,0

    6978,0

    28

    14380,0

    6984,0

    2398,0

    18317,0

    8097,0

    38

    8492,0

    10975,0

    4468,0

    10975,0

    10975,0

    45

    8572,0

    10022,0

    3315,0

    50686,0

    44526,0

    60

    7000,0

    7147,0

    2107,0

    53960,0

    10847,0

    28

    13490,0

    8902,0

    2302,0

    35065,0

    20297,0

    43

    4700,0

    5434,0

    2317,0

    27858,0

    25311,0

    40

    7256,0

    6908,0

    3147,0

    29719,0

    28900,0

    58

    6478,0

    5982,0

    2694,0

    32301,0

    21305,0

    55

    5970,0

    5371,0

    1779,0

    30475,0

    17824,0

    22

    4081,0

    1166,0

    377,0

    21938,0

    19359,0

    2

    6558,0

    14575,0

    5251,0

    28342,0

    4228,7

    78

    5814,0

    28137,0

    6414,0

    92193,0

    26075,0

    109

    16730,0

    14856,0

    3446,0

    51800,2

    10725,0

    68

    13634,0

    16277,0

    4803,0

    22107,0

    18941,0

    71

    9348,0

    27638,0

    7367,0

    88554,0

    17662,0

    110

    23553,0

    23628,0

    4130,0

    49705,0

    16431,0

    65

    25790,0

    29316,0

    4187,0

    50800,0

    17052,0

    63

    6350,0

    76758,0

    10343,0

    201524,0

    46681,0

    140

    26867,0

    12800,0

    2486,0

    36000,0

    6530,0

    30

    5325,0

    24245,0

    3174,0

    43554,0

    31789,0

    83

    8333,0

    20000,0

    3203,0

    34402,0

    20000,0

    45

    2140,0

    23454,0

    3547,0

    75790,0

    20908,0

    61

    13333,0

    13677,0

    3037,0

    33768,0

    23768,0

    47

    4625,0

    17166,0

    5044,0

    26650,0

    21323,0

    48

    1925,0

    16101,0

    2984,0

    13825,0

    10168,0

    48

    1728,0

    19006,0

    6300,0

    184240,0

    12756,0

    120

    28039,0

    19239,0

    4117,0

    204400,0

    70188,0

    47

    32400,0

    17143,0

    4973,0

    196920,0

    166929,0

    92

    33498,0

    35695,0

    7169,0

    150000,0

    52674,0

    82

    14221,0

    13251,0

    1596,0

    20302,0

    7093,0

    14

    6581,0

    13540,0

    2055,0

    75348,0

    35620,0

    25

    10468,0

    26533,0

    5840,0

    58388,0

    10249,0

    70

    5383,0

    30911,0

    7976,0

    33403,0

    10421,0

    108

    6073,0

    22854,0

    6288,0

    149345,0

    113156,0

    66

    30346,0

    11426,9

    2759,7

    79700,0

    4050,0

    53

    19181,0

    23828,0

    7206,0

    43521,0

    14118,0

    117

    9685,0

    15010,0

    3019,0

    52416,0

    14006,0

    32

    8160,0

    26200,0

    6075,0

    27000,0

    11082,0

    110

    3900,0


    Проверка исходных данных на мультиколлинеарность
    Прежде чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого построим матрицу парных коэффициентов корреляции между факторными признаками.
    Получим матрицу парных коэффициентов корреляции в следующем виде:

    Таблица 1


    Проанализируем рассчитанные парные коэффициенты корреляции между факторными признаками. Можно заметить, что между признаками Y1 и Х5, Y3 и X6 существует достаточно тесная линейная зависимость, т.к. коэффициент корреляции между ними составляет 0,9226>0,7 и 0,8429>0,7 . Следовательно, можно сделать вывод о наличии мультиколлинеарности в объясняющих переменных. Для ее устранения необходимо исключить из анализа одну из каждой пары переменных Y1 или Х5, и Y3 или X6, обычно ту, которая имеет наименьшую связь с результативным признаком Y. Наименее тесно с Y связаны признаки X5 и X6. Следовательно, из таблицы первоначальных данных удаляем столбцы X5 и X6.
    Далее строим новую корреляционную матрицу:

    Таблица 2


    Анализируем новые коэффициенты корреляции. Поскольку значения парных коэффициентов корреляции между объясняющими переменными Y1, Y3, Y4 не превышает по модулю 0,7, следовательно можем перейти к построению модели регрессии.
    Построение регрессионной модели и ее интерпретация
    I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА:



    Оценка уравнения регрессии имеет вид:

    Y=-2586,34+4,09Y1+0,082Y3-0,081Y4
    Далее необходимо проверить значимость полученных коэффициентов регрессии и уравнения регрессии в целом.. Проверку осуществим на уровне значимости α = 0,05, для чего проверим гипотезу о незначимости построенного уравнения регрессии. Рассчитаем критическое значение F-статистики с помощью встроенной статистической функции FРАСПОБР для уровня значимости α = 0,05 и числа степеней свободы числителя ν1 = k = 3 и знаменателя ν2 = n – k – 1 = 57-3-1=53. Получаем Fкр = 2,779114345.

    Значение Fнабл=54,82796558 указывается в таблице Дисперсионный анализ в столбце F.

    Т.к. наблюдаемое значение F-статистики превосходит ее критическое значение Fнабл = 54,82796558 > Fкр = 2,779114345, то гипотеза о незначимости построенного уравнения регрессии отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора коэффициентов регрессии b значимо отличается от нуля.
    Проверим далее значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу H0: b1 = b3 = b4 = 0.

    Наблюдаемые значения t-статистик tнабл указаны в нижней части таблицы результатов в столбце t-статистика. Откуда видно, что tb1 =8,8731, tb3 = 2,9794, tb4 = -1,8362.
    Расчетные значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α и числа степеней свободы ν = n – k – 1. Для расчета tкр используем встроенную статистическую функцию MS Excel СТЬЮДРАСПОБР, введя в открывшееся меню функции вероятность α = 0,05 и число степеней свободы ν = n – k – 1 = 57 – 3 – 1 = 53. Получаем tкр = 2,0057.

    Сравнив расчетные значения t-статистик с критическим, получаем, что для b1 и b3 расчетные (наблюдаемые) значения по модулю превосходят критическое:
    tb1=8,8731>tкр=2,0057, tb3=2,9794>tкр=2,0057
    Следовательно гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
    tb4=|-1,836217062|
    Следовательно гипотеза H0 не отвергается, т.е. параметр b4 незначим.
    Как видно из таблицы для коэффициента b4 p-значение превышает критический уровень в 0,05 и доверительный интервал включает ноль, т.е. по всем проверочным критериям этот коэффициент считается незначимым.

    Таким образом удаляем столбец Y4.
    II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА:



    Оценка уравнения регрессии имеет вид:

    Y=-3139,84+4,23Y1+0,047Y3
    Проверим на уровне α = 0,05 значимость уравнения регрессии. Для этого в результатах дисперсионного анализ находим наблюдаемое значение F-статистики: Fнабл = 77,1669.

    Рассчитаем критическое значение F-статистики с помощью встроенной статистической функции FРАСПОБР для уровня значимости α = 0,05 и числа степеней свободы числителя ν1 = k = 2 и знаменателя ν2 = n – k – 1 = 57 – 2 – 1 = 54. Получаем Fкр = 3,1682.

    Fнабл=77,167>Fкр=3,168, гипотеза о незначимости построенного уравнения регрессии отвергается с вероятности ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора коэффициентов регрессии b значимо отличается от нуля.
    Проверим далее значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу H0: b3 = b4 = 0.

    Наблюдаемые значения t-статистик tнабл указаны в нижней части таблицы результатов в столбце t-статистика. Откуда видно, что tb1 = 9,1206, tb3 = 2,3095.

    Расчетные значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α и числа степеней свободы ν = n – k – 1. Для расчета tкр используем встроенную статистическую функцию MS Excel СТЬЮДРАСПОБР, введя в открывшееся меню функции вероятность α = 0,05 и число степеней свободы ν = n – k – 1 = 57 – 2 – 1 = 54. Получаем tкр = 2,0049.
    tb1=9,1206>tкр=2,0049, tb3=2,3095>tкр=2,0049

    Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы
    Окончательная оценка уравнения регрессии:

    Y=-3139,84+4,23Y1+0,047Y3
    Из таблицы видно, что интервальные оценки для генеральных коэффициентов регрессии имеют вид:

    3,30281<5,1639, 0,00633<0,0889
    Интерпретация результатов:
    Из таблицы регрессионная статистика следует, что 74,08% вариации Y2-фактической стоимости введенной в отчетном году жилой площади для застройщика, объясняется вариацией ввода общей площади жилых домов (Y1) и общей стоимости реализуемых инвестиционных проектов (Y3). Оставшиеся 25,92% вариации Y объясняются вариацией прочих, неуточненных в модели и случайных факторов.

    Так как значение R2 близко к единице, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс.

    • Коэффициент регрессии при Y1 показывает, что при вводе бщей площади жилых домов на 1 кв.м. фактическая стоимость введенной в отчетном году жилой площади для застройщика увеличивается в среднем на 4233руб.

    • Коэффициент регрессии при Y3 показывает, что при увеличении общей стоимости реализуемых инвестиционных проектов на 1 тыс.руб. фактическая стоимость введенной в отчетном году жилой площади для застройщика увеличивается в среднем на 47руб.


    Сравнение исходных данных с предсказанными по уравнению регрессии:


    написать администратору сайта