Главная страница
Навигация по странице:

  • Исходные данные

  • Фонд заработной платы, (руб.)

  • Выводы

  • Эконометрика. №7395(Эконометрика). Задание


    Скачать 66.85 Kb.
    НазваниеЗадание
    АнкорЭконометрика
    Дата27.10.2020
    Размер66.85 Kb.
    Формат файлаdocx
    Имя файла№7395(Эконометрика).docx
    ТипДокументы
    #146082

    Задание

    Известны статистические данные по 36 строительным бригадам. Необходимо выяснить влияние различных факторов на величину накладных расходов в строительстве. Известно, что к накладным расходам относятся административно-хозяйственные, коммунальные расходы, дополнительная заработная плата и другие расходы. На качественном уровне выявлено, что фактический уровень накладных расходов оказался наиболее тесно связан со следующими факторами: объемом выполненных работ, численностью рабочих, занятых на строительно-монтажных работах, фондом заработной платы. Остальные факторы были признаны незначимыми. На основании имеющихся данных, необходимо при помощи использования функций Excel:

    1. Рассчитать параметры множественной линейной регрессии, проводя процедуру стандартного регрессионного исследования до получения удовлетворительной модели. Провести полный анализ полученного уравнения регрессионной связи.

    2. К числу рассчитываемых и анализируемых параметров относятся:

    а) коэффициенты регрессии (и их значимость);

    б) коэффициент корреляции (и его значимость);

    в) коэффициент детерминации;

    г) стандартные ошибки коэффициентов регрессии;

    д) доверительные интервалы для коэффициентов регрессии;

    е) величины общей, объясненной и остаточной дисперсии.

    2. На основании реальных и расчетных значений накладных расходов построить графики и сравнить их.

    Исходные данные



    Накладные расходы, (руб.)

    Объем работ, (куб. м.)

    Численность рабочих, (чел.)

    Фонд заработной платы, (руб.)

    1

    79949

    226

    5

    35115

    2

    125358

    360

    11

    38580

    3

    81469

    248

    7

    27953

    4

    57425

    135

    4

    18917

    5

    150553

    452

    10

    58030

    6

    111542

    306

    8

    42057

    7

    78841

    216

    6

    33895

    8

    104803

    259

    7

    40892

    9

    59876

    155

    6

    21407

    10

    123958

    334

    9

    51248

    11

    138340

    363

    10

    51106

    12

    102106

    292

    9

    34325

    13

    188352

    584

    14

    68394

    14

    157352

    466

    11

    58393

    15

    129227

    338

    12

    39612

    16

    170755

    501

    13

    72423

    17

    103794

    264

    9

    43263

    18

    56012

    141

    4

    18040

    19

    50595

    152

    5

    16622

    20

    73075

    205

    5

    26751

    21

    81645

    246

    6

    34503

    22

    65574

    178

    5

    25864

    23

    85281

    227

    8

    37026

    24

    100850

    312

    7

    40336

    25

    153282

    397

    11

    46487

    26

    73734

    204

    6

    29242

    27

    114042

    339

    8

    43027

    28

    66791

    196

    5

    20646

    29

    102282

    299

    9

    43076

    30

    82280

    252

    7

    30188

    31

    94302

    248

    7

    34911

    32

    68202

    194

    6

    32206

    33

    97786

    271

    6

    41208

    34

    62993

    206

    6

    24624

    35

    99282

    324

    8

    33518

    36

    80925

    243

    7

    36666


    Ход работы

    а) Находим параметры уравнения множественной регрессии вида средствами MS Excel. Выбираем «Данные» => «Анализ данных» => «Регрессия». В результате выполнения регрессионного анализа в пакете Excel получены оценкиb0, b1, b2 и b3 и их Р-значения:

     

    Коэффициенты

    P-Значение

    Y-пересечение

    486,7756271

    0,885145266

    X1

    182,309932

    1,0969E-05

    X2

    3227,064371

    0,002989917

    X3

    0,602617528

    0,007466745


    Следовательно, уравнение регрессии будет иметь вид:



    Данное уравнение записано без проверки значимости коэффициентов регрессии.

    Однако необходимо проверить, все ли из включенных в уравнение параметров действительно оказывают влияние на у.

    Для коэффициента b0 вероятность его не влияния на у равна 0,8851 (88,51%), что больше порогового значения в 5%, поэтому коэффициент b0 признается не значимым и должен быть удален из модели.

    Для коэффициента b1 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b1 признается значимым и оставляется в модели.

    Для коэффициента b2 вероятность его не влияния на у равна 0,00298 (0,3%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

    Для коэффициента b3 вероятность его не влияния на у равна 0,0075 (0,75%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

    Из модели будет исключена константа. После этого процедура регрессионного анализа проводится заново, для чего в строке «Входной интервал Х» задается те же 3 столбца данных и ставится флажок «Константа – ноль».

    По полученным результатам вновь оценивается значимость коэффициентов регрессии.
    На втором этапе полученные результаты могут иметь следующие значения:

     

    Коэффициенты

    P-Значение

    Y-пересечение

    0

    #Н/Д

    X1

    181,1168426

    5,69209E-06

    X2

    3288,403312

    0,000868729

    X3

    0,61082418

    0,004488129


    Для коэффициента b1 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b1 признается значимым и оставляется в модели.

    Для коэффициента b2 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b2 признается значимым и оставляется в модели.

    Для коэффициента b3 вероятность его не влияния на у равна 0,0045 (0,45%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

    Окончательное уравнение регрессии запишется в виде:

    .

    Регрессионная статистика окончательного уравнения:

    Регрессионная статистика

    Множественный R

    0,998571287

    R-квадрат

    0,997144616

    Нормированный R-квадрат

    0,966668532

    Стандартная ошибка

    5855,715058

    Наблюдения

    36



    б) Коэффициент корреляции равен , то говорит об очень высокой связи.

    При выполнении регрессионного анализа в пакете Excel вероятность выполнения нулевой гипотезы для коэффициента корреляции выводится как «Значимость F». Если Значимость F меньше 0,05, то количество наблюдений считается достаточным для признания полученных результатов регрессионного анализа достоверными. Если Значимость F меньше 0,05, то коэффициент корреляции незначим, и количество наблюдений необходимо увеличить.

    В результате выполнения регрессионного анализа в пакете Excel получено значение R и Значимости F:

    Множественный R – 0,998571

    Значимость F

    Вероятность незначимости (недостоверности) коэффициента корреляции очень низкая (близка к нулю), значит, исследуется достаточное, количество наблюдений недостаточно.

    в) При выполнении регрессионного анализа в Excel коэффициент детерминации выводится в таблице «Вывод итогов» как величина R-квадрат.

    Коэффициент детерминации равен . Это обозначает, что на 99,71% вариация накладных расходов обусловлена объемом работ, влияние прочих факторов составляет всего 0,29%.

    г) Стандартная ошибка коэффициента регрессии выводится в регрессионной статистике и равна .

    д) доверительные интервалы для коэффициентов регрессии.

    При выполнении регрессионного анализа в пакете Excel доверительные интервалы автоматически выводятся (наряду с другими результатами) для 95-%-го уровня надежности.

    В результате выполнения регрессионного анализа в пакете Excel получена оценка b1, b2 и b3и их доверительные интервалы:




    Коэффициенты

    Нижние 95%

    Верхние 95%

    b1

    181,1168426

    112,8584

    249,3752

    b2

    3288,403312

    1461,378

    5115,429

    b3

    0,61082418

    0,203383

    1,018265


    Значит:



    .



    е) Таблица дисперсионного анализа имеет вид:

    Дисперсионный анализ













     

    df

    SS

    MS

    F

    Значимость F

    Регрессия

    3

    3,95155E+11

    1,31718E+11

    3841,37107

    5,51E-41

    Остаток

    33

    1131550162

    34289398,83







    Итого

    36

    3,96286E+11

     

     

     


    Левая часть (TSS) – общая сумма квадратов отклонений зависимой переменной от ее среднего значения, т.е. общая дисперсия ряда наблюдений. Она характеризует общий разброс зависимой переменной.

    Дисперсия y, объясняемая линией регрессии (RSS), измеряется суммой квадратов отклонений между выровненными значениями y и их средним значением.

    Дисперсию, которую нельзя объяснить с помощью регрессии, называют оста- точной (ESS). Она характеризует разброс значений зависимой переменной, которые не смогли быть объяснены регрессией, т.е. разброс отклонений фактических значений от выровненных.

    Если средние значения случайной величины, вычисленные по отдельным выборкам одинаковы, то оценки факторной и остаточной дисперсий являются несмещенными оценками генеральной дисперсии и различаются несущественно.

    Тогда сопоставление оценок этих дисперсий по критерию Фишера должно показать, что нулевую гипотезу о равенстве факторной и остаточной дисперсий отвергнуть нет оснований.

    Оценка факторной дисперсии больше оценки остаточной дисперсии, поэтому можно сразу утверждать не справедливость гипотезы о равенстве математических ожиданий по слоям выборки.

    Иначе говоря, в данном случае факторный признак оказывает существенное влияния на результативный.

    Выводы:

    Регрессионная модель считается качественной, если

    1) связь между переменными модели тесная (R0,7), в нашем случае R= 0,99857;

    2) в уравнении связи присутствуют лишь значимые факторы (все Р-значения меньше 0,05) в нашем случае Р-значения близко к нулю;

    3) наблюдений для достоверных выводов достаточно (Значимость F меньше 0,05), в нашем случае значение F также близко к нулю.

    На основании того, что эти условия полностью соблюдаются, качество полученной модели является высоким.

    2. На основании реальных и расчетных значений накладных расходов построим графики.






    Из графиков видно, что фактические и расчетные значения ненамного отклоняются друг от друга, что говорит о правильности расчетов.


    написать администратору сайта