Эконометрика. №7395(Эконометрика). Задание
![]()
|
Задание Известны статистические данные по 36 строительным бригадам. Необходимо выяснить влияние различных факторов на величину накладных расходов в строительстве. Известно, что к накладным расходам относятся административно-хозяйственные, коммунальные расходы, дополнительная заработная плата и другие расходы. На качественном уровне выявлено, что фактический уровень накладных расходов оказался наиболее тесно связан со следующими факторами: объемом выполненных работ, численностью рабочих, занятых на строительно-монтажных работах, фондом заработной платы. Остальные факторы были признаны незначимыми. На основании имеющихся данных, необходимо при помощи использования функций Excel: 1. Рассчитать параметры множественной линейной регрессии, проводя процедуру стандартного регрессионного исследования до получения удовлетворительной модели. Провести полный анализ полученного уравнения регрессионной связи. 2. К числу рассчитываемых и анализируемых параметров относятся: а) коэффициенты регрессии (и их значимость); б) коэффициент корреляции (и его значимость); в) коэффициент детерминации; г) стандартные ошибки коэффициентов регрессии; д) доверительные интервалы для коэффициентов регрессии; е) величины общей, объясненной и остаточной дисперсии. 2. На основании реальных и расчетных значений накладных расходов построить графики и сравнить их. Исходные данные
Ход работы а) Находим параметры уравнения множественной регрессии вида ![]()
Следовательно, уравнение регрессии будет иметь вид: ![]() Данное уравнение записано без проверки значимости коэффициентов регрессии. Однако необходимо проверить, все ли из включенных в уравнение параметров действительно оказывают влияние на у. Для коэффициента b0 вероятность его не влияния на у равна 0,8851 (88,51%), что больше порогового значения в 5%, поэтому коэффициент b0 признается не значимым и должен быть удален из модели. Для коэффициента b1 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b1 признается значимым и оставляется в модели. Для коэффициента b2 вероятность его не влияния на у равна 0,00298 (0,3%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели. Для коэффициента b3 вероятность его не влияния на у равна 0,0075 (0,75%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели. Из модели будет исключена константа. После этого процедура регрессионного анализа проводится заново, для чего в строке «Входной интервал Х» задается те же 3 столбца данных и ставится флажок «Константа – ноль». По полученным результатам вновь оценивается значимость коэффициентов регрессии. На втором этапе полученные результаты могут иметь следующие значения:
Для коэффициента b1 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b1 признается значимым и оставляется в модели. Для коэффициента b2 вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b2 признается значимым и оставляется в модели. Для коэффициента b3 вероятность его не влияния на у равна 0,0045 (0,45%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели. Окончательное уравнение регрессии запишется в виде: ![]() Регрессионная статистика окончательного уравнения:
б) Коэффициент корреляции равен ![]() При выполнении регрессионного анализа в пакете Excel вероятность выполнения нулевой гипотезы для коэффициента корреляции выводится как «Значимость F». Если Значимость F меньше 0,05, то количество наблюдений считается достаточным для признания полученных результатов регрессионного анализа достоверными. Если Значимость F меньше 0,05, то коэффициент корреляции незначим, и количество наблюдений необходимо увеличить. В результате выполнения регрессионного анализа в пакете Excel получено значение R и Значимости F: Множественный R – 0,998571 Значимость F – ![]() Вероятность незначимости (недостоверности) коэффициента корреляции очень низкая (близка к нулю), значит, исследуется достаточное, количество наблюдений недостаточно. в) При выполнении регрессионного анализа в Excel коэффициент детерминации выводится в таблице «Вывод итогов» как величина R-квадрат. Коэффициент детерминации равен ![]() г) Стандартная ошибка коэффициента регрессии выводится в регрессионной статистике и равна ![]() д) доверительные интервалы для коэффициентов регрессии. При выполнении регрессионного анализа в пакете Excel доверительные интервалы автоматически выводятся (наряду с другими результатами) для 95-%-го уровня надежности. В результате выполнения регрессионного анализа в пакете Excel получена оценка b1, b2 и b3и их доверительные интервалы:
Значит: ![]() ![]() ![]() е) Таблица дисперсионного анализа имеет вид:
Левая часть (TSS) – общая сумма квадратов отклонений зависимой переменной от ее среднего значения, т.е. общая дисперсия ряда наблюдений. Она характеризует общий разброс зависимой переменной. ![]() Дисперсия y, объясняемая линией регрессии (RSS), измеряется суммой квадратов отклонений между выровненными значениями y и их средним значением. ![]() Дисперсию, которую нельзя объяснить с помощью регрессии, называют оста- точной (ESS). Она характеризует разброс значений зависимой переменной, которые не смогли быть объяснены регрессией, т.е. разброс отклонений фактических значений от выровненных. ![]() Если средние значения случайной величины, вычисленные по отдельным выборкам одинаковы, то оценки факторной и остаточной дисперсий являются несмещенными оценками генеральной дисперсии и различаются несущественно. Тогда сопоставление оценок этих дисперсий по критерию Фишера должно показать, что нулевую гипотезу о равенстве факторной и остаточной дисперсий отвергнуть нет оснований. Оценка факторной дисперсии больше оценки остаточной дисперсии, поэтому можно сразу утверждать не справедливость гипотезы о равенстве математических ожиданий по слоям выборки. Иначе говоря, в данном случае факторный признак оказывает существенное влияния на результативный. Выводы: Регрессионная модель считается качественной, если 1) связь между переменными модели тесная (R0,7), в нашем случае R= 0,99857; 2) в уравнении связи присутствуют лишь значимые факторы (все Р-значения меньше 0,05) в нашем случае Р-значения близко к нулю; 3) наблюдений для достоверных выводов достаточно (Значимость F меньше 0,05), в нашем случае значение F также близко к нулю. На основании того, что эти условия полностью соблюдаются, качество полученной модели является высоким. 2. На основании реальных и расчетных значений накладных расходов построим графики. ![]() ![]() ![]() Из графиков видно, что фактические и расчетные значения ненамного отклоняются друг от друга, что говорит о правильности расчетов. |