Эконометрика. №7395(Эконометрика). Задание

Название	Задание
Анкор	Эконометрика
Дата	27.10.2020
Размер	66.85 Kb.
Формат файла
Имя файла	№7395(Эконометрика).docx
Тип	Документы #146082

Задание

Известны статистические данные по 36 строительным бригадам. Необходимо выяснить влияние различных факторов на величину накладных расходов в строительстве. Известно, что к накладным расходам относятся административно-хозяйственные, коммунальные расходы, дополнительная заработная плата и другие расходы. На качественном уровне выявлено, что фактический уровень накладных расходов оказался наиболее тесно связан со следующими факторами: объемом выполненных работ, численностью рабочих, занятых на строительно-монтажных работах, фондом заработной платы. Остальные факторы были признаны незначимыми. На основании имеющихся данных, необходимо при помощи использования функций Excel:

1. Рассчитать параметры множественной линейной регрессии, проводя процедуру стандартного регрессионного исследования до получения удовлетворительной модели. Провести полный анализ полученного уравнения регрессионной связи.

2. К числу рассчитываемых и анализируемых параметров относятся:

а) коэффициенты регрессии (и их значимость);

б) коэффициент корреляции (и его значимость);

в) коэффициент детерминации;

г) стандартные ошибки коэффициентов регрессии;

д) доверительные интервалы для коэффициентов регрессии;

е) величины общей, объясненной и остаточной дисперсии.

2. На основании реальных и расчетных значений накладных расходов построить графики и сравнить их.

Исходные данные

№	Накладные расходы, (руб.)	Объем работ, (куб. м.)	Численность рабочих, (чел.)	Фонд заработной платы, (руб.)
1	79949	226	5	35115
2	125358	360	11	38580
3	81469	248	7	27953
4	57425	135	4	18917
5	150553	452	10	58030
6	111542	306	8	42057
7	78841	216	6	33895
8	104803	259	7	40892
9	59876	155	6	21407
10	123958	334	9	51248
11	138340	363	10	51106
12	102106	292	9	34325
13	188352	584	14	68394
14	157352	466	11	58393
15	129227	338	12	39612
16	170755	501	13	72423
17	103794	264	9	43263
18	56012	141	4	18040
19	50595	152	5	16622
20	73075	205	5	26751
21	81645	246	6	34503
22	65574	178	5	25864
23	85281	227	8	37026
24	100850	312	7	40336
25	153282	397	11	46487
26	73734	204	6	29242
27	114042	339	8	43027
28	66791	196	5	20646
29	102282	299	9	43076
30	82280	252	7	30188
31	94302	248	7	34911
32	68202	194	6	32206
33	97786	271	6	41208
34	62993	206	6	24624
35	99282	324	8	33518
36	80925	243	7	36666

Ход работы

а) Находим параметры уравнения множественной регрессии вида

средствами MS Excel. Выбираем «Данные» => «Анализ данных» => «Регрессия». В результате выполнения регрессионного анализа в пакете Excel получены оценкиb₀, b₁, b₂ и b₃ и их Р-значения:

	Коэффициенты	P-Значение
Y-пересечение	486,7756271	0,885145266
X1	182,309932	1,0969E-05
X2	3227,064371	0,002989917
X3	0,602617528	0,007466745

Следовательно, уравнение регрессии будет иметь вид:

Данное уравнение записано без проверки значимости коэффициентов регрессии.

Однако необходимо проверить, все ли из включенных в уравнение параметров действительно оказывают влияние на у.

Для коэффициента b₀ вероятность его не влияния на у равна 0,8851 (88,51%), что больше порогового значения в 5%, поэтому коэффициент b₀ признается не значимым и должен быть удален из модели.

Для коэффициента b₁ вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b₁ признается значимым и оставляется в модели.

Для коэффициента b₂ вероятность его не влияния на у равна 0,00298 (0,3%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

Для коэффициента b₃ вероятность его не влияния на у равна 0,0075 (0,75%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

Из модели будет исключена константа. После этого процедура регрессионного анализа проводится заново, для чего в строке «Входной интервал Х» задается те же 3 столбца данных и ставится флажок «Константа – ноль».

По полученным результатам вновь оценивается значимость коэффициентов регрессии.
На втором этапе полученные результаты могут иметь следующие значения:

	Коэффициенты	P-Значение
Y-пересечение	0	#Н/Д
X1	181,1168426	5,69209E-06
X2	3288,403312	0,000868729
X3	0,61082418	0,004488129

Для коэффициента b₁ вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b₁ признается значимым и оставляется в модели.

Для коэффициента b₂ вероятность его не влияния на у близка к нулю, что меньше порогового значения в 5%, поэтому коэффициент b₂ признается значимым и оставляется в модели.

Для коэффициента b₃ вероятность его не влияния на у равна 0,0045 (0,45%), что меньше порогового значения в 5%, поэтому коэффициент признается значимым и должен быть оставлен в модели.

Окончательное уравнение регрессии запишется в виде:

.

Регрессионная статистика окончательного уравнения:

Регрессионная статистика
Множественный R	0,998571287
R-квадрат	0,997144616
Нормированный R-квадрат	0,966668532
Стандартная ошибка	5855,715058
Наблюдения	36

б) Коэффициент корреляции равен

, то говорит об очень высокой связи.

При выполнении регрессионного анализа в пакете Excel вероятность выполнения нулевой гипотезы для коэффициента корреляции выводится как «Значимость F». Если Значимость F меньше 0,05, то количество наблюдений считается достаточным для признания полученных результатов регрессионного анализа достоверными. Если Значимость F меньше 0,05, то коэффициент корреляции незначим, и количество наблюдений необходимо увеличить.

В результате выполнения регрессионного анализа в пакете Excel получено значение R и Значимости F:

Множественный R – 0,998571

Значимость F –

Вероятность незначимости (недостоверности) коэффициента корреляции очень низкая (близка к нулю), значит, исследуется достаточное, количество наблюдений недостаточно.

в) При выполнении регрессионного анализа в Excel коэффициент детерминации выводится в таблице «Вывод итогов» как величина R-квадрат.

Коэффициент детерминации равен

. Это обозначает, что на 99,71% вариация накладных расходов обусловлена объемом работ, влияние прочих факторов составляет всего 0,29%.

г) Стандартная ошибка коэффициента регрессии выводится в регрессионной статистике и равна

.

д) доверительные интервалы для коэффициентов регрессии.

При выполнении регрессионного анализа в пакете Excel доверительные интервалы автоматически выводятся (наряду с другими результатами) для 95-%-го уровня надежности.

В результате выполнения регрессионного анализа в пакете Excel получена оценка b₁, b₂ и b₃и их доверительные интервалы:

	Коэффициенты	Нижние 95%	Верхние 95%
b₁	181,1168426	112,8584	249,3752
b₂	3288,403312	1461,378	5115,429
b₃	0,61082418	0,203383	1,018265

Значит:

е) Таблица дисперсионного анализа имеет вид:

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	3	3,95155E+11	1,31718E+11	3841,37107	5,51E-41
Остаток	33	1131550162	34289398,83
Итого	36	3,96286E+11

Левая часть (TSS) – общая сумма квадратов отклонений зависимой переменной от ее среднего значения, т.е. общая дисперсия ряда наблюдений. Она характеризует общий разброс зависимой переменной.

Дисперсия y, объясняемая линией регрессии (RSS), измеряется суммой квадратов отклонений между выровненными значениями y и их средним значением.

Дисперсию, которую нельзя объяснить с помощью регрессии, называют оста- точной (ESS). Она характеризует разброс значений зависимой переменной, которые не смогли быть объяснены регрессией, т.е. разброс отклонений фактических значений от выровненных.

Если средние значения случайной величины, вычисленные по отдельным выборкам одинаковы, то оценки факторной и остаточной дисперсий являются несмещенными оценками генеральной дисперсии и различаются несущественно.

Тогда сопоставление оценок этих дисперсий по критерию Фишера должно показать, что нулевую гипотезу о равенстве факторной и остаточной дисперсий отвергнуть нет оснований.

Оценка факторной дисперсии больше оценки остаточной дисперсии, поэтому можно сразу утверждать не справедливость гипотезы о равенстве математических ожиданий по слоям выборки.

Иначе говоря, в данном случае факторный признак оказывает существенное влияния на результативный.

Выводы:

Регрессионная модель считается качественной, если

1) связь между переменными модели тесная (R0,7), в нашем случае R= 0,99857;

2) в уравнении связи присутствуют лишь значимые факторы (все Р-значения меньше 0,05) в нашем случае Р-значения близко к нулю;

3) наблюдений для достоверных выводов достаточно (Значимость F меньше 0,05), в нашем случае значение F также близко к нулю.

На основании того, что эти условия полностью соблюдаются, качество полученной модели является высоким.

2. На основании реальных и расчетных значений накладных расходов построим графики.

Из графиков видно, что фактические и расчетные значения ненамного отклоняются друг от друга, что говорит о правильности расчетов.