обзорная. Эконометрика. Э н. Хайрулин Ильяс Гаяревич Кафедра математических методов в экономике Литература
Скачать 2.04 Mb.
|
Эконометрика Преподаватель доц., к.э.н. Хайрулин Ильяс Гаяревич Кафедра математических методов в экономике Литература
Эконометрика
Место эконометрики в управленческом процессеЦель Проблема Выдвижение альтернатив Сравнение, оценка и выбор Реализация Задачи, решаемые эконометрическим методомКлассификация Обоснование связи и выявление значимых факторов Проверка гипотез экономической теории Прогнозирование Анализ Этапы эконометрического исследования
Этапы (подробнее)
Сбор данныхПри моделировании экономических процессов используют следующие типы данных:
Панельными данными является набор сведений по разным объектам, взятый за интервал времени. То есть множество объектов наблюдается в течение определенного времени.Типы переменныхТипы переменных, участвующих в эконометрической модели:
Предопределенные переменные (объясняющие переменные). К ним относятся лаговые и текущие экзогенные переменные (xt , xt-1 ), а также лаговые эндогенные переменные (yt-1 ).Любая эконометрическая модель предназначена для объяснения значений текущих эндогенных переменных (одной или нескольких) в зависимости от значений предопределенных переменных.Спецификация моделейВыделяют три основных класса моделей.I. Регрессионные модели с одним уравнением (факторов может быть один или несколько)
II. Модели временных рядов, полученные с помощью следующих методовIII. Системы одновременных уравненийЛинейность и аддитивность
Оценка параметровЭтот этап предполагает нахождение неизвестных элементов в модели тем или иным способом.Наиболее распространенным методом является МНК. МНК применяется к моделям, линейным по параметрам. Если функция регрессии нелинейна по параметрам, необходима её предварительная линеаризация.Если распределение остатков ненормально, то наилучшим методом их оценки будет не МНК, а ММП.Также если не выполняются предпосылки МНК, то для нахождения параметров можно использовать ММП.Проверка качества моделиЭто важнейший этап, заключающийся в определении следующего:
Интерпретация результатов
Парная регрессия Базовые термины и идеи• Генеральная совокупность (population) (иногда используется калька с англоязычного термина – «популяция») – все множество объектов, в отношении которых формулируется исследовательская гипотеза• Выборка (sample) – ограниченная по численности группа объектов (респондентов), отбираемая из генеральной совокупности для изучения ее свойств• Сплошное и выборочное исследование• Репрезентативность выборки (representativeness of sample) – способность выборки представлять изучаемые явления достаточно полно с точки зрения их изменчивости в генеральной совокупности• Любое исследование направлено на определение некоторой характеристики или выявление связи между признаками• Связь может характеризоваться не только величиной (степенью связи) и направлением, но также и надежностью или статистической достоверностью (statistical confidence) - эта характеристика связи показывает, можно ли распространить результаты, полученные на данной выборке, на всю генеральную совокупность, из которой взята эта выборкаПарная регрессияПарная регрессия – это уравнение, описывающее корреляционную связь между парой переменных: зависимой переменной (результатом) y и независимой переменной (фактором) x.y=f(x)Функция может быть как линейной y=α+βx+ε, так и нелинейной y=α+β/x+ε, y=α+βlnx+ε, y=αβxε.Парная линейная регрессияПредположим, что для генеральной совокупности связь выражается уравнениемyi=α+βxi+εi, i=1,…,Nyi – i-е фактическое значение зависимой переменной y;α и β – генеральные параметры парной линейной регрессииN – объем генеральной совокупностиεi – теоретические ошибки, в силу наличия еще и других объясняющих факторов, не учтенных в модели или ошибок спецификацииПарная линейная регрессияНо у нас есть ограниченное объективными причинами кол-во наблюдений (выборка), для которых мы на практике можем построить уравнение =a+bxii=a+bxi+ei, i=1,…,nyi – i-е фактическое значение зависимой переменной y;- i-е значение зависимой переменной, рассчитанное по уравнению прямойa и b – выборочные параметры парной линейной регрессииn – объем выборкиei – наблюдаемые остатки, в силу наличия еще и других объясняющих факторов, не учтенных в модели или ошибок спецификацииei= yi –Буквально перед нами стоит задача провести прямую линию через множество точек в плоскости x-y.Два параметра a и b определяют наклон прямой и сдвиг по вертикали. Существует много способов провести прямую через точки на плоскости.
Каждый метод выбора a и b обладает плюсами и минусами.Построение по двум точкам неустойчиво к выбору таких точек и может давать противоречивые результаты.Сумма квадратов отклонений проста в вычислениях, обладает хорошими статистическими свойствами, позволяет выстроить теорию для проверки различных статистических гипотез, но чувствительна к «выбросам»Сумма модулей отклонений нечувствительна к «выбросам», но сложна в вычисленииФункция Хубера пытается совместить плюсы обеих мер.
F=Для этого вычислим производные функции F по параметрам a и bРаскроем скобки и получимСтандартная форма нормальных уравненийРешая систему, получим значения a и bТак мы нашли неизвестные параметры модели =a+bxiЭкономическая интерпретация a и b
Коэффициент корреляции
Шкала Чеддока rxy>0 – связь прямая, rxy<0 – связь обратная 1) Наша модель является упрощением действительности и на самом деле есть еще другие параметры, от которых зависит y. Расходы на питание могут также зависеть от региона проживания, количества членов семьи, образа жизни, склонности к потреблению. 2) Трудности в измерении данных (присутствуют ошибки измерения).Можно считать, что εi – случайная величина с некоторой функцией распределения, которой соответствует функция распределения случайной величины yi.Основные гипотезы
В этом случае модель называется классической нормальной линейной регрессионной моделью. (Classical Normal Linear Regression Model)Основные гипотезы1,2. спецификация модели отражает наше преставление о механизме зависимости yi от xi и сам выбор объясняющей переменной xi . Чтобы установить влияние xi они должны принимать различные значения.Основные гипотезы3. M[εi]=0, M[εi]=D[εi]=σ2 не зависит от xi или от tУсловие независимости дисперсии ошибки от номера наблюдения или xi называется гомоскедастичностью. В противоположном случае, наблюдают явление гетероскедастичности.Основные гипотезы4. M[εi, εj]=0 – некоррелированность ошибок для разных наблюденийВ случае, когда это условие не выполняется, говорят об автокорреляции ошибок. Часто такое происходит с временным выборками ил временными рядами.Теорема Гаусса-МарковаЗадача теперь- статистически оценить три параметра: a,b, σ2В предположениях модели:
оценки a и b, полученные по методу наименьших квадратов(МНК), имеют наименьшую дисперсию (то есть эффективны) в классе всех линейных несмещенных оценок.Статистические свойства оценок
ЗадачаПусть X1, X2, X3, X4 — случайная выборка значений из генеральной нормальной совокупности со средним и дисперсией . Рассмотрим две оценки :
Дисперсия ошибок и ее оценка
σ2 =S2 = n/(n-2)* σ2 =Дисперсии параметров a и b
Вывод формул дисперсии остатков в Я.Р. Магнус-Эконометрика:начальный курсРаспределение оценок a и bТак как a и b являются линейными функциями от y, то они тоже имеют нормальное распределениеaN(α, ) bN(β, )Значит (a-α)/N(0,1), аналогично b.Но поскольку мы не знаем , то заменяем ее на S2, при этом ta=(a-α)/t(n-2), и аналогично для btb=(b- β)/t(n-2)Статистику tb можно использовать для проверки статистической гипотезы H0: β=β0 против альтернативной гипотезы H1: β≠β0. Наиболее просто выглядит гипотеза H0: β=0 (в генеральной совокупности связи нет). Тогдаtb=b/sbt(n-2), где sb=Зададимся, например 2,5% точкой t-распределения с (n-2) степенями свободы t0,025 , т.е. P(-t0,025 Аналогично для проверки значимости a используется статистика taДоверительные интервалы параметров α и βРазрешив неравенство P{|(b-β)/Sb| |
P{b-t0,025*Sb<β То есть в интервал [b-t0,025*Sb ;b+t0,025*Sb] истинный параметр β попадет с вероятностью 95%.
Аналогично составляется доверительный интервал для α.
- Рассмотрим вариацию (разброс) значений yi вокруг своего среднего значения
- Можно доказать, что третье слагаемое равно нулю.
- Тогда
TSS(total) ESS(error) RSS(regression)
Многомерная теорема Пифагора
Средняя ошибка аппроксимации
Коэффициент детерминации
R2 принимает значения от 0 до 1 и показывает долю дисперсии результативного признака, объясненную регрессией. Если велика, то модель не объясняет вариацию (изменчивость) результата, и R2 близко к 0.
Под незначимостью модели понимается в общем виде одновременное равенство коэффициентов перед всеми факторами x, или, что то же самое, равенство =a=, и график функции регрессии параллелен оси абсцисс. Тогда . Проверим данную гипотезу H0: против H1:
Для этого составляется статистика Фишера
F(m,n-m-1), где m-количество факторов в модели, которая сравнивается с табличным значением распределения Фишера Fα(m,n-m-1) для выбранного уровня значимости α.
Качество модели
F-критерий Фишера
T-критерий Стьюдента
Качество модели
Доверительные интервалы параметров
Качество модели
Доверительный интервал прогноза
Задача
- По семи территориям приуральского района известны значения двух показателей за один год
Линейная модель на основе МНК
Автокорреляция остатков
Отрицательная автокорреляция Положительная автокорреляция
Критерий Дарбина-Уотсона (неправильный расчет)
Среднедушевая ЗП, тыс.руб. X
et
et^2
et-1
(et-et-1)^2
1
45,1
7,524
56,614
2
59,0
4,733
22,397
7,524
7,793
3
57,2
2,810
7,896
4,733
3,697
4
61,8
1,201
1,443
2,810
2,588
5
58,8
-1,537
2,361
1,201
7,495
6
47,2
-6,249
39,054
-1,537
22,210
7
55,2
-8,482
71,943
-6,249
4,984
Сумма
384,3
0,000
201,708
8,482
48,768
DW=48,768/201,708=0,24
Критерий Дарбина-Уотсона (верный расчет)
Среднедушевая ЗП, тыс.руб. X
et
et^2
et-1
(et-et-1)^2
1
45,1
7,52
56,61
2
47,2
-6,25
39,05
7,52
189,711
3
55,2
-8,48
71,94
-6,25
4,984
4
57,2
2,81
7,90
-8,48
127,506
5
58,8
-1,54
2,36
2,81
18,892
6
59,0
4,73
22,40
-1,54
39,303
7
61,8
1,20
1,44
4,73
12,471
Сумма
384,3
0,000
201,708
-1,201
392,867
DW=392,867/201,708=1,94
Задача
номер предприятия
выпуск, тыс. руб., y
Стоимость ОФ, тыс.руб. X
Yt2
Xt2
Xt*Yt
Yt модель
|Yt-Yt модель|/Yt
et
et^2
Yt модель-Yср
Yt-Yср
X-Xср
1
2608
430
6801664
184900
1121440
2760,55
0,06
-152,55
23270,50
-231,12
-383,67
-52,22
2
2500
410
6250000
168100
1025000
2672,03
0,07
-172,03
29595,25
-319,63
-491,67
-72,22
3
3060
530
9363600
280900
1621800
3203,12
0,05
-143,12
20482,42
211,45
68,33
47,78
4
3255
560
10595025
313600
1822800
3335,89
0,02
-80,89
6542,84
344,22
263,33
77,78
5
2893
480
8369449
230400
1388640
2981,83
0,03
-88,83
7891,08
-9,83
-98,67
-2,22
6
2941
430
8649481
184900
1264630
2760,55
0,06
180,45
32563,38
-231,12
-50,67
-52,22
7
3020
440
9120400
193600
1328800
2804,80
0,07
215,20
46309,43
-186,86
28,33
-42,22
8
3248
510
10549504
260100
1656480
3114,60
0,04
133,40
17794,81
122,94
256,33
27,78
9
3400
550
11560000
302500
1870000
3291,63
0,03
108,37
11743,87
299,96
408,33
67,78
Сумма
26925,00
4340,00
81259123,00
2119000,00
13099590,00
26925,00
0,44
0,00
196193,61
0,00
0,00
0,00
Среднее
2991,67
482,22
9028791,44
235444,44
1455510,00
2991,67
0,05
0,00
21799,29
0,00
0,00
0,00
0>
TSS(total) ESS(error) RSS(regression)
Многомерная теорема Пифагора
Среднедушевая ЗП, тыс.руб. X
et
et^2
et-1
(et-et-1)^2
1
45,1
7,524
56,614
2
59,0
4,733
22,397
7,524
7,793
3
57,2
2,810
7,896
4,733
3,697
4
61,8
1,201
1,443
2,810
2,588
5
58,8
-1,537
2,361
1,201
7,495
6
47,2
-6,249
39,054
-1,537
22,210
7
55,2
-8,482
71,943
-6,249
4,984
Сумма
384,3
0,000
201,708
8,482
48,768
Среднедушевая ЗП, тыс.руб. X
et
et^2
et-1
(et-et-1)^2
1
45,1
7,52
56,61
2
47,2
-6,25
39,05
7,52
189,711
3
55,2
-8,48
71,94
-6,25
4,984
4
57,2
2,81
7,90
-8,48
127,506
5
58,8
-1,54
2,36
2,81
18,892
6
59,0
4,73
22,40
-1,54
39,303
7
61,8
1,20
1,44
4,73
12,471
Сумма
384,3
0,000
201,708
-1,201
392,867
номер предприятия
выпуск, тыс. руб., y
Стоимость ОФ, тыс.руб. X
Yt2
Xt2
Xt*Yt
Yt модель
|Yt-Yt модель|/Yt
et
et^2
Yt модель-Yср
Yt-Yср
X-Xср
1
2608
430
6801664
184900
1121440
2760,55
0,06
-152,55
23270,50
-231,12
-383,67
-52,22
2
2500
410
6250000
168100
1025000
2672,03
0,07
-172,03
29595,25
-319,63
-491,67
-72,22
3
3060
530
9363600
280900
1621800
3203,12
0,05
-143,12
20482,42
211,45
68,33
47,78
4
3255
560
10595025
313600
1822800
3335,89
0,02
-80,89
6542,84
344,22
263,33
77,78
5
2893
480
8369449
230400
1388640
2981,83
0,03
-88,83
7891,08
-9,83
-98,67
-2,22
6
2941
430
8649481
184900
1264630
2760,55
0,06
180,45
32563,38
-231,12
-50,67
-52,22
7
3020
440
9120400
193600
1328800
2804,80
0,07
215,20
46309,43
-186,86
28,33
-42,22
8
3248
510
10549504
260100
1656480
3114,60
0,04
133,40
17794,81
122,94
256,33
27,78
9
3400
550
11560000
302500
1870000
3291,63
0,03
108,37
11743,87
299,96
408,33
67,78
Сумма
26925,00
4340,00
81259123,00
2119000,00
13099590,00
26925,00
0,44
0,00
196193,61
0,00
0,00
0,00
Среднее
2991,67
482,22
9028791,44
235444,44
1455510,00
2991,67
0,05
0,00
21799,29
0,00
0,00
0,00