Главная страница

Эконометрика, лекции. 1 Составитель Е. А. Парышева Введение


Скачать 1.28 Mb.
Название1 Составитель Е. А. Парышева Введение
АнкорЭконометрика, лекции.pdf
Дата18.07.2018
Размер1.28 Mb.
Формат файлаpdf
Имя файлаЭконометрика, лекции.pdf
ТипДокументы
#21642
страница8 из 13
1   ...   5   6   7   8   9   10   11   12   13


1 2
3
, ,
y f x x x

, то возможно построение следующего совмещенного уравнения
1 1 2
2 3 3 12 1 2 13 1 3 23 2 3
y a
b x b x b x b x x b x x b x Рассматриваемое уравнение включает взаимодействие первого порядка (взаимодействие двух факторов. Возможно включение в модель и взаимодействий более высокого порядка, если будет доказана их статистическая значимость по критерию Фишера, но, как правило, взаимодействия третьего и более высоких порядков оказываются статистически незначимыми. Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии соответственно к разным методикам. В зависимости оттого, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ. Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии
1. Метод исключения – отсев факторов из полного его набора.
2. Метод включения – дополнительное введение фактора.
3. Шаговый регрессионный анализ – исключение ранее введенного фактора.
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

48 При отборе факторов также рекомендуется пользоваться следующим правилом число включаемых факторов обычно враз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а критерий меньше табличного значения.
6.2. Метод наименьших квадратов (МНК) Возможны разные виды уравнений множественной регрессии линейные и нелинейные. Ввиду четкой интерпретации параметров наиболее широко используется линейная функция. Задача оценки статистической взаимосвязи переменных формулируется аналогично случаю парной регрессии. Теоретическое уравнение множественной линейной регрессии имеет вид т т x
x y
2 2
1 1
, где

- случайная ошибка,


m



,...,
,
1 0
- вектор размерности Для того, чтобы формально можно было решить задачу оценки параметров должно выполняться условие объем выборки n должен быть не меньше количества параметров, те.
1

 m Если же это условие не выполняется, то можно найти бесконечно многоразличных коэффициентов. Если
1

 m n
(например, 3 наблюдения и 2 объясняющие переменные, то оценки рассчитываются единственным образом без МНК путём решения системы
1
,
1
,
2 2
1 1







m i
x x
x т т Если же
1

 m n
, то необходима оптимизация, те. выбрать наилучшую формулу зависимости. В этом случае разность




1
m n
называется числом степеней свободы. Для получения надежных оценок параметров уравнения объём выборки должен значительно превышать количество определяемых по нему параметров. Практически, как было сказано ранее, объ-
ём выборки должен превышать количество параметров при x j
в уравнении враз. Задача построения множественной линейной регрессии состоит в определении
1

m
- мерного вектора т b
b а
а 
, элементы которого есть оценки соответствующих элементов вектора


m



,...,
,
1 Уравнение с оценёнными параметрами имеет виде ат т 2
1 1
, где е – оценка отклонения ε. Параметры при x
называются коэффициентами чистой регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне. Классический подход к оцениванию параметров линейной модели множественной регрессии основан на методе наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y
от расчетных
y минимальна



2
min i
i x
i Как известно из курса математического анализа, для того чтобы найти экстремум функции нескольких переменных, надо вычислить частные производные первого порядка по каждому из параметров и приравнять их к нулю. Итак, имеем функцию
1
m 
аргумента











n i
n i
m j
ij j
i i
m x
b a
y e
b b
a
Q
1 1
1 2
2 1
min
))
(
(
)
,...,
,
(
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

49 Она является квадратичной относительно неизвестных величин. Она ограничена снизу, следовательно имеет минимум. Находим частные производные первого порядка, приравниваем их к нулю, и получаем систему (
1

m
) уравнения с (
1

m
) неизвестным. Обычно такая система имеет единственное решение. И называется системой нормальных уравнений




































m m
m m
m m
m m
m m
yx x
b x
x b
x x
b x
a yx x
x b
x x
b x
b x
a y
x b
x b
x b
an
2 2
2 1
1 1
1 1
2 2
2 1
1 1
2 2
1 Решение может быть осуществлено методом Крамера:


m j
b a
j b
j a
,
1
,
,







, где

















2 2
1 2
2 2
2 1
2 1
1 2
2 1
1 2
1
m m
m m
m m
m x
x x
x x
x x
x x
x x
x x
x x
x x
x x
x x
n
, а j
b

- частные определители, которые получаются из

заменой соответствующего j – го столбца столбцом свободных членов. Для двухфакторной модели (
2

m данная система будет иметь вид

























2 2
2 2
2 1
1 2
1 1
2 2
2 1
1 1
2 2
1 1
yx x
b x
x b
x a
yx x
x b
x b
x a
y x
b x
b Матричный метод. Представим данные наблюдений и параметры модели в матричной форме.
]'
,...,
,
[
2 1
n y
y y
Y 
– n – мерный вектор – столбец наблюдений зависимой переменной
]'
,...,
,
,
[
2 1
p b
b b
a
A 
– (m+1) – мерный вектор – столбец параметров уравнения регрессии
]'
,...,
,
[
2 1
n e
e e
e 
– n – мерный вектор – столбец отклонений выборочных значений y i
от значений, получаемых по уравнению регрессии. Для удобства записи столбцы записаны как строки и поэтому снабжены штрихом для обозначения операции транспонирования. Наконец, значения независимых переменных запишем в виде прямоугольной матрицы размерности


1

 m n
:













nm n
n m
m x
x x
x x
x x
x x
X








2 1
2 22 21 1
12 11 1
1 Каждому столбцу этой матрицы отвечает набор из n значений одного из факторов, а первый столбец состоит из единиц, которые соответствуют значениям переменной при свободном члене. В этих обозначениях эмпирическое уравнение регрессии выглядит так Где Здесь


1
'

X
X
– матрица, обратная к
X
X '
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

50 На основе линейного уравнения множественной регрессии
1 1 2
2
m m
y a b x b x b могут быть найдены частные уравнения регрессии
 
 
 
1 2
3 2 1 3
1 2
1
,
,...,
1
,
,...,
2
,
,...,
,
,
,
m m
m m
x x x x
x x x x
x x x x
m y
f x y
f x y
f те. уравнения регрессии, которые связывают результативный признак с соответствующим фактором при закреплении остальных факторов на среднем уровне. В развернутом виде систему можно переписать в виде
1 2
3 2 1 3
1 2
1
,
,...,
1 1 2
2 3 3
,
,...,
1 1 2
2 3 3
,
,...,
1 1 2
2 3 3
,
,
m m
m m
x x x x
m m
x x x x
m m
x x x x
y a
b x b x b x b x y
a b x b x b x b x y
a b x b x b x
























 .
m m
b При подстановке в эти уравнения средних значений соответствующих факторов они принимают вид парных уравнений линейной регрессии, те. имеем
1 2
3 2 1 3
1 2
1
,
,...,
1 1 1
,
,...,
2 2
2
,
,...,
,
,
,
m m
m m
x x x x
x x x x
x x x x
m m
m y
A
b x y
A
b x y
A
b где
1 2
2 3 3 2
1 1 3 3 1 1 2
2 3 3 1
1
,
,
m m
m m
m m
m
A
a b x b x b x
A
a b x b x b x
A
a b x b x b x В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности

1 2
1 1
,
,...
,
,...,
xi i
i i
m i
y i
x x x x
x Э y





, где i
b
– коэффициент регрессии для фактора i
x в уравнении множественной регрессии,

1 2
1 1
,
,...
,
,...,
i i
i m
x x x x
x x
y



– частное уравнение регрессии. Наряду с частными коэффициентами эластичности могут быть найдены средние по совокупности показатели эластичности i
i i
i Э y


, которые показывают насколько процентов в среднем изменится результат, при изменении соответствующего фактора на 1%. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат. Анализ качества эмпирического уравнения множественной линейной регрессии Проверка статистического качества оцененного уравнения регрессии проводится, с одной стороны, по статистической значимости параметров уравнения, ас другой стороны, по общему качеству уравнения регрессии. Кроме этого, проверяется выполнимость предпосылок МНК.
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

51 Как ив случае парной регрессии, для анализа статистической значимости параметров множественной линейной регрессии с m факторами, необходимо оценить дисперсию и стандартные отклонения параметров Обозначим матрицу


,
'
1 ив этой матрице обозначим j – й диагональный элемент как '
jj z
. Тогда выборочная дисперсия эмпирического параметра регрессии равна m
j z
S
D
jj b
j
,
1
,
'
2


, а для свободного члена выражение имеет вид
,
'
00 если считать, что в матрице
1

Z
индексы изменяются от 0 до m. Здесь S
2
– несмещенная оценка дисперсии случайной ошибки ε (среднеквадратическая ошибка регрессии
1 2
2




m Соответственно, стандартные ошибки (отклонения) параметров
 
a b
j регрессии равны


a a
b b
D
S
D
S
j j


или
Для проверки значимости каждого коэффициента рассчитываются t – статистики








a a
b j
b
S
a t
S
b t
j или, Полученная t – статистика для соответствующего параметра имеет распределение Стью- дента с числом степеней свободы (т. При требуемом уровне значимости α эта статистика сравнивается с критической точкой распределения Стьюдента t(α; т) (двухсторонней. Если
)
1
;
(



m n
t кр, то соответствующий параметр считается статистически значимыми нуль – гипотеза в виде
0
:
0

j b
H
или отвергается. При
)
1
;
(



m n
t кр параметр считается статистически незначимым, и нуль – гипотеза не может быть отвергнута. Поскольку b j
не отличается значимо от нуля, фактор х j
линейно не связан с результатом. Его наличие среди объясняющих переменных не оправдано со статистической точки зрения. Не оказывая какого–либо серьёзного влияния на зависимую переменную, он лишь искажает реальную картину взаимосвязи. Поэтому после установления того факта, что коэффициент b j
статистически незначим, переменную х j
рекомендуется исключить из уравнения регрессии. Это не приведет к существенной потере качества модели, но сделаете более конкретной. Строгую проверку значимости параметров можно заменить простым сравнительным анализом. Если
1

t
, те. j
b j
S
b 
, то коэффициент статистически незначим. Если
2 1

 t
, те. j
b j
S
b
2

, то коэффициент относительно значим. В данном случае рекомендуется воспользоваться таблицей критических точек распределения Стьюдента. Если
3 2

 t
, то коэффициент значим. Это утверждение является гарантированным при (т и Если
3

t
, то коэффициент считается сильно значимым. Вероятность ошибки в данном случае при достаточном числе наблюдений не превосходит 0,001. К анализу значимости коэффициента b j
можно подойти по – другому. Для этого строится интервальная оценка соответствующего коэффициента. Если задать уровень значимости α, то
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

52 доверительный интервал, в который с вероятностью (1-α) попадает неизвестное значение параметра, определяется неравенством




j j
b j
j b
j
S
p n
t b
S
p n
t Или




a a
S
p n
t a
S
p n
t Если доверительный интервал не содержит нулевого значения, то соответствующий параметр является статистически значимым, в противном случае гипотезу о нулевом значении параметра отвергать нельзя. Для проверки общего качества уравнения регрессии используется коэффициент детерминации. Для множественной регрессии R
2
является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение. Действительно, каждая следующая объясняющая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной. Анализ статистической значимости коэффициента детерминации проводится на основе проверки нуль-гипотезы Н R
2
=0 против альтернативной гипотезы Н R
2
>0. Для проверки данной гипотезы используется следующая F – статистика. Задача 1. Бюджетное обследование пяти случайно выбранных семей дало следующие результаты (в тыс. руб Семья Накопления, S Доход, Y Имущество, W
1 3
40 60 2
6 55 36 3
5 45 36 4
3,5 30 15 5
1,5 30 90 А) Оценить регрессию S на Y и W. Б) Спрогнозируйте накопления семьи, имеющей доход 40 тыс.руб.и имущество стоимостью тыс.руб. В) Предположим, что доход семьи вырос на 10 тыс.руб, в то время как стоимость имущества не изменилась. Оцените как возрастут её накопления. Г) Оцените как возрастут накопления семьи, если её доход вырос на 5, а стоимость иму- щетва увеличилась на 15. Задача 2. Для изучения жилья в городе поданным о 46 коттеджах было получено уравнение множественной регрессии
)
83
,
0
(
)
54
,
0
(
)
8
,
1
(
7
,
0
,
57
,
3 95
,
0 2
,
6 1
,
21 2
3 2
1
j х х
х у





Где у – цена объекта (тыс.дол),
1
x
- расстояние до центра города,
2
x
- полезная площадь объекта (кв.м),
3
x
- число этажей в доме (ед. А) Проверить гипотезы о равенстве нулю коэффициентов
3 2
1
,
,
b b
b в генеральной совокупности (те. проверить значимость коэффициентов регрессии. Б) Проверить гипотезу об одновременном равенстве нулю коэффициентов множественной регрессии (или о том, что R
2
=0) в ген.совокупности.
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

53 Тема 7. Прогнозирование
7.1. Оценка прогнозных качеств модели Пример 1. Рассмотрим зависимость объёма реального частного потребления в США (Сот располагаемого дохода Y за 1971-1990 гг:
58
,
1
;
997
,
0
)
9
,
81
(
)
7
,
7
(
007
,
1 6
,
217 С Со статической точки зрения данная зависимость приемлема по всем показателям. Стандартная ошибка регрессии
20 2
2




n e
S
i при среднем значении зависимой переменной, те. составляет около Отклонения от линии регрессии носят случайный характер, и их среднее значение остаётся приблизительно постоянным. Отношение стандартной ошибки регрессии к среднему значению зависимой переменной y
S
V 
называется средней относительной ошибкой прогноза, и может служить критерием прогнозных качеств оценённой регрессионноё модели. Если величина V мала и отсутствует ав- токорреляция ошибок (те. систематичность отклонений зависимой переменной от линии регрессии, проверяемая с помощью статистики Дарбина-Уотсона), то прогнозные качества модели высоки. Если уравнение регрессии используется в прогнозировании, то величина V часто рассчитывается не для того периода, на котором было построено уравнение, а для некоторого следующего за ним «постпрогнозного» периода, для которого имеются наблюдения зависимой и объясняющих переменных. И уже для последующего периода, если для него известны прогнозы значений объясняющих переменных, может быть построен прогноз объясняемой переменной. Считается, что период прогнозирования должен быть по крайней мере в 3 раза короче, чем тот период, для которого было оценено уравнение регрессии. Для примера, оценим функцию зависимости Сот за период не 1971-1990гг, а 1971-1986 гг., а затем построим постпрогноз на период 1987-1990гг. Уравнение регрессии также получается приемлемое по всем параметрам
1   ...   5   6   7   8   9   10   11   12   13


написать администратору сайта