Главная страница

Пример решения задач по эконометрике. Линейная модель парной регрессии


Скачать 0.87 Mb.
НазваниеЛинейная модель парной регрессии
Дата31.07.2022
Размер0.87 Mb.
Формат файлаpdf
Имя файлаПример решения задач по эконометрике.pdf
ТипДокументы
#638617

Содержание
Задание по теме «Линейная модель парной регрессии» .......................................... 2
Выполнение Задания .................................................................................................... 3 1. Построение поля корреляции .............................................................................. 3 2. Построение линейной модели парной регрессии ............................................. 4 3. Коэффициент корреляции, детерминации, эластичности ................................ 5 4. Оценка значимости модели в целом................................................................... 7 5. Оценка значимости параметров модели ............................................................ 8 6. Оценка точности модели ................................................................................... 10 7. Прогнозирование выручки от продаж.............................................................. 10
Задание по теме «Предпосылки МНК» .................................................................... 12
Выполнение Задания .................................................................................................. 12 1. Случайный характер ряда остатков .................................................................. 12 2. Независимость ряда остатков ........................................................................... 13 3. Подчинение ряда остатков нормальному закону распределения ................. 15 4. Проверка на равенство нулю математического ожидания ряда остатков .... 16 5. Гомоскедастичность остатков ........................................................................... 16
Экономьте свое время и нервы. Если мало свободного времени и у вас
нет намерений стать в будущем профессором по эконометрике, то
закажите работу и сможете заняться чем-то более полезным для учебы,
работы, семьи, себя.
Работы стараюсь расписывать доступным языком, достаточно
подробно. По готовой работе, я думаю, вы сможете разобраться что-
откуда-куда-почему. Также гарантирована правильность решения. Вы
по неопытности можете ошибиться, обсчитаться, не до конца понимая
сути вопроса сделать ошибочные выводы и т.п. Рискуете во время
сессии тратить драгоценное время на поиск и устранение ошибок,
доработки. Это чревато стрессом и плохим настроением. Берегите себя!
https://studwork.org/info/3518

2
Задание по теме «Линейная модель парной регрессии»
Даны данные по 10 предприятиям:
Таблица 1
Исходные данные

Среднегодовая стоимость основных фондов,
млн. руб.
Выручка от продаж, млн.
руб.
1 2
14 2
3 16 3
4 18 4
5 20 5
6 25 6
7 24 7
8 27 8
9 29 9
10 32 10 11 31 1. Построить поле корреляции, сделать предположение о направлении и форме связи
2. Построить линейное уравнение парной регрессии.
3. Рассчитать коэффициент корреляции и детерминации, оценить статистическую значимость коэффициента корреляции.
Рассчитать коэффициент эластичности.
4. Оценить значимость построенной модели в целом.
5. Оценить значимость параметров модели.
6. Оценить точность модели с помощью средней относительной ошибки аппроксимации.
7. Построить прогноз выручки от продаж, если значение среднегодовой стоимости основных фондов составит 120% от среднего уровня. Отобразить на графике результаты моделирования и прогнозирования.

3
Выполнение Задания
1. Построение поля корреляции
Построим поле корреляции (диаграмму рассеяния). По расположению точек на поле корреляции можно судить о направлении и форме связи между переменными.
Рисунок 1 – Поле корреляции
Вывод. Расположение облака точек на поле корреляции произошло из левого нижнего угла в правый верхний угол. Это говорит о наличии прямой связи (положительной зависимости) между переменными. Т.е. с увеличением среднегодовой стоимости основных фондов х значения выручки от продаж у тоже в среднем увеличиваются. По форме связи можно предположить линейную зависимость.
0 5
10 15 20 25 30 35 0
2 4
6 8
10 12
вы
руч
к
а
от
п
ро
даж
, м
л
н
. р
уб
.
среднегодовая стоимость основных фондов, млн. руб.

4
2. Построение линейной модели парной регрессии
Общий вид линейного уравнения парной регрессии:
i
i
bx
a
y


ˆ
, где
i
yˆ
- расчетные теоретические значения результативного признака для i-го наблюдения;
a и b – параметры линейного уравнения парной регрессии;
b – коэффициент регрессии, который показывает на сколько в среднем изменяется значение результативного признака у при увеличении фактора х на единицу измерения;
x
i
– значение факторного признака для i-го наблюдения.
Параметры линейного уравнения найдем с помощью метода наименьших квадратов (МНК). Для определения параметров необходимо решить систему линейных уравнений /(систему нормальных уравнений):




















n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
y
x
b
x
a
x
y
b
x
na
1 1
2 1
1 1
Для расчета параметров можно использовать готовые формулы, которые вытекают из данной системы:










2 2
2 2
5
,
6 5
,
50 6
,
23 5
,
6 4
,
170
)
cov(
x
x
y
x
xy
xy
b
x

2,061
x
b
y
a


= 23,6 – 2,061×6,5 = 10,206
Получили линейное уравнение парной регрессии:

i
yˆ
10,206 + 2,061
i
x
Вывод. Коэффициент регрессии b показывает, что при увеличении среднегодовой стоимости основных фондов на 1 млн. руб. значение выручки от продаж в среднем возрастает на 2,061 млн. руб. Поскольку значение положительное, то связь между признаками прямая.

5
Свободный член а
= 10,206 оценивает влияние прочих факторов, оказывающих воздействие на результативный признак. Т.е. воздействие прочих факторов увеличивает значение выручки от продаж.
Теоретические (расчетные) значения результативного признака
i
yˆ
получаем путем последовательной подстановки значений факторного признака
i
x
в уравнение регрессии.
Рассчитываем остатки, как разность фактических и расчетных значений результативного признака:
i
i
i
y
y
ˆ



Таблица 2
Вспомогательная таблица для расчета коэффициента корреляции и построения модели

i
x
i
y
2
i
x
i
i
y
x
2
i
y
1 2
14 4
28 196 2
3 16 9
48 256 3
4 18 16 72 324 4
5 20 25 100 400 5
6 25 36 150 625 6
7 24 49 168 576 7
8 27 64 216 729 8
9 29 81 261 841 9
10 32 100 320 1024 10 11 31 121 341 961
Итого
12 236 505 1704 5932
Среднее
6,5 23,6 50,5 170,4 593,2
3. Коэффициент корреляции, детерминации, эластичности
Коэффициент корреляции показывает тесноту и направление линейной связи между переменными. Чем ближе значение коэффициента к единице (по модулю), тем более тесная связь между признаками.
y
x
yx
b
r




, где
y
x


,
- средние квадратические отклонения признаков.

6
Расчет средний квадратических отклонений:
872
,
2 5
,
6 5
,
50 2
2 2





x
x
x

020
,
6 6
,
23 2
,
593 2
2 2





y
y
y

Расчет коэффициента корреляции:



020
,
6 872
,
2 061
,
2
yx
r
0,983
Вывод. Значение близко к единице, коэффициент корреляции показывает, что связь между среднегодовой стоимостью основных фондов и выручкой от продаж очень тесная и прямая.
Коэффициент
детерминации характеризует долю вариации результативного признака под влиянием фактора, включенного в модель.
2 2
893
,
0

xy
r
= 0,967
Вывод. 96,7% вариации выручки от продаж у происходит под влиянием среднегодовой стоимости основных фондов х. Остальные 3,3% вариации выручки от продаж у объясняется влиянием прочих случайных факторов, неучтенных в модели.
Выдвигаем нулевую гипотезу о равенстве нулю коэффициента корреляции (незначимости связи между признаками):
0
:
0

yx
r
Н
Альтернативная гипотеза:
0
:
1

yx
r
Н
Для проверки гипотезы рассчитываем значение t-критерия Стьюдента:
220
,
15
)
2 10
(
967
,
0 1
967
,
0
)
2
(
1 2
2









n
r
r
t
xy
xy
r
По таблице значений критерия Стьюдента находим табличное
(критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8:

табл
t
2,306

7
Вывод. Поскольку табл
t
t
r

, то нулевую гипотезу о равенстве нулю коэффициента корреляции
0
:
0

yx
r
Н
отклоняем с вероятностью допустить ошибку в 5%. Связь между признаками является статистически значимой.
Коэффициент эластичности показывает, на сколько процентов в среднем изменяется значение результативного признака у при увеличении факторного признака х на 1%.
Расчет коэффициента эластичности:





6
,
23 5
,
6 061
,
2
y
x
b
Э
0,568%
Вывод. При увеличении значений среднегодовой стоимости основных фондов х на 1% значение выручки от продаж у в среднем возрастает на
0,568%.
4. Оценка значимости модели в целом
Выдвигаем нулевую гипотезу о том, что найденные показатели тесноты связи случайны, т.е. коэффициент детерминации равен нулю:
0
:
2 0

xy
r
Н
Альтернативная гипотеза:
0
:
2 1

yx
r
Н
Для проверки нулевой гипотезы рассчитываем значение F-критерия
Фишера:
66
,
231
)
2 10
(
967
,
0 1
967
,
0
)
2
(
1 2
2









n
r
r
F
xy
xy
По таблице значений критерия Фишера находим табличное
(критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df
1
= 1 и df
2
= n – 2 = 10 – 2 = 8:
F
табл
= 5,318

8
Вывод. Поскольку
318
,
5 66
,
231
табл



F
F
, то нулевую гипотезу о равенстве нулю коэффициента детерминации
0
:
2 0

xy
r
Н
отклоняем с вероятностью допустить ошибку в 5%. Модель является статистически значимой, показатели силы связи не случайны.
5. Оценка значимости параметров модели
Выдвигаем нулевые гипотезы о том, что найденные параметры не являются статистически значимыми:
0
:
0

а
Н
и
0
:
0

b
Н
Для проверки гипотез рассчитывают t-критерий Стьюдента:
a
a
S
a
t

и
b
b
S
b
t

, где
S
a
и S
b
– стандартные ошибки параметров модели.
Рассчитываем стандартную ошибку модели:
230
,
1 2
10 10
,
12 2
2
)
ˆ
(
1 2
1 2
ˆ












n
n
y
y
S
n
i
i
n
i
i
i
y

Находим стандартную ошибку свободного члена а:
962
,
0 872
,
2 10 505 230
,
1 1
2
ˆ









x
n
i
i
y
a
n
x
S
S

Находим стандартную ошибку коэффициента регрессии b:
135
,
0 10 872
,
2 230
,
1
ˆ





n
S
S
x
y
b

Расчет фактических значений критерия Стьюдента:
608
,
10 962
,
0 206
,
10


a
t
220
,
15 135
,
0 061
,
2


b
t

9
По таблице значений критерия Стьюдента находим табличное
(критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8:

табл
t
2,306
Вывод. Поскольку
306
,
2 608
,
10
табл



t
t
a
и


220
,
15
b
t
306
,
2
табл

t
, то нулевые гипотезы о равенстве нулю параметров модели
0
:
0

а
Н
и
0
:
0

b
H
отклоняем с вероятностью допустить ошибку в 5%. Свободный член
(константа) и коэффициент регрессии являются статистически значимыми.
Коэффициент регрессии является статистически значимым. Следовательно, и фактор при этом коэффициенте значим.
Проверка:
F
t
t
r
b


= 15,220
Таблица 3
Вспомогательная таблица для оценки качества модели

i
x
i
y
i
yˆ
i
i
i
y
y
ˆ



2
i

i
i
y



2
y
y
i



2
x
x
i

1 2
14 14,33
-0,33 0,11 0,023 92,16 20,25 2
3 16 16,39
-0,39 0,15 0,024 57,76 12,25 3
4 18 18,45
-0,45 0,20 0,025 31,36 6,25 4
5 20 20,51
-0,51 0,26 0,025 12,96 2,25 5
6 25 22,57 2,43 5,91 0,097 1,96 0,25 6
7 24 24,63
-0,63 0,40 0,026 0,16 0,25 7
8 27 26,69 0,31 0,10 0,011 11,56 2,25 8
9 29 28,75 0,25 0,06 0,009 29,16 6,25 9
10 32 30,81 1,19 1,41 0,037 70,56 12,25 10 11 31 32,87
-1,87 3,51 0,060 54,76 20,25
Итого
12 236 236,00 0,00 12,10 0,339 362,40 82,50

10
6. Оценка точности модели
Для оценки точности модели рассчитываем среднюю относительную ошибку аппроксимации:
10 1
%
100 1
1






n
i
i
i
отн
y
n
Е

×0,339×100% = 3,39%
Вывод. Ошибка показывает, что в среднем фактические значения выручки от продаж у отличаются от полученных по линейной модели парной регрессии на 3,39%. Т.к. ошибка меньше 7%, то модель считается точной.
7. Прогнозирование выручки от продаж
Прогнозное значение фактора (120% от среднего значения):



2
,
1
х
х
пр
6,5×1,2 = 7,8
Прогнозное значение результативного признака (точечный прогноз):



пр
пр
bx
a
уˆ
10,206 + 2,061×7,8 = 26,279
Рассчитываем среднюю квадратическую ошибку прогноза для индивидуального значения результативного признака:




427
,
0 5
,
82
)
5
,
6 6
,
7
(
10 1
1 230
,
1 1
1 2
1 2
2
ˆ
прогн














n
i
i
пр
y
x
x
х
x
n
S
S
По таблице значений критерия Стьюдента находим табличное
(критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8: табл
t
=2,306
Рассчитываем доверительный интервал:




табл прогн
t
S
пр
0,427×2,306 = 0,984
Нижняя граница прогноза:




пр
пр
нижн
пр
у
у
ˆ
ˆ
26,279 – 0,984 = 25,295
Верхняя граница прогноза:

11




пр
пр
верх
пр
у
у
ˆ
ˆ
26,279 + 0,984 = 27,263
Вывод. С вероятностью 95% можно утверждать, что если значение среднегодовой стоимости основных фондов х составит 7,8 млн. руб., то значение выручки от продаж у будет находится в пределах от 25,295 до
27,263 млн. руб.
Рисунок 2 – Результаты моделирования и прогнозирования
23.277
26.279
29.280
y = 2.0606x + 10.206
R² = 0.9666 0
5 10 15 20 25 30 35 0
2 4
6 8
10 12
вы
руч
к
а
от
п
ро
даж
, м
л
н
. р
уб
.
среднегодовая стоимость основных фондов, млн. руб.
Фактические данные прогноз
Линейная модель

12
Задание по теме «Предпосылки МНК»
По модели, построенной в задании 1 проверить выполнение предпосылок МНК.
Выполнение Задания
Для того, что бы модель считалась адекватной, необходимо, что бы рядом остатков
i
i
i
y
y
ˆ



выполнялось 5 предпосылок МНК:
1. Случайный характер остатков;
2. Независимость ряда остатков (отсутствие автокорреляции);
3. Подчинение нормальному закону распределения;
4. Средняя величина остатков должна стремиться к нулю;
5. Гомоскедастичность остатков.
1. Случайный характер ряда остатков
Выдвигаем нулевую гипотезу о случайном характере распределения ряда остатков. Для проверки гипотезы (предпосылки) используем критерий
поворотных точек (критерий пиков).
Значение случайной переменной считается поворотной точкой, если оно одновременно больше соседних с ним элементов или, наоборот, меньше значений предыдущего и последующего за ним члена.
1 1
1 1








i
i
i
i
i
i






Для выполнения предпосылки должно выполняться неравенство:
,
90 29 16 96
,
1 3
)
2
(
2













n
n
р
где
р – количество поворотных точек;
п – количество наблюдений.;
1,96 – квантиль нормального распределения для 5% уровня значимости.
Квадратные скобки означают, что берется целая часть числа.

13
Т.к. данные пространственные (по предприятиям), то ранжируем ряд в порядке возрастания фактора х и строим график остатков.
Рисунок 3 – График остатков
2
]
97
,
2
[
90 29 10 16 96
,
1 3
)
2 10
(
2 90 29 16 96
,
1 3
)
2
(
2



























n
n
По графику остатков видно, что всего 6 поворотных точек.
Вывод. Т.к. 6 > 2, неравенство выполняется, гипотеза о случайности остатков принимается, предпосылка выполняется, с вероятностью 95% остатки имеют случайный характер.
2. Независимость ряда остатков
Выдвигаем нулевую гипотезу о независимости ряда случайных отклонений. Для проверки гипотезы (предпосылки) применяем критерий
Дарбина-Уотсона. Расчетное значение критерия рассчитывается по формуле:







n
i
i
n
i
i
i
dw
1 2
2 2
1
)
(



-2.50
-2.00
-1.50
-1.00
-0.50 0.00 0.50 1.00 1.50 2.00 2.50 3.00 0
2 4
6 8
10 12
Зн
ач
ен
и
е
ос
тат
к
ов
е
Значение фактора х

14
Значение коэффициента находится в пределах от 0 до 4. В случае отсутствия автокорреляции dw = 2, при положительной автокорреляции dw
стремится к нулю, а при отрицательной - к 4.
На практике применение критерия Дарбина—Уотсона основано на сравнении величины dw с теоретическими значениями d
l и d
u
для заданных числа наблюдений n, числа независимых переменных модели k и уровня значимости α.
Если dw < d
l
, то гипотеза о независимости случайных отклонений отвергается (следовательно, присутствует положительная автокорреляция);
Если d
u
< dw < 2, то гипотеза не отвергается;
Если d
l
< dw < d
u
, то нет достаточных оснований для принятия решений.
Когда расчетное значение dw превышает 2, то с d
l
и d
u
сравнивается не сам коэффициент dw, а выражение
dw
dw


4
*
Расчет критерия Дарбина-Уотсона:
410
,
2 10
,
12 15
,
29


dw
Т.к.
2

dw
, то находим
dw
dw


4
*
=4 – 2,410 = 1,590
Для n = 10 (число наблюдений) при k = 1 (число факторов) и α = 0,05 табличные значения составляют:
d
l
= 0,88
d
u
= 1,32
Вывод. Т.к.
2 590
,
1
*
32
,
1




dw
d
u
, то гипотеза о независимости остатков принимается, предпосылка об отсутствии автокорреляции
выполняется. С вероятностью 95% в ряду остатков автокорреляция отсутствует.

15
3. Подчинение ряда остатков нормальному закону распределения
Выдвигаем нулевую гипотезу о нормальности распределения остатков.
Для проверки гипотезы используем R/S-критерий, который рассчитывается по формуле:



S
S
R
min max


, где min max
,


- максимальное и минимальное значение остатков;

S
- скорректированное среднее квадратическое отклонение остатков.
159
,
1 1
10 10
,
12 1
1 2







n
S
n
i
i


Расчет R/S-критерия:
712
,
3 159
,
1
)
87
,
1
(
43
,
2




S
R
Критические значения критерия при α = 0,05 для n = 10 составляют 2,67 и 3,57.
Вывод. Поскольку расчетное значение критерия не попадает внутрь табличного интервала [2,67; 3,57], то гипотеза о нормальности распределения остатков отвергается, предпосылка не выполняется.
Таблица 4
Вспомогательная таблица для расчета критерия Дарбина-Уотсона

i
x
i
y
i
i
i
y
y
ˆ



2
i

2 1
)
(


i
i


1 2
14
-0,33 0,11 2
3 16
-0,39 0,15 0,00 3
4 18
-0,45 0,20 0,00 4
5 20
-0,51 0,26 0,00 5
6 25 2,43 5,91 8,64 6
7 24
-0,63 0,40 9,37 7
8 27 0,31 0,10 0,88 8
9 29 0,25 0,06 0,00 9
10 32 1,19 1,41 0,88 10 11 31
-1,87 3,51 9,37

16
Итого
0,00 12,10 29,15
4. Проверка на равенство нулю математического ожидания ряда
остатков
Средняя величина остатков должны стремиться к нулю.
0 10 0
1





n
n
i
i


Вывод.

= 0, предпосылка выполняется (для линейной модели данная предпосылка выполняется автоматически).
5. Гомоскедастичность остатков


написать администратору сайта