Пример решения задач по эконометрике. Линейная модель парной регрессии
Скачать 0.87 Mb.
|
Содержание Задание по теме «Линейная модель парной регрессии» .......................................... 2 Выполнение Задания .................................................................................................... 3 1. Построение поля корреляции .............................................................................. 3 2. Построение линейной модели парной регрессии ............................................. 4 3. Коэффициент корреляции, детерминации, эластичности ................................ 5 4. Оценка значимости модели в целом................................................................... 7 5. Оценка значимости параметров модели ............................................................ 8 6. Оценка точности модели ................................................................................... 10 7. Прогнозирование выручки от продаж.............................................................. 10 Задание по теме «Предпосылки МНК» .................................................................... 12 Выполнение Задания .................................................................................................. 12 1. Случайный характер ряда остатков .................................................................. 12 2. Независимость ряда остатков ........................................................................... 13 3. Подчинение ряда остатков нормальному закону распределения ................. 15 4. Проверка на равенство нулю математического ожидания ряда остатков .... 16 5. Гомоскедастичность остатков ........................................................................... 16 Экономьте свое время и нервы. Если мало свободного времени и у вас нет намерений стать в будущем профессором по эконометрике, то закажите работу и сможете заняться чем-то более полезным для учебы, работы, семьи, себя. Работы стараюсь расписывать доступным языком, достаточно подробно. По готовой работе, я думаю, вы сможете разобраться что- откуда-куда-почему. Также гарантирована правильность решения. Вы по неопытности можете ошибиться, обсчитаться, не до конца понимая сути вопроса сделать ошибочные выводы и т.п. Рискуете во время сессии тратить драгоценное время на поиск и устранение ошибок, доработки. Это чревато стрессом и плохим настроением. Берегите себя! https://studwork.org/info/3518 2 Задание по теме «Линейная модель парной регрессии» Даны данные по 10 предприятиям: Таблица 1 Исходные данные № Среднегодовая стоимость основных фондов, млн. руб. Выручка от продаж, млн. руб. 1 2 14 2 3 16 3 4 18 4 5 20 5 6 25 6 7 24 7 8 27 8 9 29 9 10 32 10 11 31 1. Построить поле корреляции, сделать предположение о направлении и форме связи 2. Построить линейное уравнение парной регрессии. 3. Рассчитать коэффициент корреляции и детерминации, оценить статистическую значимость коэффициента корреляции. Рассчитать коэффициент эластичности. 4. Оценить значимость построенной модели в целом. 5. Оценить значимость параметров модели. 6. Оценить точность модели с помощью средней относительной ошибки аппроксимации. 7. Построить прогноз выручки от продаж, если значение среднегодовой стоимости основных фондов составит 120% от среднего уровня. Отобразить на графике результаты моделирования и прогнозирования. 3 Выполнение Задания 1. Построение поля корреляции Построим поле корреляции (диаграмму рассеяния). По расположению точек на поле корреляции можно судить о направлении и форме связи между переменными. Рисунок 1 – Поле корреляции Вывод. Расположение облака точек на поле корреляции произошло из левого нижнего угла в правый верхний угол. Это говорит о наличии прямой связи (положительной зависимости) между переменными. Т.е. с увеличением среднегодовой стоимости основных фондов х значения выручки от продаж у тоже в среднем увеличиваются. По форме связи можно предположить линейную зависимость. 0 5 10 15 20 25 30 35 0 2 4 6 8 10 12 вы руч к а от п ро даж , м л н . р уб . среднегодовая стоимость основных фондов, млн. руб. 4 2. Построение линейной модели парной регрессии Общий вид линейного уравнения парной регрессии: i i bx a y ˆ , где i yˆ - расчетные теоретические значения результативного признака для i-го наблюдения; a и b – параметры линейного уравнения парной регрессии; b – коэффициент регрессии, который показывает на сколько в среднем изменяется значение результативного признака у при увеличении фактора х на единицу измерения; x i – значение факторного признака для i-го наблюдения. Параметры линейного уравнения найдем с помощью метода наименьших квадратов (МНК). Для определения параметров необходимо решить систему линейных уравнений /(систему нормальных уравнений): n i i i n i i n i i n i i n i i y x b x a x y b x na 1 1 2 1 1 1 Для расчета параметров можно использовать готовые формулы, которые вытекают из данной системы: 2 2 2 2 5 , 6 5 , 50 6 , 23 5 , 6 4 , 170 ) cov( x x y x xy xy b x 2,061 x b y a = 23,6 – 2,061×6,5 = 10,206 Получили линейное уравнение парной регрессии: i yˆ 10,206 + 2,061 i x Вывод. Коэффициент регрессии b показывает, что при увеличении среднегодовой стоимости основных фондов на 1 млн. руб. значение выручки от продаж в среднем возрастает на 2,061 млн. руб. Поскольку значение положительное, то связь между признаками прямая. 5 Свободный член а = 10,206 оценивает влияние прочих факторов, оказывающих воздействие на результативный признак. Т.е. воздействие прочих факторов увеличивает значение выручки от продаж. Теоретические (расчетные) значения результативного признака i yˆ получаем путем последовательной подстановки значений факторного признака i x в уравнение регрессии. Рассчитываем остатки, как разность фактических и расчетных значений результативного признака: i i i y y ˆ Таблица 2 Вспомогательная таблица для расчета коэффициента корреляции и построения модели № i x i y 2 i x i i y x 2 i y 1 2 14 4 28 196 2 3 16 9 48 256 3 4 18 16 72 324 4 5 20 25 100 400 5 6 25 36 150 625 6 7 24 49 168 576 7 8 27 64 216 729 8 9 29 81 261 841 9 10 32 100 320 1024 10 11 31 121 341 961 Итого 12 236 505 1704 5932 Среднее 6,5 23,6 50,5 170,4 593,2 3. Коэффициент корреляции, детерминации, эластичности Коэффициент корреляции показывает тесноту и направление линейной связи между переменными. Чем ближе значение коэффициента к единице (по модулю), тем более тесная связь между признаками. y x yx b r , где y x , - средние квадратические отклонения признаков. 6 Расчет средний квадратических отклонений: 872 , 2 5 , 6 5 , 50 2 2 2 x x x 020 , 6 6 , 23 2 , 593 2 2 2 y y y Расчет коэффициента корреляции: 020 , 6 872 , 2 061 , 2 yx r 0,983 Вывод. Значение близко к единице, коэффициент корреляции показывает, что связь между среднегодовой стоимостью основных фондов и выручкой от продаж очень тесная и прямая. Коэффициент детерминации характеризует долю вариации результативного признака под влиянием фактора, включенного в модель. 2 2 893 , 0 xy r = 0,967 Вывод. 96,7% вариации выручки от продаж у происходит под влиянием среднегодовой стоимости основных фондов х. Остальные 3,3% вариации выручки от продаж у объясняется влиянием прочих случайных факторов, неучтенных в модели. Выдвигаем нулевую гипотезу о равенстве нулю коэффициента корреляции (незначимости связи между признаками): 0 : 0 yx r Н Альтернативная гипотеза: 0 : 1 yx r Н Для проверки гипотезы рассчитываем значение t-критерия Стьюдента: 220 , 15 ) 2 10 ( 967 , 0 1 967 , 0 ) 2 ( 1 2 2 n r r t xy xy r По таблице значений критерия Стьюдента находим табличное (критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8: табл t 2,306 7 Вывод. Поскольку табл t t r , то нулевую гипотезу о равенстве нулю коэффициента корреляции 0 : 0 yx r Н отклоняем с вероятностью допустить ошибку в 5%. Связь между признаками является статистически значимой. Коэффициент эластичности показывает, на сколько процентов в среднем изменяется значение результативного признака у при увеличении факторного признака х на 1%. Расчет коэффициента эластичности: 6 , 23 5 , 6 061 , 2 y x b Э 0,568% Вывод. При увеличении значений среднегодовой стоимости основных фондов х на 1% значение выручки от продаж у в среднем возрастает на 0,568%. 4. Оценка значимости модели в целом Выдвигаем нулевую гипотезу о том, что найденные показатели тесноты связи случайны, т.е. коэффициент детерминации равен нулю: 0 : 2 0 xy r Н Альтернативная гипотеза: 0 : 2 1 yx r Н Для проверки нулевой гипотезы рассчитываем значение F-критерия Фишера: 66 , 231 ) 2 10 ( 967 , 0 1 967 , 0 ) 2 ( 1 2 2 n r r F xy xy По таблице значений критерия Фишера находим табличное (критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df 1 = 1 и df 2 = n – 2 = 10 – 2 = 8: F табл = 5,318 8 Вывод. Поскольку 318 , 5 66 , 231 табл F F , то нулевую гипотезу о равенстве нулю коэффициента детерминации 0 : 2 0 xy r Н отклоняем с вероятностью допустить ошибку в 5%. Модель является статистически значимой, показатели силы связи не случайны. 5. Оценка значимости параметров модели Выдвигаем нулевые гипотезы о том, что найденные параметры не являются статистически значимыми: 0 : 0 а Н и 0 : 0 b Н Для проверки гипотез рассчитывают t-критерий Стьюдента: a a S a t и b b S b t , где S a и S b – стандартные ошибки параметров модели. Рассчитываем стандартную ошибку модели: 230 , 1 2 10 10 , 12 2 2 ) ˆ ( 1 2 1 2 ˆ n n y y S n i i n i i i y Находим стандартную ошибку свободного члена а: 962 , 0 872 , 2 10 505 230 , 1 1 2 ˆ x n i i y a n x S S Находим стандартную ошибку коэффициента регрессии b: 135 , 0 10 872 , 2 230 , 1 ˆ n S S x y b Расчет фактических значений критерия Стьюдента: 608 , 10 962 , 0 206 , 10 a t 220 , 15 135 , 0 061 , 2 b t 9 По таблице значений критерия Стьюдента находим табличное (критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8: табл t 2,306 Вывод. Поскольку 306 , 2 608 , 10 табл t t a и 220 , 15 b t 306 , 2 табл t , то нулевые гипотезы о равенстве нулю параметров модели 0 : 0 а Н и 0 : 0 b H отклоняем с вероятностью допустить ошибку в 5%. Свободный член (константа) и коэффициент регрессии являются статистически значимыми. Коэффициент регрессии является статистически значимым. Следовательно, и фактор при этом коэффициенте значим. Проверка: F t t r b = 15,220 Таблица 3 Вспомогательная таблица для оценки качества модели № i x i y i yˆ i i i y y ˆ 2 i i i y 2 y y i 2 x x i 1 2 14 14,33 -0,33 0,11 0,023 92,16 20,25 2 3 16 16,39 -0,39 0,15 0,024 57,76 12,25 3 4 18 18,45 -0,45 0,20 0,025 31,36 6,25 4 5 20 20,51 -0,51 0,26 0,025 12,96 2,25 5 6 25 22,57 2,43 5,91 0,097 1,96 0,25 6 7 24 24,63 -0,63 0,40 0,026 0,16 0,25 7 8 27 26,69 0,31 0,10 0,011 11,56 2,25 8 9 29 28,75 0,25 0,06 0,009 29,16 6,25 9 10 32 30,81 1,19 1,41 0,037 70,56 12,25 10 11 31 32,87 -1,87 3,51 0,060 54,76 20,25 Итого 12 236 236,00 0,00 12,10 0,339 362,40 82,50 10 6. Оценка точности модели Для оценки точности модели рассчитываем среднюю относительную ошибку аппроксимации: 10 1 % 100 1 1 n i i i отн y n Е ×0,339×100% = 3,39% Вывод. Ошибка показывает, что в среднем фактические значения выручки от продаж у отличаются от полученных по линейной модели парной регрессии на 3,39%. Т.к. ошибка меньше 7%, то модель считается точной. 7. Прогнозирование выручки от продаж Прогнозное значение фактора (120% от среднего значения): 2 , 1 х х пр 6,5×1,2 = 7,8 Прогнозное значение результативного признака (точечный прогноз): пр пр bx a уˆ 10,206 + 2,061×7,8 = 26,279 Рассчитываем среднюю квадратическую ошибку прогноза для индивидуального значения результативного признака: 427 , 0 5 , 82 ) 5 , 6 6 , 7 ( 10 1 1 230 , 1 1 1 2 1 2 2 ˆ прогн n i i пр y x x х x n S S По таблице значений критерия Стьюдента находим табличное (критическое) значение критерия на уровне значимости α = 0,05 и с числом степеней свободы df = n – 2 = 10 – 2 = 8: табл t =2,306 Рассчитываем доверительный интервал: табл прогн t S пр 0,427×2,306 = 0,984 Нижняя граница прогноза: пр пр нижн пр у у ˆ ˆ 26,279 – 0,984 = 25,295 Верхняя граница прогноза: 11 пр пр верх пр у у ˆ ˆ 26,279 + 0,984 = 27,263 Вывод. С вероятностью 95% можно утверждать, что если значение среднегодовой стоимости основных фондов х составит 7,8 млн. руб., то значение выручки от продаж у будет находится в пределах от 25,295 до 27,263 млн. руб. Рисунок 2 – Результаты моделирования и прогнозирования 23.277 26.279 29.280 y = 2.0606x + 10.206 R² = 0.9666 0 5 10 15 20 25 30 35 0 2 4 6 8 10 12 вы руч к а от п ро даж , м л н . р уб . среднегодовая стоимость основных фондов, млн. руб. Фактические данные прогноз Линейная модель 12 Задание по теме «Предпосылки МНК» По модели, построенной в задании 1 проверить выполнение предпосылок МНК. Выполнение Задания Для того, что бы модель считалась адекватной, необходимо, что бы рядом остатков i i i y y ˆ выполнялось 5 предпосылок МНК: 1. Случайный характер остатков; 2. Независимость ряда остатков (отсутствие автокорреляции); 3. Подчинение нормальному закону распределения; 4. Средняя величина остатков должна стремиться к нулю; 5. Гомоскедастичность остатков. 1. Случайный характер ряда остатков Выдвигаем нулевую гипотезу о случайном характере распределения ряда остатков. Для проверки гипотезы (предпосылки) используем критерий поворотных точек (критерий пиков). Значение случайной переменной считается поворотной точкой, если оно одновременно больше соседних с ним элементов или, наоборот, меньше значений предыдущего и последующего за ним члена. 1 1 1 1 i i i i i i Для выполнения предпосылки должно выполняться неравенство: , 90 29 16 96 , 1 3 ) 2 ( 2 n n р где р – количество поворотных точек; п – количество наблюдений.; 1,96 – квантиль нормального распределения для 5% уровня значимости. Квадратные скобки означают, что берется целая часть числа. 13 Т.к. данные пространственные (по предприятиям), то ранжируем ряд в порядке возрастания фактора х и строим график остатков. Рисунок 3 – График остатков 2 ] 97 , 2 [ 90 29 10 16 96 , 1 3 ) 2 10 ( 2 90 29 16 96 , 1 3 ) 2 ( 2 n n По графику остатков видно, что всего 6 поворотных точек. Вывод. Т.к. 6 > 2, неравенство выполняется, гипотеза о случайности остатков принимается, предпосылка выполняется, с вероятностью 95% остатки имеют случайный характер. 2. Независимость ряда остатков Выдвигаем нулевую гипотезу о независимости ряда случайных отклонений. Для проверки гипотезы (предпосылки) применяем критерий Дарбина-Уотсона. Расчетное значение критерия рассчитывается по формуле: n i i n i i i dw 1 2 2 2 1 ) ( -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50 3.00 0 2 4 6 8 10 12 Зн ач ен и е ос тат к ов е Значение фактора х 14 Значение коэффициента находится в пределах от 0 до 4. В случае отсутствия автокорреляции dw = 2, при положительной автокорреляции dw стремится к нулю, а при отрицательной - к 4. На практике применение критерия Дарбина—Уотсона основано на сравнении величины dw с теоретическими значениями d l и d u для заданных числа наблюдений n, числа независимых переменных модели k и уровня значимости α. Если dw < d l , то гипотеза о независимости случайных отклонений отвергается (следовательно, присутствует положительная автокорреляция); Если d u < dw < 2, то гипотеза не отвергается; Если d l < dw < d u , то нет достаточных оснований для принятия решений. Когда расчетное значение dw превышает 2, то с d l и d u сравнивается не сам коэффициент dw, а выражение dw dw 4 * Расчет критерия Дарбина-Уотсона: 410 , 2 10 , 12 15 , 29 dw Т.к. 2 dw , то находим dw dw 4 * =4 – 2,410 = 1,590 Для n = 10 (число наблюдений) при k = 1 (число факторов) и α = 0,05 табличные значения составляют: d l = 0,88 d u = 1,32 Вывод. Т.к. 2 590 , 1 * 32 , 1 dw d u , то гипотеза о независимости остатков принимается, предпосылка об отсутствии автокорреляции выполняется. С вероятностью 95% в ряду остатков автокорреляция отсутствует. 15 3. Подчинение ряда остатков нормальному закону распределения Выдвигаем нулевую гипотезу о нормальности распределения остатков. Для проверки гипотезы используем R/S-критерий, который рассчитывается по формуле: S S R min max , где min max , - максимальное и минимальное значение остатков; S - скорректированное среднее квадратическое отклонение остатков. 159 , 1 1 10 10 , 12 1 1 2 n S n i i Расчет R/S-критерия: 712 , 3 159 , 1 ) 87 , 1 ( 43 , 2 S R Критические значения критерия при α = 0,05 для n = 10 составляют 2,67 и 3,57. Вывод. Поскольку расчетное значение критерия не попадает внутрь табличного интервала [2,67; 3,57], то гипотеза о нормальности распределения остатков отвергается, предпосылка не выполняется. Таблица 4 Вспомогательная таблица для расчета критерия Дарбина-Уотсона № i x i y i i i y y ˆ 2 i 2 1 ) ( i i 1 2 14 -0,33 0,11 2 3 16 -0,39 0,15 0,00 3 4 18 -0,45 0,20 0,00 4 5 20 -0,51 0,26 0,00 5 6 25 2,43 5,91 8,64 6 7 24 -0,63 0,40 9,37 7 8 27 0,31 0,10 0,88 8 9 29 0,25 0,06 0,00 9 10 32 1,19 1,41 0,88 10 11 31 -1,87 3,51 9,37 16 Итого 0,00 12,10 29,15 4. Проверка на равенство нулю математического ожидания ряда остатков Средняя величина остатков должны стремиться к нулю. 0 10 0 1 n n i i Вывод. = 0, предпосылка выполняется (для линейной модели данная предпосылка выполняется автоматически). 5. Гомоскедастичность остатков |