Контрольная работа по эконометрике Номер зачетной книжки 122. Подставляем значения параметров m1, n2, l2
Скачать 166.13 Kb.
|
1 Контрольная работа по эконометрике Номер зачетной книжки 122. Подставляем значения параметров: m=1, n=2, l=2. Задание 1. По территориям десяти регионов (i - номер региона) Приволжского федерального округа известны данные по среднегодовой заработной плате за год - у i руб. и среднедушевому прожиточному минимуму одного рабочего в день - х i руб. (Таблица 1). i 1 2 3 4 5 6 7 8 9 10 х i 162-n 155 180 175 161 170 144 160 192 150+l y i 95+n 108 125 110 88 100 96 90 133 95+l Требуется построить по этим данным выборочное линейное уравнение регрессии и произвести его статистический анализ, т.е.: 1. Вычислить значения коэффициентов b 0 и b 1 уравнения 0 1 ˆy b b x методом МНК. 2. Проверить значимость коэффициентов b 0 и b 1 по критерию Стьюдента. 3. Проверить построенное уравнение регрессии на адекватность по критерию Фишера и средней относительной погрешности. 4. Построить диаграмму рассеивания и уравнение прямой. 5. Вычислить прогнозные значение прожиточного минимума для x пр =150+ l Решение: Подставим в исходные данные значения параметров m, n, l: i 1 2 3 4 5 6 7 8 9 10 х i 160 155 180 175 161 170 144 160 192 152 y i 97 108 125 110 88 100 96 90 133 97 Для повышения наглядности вычислений по МНК построим таблицу: № x i y i x 2 i x i ּ◌y i y 2 i ˆ i y 2 ( ) i y y 2 ˆ ( ) i i y y 2 ( ) i e e А i 1 160 97 25600 15520 9409 100,37 54,76 16,259 11,342 3,4719 2 155 108 24025 16740 11664 96,253 12,96 66,369 137,99 10,877 3 180 125 32400 22500 15625 116,83 424,36 154,4 66,817 6,5393 4 175 110 30625 19250 12100 112,71 31,36 69,078 7,3512 2,4648 5 161 88 25921 14168 7744 101,19 268,96 10,3 173,99 14,989 6 170 100 28900 17000 10000 108,6 19,36 17,613 73,905 8,5968 7 144 96 20736 13824 9216 87,201 70,56 295,79 77,416 9,1653 8 160 90 25600 14400 8100 100,37 207,36 16,259 107,49 11,52 9 192 133 36864 25536 17689 126,7 817,96 497,32 39,682 4,7364 10 152 97 23104 14744 9409 93,785 54,76 112,69 10,339 3,3149 ∑ 1649 1044 273775 173682 110956 1044 1962,4 1256,1 706,32 75,675 среднее 164,9 104,4 27378 17368 11096 104,4 196,24 125,61 70,632 7,5675 По формулам, приведенным в методических указаниях, находим: ( , ) Cov x y x y x y 152,64; 2 2 ( ) Var x x x 185,49; 2 2 ( ) Var y y y 196,24; 2 1 ( , ) ( ) Cov x y b Var x 0,8229; 0 1 b y b x –31,296; ( , ) ( ) ( ) xy Cov x y r Var x Var y 0,8000; 2 2 xy R r 0,6400; 2 ( ) 2 n S Var e n 88,290; 2 2 0 ( ) S x S n Var x 36,099; 2 1 ( ) S S n Var x 0,2181; 0 0 0 | | b t S 0,8669; 1 1 1 | | b t S 3,7718; 2 2 ( 2) (1 ) R n F R 14,227; 10 1 / 10 i i A A 7,5675. Построим корреляционное поле вместе с линией регрессии 0 1 ˆy b b x : 3 Теперь определим значимость параметров 0 b и 1 b , входящих в построенное уравнение регрессии. Для этого зададимся уровнем значимости α = 0,05; вычислим число степеней свободы v = n – 2 = 10 – 2 = 8. И далее по таблице распределения критерия Стьюдента определим t кр = t(α,v 1 ) = t(0,05; 8) = 2,301. Так как t 0 = 0,8669 < t кр = 2,301 и t 1 = 3,7718 > t кр = 2,301, параметр 1 b значимо отличается от нуля и должен быть оставлен в модели. Значит, построенное уравнение регрессии будет иметь вид: ˆy 0,8229 х. Оно показывает, что увеличение прожиточного минимума на 1 руб. приводит к увеличению среднегодовой зарплаты в среднем на 0,8229 руб. Теперь определим, насколько хорошо построенное уравнение регрессии описывает наблюдаемые значения y. Для этого снова зададимся уровнем значимости α = 0,05; найдем по формулам: k 1 = 1, k 2 = n – 2 = 10 – 2 = 8 числа степеней свободы; далее по таблице распределения критерия Фишера - Снедекора найдем F кр = F(α, k 1, k 2 ) = F(0,05;1;8) = 5,320. Так как F = 14,227 > F кр = 5,320, то делаем вывод, что построенное уравнение регрессии адекватно описывает наблюдаемые значения переменной y и им можно пользоваться для прогнозирования значений y при соответствующих значениях x. Для построенной модели значение коэффициента детерминации R 2 = 0,6400; что свидетельствует о том, что 64,00% вариации значений переменной y объясняется изменчивостью переменной x, и в 36,00% вариации значений y объясняется воздействием случайного фактора. Для построенной модели значение выборочного коэффициента корреляции есть r xy = 0,8000. Вычислим значение 2 ( 2) 1 r xy xy n t r r =3,7718. Выдвинем гипотезу Н 0 : ρ xy = 0. Зададимся уровнем значимости α = 0,05, вычислим v = n – 2= 10 – 2 = 8 и по таблице распределения критерия Стьюдента найдем t кр = 2,310. Для t кр и t r выполняется неравенство t r = 3,7718 > t кр = 2,301, из которого мы делаем вывод, что нулевая гипотеза должна быть отвергнута и мы должны признать, что между переменными x и y существует 4 значимая линейная зависимость. Это является еще одним подтверждением адекватности построенного уравнения регрессии. Средняя относительная погрешность модели: A 7,5675 %. Так как A <10 %, то построенное уравнение регрессии адекватно описывает наблюдаемые значения. Прогнозное значение модели для x пр =152 возьмем из таблицы выше: у пр =93,785. Задание 2. По семи формам имеются данные (см. таблицу 2) за год зависимости цены товара у i руб. от дальности перевозки х i1 км и расходов на рекламу х i2 тыс. руб. i 1 2 3 4 5 6 7 у i 45,72 51,01 50,25 72,55 64,12 69,37 42,91 х i1 11 17-m 14 30-n 18 20-l 9 х i2 8 5+m 10 8+n 6 4+l 12 Требуется по этим данным построить выборочное линейное уравнение множественной регрессии и провести статистический анализ, т.е.: 1. Вычислить значения коэффициентов b 0 , b 1 и b 2 уравнения 0 1 1 2 2 ˆy b b x b x методом МНК. 2. Проверить значимость коэффициентов b 0 , b 1 и b 2 по критерию Стьюдента. 3. Проверить значимость коэффициента корреляции 1 2 x x r по критерию Стьюдента. 4. Проверить построенное уравнение регрессии на адекватность по критерию Фишера и средней относительной погрешности. Решение: Подставим в исходные данные значения параметров m, n, l: i 1 2 3 4 5 6 7 у i 45,72 51,01 50,25 72,55 64,12 69,37 42,91 х i1 11 16 14 28 18 18 9 х i2 8 6 10 10 6 6 12 Предположим, что между объясняемой переменной y и объясняющими переменными x 1 и x 2 существует линейная зависимость: 0 1 1 2 2 y x x . По имеющейся у нас выборке наблюдений методом наименьших квадратов построим зависимость: 0 1 1 2 2 y b b x b x Будем предполагать, что все условия Гаусса – Маркова для случайного члена в зависимости выполнены. Для удобства и повышения наглядности расчетов составим вспомогательную таблицу: Таблица № x 1 x 2 y x 1 2 x 2 2 y 2 1 1 2 2 ( )( ) x x x x 1 1 ( )( ) x x y y 1 11 8 45,72 121 64 2090,3 1,5102 57,305 2 16 6 51,01 256 36 2602 0,6531 1,5861 3 14 10 50,25 196 100 2525,1 -3,918 14,426 4 28 10 72,55 784 100 5263,5 20,082 187,29 5 18 6 64,12 324 36 4111,4 -3,918 12,958 6 18 6 69,37 324 36 4812,2 -3,918 21,958 7 9 12 42,91 81 144 1841,3 -27,06 99,46 ∑ 114 58 395,93 2086 516 23246 -16,57 394,99 Среднее значение 16,286 8,2857 56,561 298 73,714 3320,8 -2,367 56,427 5 Продолжение таблицы № 2 2 ( )( ) x x y y pac y 2 ( ) pac y y 2 ( ) y y А i 1 3,0976 48,17 6,0042 117,54 5,3595 2 12,689 58,519 56,383 30,818 14,72 3 -10,82 50,981 0,5345 39,834 1,4549 4 27,409 74,01 2,131 255,63 2,0121 5 -17,28 61,809 5,3423 57,132 3,6047 6 -29,28 61,809 57,174 164,06 10,9 7 -50,71 40,633 5,1865 186,36 5,3074 ∑ -64,88 395,93 132,76 851,38 43,359 Среднее значение -9,269 56,561 18,965 121,63 6,1941 Теперь по ранее полученным формулам (см. методические указания) вычисляем значения величин: 2 2 1 1 1 ( ) ( ) Var x x x 32,776; 2 2 2 2 2 ( ) ( ) Var x x x 5,0612; 2 2 ( ) ( ) Var y y y 121,63; 10 1 2 1 2 1 2 1 1 ( , ) ( ) ( ) 10 i i i Cov x x x x x x -2,3673; 10 1 1 1 1 1 ( , ) ( ) ( ) 10 i i i Cov x y x x y y 56,427; 10 2 2 2 1 1 ( , ) ( ) ( ) 10 i i i Cov x y x x y y -9,269; 1 2 2 1 2 1 2 1 2 1 2 ( , ) ( ) ( , ) ( , ) ( ) ( ) ( , ) Cov x y Var x Cov x y Cov x x b Var x Var x Cov x x 1,6449; 2 1 1 1 2 2 2 1 2 1 2 ( ) ( ) ( , ) ( , ) ( ) ( ) ( , ) Cov x y Var x Cov x y Cov x x b Var x Var x Cov x x -1,062; 0 1 1 2 2 b y b x b x 38,572; 10 2 1 1 ˆ ( ) ( ) 10 i i i Var e y y 18,965; 2 10 ( ) 7 S Var e 33,189; 2 ( ) 1 ( ) Var e R Var y 0,8440; 1 2 1 2 1 2 ( , ) ( ) ( ) x x Cov x x r Var x Var x -0,1838; 0 1 2 1 2 1 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 2 ( ) ( ) 2 cov( , ) [1 ] ( ) (1 ) ( ) (1 ) ( ) ( ) (1 ) b x x x x x x S x x x x x x S n Var x r Var x r Var x Var x r 11,398; 1 1 2 2 2 2 1 0,339 ( ) (1 ) 10 9,560 (1 0,599 ) b x x S S n Var x r 0,3869; 2 1 2 2 2 2 ( ) (1 ) b x x S S n Var x r 0,9846; 6 0 0 0 | | b b b t S 3,3842; 1 1 1 | | b b b t S 4,2511; 2 2 2 | | b b b t S 1,0785. Далее задаемся уровнем значимости α = 0,05; вычисляем число степеней свободы по формуле v = n – k – 1 = 7 – 2 – 1 = 4 и по таблице распределения критерия Стьюдента определяем t кр = t(0,05; 4) = 2,776; выдвигаем гипотезу H 0 : b 0 = 0, так как t b0 = 3,3842 > t кр = 2,776, то гипотезу H 0 отвергаем и поэтому делаем заключение что b 0 значимо отличается от 0. Так как t b1 = 4,2511 > t кр = 2,776, то b 1 значимо отличается от 0. Так как t b2 = 1,0785 < t кр = 2,776, то b 2 незначимо отличается от 0. Значит, построенное уравнение регрессии будет иметь вид: ˆy 1,6449 x 1 +38,572. Теперь проверим адекватность построенного уравнения регрессии наблюдаемым значениям объясняемой переменной y. Для этого вычислим статистику F: 2 2 1 1 R n k F R k 10,826. Выдвигаем нулевую гипотезу Н 0 : F = 0. Для уровня значимости α = 0,05 числа степеней k 1 = k = 2 и k 2 = n – k – 1 = 7 – 2 – 1 = 4 по таблице распределения критерия Фишера - Снедекора определяем F кр = F(0,05; 2, 4) = 6,9. Так как F=10,826 > F кр = 6,9, нулевую гипотезу Н 0 : F = 0 отвергаем и признаем, что построенное уравнение регрессии адекватно описывает наблюдаемые в выборке значения объясняемой переменной у. Для построенной модели значение выборочного коэффициента корреляции есть r х1х2 = -0,1838. Вычислим значение 1 2 2 1 2 3 2 1 r x x x x n t r r =-0,2644. Выдвинем гипотезу Н 0 : r x1x2 = 0. Зададимся уровнем значимости α = 0,05, вычислим v = n – 3= 7 – 3 = 4 и по таблице распределения критерия Стьюдента найдем t кр = 2,776 Для t кр и t r выполняется неравенство t r = -0,2644 < t кр = 2,776, из которого мы делаем вывод, что нулевая гипотеза должна быть принята и мы должны признать, что между переменными x 1 и x 2 не существует значимой линейной зависимости. Средняя относительная погрешность модели: A 6,1941. Так как A <10 %, то построенное уравнение регрессии адекватно описывает наблюдаемые значения. |