Главная страница
Навигация по странице:

  • 696,5 Сравним полученные расчетные значения F-статистики Фишера с соответствующим табличным значением (см. таблица Распределение Фишера):= == =19,4

  • Практикум по эконометрике. Эконометрика Рассчитать выборочные дисперсии эмпирических коэффи. Методические указания по решению типовых практических задач, в том числе с помощью пакета прикладных программ ms excel


    Скачать 2.55 Mb.
    НазваниеМетодические указания по решению типовых практических задач, в том числе с помощью пакета прикладных программ ms excel
    АнкорПрактикум по эконометрике
    Дата11.10.2019
    Размер2.55 Mb.
    Формат файлаdoc
    Имя файлаЭконометрика Рассчитать выборочные дисперсии эмпирических коэффи.doc
    ТипМетодические указания
    #89663
    страница10 из 20
    1   ...   6   7   8   9   10   11   12   13   ...   20

    2.6. Решение типовых задач


    Задача 2.6.1.

    Рассмотрим в качестве примера множественной регрессии двухфакторную линейную модель. Исходные данные представлены в таблице 2.6.1.

    Таблица 2.6.1

    № группы

    Расходы на питание

    (y)

    Душевой доход

    (x1)

    Размер семьи

    (x2)

    1

    431

    626

    1,5

    2

    614

    1575

    2,1

    3

    790

    2235

    2,4

    4

    898

    2657

    2,7

    5

    1111

    3699

    3,2

    6

    1303

    4794

    3,4

    7

    1486

    5924

    3,6

    8

    1643

    7279

    3,7

    9

    1912

    9348

    4

    10

    2409

    18805

    3,7


    Необходимо:

    1. по МНК определить параметры множественной линейной регрессии ;

    2. оценить статистическую значимость найденных эмпирических коэффициентов регрессииb­1, b2;

    3. сравнить влияние факторов на результат при помощи средних коэффициентов эластичности;

    4. построить 95-% доверительные интервалы для найденных коэффициентов;

    5. вычислить коэффициент детерминации R2 и оценить его статистическую значимость при α = 0,05;

    6. Проверить качество построенного уравнения регрессии с помощью F-статистики Фишера.

    7. Оценить целесообразность включения в уравнение одного фактора после другого с помощью частных F-статистик Фишера.

    Решение:

    Определим по МНК коэффициенты уравнения регрессии. Для этого нам необходимо рассчитать следующую таблицу:


    Для вычисления коэффициентов уравнения регрессии необходимо определить значения 6-ти сумм:

    1. ==

    2. ==

    3. = =

    4.==

    5. = =

    6. = =

    Подставим полученные значения 6-ти сумм в формулы для расчета коэффициентов уравнения регрессии (m=2):

    или

    ==0,072;

    ==343,293;

    == -190,63.

    Таким образом, мы получили эмпирические значения параметров множественной линейной регрессии, которая имеет следующий вид:

    = - 190,63+0,072x1+343,293x2

    Рассмотрим матричный вид определения вектора оценок коэффициентов регрессии

    а. Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор получается из выражения:

    B = (XTX)-1XTY

    431

    614

    790

    898

    1111

    1303

    1486

    1643

    1912

    2409
    Матрица X Матрица Y

    1

    626

    1,5

    1

    1575

    2,1

    1

    2235

    2,4

    1

    2657

    2,7

    1

    3699

    3,2

    1

    4794

    3,4

    1

    5924

    3,6

    1

    7279

    3,7

    1

    9348

    4

    1

    18805

    3,7


    Матрица XT

    1

    1

    1

    1

    1

    1

    1

    1

    1

    1

    626

    1575

    2235

    2657

    3699

    4794

    5924

    7279

    9348

    18805

    1,5

    2,1

    2,4

    2,7

    3,2

    3,4

    3,6

    3,7

    4

    3,7


    б. Умножаем матрицы,  (XTX)

    в. Умножаем матрицы,  (XTY)

    г. Находим определитель det (XTX)T = 7865492387

    д. Находим обратную матрицу (XTX)-1

    е. Вектор оценок коэффициентов регрессии равен:

    B = (XTX)-1XTY

    Таким образом, мы получили уравнение регрессии: y = -190,6301 + 0,072x1 + 343,293x2

    2. оценим статистическую значимость найденных эмпирических коэффициентов регрессии b­1, b2 с помощью t-статистики Стьюдента. Для этого сначала необходимо определить стандартные ошибки коэффициентов корреляции:

    ==2207,582

     

    или

    ==0,0000169
    ==719,75304
    Определим значения t-статистик для каждого из коэффициентов:

    =17,5

    =12,7

    Сравним полученные расчетные значения t-статистики Стьюдента с соответствующим критическим значением (см. таблица Распределение Стъюдента):

    = == =2,365

    Так как , мы делаем вывод о том, что оба коэффициента сильно значимы для построенной модели.

    3. Рассчитаем средние коэффициенты эластичности для коэффициентов , входящих в уравнение множественной регрессии по следующей формуле:

    Таким образом, в случае изменения фактора X­­1 (доход семьи) на 1% зависимая переменная Y (расходы на питание) изменится на 0,326%, а если фактор X2 (количество человек в семье) изменится на 1%, то значение параметра Y изменится на 0,826%. Следовательно, большей чувствительностью модель обладает по фактору количество человек в семье.
    4. Построим 95-% доверительные интервалы для найденных коэффициентов:

    Таким образом, если по другим выборкам мы получим значение коэффициентов, принадлежащие этим интервалам, то мы можем утверждать, что уравнение регрессии покажет такое же поведение для Y как определенное по выборке.

    5. Определим коэффициент детерминации R2 и оценим его статистическую значимость при α = 0,05

    = = 0,995

    Следовательно, учтенные в модели факторы на 99,5% определяют поведение зависимой переменной Y.

    6. Проверим качество построенного уравнения регрессии с помощью F-статистики Фишера:

    ==696,5

    Сравним полученные расчетные значения F-статистики Фишера с соответствующим табличным значением (см. таблица Распределение Фишера):

    = == =19,4

    Следовательно, так как, мы делаем вывод о том, что модель имеет хороший уровень качества.

    6. Оценим целесообразность включения в уравнение одного фактора после другого с помощью частных F-статистик Фишера

    =

    =

    В нашем случае = 160,2173; = 300,0869; = 23,68 (для числа степеней свободы 7 и 1 соответственно и уровня значимости 0,05)

    Сравнивая значения и (300,0869 > 23,68), делаем вывод о том, что включение в модель фактора X2 после фактора X1 улучшает модель.

    Сравнение и (160,2173 > 23,86) также показывает, что включение в модель дополнительного фактора X1 после того, как фактор X2 уже включен в уравнение улучшает модель, но не на столько как в первом случае. Поэтому приходим к выводу о целесообразности включения фактора X2 после X1 и что оба фактора одинаково значимы для построенной модели.
    Рассмотрим решение задачи с помощью Excel

    Ехсеl позволяет при построении уравнения линейной регрессии большую часть работы сделать очень быстро. Важно понять, как интерпретировать полученные результаты. Воспользуемся надстройкой Пакет анализа.

    Сервис — Анализ данных — Регрессия — ОК. Появляется диалоговое окно, которое нужно заполнить. В графе Входной интервал Y: указывается ссылка на ячейки, содержащие значения результативного признака у. В графе Входной интервал Х: указывается ссылка на ячейки, содержащие значения факторов х1,..., хm (m≤16). Если первые из ячеек содержат пояснительный текст, то рядом со словом Метки нужно поставить «галочку» Уровень надежности (доверительная вероятность) по умолчанию предполагается равным 95%. Если исследователя это значение не устраивает, то рядом со словами Уровень надежности нужно поставить «галочку» и указать требуемое значение. Поставив «галочку» рядом со словом константа-ноль, исследователь получит b0 =0 по умолчанию. Если нужны значения остатков еi и их график, то нужно поставить «галочки» рядом со словами Остатки и График остатков. ОК. Появляется итоговое окно.

    Если число в графе Значимость F превышает 1 — Уровень надежности, то принимается гипотеза R2 = 0. Иначе принимается гипотеза R2 ≠ 0.

    Р-значение — это значения уровней значимости, соответствующие вычисленным t-статистикам. Р-значение = СТЬЮДРАСП (t -статистика; n-m-1) (статистическая функция мастера функций ƒx). Если Р-значение превышает 1 — Уровень надежности, то соответствующая переменная статистически незначима и ее можно исключить из модели.

    Нижние 95% и Верхние 95% — это нижние и верхние границы 95-процентных доверительных интервалов для коэффициентов теоретического уравнения линейной регрессии. Если исследователь согласился с принятым по умолчанию значением доверительной вероятности 95%, то последние два столбца будут дублировать два предыдущих столбца. Если исследователь вводил свое значение доверительной вероятности p, то последние два столбца содержат значения соответственно нижней и верхней границы p-процентных доверительных интервалов.


    Таким образом, при определении зависимости расходов на питание (Y) от размера дохода (X1) и от количества человек в семье (X2) было обнаружено, что при неизменном значении параметра количество человек в семье и изменения на 1 у.е. размера дохода семьи, расходы на питание вырастут на 0,07 у.е. В то же время, если не измениться доход семьи, а количество человек станет на одного больше, то расходы в семье вырастут на 343, 29 у.е.

    Поскольку > нулевая гипотеза отклоняется, то есть можно сделать вывод о статистической значимости уравнения в целом. Все выше обозначенные выводы позволяют сделать, что двухфакторная модель зависимости расходов на питание от душевого дохода и размера семьи является статистически значимой, надежной и может использоваться для прогнозов.

    1   ...   6   7   8   9   10   11   12   13   ...   20


    написать администратору сайта