Главная страница
Навигация по странице:

  • Эконометрика

  • Эконометрика — это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов

  • обзорная. Эконометрика. Э н. Хайрулин Ильяс Гаяревич Кафедра математических методов в экономике Литература


    Скачать 2.04 Mb.
    НазваниеЭ н. Хайрулин Ильяс Гаяревич Кафедра математических методов в экономике Литература
    Анкоробзорная. Эконометрика
    Дата15.02.2022
    Размер2.04 Mb.
    Формат файлаpptx
    Имя файла221810.pptx
    ТипЛитература
    #363067

    Эконометрика

    Преподаватель доц., к.э.н. Хайрулин Ильяс Гаяревич

    Кафедра математических методов в экономике

    Литература

    • Магнус Я.Р., Катышев П.К., Пересецкий А.А. - Эконометрика. Начальный курс: учебник.
    • Елисеева И.И. – Эконометрика: учебник
    • P.Newbold – Statistics for Business & Economics

    Эконометрика

    • «Эконометрика — это не то же самое, что экономическая статистика. Она не идентична и тому, что мы называем экономической теорией, хотя значительная часть этой теории носит количественный характер. Эконометрика не является синонимом приложений математики к экономике. Как показывает опыт, каждая из трех отправных точек — статистика, экономическая теория и математика — необходимое, но не достаточное условие для понимания количественных соотношений в современной экономической жизни. Это — единство всех трех доставляющих. И это единство образует эконометрику» (Рагнар Фриш, 1933г.)
    • Эконометрика — это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов

    Место эконометрики в управленческом процессе


    Цель

    Проблема

    Выдвижение альтернатив

    Сравнение, оценка и выбор

    Реализация

    Задачи, решаемые эконометрическим методом


    Классификация

    Обоснование связи и выявление значимых факторов

    Проверка гипотез экономической теории

    Прогнозирование

    Анализ

    Этапы эконометрического исследования

    • постановка проблемы
    • получение данных и анализ их качества
    • спецификация модели
    • оценка параметров
    • проверка качества (адекватности) модели
    • интерпретация результатов

    Этапы (подробнее)

    • качественный анализ связей экономических переменных — выделение зависимых (y) и независимых переменных (х);
    • подбор данных;
    • спецификация формы связи между у и x;
    • оценка параметров модели;
    • проверка ряда гипотез о свойствах распределения вероятностей для случайной компоненты (гипотезы о средней, дисперсии и ковариации);
    • анализ мультиколлинеарности объясняющих переменных, оценка ее статистической значимости, выявление переменных, ответственных за мультиколлинеарность;
    • введение фиктивных переменных;
    • выявление автокорреляции, лагов;
    • выявление тренда, циклической и случайной компонент;
    • проверка остатков на гетероскедастичность;
    • анализ структуры связей и построение системы одновременных уравнений;
    • проверка условия идентификации;
    • оценивание параметров системы одновременных уравнений (двухшаговый и трехшаговый метод наименьших квадратов, метод максимального правдоподобия);
    • моделирование на основе системы временных рядов: проблемы стационарности и коинтеграции;
    • построение рекурсивных моделей, ARIMA- и VAR- моделей;
    • проблемы идентификации и оценивания параметров.

    Сбор данных

    При моделировании экономических процессов используют следующие типы данных:

    • пространственные данные
    • Пространственными данными является набор сведений по разным объектам, взятым за один и тот же период или момент времени. Например, набор сведений по разным фирмам (объем производства, численность работников, размер основных производственных фондов и пр.).
    • временные данные
    • Временными данными является набор сведений, характеризующий один и тот же объект, но за разные периоды или моменты времени. Например, ежеквартальные данные о средней заработной плате, индексе потребительских цен, числе занятых за последние годы, ежедневный курс доллара США. Отличительной особенностью временных данных является то, что они естественным образом упорядочены по времени.
    • панельные данные
    • Панельными данными является набор сведений по разным объектам, взятый за интервал времени. То есть множество объектов наблюдается в течение определенного времени.

    Типы переменных

    Типы переменных, участвующих в эконометрической модели:

    • эндогенные (зависимые) — значения которых определяются внутри модели, или взаимозависимые (у);
    • экзогенные (независимые) – значения которых задаются извне, автономно, в определенной степени они являются управляемыми (планируемыми) (х)
    • лаговые — экзогенные или эндогенные переменные эконометрической модели, датированные предыдущими моментами времени и находящиеся в уравнении с текущими переменными. Например: yt — текущая эндогенная переменная, yt-1 — лаговая эндогенная переменная, yt-2 — тоже лаговая эндогенная переменная;
    • Предопределенные переменные (объясняющие переменные). К ним относятся лаговые и текущие экзогенные переменные (xt , xt-1 ), а также лаговые эндогенные переменные (yt-1 ).

      Любая эконометрическая модель предназначена для объяснения значений текущих эндогенных переменных (одной или нескольких) в зависимости от значений предопределенных переменных.

    Спецификация моделей

    Выделяют три основных класса моделей.

    I. Регрессионные модели с одним уравнением (факторов может быть один или несколько)

    • Линейные
    • Нелинейные
    • II. Модели временных рядов, полученные с помощью следующих методов

    • Экспоненциального сглаживания
    • Сезонной декомпозиции
    • Авторегрессии
    • ARIMA и др.
    • III. Системы одновременных уравнений  

    Линейность и аддитивность

    • Функция нескольких переменных y=f(x1,...,xn) линейна по всем независимым переменным тогда и только тогда, когда dy/dxi не включает xi, то есть когда d(dy/dxi)=0, эффект данного изменения по xi не зависит от уровня xi. В противном случае нелинейна
    • Функция является аддитивной по xi тогда и только тогда, когда dy/xi не включает xj , т.е. тогда, когда d(dy/dxi)/dxj=0 , эффект данного изменения по каждой независимой переменной не зависит от уровня другой переменной. В противном случае мультипликативна

    Оценка параметров

    Этот этап предполагает нахождение неизвестных элементов в модели тем или иным способом.

    Наиболее распространенным методом является МНК. МНК применяется к моделям, линейным по параметрам. Если функция регрессии нелинейна по параметрам, необходима её предварительная линеаризация.

    Если распределение остатков ненормально, то наилучшим методом их оценки будет не МНК, а ММП.

    Также если не выполняются предпосылки МНК, то для нахождения параметров можно использовать ММП.

    Проверка качества модели

    Это важнейший этап, заключающийся в определении следующего:

    • погрешности расчетов
    • точности предсказания по модели (доверительный интервал прогноза)
    • устойчивости модели к выборке (проверка по тестам Стьюдента и Фишера)

    Интерпретация результатов

    • Модель должна быть достаточно проста и отражать экономические взаимосвязи. В ином случае параметры не будут интерпретируемы.
    • Однако если модель строилась исключительно для прогноза, требования к экономической интерпретации смягчаются.

    Парная регрессия

    Базовые термины и идеи

    • Генеральная совокупность (population) (иногда используется калька с англоязычного термина – «популяция») – все множество объектов, в отношении которых формулируется исследовательская гипотеза

    • Выборка (sample) – ограниченная по численности группа объектов (респондентов), отбираемая из генеральной совокупности для изучения ее свойств

    • Сплошное и выборочное исследование

    • Репрезентативность выборки (representativeness of sample) – способность выборки представлять изучаемые явления достаточно полно с точки зрения их изменчивости в генеральной совокупности

    • Любое исследование направлено на определение некоторой характеристики или выявление связи между признаками

    • Связь может характеризоваться не только величиной (степенью связи) и направлением, но также и надежностью или статистической достоверностью (statistical confidence) - эта характеристика связи показывает, можно ли распространить результаты, полученные на данной выборке, на всю генеральную совокупность, из которой взята эта выборка

    Парная регрессия

    Парная регрессия – это уравнение, описывающее корреляционную связь между парой переменных: зависимой переменной (результатом) y и независимой переменной (фактором) x.

    y=f(x)

    Функция может быть как линейной y=α+βx+ε, так и нелинейной y=α+β/x+ε, y=α+βlnx+ε, y=αβ.

    Парная линейная регрессия

    Предположим, что для генеральной совокупности связь выражается уравнением

    yi=α+βxi+εi, i=1,…,N

    yi – i-е фактическое значение зависимой переменной y;

    α и β – генеральные параметры парной линейной регрессии

    N – объем генеральной совокупности

    εi – теоретические ошибки, в силу наличия еще и других объясняющих факторов, не учтенных в модели или ошибок спецификации

    Парная линейная регрессия

    Но у нас есть ограниченное объективными причинами кол-во наблюдений (выборка), для которых мы на практике можем построить уравнение =a+bxi

    i=a+bxi+ei, i=1,…,n

    yi – i-е фактическое значение зависимой переменной y;

    - i-е значение зависимой переменной, рассчитанное по уравнению прямой

    a и b – выборочные параметры парной линейной регрессии

    n – объем выборки

    ei – наблюдаемые остатки, в силу наличия еще и других объясняющих факторов, не учтенных в модели или ошибок спецификации

    ei= yi –

    Буквально перед нами стоит задача провести прямую линию через множество точек в плоскости x-y.

    Два параметра a и b определяют наклон прямой и сдвиг по вертикали. Существует много способов провести прямую через точки на плоскости.

    • можно проводить прямую через две произвольные точки
    • пытаться минимизировать сумму квадратов остатков
    • пытаться минимизировать сумму модулей отклонений
    • любая другая мера учета отклонений , например функция Хубера, которая при малых отклонениях квадратична, а при больших линейна

    Каждый метод выбора a и b обладает плюсами и минусами.

    Построение по двум точкам неустойчиво к выбору таких точек и может давать противоречивые результаты.

    Сумма квадратов отклонений проста в вычислениях, обладает хорошими статистическими свойствами, позволяет выстроить теорию для проверки различных статистических гипотез, но чувствительна к «выбросам»

    Сумма модулей отклонений нечувствительна к «выбросам», но сложна в вычислении

    Функция Хубера пытается совместить плюсы обеих мер.

    • Рассмотрим задачу наилучшей аппроксимации набора наблюдений xi,yi линейной функцией =a+bxi в смысле минимизации функционала
    • F=

    • то есть задачу можно сформулировать следующим образом: имея в наличии набор данных xi,yi подобрать значения a и b, чтобы функция F(a,b) была минимальна. Эта задача безусловной нелинейной оптимизации решается через нахождение экстремума функции двух переменных. Найдем экстремум функции двух переменных.

    Для этого вычислим производные функции F по параметрам a и b

    Раскроем скобки и получим

    Стандартная форма нормальных уравнений

    Решая систему, получим значения a и b

    Так мы нашли неизвестные параметры модели =a+bxi

    Экономическая интерпретация a и b

    • Коэффициент b показывает среднее изменение результативного признака (в единицах измерения y) при изменении величины фактора x на 1 единицу его измерения.
    • Коэффициент a показывает среднее значение результативного признака при x=0, если практически x может принимать нулевое значение. В ином случае, коэффициент a не имеет экономической интерпретации.

    Коэффициент корреляции

    • Наряду с оценками a и b часто сразу оценивают тесноту связи между случайными величинами x и y с помощью линейного коэффициента корреляции rxy

    Шкала Чеддока

    rxy>0 – связь прямая, rxy<0 – связь обратная
    1) Наша модель является упрощением действительности и на самом деле есть еще другие параметры, от которых зависит y. Расходы на питание могут также зависеть от региона проживания, количества членов семьи, образа жизни, склонности к потреблению.

    2) Трудности в измерении данных (присутствуют ошибки измерения).

    Можно считать, что εi – случайная величина с некоторой функцией распределения, которой соответствует функция распределения случайной величины yi.

    Основные гипотезы

    • yi=α+βxi+εi, i=1,…,N – спецификация модели
    • xi - детерминированная величина, где xi-разные величины
    • M[εi]=0, M[εi]=D[εi]=σ2 не зависит от xi или от t
    • M[εi, εj]=0 – некоррелированность ошибок для разных наблюдений
    • Ошибки εi имеют совместное нормальное распределение N(0, σ2)
    • В этом случае модель называется классической нормальной линейной регрессионной моделью. (Classical Normal Linear Regression Model)

    Основные гипотезы

    1,2. спецификация модели отражает наше преставление о механизме зависимости yi от xi и сам выбор объясняющей переменной xi . Чтобы установить влияние xi они должны принимать различные значения.

    Основные гипотезы

    3. M[εi]=0, M[εi]=D[εi]=σ2 не зависит от xi или от t

    Условие независимости дисперсии ошибки от номера наблюдения или xi называется гомоскедастичностью. В противоположном случае, наблюдают явление гетероскедастичности.

    Основные гипотезы

    4. M[εi, εj]=0 – некоррелированность ошибок для разных наблюдений

    В случае, когда это условие не выполняется, говорят об автокорреляции ошибок. Часто такое происходит с временным выборками ил временными рядами.

    Теорема Гаусса-Маркова

    Задача теперь- статистически оценить три параметра: a,b, σ2

    В предположениях модели:

    • yi=α+βxi+εi, i=1,…,N – спецификация модели
    • xi - детерминированная величина, где xi-разные величины
    • M[εi]=0, M[εi]=D[εi]=σ2 не зависит от xi или от t
    • M[εi, εj]=0 – некоррелированность ошибок для разных наблюдений
    • оценки a и b, полученные по методу наименьших квадратов(МНК), имеют наименьшую дисперсию (то есть эффективны) в классе всех линейных несмещенных оценок.

    Статистические свойства оценок

    • Статистические оценки (или просто оценки)— это статистики, которые используются для оценивания неизвестных параметров распределений случайной величины.
    • Несмещённая оце́нка в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру. M[b]=β
    • Эффективная оценка – это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра. D[b]

    Задача

    Пусть X1, X2, X3, X4 — случайная выборка значений из генеральной нормальной совокупности со средним и дисперсией . Рассмотрим две оценки :

    • Покажите, что обе оценки несмещенные.
    • Какая из оценок более эффективна?
    • Найдите относительную эффективность двух оценок.
    • Найдите несмещенную оценку, более эффективную, чем каждая из двух оценок .

    Дисперсия ошибок и ее оценка

    • σ2 – дисперсия теоретических ошибок (то есть для генеральной совокупности)
    • σ2 =

    • S2 – несмещенная оценка дисперсии ошибок σ2 – то есть то, что мы можем наблюдать в выборке.
    • S2 = n/(n-2)* σ2 =

    Дисперсии параметров a и b

    • Величина дисперсии остатков напрямую влияет на дисперсию оценок a и b. (Напоминаю: a и b – случайные величины)
    • D[b]=
    • D[a]=
    • Вывод формул дисперсии остатков в Я.Р. Магнус-Эконометрика:начальный курс

    Распределение оценок a и b

    Так как a и b являются линейными функциями от y, то они тоже имеют нормальное распределение

    aN(α, ) bN(β, )

    Значит (a-α)/N(0,1), аналогично b.

    Но поскольку мы не знаем , то заменяем ее на S2, при этом ta=(a-α)/t(n-2), и аналогично для b

    tb=(b- β)/t(n-2)

    Статистику tb можно использовать для проверки статистической гипотезы H0: β=β0 против альтернативной гипотезы H1: β≠β0. Наиболее просто выглядит гипотеза H0: β=0 (в генеральной совокупности связи нет). Тогда

    tb=b/sbt(n-2), где sb=

    Зададимся, например 2,5% точкой t-распределения с (n-2) степенями свободы t0,025 , т.е. P(-t0,025 Мы отвергаем гипотезу H0 (и принимаем H1) на 5% уровне значимости, если |tb|>t0,025 («редкое» событие с точки зрения гипотезы H0), в противном случае мы не можем отвергнуть H0 (и принимаем H0). Вероятность найти связь там, где ее на самом деле нет (β=0 , а |tb|>t0,025 ) называется ошибкой первого рода и не превышает уровня значимости.

    Аналогично для проверки значимости a используется статистика ta

    Доверительные интервалы параметров α и β

    Разрешив неравенство P{|(b-β)/Sb|β получим

    P{b-t0,025*Sb<β

    То есть в интервал [b-t0,025*Sb ;b+t0,025*Sb] истинный параметр β попадет с вероятностью 95%.

    Аналогично составляется доверительный интервал для α.

    • Рассмотрим вариацию (разброс) значений yi вокруг своего среднего значения
    • Можно доказать, что третье слагаемое равно нулю.
    • Тогда
    • TSS(total) ESS(error) RSS(regression)

      Многомерная теорема Пифагора


    Средняя ошибка аппроксимации

    Коэффициент детерминации

     

    R2 принимает значения от 0 до 1 и показывает долю дисперсии результативного признака, объясненную регрессией. Если велика, то модель не объясняет вариацию (изменчивость) результата, и R2 близко к 0.

     
    Под незначимостью модели понимается в общем виде одновременное равенство коэффициентов перед всеми факторами x, или, что то же самое, равенство =a=, и график функции регрессии параллелен оси абсцисс. Тогда .

    Проверим данную гипотезу H0: против H1:

    Для этого составляется статистика Фишера

    F(m,n-m-1), где m-количество факторов в модели, которая сравнивается с табличным значением распределения Фишера Fα(m,n-m-1) для выбранного уровня значимости α.

    Качество модели


    F-критерий Фишера

    T-критерий Стьюдента

    Качество модели


    Доверительные интервалы параметров

    Качество модели


    Доверительный интервал прогноза

    Задача

    Линейная модель на основе МНК

    Автокорреляция остатков


    Отрицательная автокорреляция Положительная автокорреляция

    Критерий Дарбина-Уотсона (неправильный расчет)


    Среднедушевая ЗП, тыс.руб. X

    et

    et^2

    et-1

    (et-et-1)^2

    1

    45,1

    7,524

    56,614

    2

    59,0

    4,733

    22,397

    7,524

    7,793

    3

    57,2

    2,810

    7,896

    4,733

    3,697

    4

    61,8

    1,201

    1,443

    2,810

    2,588

    5

    58,8

    -1,537

    2,361

    1,201

    7,495

    6

    47,2

    -6,249

    39,054

    -1,537

    22,210

    7

    55,2

    -8,482

    71,943

    -6,249

    4,984

    Сумма

    384,3

    0,000

    201,708

    8,482

    48,768

    DW=48,768/201,708=0,24

    Критерий Дарбина-Уотсона (верный расчет)


    Среднедушевая ЗП, тыс.руб. X

    et

    et^2

    et-1

    (et-et-1)^2

    1

    45,1

    7,52

    56,61

    2

    47,2

    -6,25

    39,05

    7,52

    189,711

    3

    55,2

    -8,48

    71,94

    -6,25

    4,984

    4

    57,2

    2,81

    7,90

    -8,48

    127,506

    5

    58,8

    -1,54

    2,36

    2,81

    18,892

    6

    59,0

    4,73

    22,40

    -1,54

    39,303

    7

    61,8

    1,20

    1,44

    4,73

    12,471

    Сумма

    384,3

    0,000

    201,708

    -1,201

    392,867

    DW=392,867/201,708=1,94

    Задача


    номер предприятия

    выпуск, тыс. руб., y

    Стоимость ОФ, тыс.руб. X

    Yt2

    Xt2

    Xt*Yt

    Yt модель

    |Yt-Yt модель|/Yt

    et

    et^2

    Yt модель-Yср

    Yt-Yср

    X-Xср

    1

    2608

    430

    6801664

    184900

    1121440

    2760,55

    0,06

    -152,55

    23270,50

    -231,12

    -383,67

    -52,22

    2

    2500

    410

    6250000

    168100

    1025000

    2672,03

    0,07

    -172,03

    29595,25

    -319,63

    -491,67

    -72,22

    3

    3060

    530

    9363600

    280900

    1621800

    3203,12

    0,05

    -143,12

    20482,42

    211,45

    68,33

    47,78

    4

    3255

    560

    10595025

    313600

    1822800

    3335,89

    0,02

    -80,89

    6542,84

    344,22

    263,33

    77,78

    5

    2893

    480

    8369449

    230400

    1388640

    2981,83

    0,03

    -88,83

    7891,08

    -9,83

    -98,67

    -2,22

    6

    2941

    430

    8649481

    184900

    1264630

    2760,55

    0,06

    180,45

    32563,38

    -231,12

    -50,67

    -52,22

    7

    3020

    440

    9120400

    193600

    1328800

    2804,80

    0,07

    215,20

    46309,43

    -186,86

    28,33

    -42,22

    8

    3248

    510

    10549504

    260100

    1656480

    3114,60

    0,04

    133,40

    17794,81

    122,94

    256,33

    27,78

    9

    3400

    550

    11560000

    302500

    1870000

    3291,63

    0,03

    108,37

    11743,87

    299,96

    408,33

    67,78

    Сумма

    26925,00

    4340,00

    81259123,00

    2119000,00

    13099590,00

    26925,00

    0,44

    0,00

    196193,61

    0,00

    0,00

    0,00

    Среднее

    2991,67

    482,22

    9028791,44

    235444,44

    1455510,00

    2991,67

    0,05

    0,00

    21799,29

    0,00

    0,00

    0,00



    написать администратору сайта