Главная страница

Эконометрика. Эконометрика_экз. 6 Множественные уравнения регрессии с переменной структурой, фиктивные переменные dummy


Скачать 0.73 Mb.
Название6 Множественные уравнения регрессии с переменной структурой, фиктивные переменные dummy
АнкорЭконометрика
Дата31.05.2022
Размер0.73 Mb.
Формат файлаdocx
Имя файлаЭконометрика_экз.docx
ТипЛекция
#560931

Эконометрика экзамен

СЗ 6 «Множественные уравнения регрессии с переменной структурой, фиктивные переменные (dummy-variables)» (см. ЛЕКЦИЯ 8)

  1. Что такое фиктивные переменные и для чего они нужны?

Ответ: Фиктивные переменные – переменные, которые оцифровывают качественные переменные. То есть качественные превращаются в количественные переменные. Дело в том, что компьютер работает только с цифровыми данными, а с качественными переменными он не работает.

ЛОВУШКА:

Есть правило:

Если число уровней (градаций) качественной переменной больше двух, то вводится несколько бинарных переменных, причем их число m берется на единицу меньше, чем число уровней.

Например: Изучается вопрос. Модель составляется для того, чтобы уяснить, как влияет образовательный ценз человека на его зарплату и качественные переменные такие: высшее специальное образование – это одна градация, среднее специальное образование – вторая градация, третья градация - средняя школа. Нужно оцифровать это качественные переменные.

То есть нужно взять две бинарные переменные, одна бинарная переменная (булевая), а высшая градация – высшее образование.

Первая булевая переменная ; единица - если это высшее специальное образование, 0 - в противном случае.

Вторая булевая переменная - среднее специальное образование, 1 если оно есть, 0 в противном случае.

Третья булевая переменная для градации средняя школа не надо вводить, иначе будет ЛОГИЧЕСКАЯ ЛОВУШКА - будет смешанная оценка со свободным членом регрессии. Две достаточно. Если не высшее образование, 0, не среднее специальное, то 0 тоже, то автоматически будет означать школьное образование, и третья булевая переменная не нужна.

Таким образом, подводя итог, отметим, что фиктивная переменная нужна для оцифровки качественных переменных, чтобы их учесть в модели.

Или другой пример: стоимость жилья. Дом каменный – единица, дом панельный – ноль. Нужна всего одна переменная.

  1. Как используются фиктивные переменные для учёта сезонных колебаний? (какое отношение имеют фиктивные переменные к вопросу о сезонных колебаниях?)

Ответ: Сезонные колебания обычно с кварталами связаны, а номер квартала это есть качественная переменная. Первый квартал – это зима, второй квартал – это весна, третий квартал – лето, четвертый квартал – осень. Значит, исходя из смысла нужно вводить всего 3 булевых переменных, потому что градаций 4, а булевых переменных должно быть на 1 меньше, значит, всего 3.

За базовое наблюдение берём наблюдение первого квартала, для второго будет булевая переменная единица второй квартал, ноль в противном случае.

Вторая булева переменная – единица – это третий квартал, ноль – в противном случае. Для 4го квартала – единица – это четвертый квартал в наблюдениях, 0 в противном случае. Всего 3 булевых переменных.

Замечание. Оцифровывать как некоторые студенты в виде 1 2 или 123 это неграмотно!! Потому что нужно просто если градаций много, увеличить число булевых переменных, а не с потолка брать 1234. Присваивая цифру не 10, а 2 или 3, мы навязываем модели те свойства, которые в объекте реальном нет, то есть тогда навязывая, мы получим там, где цифровая переменная 3, она будет превалировать над всеми остальными. И все остальные будут ничтожными.

  1. Что такое уравнение регрессии с переменной структурой?

Ответ: Уравнение регрессии с переменной структурой - коэффициенты не постоянны, приводит к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака, при изменении условий моделирования.

Например: студент получал стипендию 2400 руб., идёт время, он стал бакалавром, скачком изменились условия его трудовой деятельности, зарплата будет выше, чем стипендия. Скачок учитывается в том, что меняется структура модели, то есть угол наклона соответствующих уравнений или сами коэффициенты. А как это сделать? С помощью фиктивных переменных. Вводя фиктивные переменные, мы учитываем эти скачки, например, размер стипендии это 0, размер специалиста это 1. Вводим булевую двоичную переменную и учитываем скачок.

СЗ 2 «Корреляционный анализ»

  1. Что такое корреляция и зачем она нужна?

Ответ: Коэффициент корреляции - мера связи двух случайных величин, служит мерой связи, степени связи – сильная связь, значимая или незначимая.

Цель корреляционного анализа – количественная оценка тесноты(силы) связи (связь может быть значимой или незначимой) между двумя случайными величинами с использованием различных числовых мер. (значимость проверяется по критерию Стьюдента).

  1. Какие числовые меры силы связи существуют в эконометрике?

Ответ: Коэффициент детерминации, индекс корреляции, коэффициент линейной парной корреляции, коэффициент множественной корреляции,

(Коэффициент линейной парной корреляции накладывает ограничения, его можно использовать только при линейной связи двух случайных величин, если связь нелинейная, используется так называемое корреляционное отношение или индекс корреляции).

  1. Чем отличается индекс корреляции от коэффициента корреляции?

Ответ: Индекс корреляции используется для нелинейных моделей. (оценка парных коэффициентов корреляции производится). Если две величины связаны нелинейно, то надо применять корреляционное отношение.

  1. Множественный коэффициент корреляции – характеризует тесноту линейной связи между одной переменной и совокупностью других рассматриваемых переменных. Скопом анализируем.




  1. Как изменится коэффициент корреляции, если случайных величин не две, а несколько?

Ответ: Тогда накладывается ещё одна связь. Все эти СВ должны иметь совместный нормальный закон распределения. Тогда применяется коэффициент множественной корреляции или индекс множественной корреляции.

  1. Что такое корреляционная матрица?

Ответ: Корреляционная матрица – это матрица, элементами которой являются коэффициенты линейной парной корреляции. Корреляционная матрица даёт много информации: есть мультиколлинеарность или нет, влияют ли факторы на моделируемую величину или нет и т. д.

Важные свойства корреляционной матрицы:

  1. Все диагональные элементы матрицы равны единице

  2. Корреляционная матрица – симметричная, т.е. ее элементы, симметричные относительно главной диагонали, равны друг другу.



  1. Что такое коэффициент детерминации?

Ответ: Коэффициент детерминации – это квадрат коэффициента корреляции. Печатается в первом протоколе регрессионного анализа. Он отвечает на вопрос(показывает) интерпретация: на сколько процентов вариация Y обусловлена вариацией факторов. Например, коэффициент детерминации 80, это значит, на 80 процентов факторы формируют моделируемый показатель в уравнении регрессии. А на 20 оставшихся процентов действуют случайные ошибки. Это регрессионные остатки.

  1. Какой статистический смысл имеет коэффициент линейной парной корреляции?


Ответ: Коэффициент линейной парной корреляции есть скорость изменения, то есть первая производная нормированной функции по нормированному аргументу X. Нормировка делается путем деления на среднее квадратическое отклонение.

(к сведению: в любой области человеческих знаний первая производная исследуемой величины есть скорость изменения функции, если изменяется ее аргумент).


  1. Как определить значимость коэффициента корреляции?


Ответ: На глаз это делать нельзя. Нужно вычислить критерий Стьюдента и сравнить с табличным. Если больше табличного, то критерий значим. (чем ближе к 1, тем более значим). Если незначим, то связи нет. ( в семинаре 2 это делали).
СЗ 1 «Построение множественного линейного уравнения регрессии методом наименьших квадратов (МНК)»

Метод наименьших квадратов – это метод разработал великий математик немецкий Гаусс 200 лет назад, до сих пор является одним из основных инструментов во всех областях человеческих знаний: экономика, социология, медицина, физика, математика, технологические науки и т. д

  1. В чем смыс метода наименьших квадратов (МНК)?

Ответ: Идея проста: составляется функционал, равный сумме квадратов разности между опытным значением Y и будущим расчётным значением в квадрате. Эти разности в квадрате суммируются по всем наблюдениям и делятся на число опытов, то есть усредняются.


  1. Какие должны выполняться предпосылки эконометрики, чтобы можно было применять метод наименьших квадратов (МНК)?

Ответ: Главная предпосылка эконометрики - чтобы результат наблюдения (опыта) можно было расчленить на две части - объяснённую и случайную.

(Объясненная часть – непрерывная функция от аргументов, факторов. Берется равной мат.ожиданию y при фиксированном веторе.

а случайное возмущение – это то, что не объясняется моделью).

Вторая предпосылка математические ожидания возмущения должны быть равны нулю.


  1. Когда можно применять метод наименьших квадратов(МНК), когда нельзя?

Ответ: МНК очень эффективен, но накладывает жёсткие ограничения на остатки уравнения регрессии. Можно, когда выполняются все 6 условий теоремы Гаусса-Маркова и нельзя, когда хотя бы одно нарушается.

Гипотезы МНК(предпосылки Гаусса-Маркова):

  1. Гипотеза о близости к нулю математического ожидания остатков;

  2. Гипотеза о статистической значимости коэффициентов регрессии;

  3. Гипотеза о статистической значимости всего уравнения регрессии в целом;

  4. Оценка качества уравнения регрессии;

  5. Проверка гипотезы о чисто случайном характере остатков;

  6. Проверка гипотезы о нормальном законе распределения остатков

(к слову: есть ещё одно условие для МНК кроме этих 6, должна отсутствовать мультиколлинеарность. Иначе будет плохое уравнение)



  1. Какие свойства имеет МНК, которые позволяют этому методу уже в течение 200 лет вплоть до разработки нейросетевых моделей так эффективно использоваться?

Ответ: МНК имеет 3 свойства:

  1. оценка получается несмещенная согласно теореме Гаусса-Маркова (не содержит систематических ошибок)

  2. оценка получается состоятельная, то есть чем больше наблюдений, тем меньше разность между генеральным значением и расчетным.

  3. эффективность оценки теоремы. оценка соответствует минимальной дисперсии.

4. Как оценить адекватность уравнения регрессии (УР)?

Ответ: Путем проверки гипотез 6 о предпосылках МНК или условий теоремы Гаусса-Маркова.

(математическое ожидание остатков близко к нулю, значимость уравнения регрессии в целом по критерию Фишера и тд 6 гипотез. (Их нужно грамотно осмысливать.)

(Например: Критерий Фишера больше табличного, пишут, что это нарушение – это не нарушение!! а наоборот подтверждение значимости уравнения в целом!)

5.Точечный и интервальный прогноз.

Ответ: Точечный: Подставляем в уравнение регрессии значение фактора x, включая время и получим точечный прогноз для y.

Интервальный сложнее: он требует матричных вычислений. К счастью, их делает программа, пакет анализ данных.

Например, любой прибор – холодильник, утюг, компьютер, лампочка – в паспорте указано напряжение питания 230 вольт, +/- 2 или 3 Вольта. Это и есть доверительный интервал. Точно указать невозможно для прибора, потому что вероятность попадания в точку теоретически равна нулю. А доверительный интервал накрывает неизвестное значение с наперед заданной доверительной вероятностью.

  1. Какую информацию даёт коэффициент эластичности?

Ответ: Коэффициент эластичности показывает, на сколько процентов изменится y, если x изменится на 1 процент, естественно в своём измерении, где за 100 процентов для x принята одна величина, для y - другая. Он связан с первой производной. Коэффициент эластичности показывает скорость изменения y, если меняется фактор - аргумент функции Х.

  1. Уравнение регрессии с гетероскедастичными остатками.

Что такое гетероскедастичность для построенного уравнения регрессии?
Ответ: Гетероскедастичность – это непостоянство дисперсии на разных участках изменения X факторов. (Факторы связаны с остатками. Дисперсия не постоянна, в одних меньше, в других больше).

Гетероскедастичность здорово ухудшает качество модели, с ней надо бороться.

Как бороться с гетероскедастичностью? (ослабить)

Ответ: Есть разные методы – мы использовали обобщенный метод мнк(если есть в программном продукте): взвешивали уравнение регрессии ( и левую и правую часть), делили ( и y и иксы) на коэффициент сигма итая с крышечкой (это есть корень из левой части, сигма, дисперсия) равно корню квадратному из Е с крышечкой в квадрате). Когда взвесим уравнение левую и правую часть, это улучшает свойство модели. Либо исчезает в несколько шагов, либо ослабляется.

(Противоположное свойство гомоскедастичность. Гомоскедастичность – постоянство дисперсии остатков.)ая

  1. Что такое тест Уайта? Для чего он нужен?

Ответ: Тест Уайта нужен для проверки, есть гетероскедастичность или ее нет.

  1. Как выглядит уравнение Уайта? (по критерию Фишера)

Ответ: Левая часть функции – квадрат остатков (это функция квадратов остатков, а ее аргументом является функция), она неизвестна, пока не построим уравнение Уайта и не проверим его на значимость по критерию Фишера. Справа – их факторы, их 1 степени и плюс квадраты. Может быть включен член смешанный x1*x3



Проверяем значимо или нет по критерию Фишера.

Вопрос: МНК даже для нелинейных моделей можно применять классическую схему. А в некоторых случаях сразу видно, что нельзя применять, нужно какие-то преобразования делать. Когда можно применять сразу, когда нельзя и нужны какие-то преобразования?

Ответ: Это связано с нормальными уравнениями.

Нормальное уравнение, связанное с алгоритмом МНК – когда мы берем частные производные по искомым параметрам, то если получаются линейные алгебраические уравнение, тогда можно МНК применять классическую схему, а в случае степенной модели(Кобба-Дугласа) там нелинейность и по факторам и по коэффициентам, там нельзя.

Модель Кобба-Дугласа – это степенная модель производственной функции, то есть в зависимости от количества продукта производимого, от капитала, труда, выраженного в деньгах. Эта модель, к сожалению, нелинейна как по факторам, так и по искомым коэффициентам. То есть искомые коэффициенты b1, b2 входят как степень факторов, а степенная функция нелинейная, значит, нельзя применять классическую схему МНК. К счастью, есть простое преобразование математическое логарифмическое. Если мы прологарифмируем левую и правую часть уравнения Кобба-Дугласа, получим линейную модель логарифмических переменных, и к ней применяем классическую схему МНК, потом совершаем возврат в исходное пространство игрек-икс, беря экспоненты от соответствующих цифр логарифмических переменных.

Что такое нелинейность уравнения регрессии по факторам (не по искомым коэффициентам, а по факторам) т.е экзогенным переменным. Можно тогда применять МНК, классическую или нет?

Ответ: Когда нелинейна по факторам, то есть искомые коэф b1 b2 входят как степень факоров. Степенная функция нелинейная, значит нельзя применять классическую схему МНК.

Уравнение регрессии нелинейно по факторам, но линейно по искомым коэффицентам? Когда вид уравнения регрессии (модели) такой, что она линейная по искомым коэффицентам, нелинейная по факторам, где встречали такую модель?

Ответ: Когда делали трендовые модели временных рядов.

СЗ «Проблема мультиколлинеарности двух и отбор факторов для построения уравнения регрессии» (ДТЗ)

Строим корреляционную матрицу и определяем по ней, есть мультиколлинеарность или нет. При построении уравнения регрессии в данных может существовать корреляционная связь как между двумя объясняющими переменными (факторами), так и между несколькими. Так порождается мультиколлинеарность. От неё надо избавляться.

  1. Что такое проблема мультиколлинеарности?

Ответ: Мультиколлинеарность – это наличие линейной взаимосвязи между любыми двумя факторами, а если факторов много, может быть несколько мультиколлинерностей от взаимосвязи линейной факторов между собой.

  1. Почему нужно выявлять и бороться с мультиколлинеарностью?

Ответ: Она очень сильно портит уравнение регрессии, оценки становятся смещенными, ошибка аппроксимации большая, следовательно результаты недостоверные.


  1. Как выявлять мультиколлинеарность? (как обнаружить мультиколлинеарность)

Ответ: Есть два способа:

1. Строим корреляционную матрицу (пакет анализ данных, корреляция) и определяем значимость соответствующих коэффициентов корреляции. Используем критерий Стьюдента. (там видно, если соответствующий коэффициент корреляции статистически значим по критерию стьюдента, то имеет место связь между этими факторами, мультиколлинеарность). Если ни один не значим, значит нету мультиколлинеарности. Не путать связь между фактором и у. Там полезная связь, а между факторами – вредная. Каждый фактор в линейном уравнении должен действовать сам по себе.

Ослабление мультиколлинеарности, вернее уничтожение, делается расщеплением соответствующих пар, у которых есть мультиколлинеарность. Одна переменная оставляется, другая выбрасывается. Не надо жалеть о том, что она выбрасывается! Информация о ней сохраняется в другом факторе, с которым данный фактор связан.

Какую выбросить? Выбросить тот фактор, который слабее связан с y, а который сильнее - его оставить. Видно из корреляционной матрицы.

2. Метод пошагового исключения - по очереди исключаются наиболее слабые факторы, по шагам. Выбирается или промежуточный шаг или конечный, где коэфициент детерминации самый большой, т.е индикаторов наилучшего отбора факторов является R квадрат. Там где оно наибольшее, та совокупность факторов лучше всего.

Вывод решения: смотрим там, где коэффициент детерминации р-квадрат самый большой, тот набор факторов и лучший, его и надо использовать в данной задаче.

«СЗ 3 трендовые модели временных рядов»


  1. Что такое тренд?

Ответ:

Тренд – устойчивая долговременная зависимость во временном ряду.

Определяется для долговременного прогноза.

Например прибыль меняется в течении 20 лет, можно моделировать, построить, аппроксимировать долговременную зависимость.

Просто на всякий, но не надо отвечать:

(Для этого используется уравнение регрессии, где необязательно линейные, они должны быть линейными по искомым параметрам, а по времени могут быть квадрат, даже кубы, то есть полиномы по времени, степени начиная от первой до высокой, если есть зигзаги в графике временного ряда, надо применять полином третьей и высшей степени.)

(Если мы используем Мастер диаграмм, он сразу строит модель, степень полинома задаём сами, квадрат времени это парабола получается, и если заказываем в диалоге р-квадрат, то показывает качество аппроксимации. Можно использовать МНК без мастера диаграмм. Рассматривать время как фактор икс, тогда получим модель линейную по искомым коэффициентам, но нелинейную по факторам.)

  1. Какие методы используются для среднесрочного, краткосрочного прогноза?

Ответ: Там другие методы: Арма, Рима, модельБрауна(в других семинарах описана)

  1. В чем идея метода простой скользящей средней?

Ответ: Выделяется интервал сглаживания. То есть количество опытов на интервале, который мы будем сглаживать. (Анализ данных, скользящая средняя : Интервал)

Интервал сглаживания – это количество наблюдений, на которых происходит сглаживание методом простой скользящей средней. Например, интервал сглаживания =3. Берём 3 наблюдения первых, начиная с третьего, потому что первые две точки не сглаживаются, находим среднее арифметическое и присваиваем его к середине интервала сглаживания.

Две первые точки не сглаживаются, потому что у них нет двух соседей слева!!! (точка должна равняться несглаженному значению).

Как быть?

Первым двум точкам присваиваются несглаженные значения, приближённо.

  1. Критерий Дарвина Уотсона для временных рядов. Для чего критерий Дарвина Уотсона? Как проверяется адекватность, если использовали МНК и время учли дополнительным фактором времени?

Ответ: В трендовых моделях помимо 6 гипотез нужно проверять + ещё 1 гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона. Критерий Дарвина Уотсона нужен для проверки есть автокорреляция в модели или нет.

Метод поворотных точек. Что делать, если поворотных точек много?

Ответ: Если поворотных точек много, то это хорошо. И если их больше чем теоретическое значение, вычисляемое по формуле, в модели по этому пункту нет нарушения по адекватности. А если мало поворотных точек, то может и теоретическое значение больше чем расчетное, то модель неадекватна. Предельный случай: график остатков, сначала остатки уменьшаются, потом проходят минимум и потом все время растут, то есть всего одна поворотная точка. Это крайний случай неадекватности модели.

В СЗ как делали сглаживание данных уровней временного ряда, каким методом?

Ответ: Методом простой скользящей средней.

Вопрос: Как грамотно аппроксимировать сглаженные уровни временного ряда?

Аппроксимация – описание, приближение. Как аппроксимировали сглаженные данные временного в семинаре?

Ответ: (С помощью t и t квадрат. T рассматривали как икс, t в первой, нулевой и квадратной.)

Какого вида модель надо выбирать?

Речь идет о том, что задана кривая с зигзагами. То есть рост, потом падаение. Применяется полином третьей высшей степени.!!!

Если попадает в инт делать выводы нельзя.

Нужно делать вывод первый коэф автокорреляции.

СЗ 7 Модель Кобба-Дугласа Построение нелинейных уравнений регрессии на примере модели Кобба-Дугласа(нелинейное уравнение регрессии)

  1. Степенная модель Кобба-Дугласа можно ли прямо к ней применить метод наименьших квадратов МНК?

Ответ: Нельзя, потому что нелинейность содержится внутри неизвестных параметров, т.е модель нелинейна как по факторам(степенная функция), так и по искомому параметру.

Как быть Кобба-Дугласа?

Нужно просто прологарифмировать левую и правую части уравнения регрессии, заданную в буквенном виде. Тогда, формально введя новые переменные z1= ln x1; z2=ln x2 и в левой части ln y мы получаем простое линейное уравнение, которое линеаризовалось за счет логарифмирования как по аргументу, т.е по z, так и по факторам. Сами коэффициенты уже не содержат нелинейность.

  1. Что такое модель Кобба-Дугласа?

Ответ: Модель Кобба-Дугласа – это степенная модель производственной функции, то есть в зависимости от количества продукта производимого, от капитала, труда, выраженного в деньгах. Эта модель, к сожалению, нелинейна как по факторам, так и по искомым коэффициентам.То есть искомые коэффициенты b1, b2 входят как степень факторов, а степенная функция нелинейная, значит, нельзя применять классическую схему МНК. К счастью, есть простое преобразование математическое логарифмическое. Если мы прологарифмируем левую и правую часть уравнения Кобба-Дугласа, получим линейную модель логарифмических переменных, и к ней применяем классическую схему МНК, потом совершаем возврат в исходное пространство игрек-икс, беря экспоненты от соответствующих цифр логарифмических переменных. Доверительный интервал определяем в логарифмическом пространстве, потом от полуширины доверительного интервала берём экспоненту на калькуляторе и получаем ответ.)

  1. Как вернуть результаты моделирования в исходное пространство икс игрек?

Ответ: Используя экспоненты от соответсвующих цифр логарифмических переменных. Доверительный интервал определяем в логарифмическом пространстве, потом от полуширины доверительного интервала берём экспоненту.

СЗ 4 «Авторегрессионные модели временных рядов. Модели ARMA, ARIMA»АРМА АРИМА

Они Служат для краткосрочного прогноза.

  1. Зачем ARMA ARIMA если мы уже изучили трендовую модель?

Ответ: Трендовая модель для долговременного прогноза, долговременных временных зависимостей (вход-выход), а АРМА АРИМА для краткосрочных.

  1. Для чего нужен коэффициент Дики Фулера? Что такое расширенный тест Дики Фулера?(АРМА,АРИМА) В чем смысл расширенного теста?

Ответ: Выполнение этого теста проверки гипотезы отвечает на вопрос: исходный(временные) ряд который мы собираемся моделировать является стационарным или не стационарным? Дело в том, что к нестационарному ряду нельзя применять методы авторегрессии. Метод АR(p) Мувинг Аверэйдж скользящей средней. Значит надо увидеть есть нестационарность или нет. Чаще всего на глазок видно, если есть тренд, то модель нестационарна, процесс нестационарный.

  1. Как быть, если процесс нестационарный?

Ответ: Лучше всего моделировать не саму величину y, а ее первую производную. Т.е левая часть – это разностный временной ряд первого порядка. Его и проверяем по критерию Дики Фулера. Если стационарный прогноз, делаем прогноз, если нет – надо моделировать разность второго порядка.

Как правило переход к разностному ряду не только устраняет нестационарность, но и устраняет автокорреляцию, он ее уничтожает. Сам прогноз лучше интерпретировать в исходных категориях. Пользуются формулами первой производной, второй производной. (в семинаре уравнение 2 и 3).



  1. Что такое модель AR(p) авторегрессия порядка p, что такое модель MA(q) Мувинг Аверэйдж порядка q? В чем разница?

Ответ: Мувинг Аверэйдж MA(q) – модель скользящей средней. Переменными служат регрессионные остатки.

AR(p) – авторегрессионная модель порядка, то есть в качестве факторов не взяты лаговые переменные от игрек.

P – порядок, число лаговых переменных слвинутый в прошлое.

Лаг – сдвиг от времени в прошлое.

Лаговая переменная – переменная, значения которой мы берем не за текущий, а за отстоящий от него на определенное расстояние предыдущий момент времени.

  1. Для чего делается переход от моделируемой величины y к разностной модели(разность для y берется) дельта игрек?

Ответ: Для устранения нестационарности. Нестационарность может не полностью быть устранена. Авторегрессия подавляется эффективно.

Что такое временной ряд?

Ответ: Временной ряд – последовательность наблюдений моделируемого показателя, упорядоченная в порядке возрастания времени

(Коэффициент автокорреляции? , коррелограмма ?)

(ИЗ ИНЕТА:

Коррелограмма (автокоррелограмма)показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции (и их стандартные ошибки) для последовательности лагов из определенного диапазона

Коэффициент автокорреляции показывает тесноту связи между уровнями ряда, сдвинутыми на 1 или более шаг.)

К сведению:

AR(p) - это авторегрессионная модель порядка p, то есть в качестве факторов не взяты лаговые переменные от игрек. Лаг – это сдвиг во времени в прошлое. Т=0 это сегодня, т-1 вчера, т+1 это будет завтра.

AR(q) – авторегрессионная модель порядка q это модель скользящего среднего, q порядок. В этой модели переменными служат остатки регрессионные в нулевой степени, первой степени, в квадрате.

Их комбинация даёт ARMA модель

ARIMA - это проинтегрированная модель комбинации.

Модели авторегрессии можно применять только для стационарных процессов.

Могучим средством устранения нестационарности (если ее увидели, например, тренд – это нестанционарность) является переход от игрек к разности, к разностной модели первого или второго порядка.

Модель исходная стационарная или нестационарная определяется по критерию Дики-Фуллера.

Мощным средством достижения стационарности и уничтожения авторегрессии, автокорреляции остатков является переход к разностным моделям первого и второго порядка.

СЗ 5 «Адаптивные модели временных рядов для кратковременного прогноза, модель Брауна»( лекция 7, семинар 5)

  1. В чем идея модели Брауна (В чем основная идея адаптивных моделей временных рядов?)

Ответ:

ПРАВИЛЬНЫЙ ОТВЕТ:

Модель Брауна – это линейная модель. На каждом шаге коэффициенты регрессии изменяются, и изменяются остатки, предсказанные значения игрек. Ошибка в методе Брауна сжимается, то есть уменьшаются регрессионные остатки, среднее значение сжимается начало к концу временного ряда.


К сведению:

(Сама модель является линейной, то есть y с крышечкой равняется a с индексом т с крышечкой + b т с крышечкой

y = at + bt

Линейная модель, но в чем адаптация? В том, что коэф. Регрессии ab непостоянны, а меняются от шага к шагу, чтобы уменьшить ошибку аппроксимации. На каждом шаге(начиная со 2) эти коэффиенты изменяются.

Закон изменения задается формулой, где участвует квадрат дисконтирования (бэтаквадрат) либо квадрат коэффициента сглаживания. Дисконтирование имеет тот смысл, что последние данные являются более ценными, чем начальные.

Если данных много, ошибка сильно сжимается, от хвоста временного к его голове.)

  1. Что такое адаптивные модели?

Ответ: Адаптивные модели – значит, у них коэффициенты регрессии не остаются постоянными, а приспосабливаются к текущим значениям исходных данных. Мы использовали модель Брауна – это линейная модель. На каждом шаге коэффициенты регрессии изменяются, и изменяются остатки, предсказанные значения игрек. Ошибка в методе Брауна сжимается, то есть уменьшаются регрессионные остатки, среднее значение сжимается начало к концу временного ряда.

СЗ 9 «Эконометрические системы одновременных уравнений»

Три темы: Разрешение системы методом двухшагового МНК уравнений, , двухшаговый метод наименьших квадратов, инструментальные переменные.

  1. Что такое инструментальные переменные? И как получаются новые инструментальные переменные конкретно в двухшаговом МНК?

Ответ: Переменные, которые не связаны с остатками, очищены от остатков. Мы берём из правой части нарушающие игреки и их аппроксимируем, то есть превращаем в новые инструментальные переменные, которые не связаны с остатками, то есть очищены от остатков.

Какая идея?

Идея проста: Суть проблемы системы в том, что в правую часть могут попасть эндогенные переменные, то есть моделируемые переменные Y в уравнении для Y2, а в правую часть попала Y1. Этого не должно быть. В правой части только факторы, как детерминированные величины. Это уже нарушение предпосылок МНК.

  1. Как бороться с нарушением?

Ответ: Допустим у нас в системе 2 уравнения и 2 переменные y1 y2, которые не только в левой части содержатся, но и в правой часть перекрестно попадают. Как быть? Мы просто заменяем эти случайные величины соответсвующими инструментальными переменными. То есть аппроксимируемых функциями иксов факторов. Это приближенная аппроксимация. Тем самым получаем новые инструментальные переменные, подставляя их в исходное уравнение в общем улучшаем качество модели.

  1. В чем смысл двухшагового МНК?

Ответ: на первом шаге в правой части могут включаться игреки, эндогенные переменные, это есть нарушение условий теоремы Гаусса-Маркова, они не должны быть случайными. В правой части только детерминированные факторы. Как бороться с нарушением? Мы берём из правой части нарушающие игреки и их аппроксимируем, то есть превращаем в новые инструментальные переменные, которые не связаны с остатками, то есть очищены от остатков. Факторы считаются инструментальными, мы получаем новые переменные игрек с волной. В правую часть вставляем вместо игрек, который ухудшает качество уравнения.

В левой части неизвестная пока значение игрек приближенное, которое будет заменять в модели мешающий игрек в правой части.

Оно находится с помощью новых инстурмент перем, в левой игрек с волной в правой факторы

Новые инстр переменные.



написать администратору сайта