ВКР Рынок жилья. Заключение 45
Скачать 316.47 Kb.
|
3.3 Корреляционно-регрессионный анализ влияния программы реновации пятиэтажек на среднюю цену за квадратный метр на первичном рынке жилья города МосквыПримем среднюю цену за кв.м. за результативный признак – Y. Рассмотрим влияние на среднюю цену следующего фактора: Х – Оставшийся на конец года объем пятиэтажных домов, подлежащих сносу, кв.м. Линейное уравнение регрессии имеет вид y = bx + a Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти. Здесь ε - случайная ошибка (отклонение, возмущение). Для оценки параметров α и β - используют МНК (метод наименьших квадратов). Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии. Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (ε) и независимой переменной (x). Формально критерий МНК можно записать так: S = ∑(yi - y*i)2 → min (31) Система нормальных уравнений. an + b∑x = ∑y (32) a∑x + b∑x2 = ∑yx (33) Для наших данных система уравнений имеет вид 6a + 912179 b = 7330600 (34) 912179 a + 141153528693 b = 1066635249700 (35) Домножим уравнение (34) системы на (-152029.83), получим систему, которую решим методом алгебраического сложения. -912179a -138678418299.57 b = -1114469871798 (36) 912179 a + 141153528693 b = 1066635249700 (37) Получаем: 2475110393.43 b = -47834622098 (38) Откуда b = -19.3263 Теперь найдем коэффициент «a» из уравнения (1): 6a + 912179 b = 7330600 (39) 6a + 912179*(-19.3263) = 7330600 (40) 6a = 24959637.37 a = 4159939.5621 Получаем эмпирические коэффициенты регрессии: b = -19.3263, a = 4159939.5621 Уравнение регрессии (эмпирическое уравнение регрессии): y = -19.3263 x + 4159939.5621 (41) Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Найдем коэффициент линейной парной корреляции: (42) Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле: (43) Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < rxy < 0.3: слабая; 0.3 < rxy < 0.5: умеренная; 0.5 < rxy < 0.7: заметная; 0.7 < rxy < 0.9: высокая; 0.9 < rxy < 1: весьма высокая; В нашем примере связь между признаком Y и фактором X весьма высокая и обратная. Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b: (44) Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты. Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения. Коэффициент эластичности находится по формуле: (45) (46) В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y. Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических: (47) Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. (48) В среднем, расчетные значения отклоняются от фактических на 11.65%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии. Найдем коэффициент детерминации. Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах. R2= -0.9062 = 0.8203 т.е. в 82.03% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 17.97% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации). Таблица 9. Показатели качества уравнения регрессии
Изучена зависимость Y от X. На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 82.03% общей вариабельности Y объясняется изменением X. Установлено также, что параметры модели статистически значимы. Возможна экономическая интерпретация параметров модели - увеличение X на 1 ед.изм. приводит к уменьшению Y в среднем на 19.326 ед.изм. Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями. Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов. Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето). Найдем коэффициент автокорреляции по следующей формуле: (49) Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки. Стандартная ошибка коэффициента корреляции рассчитывается по формуле: (50) Коэффициенты автокорреляции случайных данных должны обладать выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным (51) Если коэффициент автокорреляции первого порядка r1 находится в интервале: -2.776 • 0.408 < r1 < 2.776 • 0.408 (52) то можно считать, что данные не показывают наличие автокорреляции первого порядка. Используя расчетную таблицу, получаем: (53) Так как -1.133 < r1 = -0.128 < 1.133, то свойство независимости остатков выполняется. Автокорреляции отсутствует. Проверим наличие автокорреляции через критерий Дарбина-Уотсона. Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона: (54) (55) Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 6 и количества объясняющих переменных m=1. Автокорреляция отсутствует, если выполняется следующее условие: d1 < DW и d2 < DW < 4 - d2. (55) Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 < 1.52 < 2.5, то автокорреляция остатков отсутствует. Для более надежного вывода целесообразно обращаться к табличным значениям. По таблице Дарбина-Уотсона для n=6 и k=1 (уровень значимости 5%) находим: d1 = 1.08; d2 = 1.36. Поскольку 1.08 < 1.52 и 1.36 < 1.52 < 4 - 1.36, то автокорреляция остатков отсутствует. |