Y только от одной объясняющей переменной X
Скачать 1.62 Mb.
|
% y y ˆ y n % y e n A n A n i i i i n i i i n i i 100 1 100 1 1 1 1 1 ⋅ − ⋅ = ⋅ ⋅ = ⋅ = ∑ ∑ ∑ = = = (1.6) Практическидопустимой обычно считают % 10 ... 8 A < ! Замечание. На практике необходимо оценивать точность модели как коэффициентом детер- минации, так и средней относительной ошибкой. При очень малых y даже небольшой разброс наблюдаемых значений от линии регрессии (т.е. при 1 R → ) может привести к существенным относительным ошибкам. И наоборот, при очень больших y малые A еще не означают, что точки легли достаточно близко к линии регрессии. Силусвязимежду объясняемой и объясняющей переменными в ли- нейной регрессии характеризует среднийкоэффициентэластичности y x b Э n 1 Э n 1 i i ⋅ = = ∑ = (1.7) где i i i i i i 0 x i i 0 x i y x b y x ' y y x x y x x y y Э lim lim ⋅ = ⋅ = ⋅ = = → → ∆ ∆ ∆ ∆ ∆ ∆ - местный коэффициент эластичности. Смысл: Э показывает, на сколько % в среднем по совокупности из- менится y от своего среднего значения при изменении x в среднем по со- вокупности на 1% от своего среднего значения. Значимость (надёжность) уравнения (модели) парнойлиней- нойрегрессиивцелом определяет F-критерийФишера-Снедекора. Оценка значимости модели в целом необходима для определения сте- пени соответствия модели, полученной по конкретной ограниченной выборке, реальным закономерностям генеральной совокупности. До- статочно ли имеющегося количества наблюдений при учтенном числе факторов для построения адекватной модели? Например, идеально точная ( 1 2 = R ) модель парной линейной регрессии, полученная по 2-м наблюдениям ( 2 = n ) явно ненадежна и требует большего числа наблюдений. А достаточно ли 3, 4, 5 наблюдений? Где та грань, когда наблюдений достаточно? Уравнение парной линейной регрессии значимо на уровне α ( обычно принимают 05 , 0 = α [9]), если 2 n ; 1 ; r r F Q Q ) 2 n ( Q F − > − − = α (1.8) Полянский Ю.Н. Эконометрика. Экономическое моделирование и прогнозирование. 19 Критическое значение 2 n ; 1 ; F − α определяется по специальным ста- тистическим таблицам (табл.4 приложений). В парной линейной регрессии F-статистика связана с коэффици- ентом детерминации соотношением ) 2 n ( R 1 R F 2 2 − ⋅ − = (1.9) Значимостьоценоккоэффициентовлинейнойрегрессии aˆ и bˆ определяется t-статистикойСтьюдента, например ∑ = = = n i i bˆ bˆ ) x - x ( s bˆ m bˆ t 1 2 (1.10) где ∑ = = n i i bˆ ) x - x ( s m 1 2 - стандартная ошибка bˆ ; 2 2 1 2 1 2 − = − − = ∑ ∑ = = n e n ) y y ˆ ( s n i i n i i i - выборочное среднеквадратичное от- клонение остатков, иначе - стандартная ошибка ; (1.11) 2 s - выборочная остаточная дисперсия (оценка дисперсии ошибок). Если 2 - n ; - bˆ t t α 1 > , то оценка коэффициента регрессии bˆ значима на уровне α Для парной линейной регрессии справедливо соотноше- ние F t bˆ = Этот показатель характеризует степень необходимости присут- ствия в модели свободного члена aˆ и конкретного фактора, отражае- мого коэффициентом bˆ Например, есть эконометрические модели с отсутствующим (=0) свободным членом aˆ Не всегда необходимость его отсутствия может быть оправдано экономическими соображения- ми, а может определяться , например, t-статистикой Стьюдента. Для парной линейной модели этот показатель не столь актуален. Особо важен он во множественных моделях (см. п.3.1.3). Значимостькоэффициентакорреляции определяется t- статистикой Стьюдента 2 1 2 r n r t r − − = (1.12) Если 2 - n ; - r t t α 1 > , то коэффициент корреляции r значим на вы- бранном уровне значимости α Справедливо соотношение F t r = Полянский Ю.Н. Эконометрика. Экономическое моделирование и прогнозирование. 20 1.1.3. Прогнозирование с помощью парных линейных регрессий Прогнозирование с помощью парной линейной регрессии может осуществляться путем подстановки значения объясняющей перемен- ной в полученное уравнение регрессии. Например, получено регресси- онное уравнение, связывающее цену на товар ( X ) и количество про- данного товара ( Y ) x , , y 04 1 73 320 − = Для определения объема продаж по цене 0 x =120 руб. необходимо подставить 0 x в уравнение. Прогноз продаж: 9 195 120 04 1 73 320 120 , , , ) ( y = ⋅ − = кг. Конечно, такой прогноз отвечает на вопрос, каково будет среднее значение результата. Однако зачастую необходимо знать диапазон возможных значе- ний результатов с заданной надежностью. Ниже приводятся формулы, позволяющие производить интер- вальное (а не точечное, как по уравнению регрессии) прогнозирование. Более подробно об интервальной оценке по регрессионному уравне- нию см. далее в задаче 1.3. Доверительныйинтервалдляиндивидуальногозначения o x : o o y n o o y n o s t y y s t y ˆ 2 ; 1 * ˆ 2 ; 1 ˆ ˆ − − − − + ≤ ≤ − α α (1.13) где ( ) ∑ = − − + + = n i i o y x x x x n s s o 1 2 2 2 2 ˆ ) ( ) ( 1 1 – дисперсия индивидуальных значений o y ; 2 - n ; α - 1 t – t- критерий Стьюдента (табл.2 приложений). Доверительныйинтервалдляусловногоматематического ожиданияобъясняемой переменной: yˆ 2 - n ; - 1 x y ˆ 2 - n ; - 1 s t y ˆ ) y ( M s t - yˆ α α + ≤ ≤ , (1.14) где ( ) ∑ + = 2 i 2 о 2 2 y ˆ ) x - x ( ) x - x ( n 1 s s – дисперсия групповых средних. Доверительныйинтервалдлякоэффициентарегрессии: ∑ ∑ = − − = − − − + ≤ ≤ − − n 1 i 2 i 2 n ; 1 n 1 i 2 i 2 n ; 1 ) x x ( s t bˆ b ) x x ( s t bˆ α α (1.15) Доверительныйинтервалдлядисперсии: 2 2 - n ; 2 - 1 2 2 2 2 - n ; 2 2 s n s n α α χ σ χ ≤ ≤ (1.16) Полянский Ю.Н. Эконометрика. Экономическое моделирование и прогнозирование. 21 1.2. ПРАКТИЧЕСКИЕ ЗАДАНИЯ . Задача 1.1 Имеются данные о цене на некото- рый товар (X, руб.) и соответствующем ежедневном спросе на него (Y, кг) у n=10 продавцов. Задания выполнить расчетами (по формулам). 1) Построить поле корреляции (то- чечный график экспериментальных значений) и сделать предваритель- ное эмпирическое предположение о характере связи между Y и X. 2) Оценить тесноту линейной связи между СВ Y и X с помощью коэф- фициента корреляции r ( согласу- ется ли оно с предварительным предположением?). 3) Получить МНК-уравнение парной линейной регрессии Y на X. 4) Получить прогнозные (теоретические) значения объясняемой пере- менной Y для заданных значений X; пользуясь ими, нанести линию полученной линейной регрессии на одну диаграмму с точечным гра- фиком экспериментальных данных; визуально убедиться в качестве построенной модели. Решение. Решать будем с использованием табличного процессора Microsoft Ex- cel ( версия любая). Заготовим таблицу исходных данных (рис.1.11). ! Замечания. • Как правило, буквенные подписи в ячейках – лишь комментарии, способствую- щие пониманию задачи и не имеющие прямого отношения к ее решению. • Удобно в строках таблицы записывать данные, касающиеся конкретного i-го наблюдения. При необходимости строки могут быть добавлены • Для использования в расчетах каких-либо данных (коэффициентов, характери- стик и т.п.), которые могут изменяться, исходя из условий задачи, нужно предусмотреть ячейки для их ввода. Это лучше, чем включение соответствующих чисел в формулы, т.к. делает программу универсальной и понимаемой. Например, в данной задаче в ячейку A14 можно ввести строку-комментарий «n=», а в ячейку B14 – объем выборки - число 10. Впрочем, те, кто знаком с функциями Microsoft Excel, могут это значение вычислить как количество непустых строк в таблице данных. • Для облегчения восприятия вводимого алгоритма и снижения вероятности ошибки рекомендуется выделять необходимые ячейки рамкой, цветом, шрифтом, сопро- вождать комментариями, группировать по логике решения и т.п. Рис. 1.11 Полянский Ю.Н. Эконометрика. Экономическое моделирование и прогнозирование. 22 1) Эконометрические исследования рекомендуется начинать с по- строения поля корреляции для визуальной оценки исходных данных. Для этого воспользуемся Мастеромдиаграмм, входящим в состав Microsoft Excel. В настоящей работе не ставится цель обучить работе с ним, а лишь рассматриваются наиболее общие вопросы построения графиков для облегчения исследований. ! Замечания. • Важно выбрать необходимый тип диаграммы. Чаще всего в дальнейшем мы будем использовать типы диаграмм «Точечная» и «График». Они имеют отличия: - В диаграмме типа «График» не важны числовые значения аргумента. Точки просто располагаются по порядку через равные промежутки по оси OX и могут быть во- обще не числами, а произвольными строками-подписями (в т.ч. и числовыми). - Для построения диаграммы «Точечная» требуется ввести диапазоны ячеек как переменной Y, так и X. И точки располагаются в масштабе не только по OY, но и по OX. - Оба типа диаграмм допускают соединение точек линиями, рисование маркеров и т.п. Для этого достаточно выбрать соответствующий вид диаграммы в пределах своего типа (рис.1.12) или уже после построения диаграммы дважды щелкнуть на линии графи- ка левой кнопкой мышки и установить соответствующие параметры в раскрывшемся окне диалога. • При построении графика данные необходимо упорядочивать по возрастанию X ( меню «Данные – Сортировка»). Для этого надо выделить всю таблицу исходных данных ( вместе с шапкой) и выбрать меню «Данные – Сортировка». Внимание! Если выделить лишь нужный столбец, то только он и будет упорядочен. При этом может потеряться со- ответствие между переменными X и Y в столбцах таблицы (тогда можно отменить сор- тировку кнопкой отката на панели инструментов). Сортировать таблицы по столбцу можно и с помощью кнопки , встав на соответствующий столбец. Итак, упорядочим данные по возрастанию X, а затем вызовем Мастер диаграмм,щелкнув левой кнопкой мышки на кнопку панели инстру- ментов. Т.к. исходные значения объясняемой переменной X произвольны, не обязательно следующие через равные промежутки, то выберем тип «Точеч- ная» (в котором предусмотрена шкала оси X). При изображении графика экспериментальных данных точки принято (и это логично) рисовать марке- рами (лучше всего кружками) и не соединять между собой линиями. Поэто- му выберем 1-й вид графика (рис.1.12) и кнопку «Далее». В следующем окне откроем закладку «Ряд» (рис.1.13). На одной диа- грамме может быть изображено несколько графиков (в терминологии руси- фицированного Microsoft Excel - рядов). Введем первый из них, щелкнув на кнопку «Добавить». Укажем источник исходных данных для графика, т.е. диапазоны ячеек с переменными X и Y. Для этого щелкнем указателем на поле ввода «Значения X» и выделим мышкой диапазон ячеек (столбец) C2:C11. Обратите внимание, что при этом в активном поле ввода автомати- чески запишется строка «=Лист1!$C$2:$C$11». Полянский Ю.Н. Эконометрика. Экономическое моделирование и прогнозирование. 23 Аналогично введем данные об Y в поле «Значения Y» (предваритель- но, если она есть, стерев строку «={1}»). В поле автоматически запишется «= Лист1!$B$2:$B$11». Обратите внимание, что в окне предварительного просмотра уже можно видеть общий вид графика. Рис |