Главная страница
Навигация по странице:

  • Точечный и интервальный прогнозы для модели парной линейной регрессии

  • 8. Построение модели парной линейной регрессии средствами MS Office Excel

  • Входной интервал Y

  • «Метки»

  • «Параметры вывода»

  • «Стандартизированные остатки»

  • «График нормальной вероятности»

  • Тема Модель парной линейной регрессии Понятие регрессии. Спецификация модели регрессии


    Скачать 1.6 Mb.
    НазваниеТема Модель парной линейной регрессии Понятие регрессии. Спецификация модели регрессии
    Дата23.09.2021
    Размер1.6 Mb.
    Формат файлаdocx
    Имя файла2.docx
    ТипДокументы
    #235694
    страница7 из 7
    1   2   3   4   5   6   7

    Пример 2.10. В нашем примере:


    При этом p-величина для рассчитанных значений критериев составила 0,0001 или 0,1%.

    Поскольку t-критерий характеризует возможное отношение оценки параметра к его стандартной ошибке при заданном уровне значимости, табличное значение t-критерия можно построить использовать для построения доверительных интервалов параметров модели регрессии:

    Тогда для модели парной линейной регрессии:



    Пример 2.11. Рассчитаем интервальные оценки параметров модели регрессии оборота розничной торговли по величине доходов населения при уровне значимости :



    Таким образом, с вероятностью 95% можно утверждать, что значения параметров модели регрессии находятся в следующих пределах:



    Если доверительный интервал параметра модели регрессии включает в себя нулевое значение, то это говорит о том, что гипотеза о статистической незначимости параметра не может быть отвергнута при заданном уровне значимости .
    7. Точечный и интервальный прогнозы для модели парной линейной регрессии
    Одной из задач эконометрического моделирования выступает прогнозирование социально-экономических явлений и процессов. Эта задача может решаться на основе регрессионных моделей, с помощью которых прогнозируется поведение результативной переменной в зависимости от поведения факторных переменных, включенных в модель.

    Точечный прогноз значения результативной переменной ( ) при заданном значение факторной переменной ( ) будет определяться по формуле:

    При этом действительная величина будет определяться как:

    Таким образом, истинное значение результативной переменной будет отклоняться от расчетного значения под влиянием ошибок параметров модели и случайной ошибки регрессии.

    Запишем модель регрессии, используемую для прогнозирования, в следующем виде:



    Отсюда следует, что стандартная ошибка регрессии в точке зависит от стандартной ошибки результативной переменной и стандартной ошибки коэффициента регрессии :



    Теоретическое значение (математическое ожидание) результативной переменной в точке с вероятностью будет находиться в интервале, определяемом как:



    В свою очередь, ошибка истинного значения результативной переменой будет зависеть от ошибки регрессии в точке и дисперсии ошибок регрессии:





    Таким образом, истинное значение результативной переменной в точке с вероятностью будет находиться в интервале, определяемом как:



    Другими словами фактических значений результативной переменной в генеральной совокупности будут находиться в пределах указанного интервала.

    Из приведенных формул мы видим, что ошибка как теоретического, так и фактического значения результативной переменной зависят от трех параметров:

    1. Значение стандартной ошибки регрессии . Стандартная ошибка регрессии представляет собой корень из остаточной дисперсии на одну степень свободы. Следовательно, чем выше качество регрессионной модели, тем точнее сделанный по ней прогноз.

    2. Отклонение точки для которой рассчитывается прогнозное значение от среднего значения факторной переменной. Чем ближе к , тем точнее прогноз. Максимальная точность достигается в точке , то есть .

    3. Дисперсии факторной переменной. Чем больше дисперсия xпри фиксированном числе наблюдений, тем точнее прогноз зависимой переменной.

    Пример 2.12. Рассмотрим пример нахождения доверительных интервалов для построенной нами модели парной линейной регрессии, описывающей зависимость оборота розничной торговли от доходов населения.

    Необходимо найти прогнозное значение оборота розничной торговли на душу населения в регионе, при заданной величине среднедушевых денежных доходов населения 15,6 тыс. руб.

    Занесем исходные данные в таблицу 2.7.1.

    Таблица 2.7.1

    Исходные данные для прогнозирования оборота розничной торговли

    п/п

    Показатель

    Значение

    Источник

    1



    0,34

    Таблица 2.6.2

    2



    0,58

    Расчет

    3



    31,19

    Таблица 2.6.3

    4



    13,9

    Таблица 2.2.1

    5



    15,6

    Исходные данные

    6

    n

    16

    Исходные данные

    7



    2,14

    Таблица распределения Стьюдента


    Теоретическое значение оборота розничной торговли на душу населения при среднедушевых доходах населения в размере 15,6 тыс. руб. составит:



    Найдем 95% доверительные интервалы для этого значения:







    Таким образом, в 95% выборок (и соответственно в построенных по этим данным моделях регрессии) прогнозное значение оборота розничной торговли при среднедушевых доходах населения в размере 15,6 тыс. руб. будет находиться в пределах от 7,6 тыс. руб. до 8,5 тыс. руб.

    Определим 95% доверительные интервалы для фактического значения оборота розничной торговли при среднедушевых доходах населения в размере 15,6 тыс. руб.:





    Следовательно, с вероятностью 0,95 мы можем утверждать, что фактическое значение оборота розничной торговли при среднедушевых доходах населения в размере 15,6 тыс. руб. будет находиться в пределах от 6,8 тыс. руб. до 9,4 тыс. руб.

    Рассмотрим графическое изображение найденных доверительных интервалов значений результативной переменной (рис. 2.7.1).


    Линия регрессии

    Доверительный интервал для линии регрессии

    Рис. 2.7.1. Доверительные интервалы для теоретических и фактических значений результативной переменной

    (оборота розничной торговли на душу населения)
    На рисунке 2.6.1 мы видим, что границы доверительных интервалов расширяются по мере удаления от центра распределения факторной переменной. При этом все фактические значения оборота розничной торговли на душу населения попадают в 95% доверительный интервал.
    8. Построение модели парной линейной регрессии средствами

    MS Office Excel
    Оценки параметров модели регрессии, а также показатели качества и статистической значимости модели можно рассчитать, используя возможности модуля «Анализ данных», входящего в блок надстроек «Пакет анализа».

    Для вызова команды «Анализ данных» необходимо нажать на соответствующую кнопку в меню «Данные»:


    В меню «Анализ данных» необходимо выбрать инструмент анализа «Регрессия»:

    В диалоговом окне «Регрессия» возможно установить следующие параметры анализа:




    1. «Входной интервал Y» - ссылка на диапазон значений результативной переменной. Диапазон должен состоять из одного столбца.

    2. «Входной интервал X» - ссылка на диапазон значений факторной переменной.

    3. «Метки» - необходимо установить флажок, если выделенный диапазон содержит заголовки столбцов.

    4. «Уровень надежности» - необходимо установить флажок, если доверительные интервалы для параметров модели регрессии должны быть дополнительно рассчитаны для вероятности отличной от 95%, применяемой по умолчанию. Обычно используют уровень надежности 99% для проверки нулевых гипотез при уровне значимости

    5. «Константа – ноль» - необходимо установить флажок, если теоретическое обоснование модели предполагает

    6. «Параметры вывода» - необходимо выбрать расположение таблицы с результатами регрессионного анализа.

    7. «Остатки» - при установке флажка в результаты регрессии будут включены значения регрессионных остатков.

    8. «Стандартизированные остатки» - при установке флажка в результаты регрессии будут включены стандартизированные значения регрессионных остатков (со средней равной 0 и дисперсией равной 1).

    9. «График остатков» - при установке флажка будет показана диаграмма рассеяния для значений регрессионных остатков и факторной переменной. Данный график используется для визуальной проверки предпосылок МНК о гомоскедастичности остатков и экзогенности факторной переменной.

    10. «График подбора» - при установке флажка будет показан график зависимости фактических и теоретических значений результативной переменной. Данный график используется для визуальной оценки качества построенной модели.

    11. «График нормальной вероятности» - при установке флажка будут показаны таблица и график распределения результативной переменной.

    Пример 2.13. Проведем анализ данных, характеризующих среднедушевые денежные доходы населения и среднемесячный оборот розничной торговли на душу населения регионов Центрального федерального округа Российской Федерации за 2010 г. с использованием инструмента «Регрессия» пакета анализа MSOfficeExcel:

    Полученная в результате использования инструмента «Регрессия» таблица «Вывод итогов» состоит из следующих элементов:


    1. Таблица «Регрессионная статистика»




    Регрессионная статистика

    Множественный R

    0,810672833

    R-квадрат

    0,657190443

    Нормированный R-квадрат

    0,632704046

    Стандартная ошибка

    0,580828145

    Наблюдения

    16


    Для модели парной линейной регрессии доступна интерпретация следующих показателей:

    Обозначение в MS Office Excel

    Название показателя

    Формула расчета

    Интерпретация

    Множественный R

    Линейный коэффициент множественной корреляции



    Для парной линейной зависимости равен модулю линейного коэффициента корреляции (Пример 2.2)

    R-квадрат

    Коэффициент детерминации



    Пример 2.6

    Стандартная ошибка

    Стандартная ошибка регрессии



    Пример 2.12

    Наблюдения

    Число наблюдений, объем выборки









    1. Таблица «Дисперсионный анализ»




    Дисперсионный анализ
















     

    df

    SS

    MS

    F

    Значимость F

    Регрессия

    1

    9,054

    9,054

    26,839

    0,0001394

    Остаток

    4

    4,723

    0,337







    Итого

    5

    13,777

     

     

     


    Для модели парной линейной регрессии доступна интерпретация всех показателей:

    Обозначение в MS Office Excel

    Название показателя

    Формула расчета

    Интерпретация

    Регрессия:

    - df

    Число степеней свободы суммы квадратов отклонений, объясненных регрессией (факторной)



    Пример 2.7

    - SS

    Сумма квадратов отклонений, объясненных регрессией (факторная)



    Пример 2.6

    - MS

    Объясненная (факторная) дисперсия на одну степень свободы



    Пример 2.7

    Остаток:

    - df

    Число степеней свободы остаточной суммы квадратов отклонений



    Пример 2.7

    - SS

    Остаточная сумма квадратов отклонений



    Пример 2.6

    - MS

    Остаточная дисперсия на одну степень свободы



    Пример 2.7

    Итого:

    - df

    Число степеней свободы общей суммы квадратов отклонений



    Пример 2.7

    - SS

    Общая сумма квадратов отклонений



    Пример 2.6

    F

    F-критерий Фишера



    Пример 2.7

    Значимость F

    p-значение для F-критерий Фишера

    -

    Пример 2.7




    1. Таблица «Оценка параметров»




     

    Коэффициенты

    Стандартная ошибка

    t-статистика

    P-Значение

    Y-пересечение

    -0,288

    1,450

    -0,199

    0,845307

    Переменная X 1

    0,539

    0,104

    5,181

    0,000134


    Нижние 95%

    Верхние 95%

    Нижние 99,0%

    Верхние 99,0%

    -3,399

    2,822

    -4,606

    4,029

    0,316

    0,762

    0,229

    0,848


    Для модели парной линейной регрессии доступна интерпретация всех показателей:


    Обозначение в MS Office Excel

    Название показателя

    Формула расчета

    Интерпретация

    Y-пересечение

    Коэффициенты

    Оценка параметра модели , свободный член



    Пример 2.4

    Стандартная ошибка

    Стандартная ошибка оценки параметра



    Пример 2.8

    t-статистика

    t-критерий Стьюдента для параметра



    Пример 2.8

    P-Значение

    p-значение для t-критерия для параметра

    -

    Пример 2.8

    Нижние 95%

    Нижняя граница 95% доверительного интервала параметра



    Пример 2.11

    Верхние 95%

    Верхняя граница 95% доверительного интервала параметра



    Пример 2.11

    Нижние 99,0%

    Нижняя граница 99% доверительного интервала параметра



    Пример 2.11

    Верхние 99,0%

    Верхняя граница 99% доверительного интервала параметра



    Пример 2.11

    Переменная X 1

    Коэффициенты

    Оценка параметра модели , коэффициент регрессии



    Пример 2.4

    Стандартная ошибка

    Стандартная ошибка оценки параметра



    Пример 2.8

    t-статистика

    t-критерий Стьюдента для параметра



    Пример 2.8

    P-Значение

    p-значение для t-критерия для параметра

    -

    Пример 2.8

    Нижние 95%

    Нижняя граница 95% доверительного интервала параметра



    Пример 2.11

    Верхние 95%

    Верхняя граница 95% доверительного интервала параметра



    Пример 2.11

    Нижние 99,0%

    Нижняя граница 99% доверительного интервала параметра



    Пример 2.11

    Верхние 99,0%

    Верхняя граница 99% доверительного интервала параметра



    Пример 2.11


    Значения показателей, полученные с использованием инструмента «Регрессия» пакета анализа MSOfficeExcelсовпадают со значениями, полученными нами ранее при самостоятельных расчетах, с учетом ошибок округления.

    Рассмотрим графики, построенные с использованием инструмента «Регрессия» пакета анализа MSOfficeExcel:

    1. График остатков:


    Рис. 2.8.1. График остатков модели регрессии оборота розничной торговли на душу населения по величине среднедушевых денежных доходов населения
    Вид графика остатков говорит нам о том, что:

    - величина остатков равномерно распределена вокруг нулевого среднего значения (то есть остатки гомоскедастичны);

    - значения остатков не зависят от значений факторной переменной.


    1. График подбора:


    Рис. 2.8.2. График наблюдаемых и предсказанных значений оборота розничной торговли на душу населения
    Вид графика подбора говорит нам о том, что:

    - расчетные (предсказанные) значения результативной переменой незначительно отличаются от фактических (наблюдаемых) значений;

    - значения остатков (разность между столбцами) не зависят от значений факторной переменной.

    Ранее мы говорили о том, что для корректного использования параметрических критериев и построения доверительных интервалов необходимо, чтобы ошибки регрессии подчинялись нормальному распределению. Для проверки соблюдения данной предпосылки оценивают гипотезу о нормальном распределении регрессионных остатков. При этом обычно используют критерии согласия Пирсона, Колмогорова-Смирнова и др.

    Однако использование указанных критериев сопряжено с трудностями вычислений, при отсутствии специализированного программного обеспечения. Этого недостатка лишен тест Жарка-Бера при помощи которого проверяется гипотеза вида:

    Если нулевая гипотеза верна, то величина:


    имеет распределение с числом степеней свободы равным 2.
    Величину называют коэффициентом асимметрии и рассчитывают как:


    где – центральный момент регрессионных остатков порядка k.
    Величину называют коэффициентом эксцесса и рассчитывают как:

    Пример 2. 14. Используем тест Жарка-Бера для проверки гипотезы о нормальном распределении остатков модели регрессии оборота розничной торговли по доходам населения.

    Значения регрессионных остатков получим при использовании инструмента «Регрессия» модуля «Анализ данных» MSOfficeExcel, установив флажок «Остатки».

    Значения коэффициентов асимметрии и эксцесса определим используя инструмент «Описательная статистика» модуля «Анализ данных» MSOfficeExcel:



    Коэффициент асимметрии

    Коэффициент эксцесса

    Рассчитаем значение статистики Жарка-Бера:



    Табличное значение распределения с числом степеней свободы равным 2 при уровне значимости определим используя формулу «ХИ2ОБР» MSOfficeExcel:

    Поскольку нулевая гипотеза о нормальном распределении ошибки регрессии не может быть отвергнута при заданном уровне значимости.

    Следовательно, использование нами для оценки статистической значимости модели регрессии распределений Фишера и Стьюдента является корректным.
    1   2   3   4   5   6   7


    написать администратору сайта