Главная страница
Навигация по странице:

  • Пример 2.8.

  • Проверка статистической значимости линейного коэффициента корреляции

  • Тема Модель парной линейной регрессии Понятие регрессии. Спецификация модели регрессии


    Скачать 1.6 Mb.
    НазваниеТема Модель парной линейной регрессии Понятие регрессии. Спецификация модели регрессии
    Дата23.09.2021
    Размер1.6 Mb.
    Формат файлаdocx
    Имя файла2.docx
    ТипДокументы
    #235694
    страница6 из 7
    1   2   3   4   5   6   7

    Проверка статистической значимости параметра модели регрессии заключается в проверке нулевой гипотезы о равенстве нулю его значения в генеральной совокупности:


    Для проверки выдвинутой гипотезы используется t-критерий, подчиняющийся распределению Стьюдента:


    где – t-критерий для параметра ;

    – оценка параметра в выборочной совокупности;

    – стандартная ошибка параметра .
    t-критерий показывает во сколько раз разность между оценкой параметра и его истинным значением больше стандартной ошибки параметра.

    Учитывая, что согласно выдвинутой гипотезе , а стандартная ошибка параметра представляет собой стандартное отклонение его выборочной оценки , формулу для расчета t-критерия можно представить в следующем виде:

    Критическое значение t-критерия ( ) определяется по таблицам распределения Стьюдента для проверки двусторонних (two tailed) гипотез при заданном уровне значимости и числе степеней свободы . Если используются таблицы распределения Стьюдента для проверки односторонних (one tailed) гипотез, следует указывать уровень значимости .

    Область допустимых значений задается условием , а критическая область – условием .

    Таким образом, если рассчитанное по выборочным данным значение t-критерия больше критического значения ( ), то нулевая гипотеза о равенстве нулю параметра регрессии отвергается с вероятностью ошибки и параметр считается статистически значимым.

    Если рассчитанное по выборочным данным значение t-критерия меньше или равно критическому значению ( ), то нулевая гипотеза о равенстве нулю параметра регрессии принимается и параметр регрессии считается статистически незначимым.

    С учетом рассмотренных выше формул оценки дисперсии МНК-оценок параметров парной линейной регрессии, формулы для расчета t-критерия будут иметь следующий вид:


    Пример 2.8. Рассмотрим оценку статистической значимости параметров модели парной линейной регрессии на примере зависимости между оборотом розничной торговли и доходами населения регионов Центрального федерального округа. Исходные данные для анализа представлены в таблице 2.6.3.

    Таблица 2.6.3

    Исходные данные для анализа статистической значимости параметров регрессии

    № п/п

    Среднедушевые доходы населения,

    тыс. руб. (x)

    Ср.-месячный оборот розничной торговли на душу населения,

    тыс. руб. (y)







    1

    16,6

    7,8

    275,56

    7,43

    0,73

    2

    13,2

    7,2

    174,24

    0,46

    0,14

    3

    12,5

    5,6

    156,25

    1,89

    0,72

    4

    12,7

    6,9

    161,29

    1,38

    0,12

    5

    10,9

    5,6

    118,81

    8,85

    0,00

    6

    15,2

    8,1

    231,04

    1,76

    0,04

    7

    12,7

    5,7

    161,29

    1,38

    0,73

    8

    14,6

    7,2

    213,16

    0,53

    0,14

    9

    15,7

    8,4

    246,49

    3,33

    0,05

    10

    12,9

    6,6

    166,41

    0,95

    0,00

    11

    13,3

    7

    176,89

    0,33

    0,01

    12

    14,6

    8,6

    213,16

    0,53

    1,04

    13

    13,6

    7,5

    184,96

    0,08

    0,21

    14

    13,8

    7,8

    190,44

    0,01

    0,43

    15

    15,3

    8,1

    234,09

    2,03

    0,02

    16

    14,4

    6,9

    207,36

    0,28

    0,33

    Всего:







    3 111,44

    31,19

    4,73





    Определим критическое значение t-критерия по таблице распределения Стьюдента для проверки двусторонних гипотез:

    Расчетное значение t-критерия для параметра попадает в область принятия гипотезы , следовательно мы не можем отклонить нулевую гипотезу о его равенстве нулю с приемлемой вероятностью ошибки. Однако ранее мы отмечали, что в построенной нами модели параметр не имеет экономического смысла и, соответственно, мы можем не делать никаких предположений относительно его значения.

    Расчетное значение t-критерия для параметра попадает в критическую область , следовательно с вероятностью 95% мы отвергаем нулевую гипотезу о равенстве нулю коэффициента регрессии и считаем его статистически значимым.

    Табличное значение t-критерия можно получить используя функцию СТЬЮДРАСПОБР из категории «Статистические» в Microsoft Office Excel:

    В диалоговом окне функции необходимо:

    1. в поле «Вероятность» - ввести уровень значимости (обычно 0,05 или 5%);

    2. в поле «Степени_свободы» ввести число степеней свободы для объясненной суммы квадратов отклонений (в модели парной линейной регрессии – , в нашем примере 16-2=14).

    Полученное значение t-критерия равное 2,14 совпадает с тем значением, которое мы определили по таблице t-распределения.

    С помощью функции СТЬЮДРАСПР входящей в категорию «Статистические» Microsoft Office Excel возможно по рассчитанному значению t-критерия определить соответствующую ему р-величину:



    В диалоговом окне функции необходимо:

    1. в поле «Х» - ввести рассчитанное по выборочным данным значение t-критерия (в нашем примере 5,18);

    2. в поле «Степени_свободы» ввести число степеней свободы для объясненной суммы квадратов отклонений (в модели парной линейной регрессии – , в нашем примере 16-2=14);

    3. в поле «Хвосты» ввести число 2, поскольку t-критерий используется для проверки двухсторонней гипотезы.

    р-значение говорит нам о том, что вероятность ошибки при отклонении нулевой гипотезы составляет . Таким образом, вероятность того, что коэффициент регрессии принимает значение, отличное от нуля, составляет 99,99%.

    Проверка статистической значимости линейного коэффициента корреляции заключается в проверке нулевой гипотезы о равенстве нулю его значения в генеральной совокупности:

    Учитывая, что стандартная ошибка коэффициента корреляции определяется по формуле:


    расчетное значение t-критерия составит:


    Порядок проверки нулевой гипотезы относительно значения коэффициента корреляции с использованием t-критерия аналогичен проверке гипотезы о значении параметров модели регрессии.

    Применение t-критерия для проверки гипотезы о равенстве нулю коэффициента корреляции целесообразно при выполнении следующих условий:

    1. значительное число наблюдений (объем выборки

    2. абсолютное значение коэффициента корреляции значительно меньше 1 ( ).

    Если указанные условия не выполняются, то распределение оценок коэффициента корреляции не подчиняется нормальному распределению, в силу того, что их значения ограничены интервалом .

    Для решения данной проблемы Р. Фишером было предложено использовать вспомогательную нормально распределенную величину , имеющую стандартную ошибку .

    Рассчитанное значение критерия:

    сопоставляют с табличным значением, определенным по таблице нормального распределения с заданным уровнем значимости .

    Пример 2.9. Рассмотрим пример оценки статистической значимости коэффициента корреляции между оборотом розничной торговли и величиной доходов населения, рассчитанным по данным 16 регионов Центрального федерального округа:

    Рассчитанное значение превышает табличное значение при , и следовательно коэффициент корреляции между оборотом розничной торговли и величиной доходов населения является статистически значимым.

    Однако исходные данные не удовлетворяют условиям использования t-критерия. Поэтому проведем оценку статистической значимости коэффициента корреляции с использованием преобразования Фишера:

    Табличное значение критерия определим, используя функцию НОРМСТОБР входящую в категорию «Статистические» Microsoft Office Excel:

    Поскольку проверяемая гипотеза является двухсторонней, а нормальное распределение – симметричным, в поле «Вероятность» необходимо указать величину .

    Поскольку рассчитанное значение критерия (4,06) превышает табличное (1,96), нулевая гипотеза о равенстве нулю коэффициента корреляции отвергается с вероятностью ошибки 5%, и коэффициент корреляции между оборотом розничной торговли и доходами населения является статистически значимым.

    Учитывая, что , а мы можем признать равносильными гипотезы . Таким образом, если уравнение парной регрессии в целом статистически значимо, то статистически значимыми являются коэффициент регрессии и коэффициент корреляции. Поскольку квадрат случайной величины имеющей распределение Стьюдента имеет распределение Фишера можно записать следующее соотношение:

    Действительно:







    1   2   3   4   5   6   7


    написать администратору сайта