Главная страница
Навигация по странице:

  • 42. Проверка значимости для коэффициента детерминации.

  • 43. Проверка линейной регрессии

  • Выбор формы уравнения регрессии


    Скачать 8.7 Mb.
    НазваниеВыбор формы уравнения регрессии
    Анкорkira_shpory.doc
    Дата07.05.2018
    Размер8.7 Mb.
    Формат файлаdoc
    Имя файлаkira_shpory.doc
    ТипДокументы
    #19000
    страница11 из 13
    1   ...   5   6   7   8   9   10   11   12   13

    41. Проверка значимости для коэффициента корреляции

    Как неоднократно отмечалось, для статистического вывода о на­личии или отсутствии корреляционной связи между исследуемыми пе­ременными необходимо произвести проверку значимости выборочного коэффициента корреляции. В связи с тем что надежность статистиче­ских характеристик, в том числе и коэффициента корреляции, зависит от объема выборки, может сложиться такая ситуация, когда величина коэффициента корреляции будет целиком обусловлена случайными колебаниями в выборке, на основании которой он вычислен. При существенной связи между переменными коэффициент корреляции должен значимо отличаться от нуля. Если корреляционная связь меж­ду исследуемыми переменными отсутствует, то коэффициент корреля­ции генеральной совокупности ρ равен нулю. При практических ис­следованиях, как правило, основываются на выборочных наблюдениях. Как всякая статистическая характеристика, выборочный коэффициент корреляции является случайной величиной, т. е. его значения случай­но рассеиваются вокруг одноименного параметра генеральной совокуп­ности (истинного значения коэффициента корреляции). При отсутствии корреляционной связи между переменными у и х коэффициент корре­ляции в генеральной совокупности равен нулю. Но из-за случайного характера рассеяния принципиально возможны ситуации, когда не­которые коэффициенты корреляции, вычисленные по выборкам из этой совокупности, будут отличны от нуля.

    Могут ли обнаруженные различия быть приписаны случайным ко­лебаниям в выборке или они отражают существенное изменение усло­вий формирования отношений между переменными? Если значения выборочного коэффициента корреляции попадают в зону рассеяния, обусловленную случайным характером самого показателя, то это не является доказательством отсутствия связи. Самое большее, что при этом можно утверждать, сводится к тому, что данные наблюдений не отрицают отсутствия связи между переменными. Но если значение вы­борочного коэффициента корреляции будет лежать вне упомянутой зоны рассеяния, то делают вывод, что он значимо отличается от нуля, и можно считать, что между переменными у и х существует статистиче­ски значимая связь. Используемый для решения этой задачи критерий, основанный на распределении различных статистик, называется крите­рием значимости.

    Процедура проверки значимости начинается с формулировки ну­левой гипотезы H0. В общем виде она заключается в том, что между па­раметром выборки и параметром генеральной совокупности нет каких- либо существенных различий. Альтернативная гипотеза H1 состоит в том, что между этими параметрами имеются существенные различия. Например, при проверке наличия корреляции в генеральной совокуп­ности нулевая гипотеза заключается в том, что истинный коэффициент корреляции равен нулю (Н0: ρ = 0). Если в результате проверки ока­жется, что нулевая гипотеза не приемлема, то выборочный коэффи­циент корреляции rух значимо отличается от нуля (нулевая гипотеза отвергается и принимается альтернативная Н1). Другими словами, предположение о некоррелированности случайных переменных в ге­неральной совокупности следует признать необоснованным. И нао­борот, если на основе критерия значимости нулевая гипотеза прини­мается, т. е. rух лежит в допустимой зоне случайного рассеяния, то нет оснований считать сомнительным предположение о некоррелиро­ванности переменных в генеральной совокупности.

    При проверке значимости исследователь устанавливает уровень значимости α, который дает определенную практическую уверенность в том, что ошибочные заключения будут сделаны только в очень ред­ких случаях. Уровень значимости выражает вероятность того, что ну­левая гипотеза Н0 отвергается в то время, когда она в действительности верна. Ясно, что имеет смысл выбирать эту вероятность как можно меньшей.

    Пусть известно распределение выборочной характеристики, яв­ляющейся несмещенной оценкой параметра генеральной совокупности. Выбранному уровню значимости α соответствуют под кривой этого распределения заштрихованные площади (см. рис. 24). Незаштрихованная площадь под кривой распределения определяет вероятность Р = 1 — α. Границы отрезков на оси абсцисс под заштрихованными площадями называют критическими значениями, а сами отрезки обра­зуют критическую область, или область отклонения гипотезы.

    При процедуре проверки гипотезы выборочную характеристику, вычисленную по результатам наблюдений, сравнивают с соответствую­щим критическим значением. При этом следует различать односторон­нюю и двустороннюю критические области. Форма задания критической области зависит от постановки задачи при статистическом исследова­нии. Двусторонняя критическая область необходима в том случае, когда при сравнении параметра выборки и параметра генеральной со­вокупности требуется оценить абсолютную величину расхождения между ними, т. е. представляют интерес как положительные, так и от­рицательные разности между изучаемыми величинами. Когда же надо убедиться в том, что одна величина в среднем строго больше или мень­ше другой, используется односторонняя критическая область (право- или левосторонняя). Вполне очевидно, что для одного и того же критического значения уровень значимости при использовании одно­сторонней критической области меньше, чем при использовании дву­сторонней. Если распределение выборочной характеристики симметрично,



    Рис. 24. Проверка нулевой гипотезы H0

    то уровень значимости двусторонней критической области равен α, а односторонней - (см. рис. 24). Ограничимся лишь общей по­становкой проблемы. Более подробно с теоретическим обоснованием проверки статистических гипотез можно познакомиться в специальной литературе. Далее мы лишь укажем критерии значимости для различ­ных процедур, не останавливаясь на их построении.

    Проверяя значимость коэффициента парной корреляции, устанав­ливают наличие или отсутствие корреляционной связи между исследуе­мыми явлениями. При отсутствии связи коэффициент корреляции гене­ральной совокупности равен нулю (ρ = 0). Процедура проверки на­чинается с формулировки нулевой и альтернативной гипотез:

    Н0 : различие между выборочным коэффициентом корреляции rи ρ = 0 незначимо,

    Н1 : различие между r и ρ = 0 значимо, и следовательно, между переменными у и х имеется существенная связь. Из альтернативной ги­потезы следует, что нужно воспользоваться двусторонней критической областью.

    В разделе 8.1 уже упоминалось, что выборочный коэффициент кор­реляции при определенных предпосылках связан со случайной вели­чиной t, подчиняющейся распределению Стьюдента с f= п — 2 сте­пенями свободы. Вычисленная по результатам выборки статистика

     (8.38)

    сравнивается с критическим значением, определяемым по таблице рас­пределения Стьюдента при заданном уровне значимости α и f= п — 2 степенях свободы. Правило применения критерия заключается в сле­дующем: если |t| > tf, то нулевая гипотеза на уровне значимости αотвергается, т. е. связь между переменными значима; если |t| ≤ tf, то нулевая гипотеза на уровне значимости α принимается. Отклонение значения rот ρ = 0 можно приписать случайной вариации. Данные выборки характеризуют рассматриваемую гипотезу как весьма возмож­ную и правдоподобную, т. е. гипотеза об отсутствии связи не вызывает возражений.

    Процедура проверки гипотезы значительно упрощается, если вместо статистики t воспользоваться критическими значениями коэф­фициента корреляции, которые могут быть определены через квантили распределения Стьюдента путем подстановки в (8.38) t=tf,а и r = ρf,а:

     (8.39)

    Существуют подробные таблицы критических значений, выдержка из которых приведена в приложении к данной книге (см. табл. 6). Правило проверки гипотезы в этом случае сводится к следующему: если r > ρf,а, то можем утверждать, что связь между переменными су­щественная. Если rrf, то результаты наблюдений считаем непро­тиворечащими гипотезе об отсутствии связи.

    42. Проверка значимости для коэффициента детерминации.

    При выполнении процедуры проверки значимости коэффициента детерминации выдвигается нулевая гипотеза Н0 против альтернативной Н1 которые заключаются в следующем.

    Н0: существенного различия между выборочным коэффициентом детерминации и коэффициентом детерминации генеральной совокупности B(г) = 0 нет.

    Эта гипотеза равносильна гипотезе Н0: = β1=β2=…βm=0, т. е. ни одна из объясняющих переменных, включенных в регрессию, не оказывает существенного влияния на зависимую переменную.

    Н1: выборочный коэффициент детерминации существенно больше коэффициента детерминации генеральной совокупности B(г) = 0.

    Из постановки задачи ясно, что следует использовать одностороннюю критическую область. Принятие гипотезы Н1 означает, что по крайней мере одна из m объясняющих переменных, включенных в регрессию, оказывает существенное влияние на переменную у.

    Для оценки значимости парного коэффициента детерминации используется статистика

     (8.50)

    имеющая F-распределение Фишера с f1=m=1 и f2=n-2степенями свободы. Значение статистики, вычисленное по (8.50), сравнивается с критическим значением этой статистики, найденным по табл. 4 приложения при заданном уровне значимости α и соответствующем числе степеней свободы. Если F > Ff1;f2;α , то вычисленный коэффициент детерминации значимо отличается от нуля. Этот вывод обеспечивается с вероятностью 1- α.

    Пример

    В разделе 3.2 был вычислен по п = 14 предприятиям коэффициент детерминации для регрессии, отражающей зависимость производитель­ности труда от уровня механизации работ, Bvx = 0,938. По (8.50) получим



    Зададимся уровнем значимости α = 0,05. Числа степеней свободы со­ответственно следующие: f1 = 1 и f 2 = 12. По табл. 4 приложения на­ходим критическое значение F1;12;0,05 = 4,747. Вследствие того что F>F1;12;0,05, делаем вывод, что Вух существенно отличается от нуля, и, следовательно, включенные в регрессию переменные достаточно объясняют зависимую переменную.

    Можно показать, что при fx = 1 всегда F = t2. Тогда (8.50) можно записать в виде

     (8.51)

    Эта величина имеет F-распределение с f=п-2 степенями свободы. Если мы теперь учтем, что В = r2 (см. (4.13)), то отсюда следует, что с помощью критерия (8.51) можно проверить также значимость коэф­фициента корреляции.

    Оценка значимости коэффициента множественной детерминации производится с помощью статистики

     (8.52)

    которая имеет F-распределение с f1= m и f2= n-т-1 степеня­ми свободы. Здесь т - количество учитываемых объясняющих пере­менных. Значение статистики (8.52), вычисленное по эмпирическим данным, сравнивается с табличным значением Ff1;f2;α. Критическое значение определяется по табл. 4 приложения по заданному α и сте­пеням свободы f1 и f2. Правило проверки аналогично процедуре оцен­ки значимости коэффициента парной детерминации.

    Пример

    В разделе 3.3 были вычислены два коэффициента множественной де­терминации, Ву.12 = 0,9447 и Ву.123 = 0,9541, по п = 14 наблюде­ниям соответственно для т = 2 и т = 3 объясняющих переменных. Имеем:





    Итак, в обоих случаях F > Ff1;f2;α. Коэффициенты множественной детерминации существенно отличны от нуля, и, следовательно, рассма­триваемые регрессии достаточно определены включенными перемен­ными. Для оценки значимости коэффициента частной детерминации используется статистика

     (8.53)

    которая имеет f-распределение с f1 = т и f2 = n-m-p-1степенями свободы. Здесь р число переменных, исключенных при вычислении коэффициентов частной детерминации. Процедура про­верки значимости аналогична описанным выше.

    43. Проверка линейной регрессии

    В экономике причинно-следственные отношения между явлениями часто описываются с помощью линейных или линеаризуемых зависимостей. Разработаны статистические критерии, позволяющие либо подтвердить факт непротиворечивости линейной формы зависимости опытным данным, либо отвергнуть предложенный вид зависимости как не соответствующий этим данным. Для проверки линейности регрессии применяется следующий метод. Пусть каждому значению объясняющей переменной соответствует несколько значений зависимой переменной, по которым вычисляют частные средние ,  и т.д. Обозначим через  частное среднее, соответствующее j-му значению объясняющей переменной:

     (8.71)

    где  — число значений у, относящихся к  (k = 1, ..., m); Найдем теперь средний квадрат отклонений значений  от их частных средних:

    (8.72)

    Показатель (8.72) является мерой рассеяния опытных данных около своих частных средних, т. е. мерой, не зависящей от выбранного вида регрессии. В качестве меры рассеяния опытных данных вокруг эмпирической регрессионной прямой выбирается средний квадрат отклонений:

    (8.73)

    Оба показателя  и  представляют собой независимые статистические оценки одной и той же дисперсии в . Если  несущественно больше , то в качестве гипотетической зависимости может быть принята линейная.

    Если в генеральной совокупности существует линейная регрессия и условные распределения переменной у хотя бы приблизительно нормальны, то отношение средних квадратов отклонений (8.72) и (8.73)

     (8.74)

    имеет F-распределение c f1 = p-m-1 и f2 = n - р степенями свободы. Значение F, подсчитанное по формуле (8.74), сравнивается с критическим Ff1;f2, найденным по табл. 4 приложения при заданном уровне значимости α и f1, f2 степенях свободы. Если F ≤ Ff1;f2, то разница между обоими средними квадратами отклонений статистически незначима и выбранная нами линейная регрессионная зависимость может быть принята как правдоподобная, не противоречащая опытным данным. Если F > Ff1;f2, то различие между обоими средними квадратами отклонений существенно, неслучайно, и гипотеза о линейной зависимости между переменными несостоятельна. Разработаны также другие критерии проверки гипотезы о линейности регрессии. Заинтересованный читатель может найти их в соответствующей литературе [122], [76].
    1   ...   5   6   7   8   9   10   11   12   13


    написать администратору сайта