Методические указания к выполнению контрольной работы для студентов заочной формы обучения
![]()
|
Мультиколлинеарность имеет место, если определитель матрицы межфакторной корреляции близок к нулю:![]() Если же определитель матрицы межфакторной корреляции близок к единице, то мультколлинеарности нет.Существуют различные подходы преодоления сильной межфакторной корреляции. Простейший из них – исключение из модели фактора (или факторов), в наибольшей степени ответственных за мультиколлинеарность при условии, что качество модели при этом пострадает несущественно (а именно, теоретический коэффициент детерминации -R2y(x1...xm) снизится несущественно). Определение факторов, ответственных за мультиколлинеарность, может быть основано на анализе матрицы межфакторной корреляции. При этом определяют пару признаков-факторов, которые сильнее всего связаны между собой (коэффициент линейной парной корреляции максимален по модулю). Из этой пары в наибольшей степени ответственным за мультиколлинеарность будет тот признак, который теснее связан с другими факторами модели (имеет более высокие по модулю значения коэффициентов парной линейной корреляции). Еще один способ определения факторов, ответственных за мультиколлинеарность основан на вычислении коэффициентов множественной детерминации (R2xj(x1,...,xj-1,xj+1,...,xm)), показывающего зависимость фактора xj от других факторов модели x1,...,xj-1, xj+1,...,xm. Чем ближе значение коэффициента множественной детерминации к единице, тем больше ответственность за мультиколлинеарность фактора, выступающего в роли зависимой переменной. Сравнивая между собой коэффициенты множественной детерминации для различных факторов можно проранжировать переменные по степени ответственности за мультиколлинеарность. При выборе формы уравнения множественной регрессии предпочтение отдается линейной функции: yi=a+b1·x1i+ b2·x2i+...+ bm·xmi+ui в виду четкой интерпретации параметров. Данное уравнение регрессии называют уравнением регрессии в естественном (натуральном) масштабе. Коэффициент регрессии bjпри факторе хjназывают условно-чистым коэффициентом регрессии. Он измеряет среднее по совокупности отклонение признака-результата от его средней величины при отклонении признака-фактора хj на единицу, при условии, что все прочие факторы модели не изменяются (зафиксированы на своих среднихуровнях). Если не делать предположения о значениях прочих факторов, входящих в модель, то это означало бы, что каждый из них при изменении хj также изменялся бы (так как факторы связаны между собой), и своими изменениями оказывали бы влияние на признак-результат. Расчет параметров уравнения линейной множественной регрессииПараметры уравнения множественной регрессии можно оценить методом наименьших квадратов, составив и решив систему нормальных линейных уравнений. Кроме того, для линейной множественной регрессии существует другой способ реализации МНК при оценке параметров - через -коэффициенты (через параметры уравнения регрессии в стандартных масштабах). Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам: ![]() где хji- значение переменной хji в i-ом наблюдении. ![]() Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение . Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением: ![]() Для оценки -коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид: rx1y=1+rx1x2∙2+…+ rx1xm∙m rx2y= rx2x1∙1+2+…+ rx2xm∙m … rxmy=rxmx1∙1+rxmx2∙2+…+m Найденные из данной системы –коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам: ![]() ![]() Показатели тесноты связи факторов с результатом. Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат. К таким показателям тесноты связи относят: частные коэффициенты эластичности, –коэффициенты, частные коэффициенты корреляции. Частные коэффициенты эластичности Эj рассчитываются по формуле: ![]() ![]() ![]() Стандартизированные частные коэффициенты регрессии - -коэффициенты (j) показывают, на какую часть своего среднего квадратического отклонения у изменится признак-результат y с изменением соответствующего фактора хj на величину своего среднего квадратического отклонения (хj) при неизменном влиянии прочих факторов (входящих в уравнение). По коэффициентам эластичности и -коэффициентам могут быть сделаны противоположные выводы. Причины этого: а) вариация одного фактора очень велика; б) разнонаправленное воздействие факторов на результат. Коэффициент j может также интерпретироваться как показатель прямого (непосредственного) влияния j-ого фактора (xj) на результат (y). Во множественной регрессии j-ый фактор оказывает не только прямое, но и косвенное (опосредованное) влияние на результат (т.е. влияние через другие факторы модели). Косвенное влияние измеряется величиной: ![]() Коэффициент частной корреляции измеряет «чистое» влияние фактора на результат при устранении воздействия прочих факторов модели. Для расчета частных коэффициентов корреляции могут быть использованы парные коэффициенты корреляции. Для случая зависимости y от двух факторов можно вычислить 2 коэффициента частной корреляции: ![]() (фактор х2 фиксирован). ![]() (фактор х1 фиксирован). Это коэффициенты частной корреляции 1-ого порядка (порядок определяется числом факторов, влияние которых устраняется). Частные коэффициенты корреляции, рассчитанные по таким формулам изменяются от –1 до +1. Они используются не только для ранжирования факторов модели по степени влияния на результат, но и также для отсева факторов. При малых значениях ryxm/x1,x2…xm-1 нет смысла вводить в уравнение m-ый фактор, т.к. его чистое влияние на результат несущественно. Коэффициенты множественной детерминации и корреляции характеризуют совместное влияние всех факторов на результат. По аналогии с парной регрессией можно определить долю вариации результата, объясненной вариацией включенных в модель факторов (2), в его общей вариации (2y). Ее количественная характеристика – теоретический множественный коэффициент детерминации (R2y(x1,...,xm)). Для линейного уравнения регрессии данный показатель может быть рассчитан через -коэффициенты, как: ![]() ![]() Оценка значимости полученного уравнения множественной регрессии. Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: ![]() Для ее проверки используют F-критерий Фишера. При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2y(x1,...,xm), рассчитанный по данным конкретного наблюдения: ![]() По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости (обычно его берут равным 0,05) и двумя числами степеней свободы k1=h-1 и k2=n-h. Сравнивают фактическое значение F-критерия (Fнабл) с табличным Fкр(;k1;k2). Если Fнабл<Fкр(;k1;k2), то гипотезу о незначимости уравнения регрессии не отвергают. Если Fнабл>Fкр(;k1;k2), то выдвинутую гипотезу отвергают и принимают альтернативную гипотезу о статистической значимости уравнения регрессии. Задание № 2 На основе данных, приведенных в Приложении и соответствующих Вашему варианту (таблица 2), требуется: Построить уравнение множественной регрессии. При этом признак-результат и один из факторов остаются теми же, что и в первом задании. Выберите дополнительно еще один фактор из приложения 1 (границы наблюдения должны совпадать с границами наблюдения признака-результата, соответствующего Вашему варианту). При выборе фактора нужно руководствоваться его экономическим содержанием или другими подходами. Пояснить смысл параметров уравнения. Рассчитать частные коэффициенты эластичности. Сделать вывод. Определить стандартизованные коэффициенты регрессии (-коэффициенты). Сделать вывод. Определить парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции; сделать выводы. Оценить значимость параметров уравнения регрессии с помощью t-критерия Стьюдента, а также значимость уравнения регрессии в целом с помощью общего F-критерия Фишера. Предложить окончательную модель (уравнение регрессии). Сделать выводы. |