фқвасмвапрти. Розибойев Маьруфжон 320-21. Министерство цифровых технологий республики Узбекистан Нурафшанскийфилиал Ташкентского университета информационных технологий имени Мухаммада альхорезми
Скачать 1.81 Mb.
|
Министерство цифровых технологий республики Узбекистан Нурафшанскийфилиал Ташкентского университета информационных технологий имени Мухаммада аль-хорезмиКафедра .К.И. Самостоятельная работа Выполни .Розибойев.М.А Проверил .Умаров.М. А. Студент гр. 320-21 Нелинейные уравнения регрессии. Многомерная регрессия и корреляция.Множественные регрессионные моделиНезависимая переменная y характеризует состояние или поведение экономического объекта. Набор переменных x1,…,xm, характеризуют этот экономический объект качественно или количественно. Предполагаем, что переменные x оказывают влияние на переменную y , т. е. реализации переменной y выступают в виде функции. Значения y определяются с некоторой погрешностью, значениями объясняющих переменных, выступающих в роли аргументов этой функции, т. е. y = f(x 1,…, x m) + , где - случайная компонента. ПримерУравнение множественной линейной регрессии Множественная регрессия широко используется в решении проблем спроса, изучении доходности акций, изучении функции издержек, производства, в макроэкономических расчетах. Основная цель множественной регрессииПостроить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация моделиСпецификация модели включает в себя два круга вопросов: - отбор факторов; - выбор вида уравнения регрессии. Отбор факторов при построении множественной регрессии.1.) Факторы должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. Например:в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости: районы могут быть пронумерованы. 2.) Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Пусть в уравненииПусть в уравнении Тогда можно говорить, что параметр b1 измеряет силу влияния фактора x1 на средний результат y при неизменном значении фактора x2. Если же , то с изменением фактора x1 фактор x2 не может оставаться неизменным. Отсюда b1 и b2 нельзя интерпретировать как показатели раздельного влияния x1 и x2 на y . ПримерРассмотрим регрессию себестоимости единицы продукции (руб.,у) от заработной платы работника (руб., x) и производительности его труда (единиц в час, z): отбор факторов обычно осуществляется в две стадии на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют существенность включения в уравнение регрессии каждого из факторов. Коэффициенты интеркорреляции – коэфф. корреляции между объясняющими переменными. Считается, что две переменные явно коллинеарны, т.е находятся между собой в линейной зависимости, если rxixj> 0,7. Одним из условий построения уравнения множественной регрессии является независимость действия факторов. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточной тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. 1 0,8 1 0,7 0,8 1 0,6 0,5 0,2 1 Пусть, например, при изучении зависимости y=a+b*x+c*z+d*v+ матрица парных коэффициентов корреляции оказалась следующей: Очевидно, что факторы x и z дублируют друг друга. В анализ целесообразно включить фактор z, а не x, хотя корреляция z с результатом y слабее, чем корреляция фактора x с y (ryz<ryx), но зато слабее, чем межфакторная корреляция rzv<rxv . Поэтому в данном случае в уравнении множественной регрессии включаются факторы z, v. Пример1 0,3 1 0,7 0,75 1 0,6 0,5 0,8 1 По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью. МультиколлинеарностьМультиколлинеарность – это проблема, когда тесная корреляционная зависимость между регрессорами ведет к получению ненадежных оценок регрессии Неизбежность мультиколлинеарностиМультиколлинеарность – нормальное явление. Практически любая модель содержит мультиколлинеарность. Мы не обращаем внимания на мультиколлинеарность до появления явных симптомов. Только чрезмерно сильные связи становятся помехой. Механизм действия мультиколлинеарностиМультиколлинеарность проявляется в совместном действии факторов: Построить модель – значит определить вклад каждого фактора. Если два или более фактора изменяются только совместно, их вклад по отдельности становится невозможно различить. Чем более сильно коррелированы переменные, тем труднее различить их вклад. Обнаружение мультиколлинерностиВнешние признаки, являющимся следствиями мультиколлинеарности:
небольшое изменение исходных экономических данных приводит к существенному изменению оценок коэффициентов модели; большинство t-статистик коэффициентов малы, в то же время модель в целом является значимой, о чем говорит высокое значение F-статистики. Обнаружение мультиколлинерностиДля оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если бы факторы не коррелировали между собой, то определитель матрицы парных коэффициентов корреляции был бы единичной матрицей т.е. Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю: Таким образом,Таким образом, чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. Включение дополнительных факторовПри дополнительном включении в регрессию m+1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться; и Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором. ПримерТак, если для регрессии, включающих пять факторов, коэффициент детерминации составил 0,857. Включение шестого фактора дало коэффициент детерминации 0,858, вряд ли целесообразно дополнительно включать в модель этот фактор. Методы построения уравнения множественной регрессииМетод исключения Отсев факторов из полного его набора Метод включения Дополнительное введение фактора Выбор формы уравнения регрессииВыбор формы уравнения регрессииЛинейная регрессия Линеаризуемые регрессии
Экспоненциальная регрессия Гиперболическая регрессия ПримерПредположим, что при исследовании спроса на мясо получено уравнение. где y – количество спрашиваемого мяса; x1 – цена; x2 – доход. Рост цен на 1% при том же доходе вызывает снижение спроса в среднем на 2,63%. Увеличение дохода на 1% обуславливает при неизменных ценах рост спроса на 1,11%. Оценка параметров уравнения множественной регрессииМетод наименьших квадратов для множественной линейной регрессииМодель Система нормальных уравнений ……………………………………… Матричная форма записи множественной линейной регрессиигде ИтогМНК оценки коэффициентов множественной линейной регрессии Множественная корреляцияМножественная корреляцияПрактическое значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Множественная корреляцияЧем ближе R к единице, тем теснее связь рассматриваемых признаков. R2 коэффициент множественной детерминации. R2, вообще говоря, возрастает при добавлении еще одного фактора, поэтому для выбора между несколькими регрессионными уравнениями не следует полагаться только на R2. Если число параметров при xj равно m и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент детерминации приблизится к единице даже при слабой связи факторов с результатом. Попыткой устранить эффект, связанный с ростом R2 при увеличении числа факторов, является коррекция R2 на число факторов- наложение "штрафа" за увеличение числа независимых переменных. где m – число параметров при переменных x; n – число наблюдений. Свойства скорректированного коэффициента детерминацииЧем больше m, тем сильнее различаются При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) убывает. Его величина может стать и отрицательной при слабых связах результата с факторами. В этом случае он должен считаться равным нулю. Частная корреляцияЧастные коэффициенты корреляциихарактеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. Частные показатели корреляции широко используются при решении проблемы отбора факторов; ранжировании факторов, участвующих в множественной регрессии. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, или — коэффициент частной корреляции первого порядка. Для линейной регрессииКоэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле Изменяется в пределах от -1 до 1. Для линейной регрессииПри двух факторах и i = 1 данная формула примет вид: При i = 2 ? Для нелинейной регрессии- коэффициент частной детерминации. Частный коэффициент корреляции изменяется в пределах от 0 до 1. Для нелинейной регрессииПри двух факторах и i = 1 данная формула примет вид: При i = 2 ? - измеряет тесноту связи между y и x1 при неизменном уровне фактора x2. Частные коэффициенты корреляцииВ эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов. Величина множественного коэффициента корреляции всегда больше (или равна) максимального частного коэффициента корреляции. Оценка надежности результатов множественной регрессии и корреляцииОценка значимости уравнения множественной регрессииЗначимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F - критерия Фишера. где m – число параметров при переменных x. Частный F-критерийОценивает значимость не уравнения в целом, а фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Частный F-критерийПри двух факторах и i = 1 данная формула примет вид: При i = 2 ? Частный F-критерийЕсли фактическое значение превышает , то дополнительное включение фактора xi в модель статистически оправданно и коэффициент чистой регрессии bi при факторе xi статистически значим. С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xi вводился в уравнение множественной регрессии последним. Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину , можно определить и t-критерий для коэффициента регрессии при i-м факторе, , а именно: Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как ив парной регрессии, для каждого фактора используется формула Для уравнения множественно регрессии При представлении результатов множественной регрессии наряду с уравнением множественной регрессии и скорректированным коэффициентом множественной детерминации принято приводить значения . Пример1 шаг – изучение корреляционной матрицы 2 шаг – анализ всех возможных регрессий или пошаговая регрессия Анализ всех возможных регрессий1этап – все возможные уравнения регрессии ( ) 2 этап – разделение уравнений на множества (по количеству оцениваемых параметров) Анализ всех возможных регрессийАнализ всех возможных регрессийАнализ всех возможных регрессий3 этап – выбор наилучшей независимой переменной (или переменных) из каждой группы с определенным числом параметров Анализ всех возможных регрессий4 этап – выбор наилучшего уравнения Желательно иметь наибольшее из возможных значений показателя детерминации, НО максимально простое уравнение регрессии Это уравнение объясняет 89,48% вариации переменной Y |