эмм. ЭММ. Задача к теме 3 3 Задача 1 к теме 4 9 Задача 2 к теме 4 11 Задача к теме 5 15
Скачать 477.43 Kb.
|
Задача к теме 5По имеющимся данным, представленным в таблице, получена матрица парных коэффициентов корреляции. Таблица 8 – Исходные данные задачи к теме 5
Таблица 9 – Матрица парных коэффициентов корреляции, полученная на основании исходных данных
Задание: Укажите, какие фиктивные переменные использованы в модели. Проверьте факторы на мультиколлинеарность и устраните её. Запишите новое уравнение многофакторной регрессии, после устранения мультиколлинеарности. Решение: С помощью матрицы коэффициентов корреляции оценивается теснота связи зависимой переменной и факторов. Между переменными Y и X1 наблюдается обратная связь (отрицательный коэффициент корреляции). Прямой и достаточно тесной является связь между Y и X2, X3 и X7 (коэффициенты корреляции имеют значения близкие к 1). В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств: Если одно из неравенств не соблюдается, то исключается тот параметр Xj или Xi, связь которого с результативным показателем Y оказывается наименее тесной. Для отбора наиболее значимых факторов Xi учитываются следующие условия: связь между результативным признаком и факторным должна быть выше межфакторной связи; связь между факторами должна быть не более 0,7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0,7, то в данной модели множественной регрессии существует мультиколлинеарность; при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними. Оценим связь между факторами (X1,…X8). Между парами переменных (X2, X3), (X2, X4), (X3, X4), (X3, X5), (X4, X5) существует сильная связь (r>0,7), т.е. наблюдается явление мультиколлинеарности. Анализ последней строки матрицы коэффициентов корреляции позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых |ryxi| < 0,5 исключают из модели. Таких факторов два – X1 и X4. Исключим их из модели. Тогда зависимой переменной останется Y (стоимость квартиры, тыс. $), объясняющими выступают 6 переменных: X2 - кол-во комнат, X3 - общая площадь, X5 - площадь кухни, X6 - этаж, средние/крайние, X7 – материал дома, X8 – срок сдачи. Линейная модель будет иметь вид: |