Главная страница

эмм. ЭММ. Задача к теме 3 3 Задача 1 к теме 4 9 Задача 2 к теме 4 11 Задача к теме 5 15


Скачать 477.43 Kb.
НазваниеЗадача к теме 3 3 Задача 1 к теме 4 9 Задача 2 к теме 4 11 Задача к теме 5 15
Дата16.02.2022
Размер477.43 Kb.
Формат файлаdocx
Имя файлаЭММ.docx
ТипЗадача
#364630
страница4 из 4
1   2   3   4

Задача к теме 5


По имеющимся данным, представленным в таблице, получена матрица парных коэффициентов корреляции.

Таблица 8 – Исходные данные задачи к теме 5

Номер района, а/б

Кол-во комнат

Общая площадь

Жилая площадь

Площадь кухни

Этаж, средние/крайние

Дом, кирп/ пан

Срок сдачи, ч/з _ мес.

Стоимость квартиры, тыс. $

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

Y

1

1

39,8

19

7

1

2

7

20,5

1

1

53,2

19,4

9

2

1

3

23,6

2

1

46

18

9

2

2

1

14,2



















1

5

370

180

35

2

2

2

190

2

5

231,2

149

30

2

2

2

139,2

2

6

251,5

167

32,5

2

1

5

157,2


Таблица 9 – Матрица парных коэффициентов корреляции, полученная на основании исходных данных

 

X1

X2

X3

X4

X5

X6

X7

X8

Y

X1

1

0

0

0

0

0

0

0

0

X2

-0,0143

1

0

0

0

0

0

0

0

X3

-0,0375

0,9766

1

0

0

0

0

0

0

X4

-0,2663

0,7628

0,8391

1

0

0

0

0

0

X5

0,0341

0,1064

0,8621

0,7973

1

0

0

0

0

X6

-0,2719

0,0663

0,5121

-0,0341

-0,0084

1

0

0

0

X7

-0,5308

0,0068

0,0711

-0,1763

0,0328

0,0680

1

0

0

X8

0,4406

0,0044

0,4438

0,0101

0,2764

-0,1068

-0,0354

1

0

Y

-0,4033

0,8333

0,9101

0,2703

0,7703

0,603

0,8001

0,7473

1

Задание:

  1. Укажите, какие фиктивные переменные использованы в модели.

  2. Проверьте факторы на мультиколлинеарность и устраните её.

  3. Запишите новое уравнение многофакторной регрессии, после устранения мультиколлинеарности.

Решение:

С помощью матрицы коэффициентов корреляции оценивается теснота связи зависимой переменной и факторов. Между переменными Y и X1 наблюдается обратная связь (отрицательный коэффициент корреляции). Прямой и достаточно тесной является связь между Y и X2, X3 и X7 (коэффициенты корреляции имеют значения близкие к 1).

В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:



Если одно из неравенств не соблюдается, то исключается тот параметр Xj или Xi, связь которого с результативным показателем Y оказывается наименее тесной.

Для отбора наиболее значимых факторов Xi учитываются следующие условия:

  • связь между результативным признаком и факторным должна быть выше межфакторной связи;

  • связь между факторами должна быть не более 0,7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0,7, то в данной модели множественной регрессии существует мультиколлинеарность;

  • при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.

Оценим связь между факторами (X1,…X8). Между парами переменных (X2, X3), (X2, X4), (X3, X4), (X3, X5), (X4, X5) существует сильная связь (r>0,7), т.е. наблюдается явление мультиколлинеарности.

Анализ последней строки матрицы коэффициентов корреляции позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых |ryxi| < 0,5 исключают из модели. Таких факторов два – X1 и X4. Исключим их из модели. Тогда зависимой переменной останется Y (стоимость квартиры, тыс. $), объясняющими выступают 6 переменных: X2 - кол-во комнат, X3 - общая площадь, X5 - площадь кухни, X6 - этаж, средние/крайние, X7 – материал дома, X8 – срок сдачи. Линейная модель будет иметь вид:



1   2   3   4


написать администратору сайта