Задача. Задача 5 Имеются следующие данные о связи между объемом валовой продукции и стоимостью основных фондов
Скачать 112 Kb.
|
Задача №5 Имеются следующие данные о связи между объемом валовой продукции и стоимостью основных фондов:
На основании данных построить график корреляционного поля взаимозависимости двух показателей, вычислить параметры уравнения регрессии, с помощью коэффициента корреляции и детерминации оценить тесноту связи. Решение: На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер. Линейное уравнение регрессии имеет вид y = bx + a Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, a и b соответственно оценки параметров α и β регрессионной модели, которые следует найти. Для оценки параметров α и β - используют МНК (метод наименьших квадратов). Система нормальных уравнений. a·n + b·∑x = ∑y a·∑x + b·∑x2 = ∑y·x Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
Для наших данных система уравнений имеет вид 10a + 264·b = 54.9 264·a + 7120·b = 1478.622 Получаем эмпирические коэффициенты регрессии: b = 0.1946, a = 0.3536 Уравнение регрессии (эмпирическое уравнение регрессии): y = 0.1946 x + 0.3536 1. Параметры уравнения регрессии. Выборочные средние. Выборочные дисперсии: Среднеквадратическое отклонение Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно: a = y - b·x = 5.49 - 0.1946·26.4 = 0.3536 Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < rxy < 0.3: слабая; 0.3 < rxy < 0.5: умеренная; 0.5 < rxy < 0.7: заметная; 0.7 < rxy < 0.9: высокая; 0.9 < rxy < 1: весьма высокая; В нашем примере связь между признаком Y и фактором X весьма высокая и прямая. Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b: Линейное уравнение регрессии имеет вид y = 0.195 x + 0.354 Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b = 0.195 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.195. Коэффициент a = 0.354 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо. Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения. Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая. Для линейной зависимости коэффициент детерминации равен квадрату коэффициента корреляции rxy: R2 = rxy2. R2 = 0.970225 Означает, что в 97% случаев изменения х приводят к изменению y. Другими словами, точность подбора уравнения регрессии - высокая. Выводы. Изучена зависимость Y от X. На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Возможна экономическая интерпретация параметров модели - увеличение X на 1 тыс.руб. приводит к увеличению Y в среднем на 0.195 тыс.руб. |