Задание. Вариант Таблица
Скачать 443.5 Kb.
|
Задание 2. Выберите результативный и факторный признаки, соответствующие своему варианту (номеру по списку в журнале).
Используя данные (Y, X) Приложения 1 для соответствующего № варианта, выполните следующие задания: Постройте поле корреляции. Рассчитайте линейный коэффициент корреляции и поясните его смысл. Сделайте вывод о тесноте и направлении связи между Y и X. Оцените его статистическую значимость и построите его интервальную оценку. Найдите коэффициент детерминации и проверьте его статистическую значимость. Построите ковариационную и корреляционную матрицы. Сделайте выводы. Рассчитайте параметры линейного уравнения регрессии . Дайте экономическую интерпретацию коэффициентов регрессии b0 и b1. Протестируйте статистические гипотезы о достоверности коэффициентов регрессии b0 и b1 при уровне значимости α=0,05. Постройте доверительные интервалы для параметров b0 и b1 и прямую линию регрессии на корреляционном поле. Оцените качество уравнения регрессии, протестировав статистическую гипотезу о достоверности уравнения регрессии при уровне значимости α=0,05. Проверьте вычисления, используя надстройку Excel «Поиск решения». Вычислите среднюю и относительную ошибки аппроксимации. Найдите средние и частные коэффициенты эластичности. Сделайте выводов о возможности использования регрессионной модели для прогнозирования. По линейному уравнению регрессии найдите прогнозное значение признака Y при прогнозном значении X, составляющем 105% от его среднего уровня, оцените точность прогноза по стандартной ошибке и доверительному интервалу. Решение: Постройте поле корреляции. Рассчитайте линейный коэффициент корреляции и поясните его смысл. Сделайте вывод о тесноте и направлении связи между Y и X. Оцените его статистическую значимость и построите его интервальную оценку. Найдите коэффициент детерминации и проверьте его статистическую значимость. Построите ковариационную и корреляционную матрицы. Сделайте выводы. Построим поле корреляции и сформулировать гипотезу о форме связи: Рис.1 Поле корреляции По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь. Для определения степени тесноты связи обычно используют линейный коэффициент корреляции: , где , – выборочные дисперсии переменных x и y, – ковариация признаков. Соответствующие средние определяются по формулам:
Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.): Таблица 1.
По данным таблицы находим: , , , , , . Таким образом, между оборотом розничной торговли (y) и среднедушевыми денежными доходами (в месяц) (x) существует прямая достаточно сильная корреляционная зависимость. Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента: , который имеет распределение Стьюдента с k=n–2 и уровнем значимости . В нашем случае и . Поскольку , то коэффициент корреляции существенно отличается от нуля. Для значимого коэффициента можно построить доверительный интервал, который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n<30), используют z-преобразование Фишера: Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией . Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное z-преобразование. Применяя z-преобразование для найденного коэффициента корреляции, получим . Доверительный интервал для M(z) будет иметь вид , где tγ находится с помощью функции Лапласа Ф(tγ)=γ/2. Для γ=0,95 имеем tγ=1,96. Тогда , или . Обратное z-преобразование осуществляется по формуле В результате находим . В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции ρ. Коэффициент детерминации для линейной модели равен квадрату коэффициента корреляции Это означает, что 72,7% вариации оборота розничной торговли (y) объясняется вариацией фактора x – среднедушевых денежных доходов (в месяц). Значимость уравнения регрессии проверяется при помощи F-критерия Фишера, для линейной парной регрессии он будет иметь вид , (1.10) где F подчиняется распределению Фишера с уровнем значимости α и степенями свободы k1=1 и k2= n–2. В нашем случае . Поскольку критическое значение критерия равно и , то признается статистическая значимость коэффициента детерминации. Построите ковариационную и корреляционную матрицы: Ковариационная Корреляционная
Рассчитайте параметры линейного уравнения регрессии . Дайте экономическую интерпретацию коэффициентов регрессии b0 и b1. Протестируйте статистические гипотезы о достоверности коэффициентов регрессии b0 и b1 при уровне значимости α=0,05. Постройте доверительные интервалы для параметров b0 и b1 и прямую линию регрессии на корреляционном поле. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии: , где b0 и b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной: , где – отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений: Решая систему (1.13) , найдем , . По данным таблицы (1.) находим ; . Получено уравнение регрессии: , Параметр регрессии b1 позволяет сделать вывод, что с увеличением среднедушевых денежных доходов (в месяц) на 1 руб. оборот розничной торговли увеличивается в среднем на 77,54 млн.руб. Оценка параметра b0 = - 964778,7 показывает прогнозируемый уровень оборота розничной торговли, но только в том случае, если среднедушевые денежные доходы (в месяц) равны 0 руб. В геометрическом смысле значение коэффициента b0 = - 964778,7 определяет точку пересечения прямой регрессии с осью ординат и характеризует сдвиг линии регрессии вдоль оси Y. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки статистической значимости каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии . (1.17) В нашем случае . Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента: , (1.18) где – стандартная ошибка коэффициента регрессии. Для коэффициента b1 оценку Стандартного отклонения можно получить по формуле: . (1.19) В нашем случае Следовательно, . Отметим, что для парной линейной регрессии t-критерий для коэффициента корреляции rxy и коэффициента регрессии b1 совпадают. Для коэффициента b0 оценку дисперсии можно получить по формуле: . (1.20) Тогда Критическое значение критерия было уже найдено . Поскольку , то коэффициент регрессии b1 значимо отличается от нуля. Следовательно, для него можно построить доверительные интервалы. Поскольку , то коэффициент регрессии b0 значимо отличается от нуля. Следовательно, для него можно построить доверительные интервалы. Определим предельные ошибки для каждого показателя: , , где . В нашем случае , . В результате, получаем следующие доверительные интервалы для коэффициентов регрессии: и , или и . Рис.2 Поле корреляции и линия регрессии Оцените качество уравнения регрессии, протестировав статистическую гипотезу о достоверности уравнения регрессии при уровне значимости α=0,05. Проверьте вычисления, используя надстройку Excel «Поиск решения». Вычислите среднюю и относительную ошибки аппроксимации. , (1.21) где F подчиняется распределению Фишера с уровнем значимости α и степенями свободы k1=1 и k2=n–2. В нашем случае . Поскольку критическое значение критерия равно и , то признается статистическая значимость построенного уравнения регрессии. Задачи регрессионного анализа можно решать с использованием компьютеров. Например, можно использовать программу Excel. Для этого достаточно ввести свои данные и использовать пакет Анализ данных. Опишем кратко последовательность действий: Проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа. В главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК. Заполните диалоговое окно ввода данных и параметров вывода: Входной интервал Y – диапазон, содержащий данные результативного признака; Входной интервал X – диапазон столбцов, содержащие значения факторов независимых признаков. Результаты регрессионного анализа представлены в таблице 1.3. Отметим, что в компьютерных программах вычисляется не критическое значение критерия, допустим Tкрит, а вероятность . Если P<α, то нет оснований отклонять нулевую гипотезу, если P>α, то нулевая гипотеза отклоняется. Таблица 2
Качество модели определяет средняя ошибка аппроксимации: . Качество построенной модели оценивается как не удовлетворительное, так как превышает 50%. В данных присутствуют выбросы. Найдите средние и частные коэффициенты эластичности. Сделайте выводов о возможности использования регрессионной модели для прогнозирования. Среднее значение коэффициента эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения. Для линейного уравнения регрессии найдем средний коэффициент эластичности
В нашем случае увеличение среднедушевых денежных доходов (в месяц) (от своего среднего значения) на 1% увеличивает в среднем оборот розничной торговли на 6,99%. Найдем частные коэффициенты эластичности по формуле Частный коэффициент эластичности показывает, на сколько процентов изменится зависимая переменная y при изменении j-го фактора на 1 %. Данный коэффициент не учитывает степень колеблемости факторов. Значения частных коэффициентов эластичности приведены в таблице 3. Таблица 3
Полученные оценки уравнения регрессии не позволяют использовать его для прогноза. По линейному уравнению регрессии найдите прогнозное значение признака Y при прогнозном значении X, составляющем 105% от его среднего уровня, оцените точность прогноза по стандартной ошибке и доверительному интервалу. Прогнозное значение yp определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения xp. В нашем случае прогнозное значение среднедушевых денежных доходов (в месяц) составит: руб. , тогда прогнозное значение оборота розничной торговли составит: млн. руб. Средняя стандартная ошибка прогноза вычисляется по формуле: . (1.22) В нашем случае Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит: . Доверительный интервал прогноза , или . Выполненный прогноз оборота розничной торговли оказался не надежным (γ=0,95), и достаточно не точным, т.к. относительная точность прогноза составила 9,84%. |