Статистика лаба. Отчет по лабораторной работе 4. Рисунок 1 Поле корреляции
Скачать 198.47 Kb.
|
Построим поле корреляции. Введем исходные данные в программе Microsoft Excel, выделим столбцы x, y и выберем «Точечная диаграмма» в меню Вставка. Построенное поле корреляции показано на рисунке 1. Рисунок 1 – Поле корреляции Определим тесноту связи между прибылью предприятия x и выработкой продукции на одного работника y. Для этого рассчитаем коэффициент парной корреляции по формуле: , где x и y – средние квадратические отклонения фактора x и результата y; – среднее значение произведения фактора x и результата y; – их средние значения. Для определения среднего и средних квадратических отклонений, составим таблицу (Рис. 2). Все коэффициенты считаем в отдельных ячейках под таблицей. Рисунок 2 – Таблица значений По расчетам коэффициент корреляции – значение близко к 1. Это свидетельствует о тесной линейной связи между прибылью и затратами денег на рекламу. Коэффициент детерминации представляет собой квадрат коэффициента корреляции. Затрата 1 млн руб. на рекламу объясняет 93% различий в значении прибыли ( ). Значения коэффициентов вариации и для x, и для y менее 30 %. Это говорит об однородности данных и возможности построения уравнения регрессии. Найдем параметры a и b парной линейной регрессии: . Используя метод наименьших квадратов и решая систему уравнений, где n – число наблюдений. Составив и решив систему уравнений выше, получим уравнение линейной регрессии. Для этого необходимо посчитать значения n, x, y, x2, yx . Создаем столбики с расчетом значений под знаком суммы и вычисляем результат в нижней строчке. Для решения системы уравнений воспользуемся расчетом определителей. Вычислим их в отдельных ячейках по формулам: Через определители находим коэффициенты уравнения регрессии: a a / , b b / , Итоговый результат вычислений показан на рис. 2. В столбике «Y(х)» показаны значения, полученные по уравнению регрессии. Знак b указывает на направление связи между признаками. При b 0 связь прямая, при b 0 – обратная. Средний коэффициент эластичности для парной линейной регрессии рассчитывается по формуле: . Он показывает, как меняется зависимая величина при изменении факторного признака на 1% от своего среднего значения. Средняя относительная ошибка аппроксимации определяется следующим образом: Определение ошибки аппроксимации так же рассчитывается в общей таблице (Рис. 2). Ее значение в пределах до 10 % говорит о хорошем соответствии модели регрессии исходным данным. В данном случае средняя ошибка аппроксимации составляет 3%. Рассчитаем значение F-критерия Фишера, используя формулу: где df = n – 2 – количество степеней свободы. Значение критерия Фишера находится по таблице при определенном уровне значимости (0,05) и числе степеней свободы n 2 . Расчетное значение сравнивается с табличным значением. Если Fф > Fтаб, уравнение регрессии статистически значимо (на заданном уровне значимости). Для определения прогнозного значения прибыли нужно подставить значение интересующего факторного признака в уравнение регрессии. Выполнить регрессионный анализ можно воспользовавшись пакетом прикладных программ. Рассмотрим построение парной линейной регрессии с помощью Microsoft Excel. Для этого надо следующие действия: 1. Выбрать Данные Анализ данных Регрессия. 2. В диалоговом окне Регрессия сделать следующее: Ввести диапазон зависимой переменной в окне Входной интеравал Y; Ввести диапазон факторной переменной в окне Входной интеравал Х; Установить флажок Метки, если первая строка содержит название столбцов; Установить флажок Константа – ноль, если в уравнении регрессии отсутствует свободный член a; Ввести в окне редактирование Выходной интервал – номер свободной ячейки на рабочем листе; Нажать кнопку ОК. На экране появится таблица результатов расчета с помощью Microsoft Excel (Рис. 3): Рисунок 3 – Регрессионный анализ а) регрессионная статистика: множественный R – коэффициент корреляции rxy = 0,96; R-квадрат – коэффициент детерминации ; наблюдения – число наблюдений n 12; б) дисперсионный анализ: столбец df – число степеней свободы. Для строки Регрессия число степеней свободы определяется числом параметров m в уравнении регрессии: dfф = m - 1. В нашем примере dfф = 2 – 1 = 1. Для строки Остаток (остаточная вариация) число степеней свободы равно: dfoc = n - m. В нашем примере dfф = 12 – 2 = 10. Для строки Итого (общая вариация) число степеней свободы равно: dfoбщ = dfф + dfoc = n – 1, в примере dfoбщ = 12 – 1 = 11. В столбец SS вносят сумму квадратов отклонений: Для строки Регрессия – это сумма квадратов отклонений теоретических данных от среднего значения: – колеблемость y, объясненная уравнением регрессии; для строки Остаток – это сумма квадратов отклонений фактических данных от теоретических: – остаточная колеблемость y; для строки Итого – это сумма квадратов отклонений фактических данных от среднего значения: – общая колеблемость y. В столбце MS показаны дисперсии на одну степень свободы: для строки Регрессия – это объясненная (факторная) дисперсия; для строки Остаток – это остаточная дисперсия на одну степень свободы. В столбце F показано расчетное значение F-критерия Фишера Fф, вычисляемое по формуле: В столбце Значимость F показан уровень значимости, который зависит от вычисленного значения Fф и числа степеней свободы регрессии и остатка. Определяется с помощью функции FРАСП(Fф; dfф ; dfoc). В столбце Коэффициенты показаны значения коэффициентов уравнения регрессии. В строке Y-пересечение показано значение параметра a, в строке х – значение параметра b уравнения регрессии. |