Главная страница

Статистика лаба. Отчет по лабораторной работе 4. Рисунок 1 Поле корреляции


Скачать 198.47 Kb.
НазваниеРисунок 1 Поле корреляции
АнкорСтатистика лаба
Дата29.04.2022
Размер198.47 Kb.
Формат файлаdocx
Имя файлаОтчет по лабораторной работе 4.docx
ТипДокументы
#503784

Построим поле корреляции. Введем исходные данные в программе Microsoft Excel, выделим столбцы x, y и выберем «Точечная диаграмма» в меню Вставка. Построенное поле корреляции показано на рисунке 1.



Рисунок 1 – Поле корреляции
Определим тесноту связи между прибылью предприятия x и выработкой продукции на одного работника y. Для этого рассчитаем коэффициент парной корреляции по формуле:

,

где  x и  y – средние квадратические отклонения фактора x и результата y; – среднее значение произведения фактора x и результата y; – их средние значения.

Для определения среднего и средних квадратических отклонений, составим таблицу (Рис. 2). Все коэффициенты считаем в отдельных ячейках под таблицей.



Рисунок 2 – Таблица значений
По расчетам коэффициент корреляции – значение близко к 1. Это свидетельствует о тесной линейной связи между прибылью и затратами денег на рекламу.

Коэффициент детерминации представляет собой квадрат коэффициента корреляции. Затрата 1 млн руб. на рекламу объясняет 93% различий в значении прибыли ( ).

Значения коэффициентов вариации и для x, и для y менее 30 %. Это говорит об однородности данных и возможности построения уравнения регрессии.

Найдем параметры a и b парной линейной регрессии: .

Используя метод наименьших квадратов и решая систему уравнений,



где n – число наблюдений.

Составив и решив систему уравнений выше, получим уравнение линейной регрессии. Для этого необходимо посчитать значения n, x, y, x2, yx . Создаем столбики с расчетом значений под знаком суммы и вычисляем результат в нижней строчке.

Для решения системы уравнений воспользуемся расчетом определителей. Вычислим их в отдельных ячейках по формулам:



Через определители находим коэффициенты уравнения регрессии:

a  a / , b  b / ,

Итоговый результат вычислений показан на рис. 2. В столбике «Y(х)» показаны значения, полученные по уравнению регрессии.

Знак b указывает на направление связи между признаками. При b  0 связь прямая, при b  0 – обратная.

Средний коэффициент эластичности для парной линейной регрессии рассчитывается по формуле: .

Он показывает, как меняется зависимая величина при изменении факторного признака на 1% от своего среднего значения.

Средняя относительная ошибка аппроксимации определяется следующим образом:



Определение ошибки аппроксимации так же рассчитывается в общей таблице (Рис. 2). Ее значение в пределах до 10 % говорит о хорошем соответствии модели регрессии исходным данным. В данном случае средняя ошибка аппроксимации составляет 3%.

Рассчитаем значение F-критерия Фишера, используя формулу:



где df = n – 2 – количество степеней свободы.

Значение критерия Фишера находится по таблице при определенном уровне значимости (0,05) и числе степеней свободы n  2 . Расчетное значение сравнивается с табличным значением. Если Fф > Fтаб, уравнение регрессии статистически значимо (на заданном уровне значимости).

Для определения прогнозного значения прибыли нужно подставить значение интересующего факторного признака в уравнение регрессии.

Выполнить регрессионный анализ можно воспользовавшись пакетом прикладных программ. Рассмотрим построение парной линейной регрессии с помощью Microsoft Excel. Для этого надо следующие действия:

1. Выбрать Данные  Анализ данных  Регрессия.

2. В диалоговом окне Регрессия сделать следующее:

 Ввести диапазон зависимой переменной в окне Входной интеравал Y;

 Ввести диапазон факторной переменной в окне Входной интеравал Х;

 Установить флажок Метки, если первая строка содержит название столбцов;

 Установить флажок Константа – ноль, если в уравнении регрессии отсутствует свободный член a;

 Ввести в окне редактирование Выходной интервал – номер свободной ячейки на рабочем листе;

 Нажать кнопку ОК. На экране появится таблица результатов расчета с помощью Microsoft Excel (Рис. 3):



Рисунок 3 – Регрессионный анализ
а) регрессионная статистика:

 множественный R – коэффициент корреляции rxy = 0,96;

 R-квадрат – коэффициент детерминации ;

 наблюдения – число наблюдений n  12;

б) дисперсионный анализ:

 столбец df – число степеней свободы.

Для строки Регрессия число степеней свободы определяется числом параметров m в уравнении регрессии: dfф = m - 1. В нашем примере dfф = 2 – 1 = 1.

Для строки Остаток (остаточная вариация) число степеней свободы равно: dfoc = n - m. В нашем примере dfф = 12 – 2 = 10.

Для строки Итого (общая вариация) число степеней свободы равно:

dfoбщ = dfф + dfoc = n – 1, в примере dfoбщ = 12 – 1 = 11.

В столбец SS вносят сумму квадратов отклонений:

 Для строки Регрессия – это сумма квадратов отклонений теоретических данных от среднего значения:

– колеблемость y, объясненная уравнением регрессии;

 для строки Остаток – это сумма квадратов отклонений фактических данных от теоретических:

– остаточная колеблемость y;

 для строки Итого – это сумма квадратов отклонений фактических данных от среднего значения:

– общая колеблемость y.

В столбце MS показаны дисперсии на одну степень свободы:

 для строки Регрессия – это объясненная (факторная) дисперсия;

 для строки Остаток – это остаточная дисперсия на одну степень свободы.

В столбце F показано расчетное значение F-критерия Фишера Fф, вычисляемое по формуле:



В столбце Значимость F показан уровень значимости, который зависит от вычисленного значения Fф и числа степеней свободы регрессии и остатка. Определяется с помощью функции FРАСП(Fф; dfф ; dfoc).

В столбце Коэффициенты показаны значения коэффициентов уравнения регрессии.

В строке Y-пересечение показано значение параметра a, в строке х – значение параметра b уравнения регрессии.


написать администратору сайта