Главная страница
Навигация по странице:

  • Средняя ошибка аппроксимации

  • Средний коэффициент эластичности

  • Прогнозное значение

  • Парная регрессия и коррекция. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ. Теоретические сведения


    Скачать 196.62 Kb.
    НазваниеТеоретические сведения
    АнкорПарная регрессия и коррекция
    Дата29.04.2022
    Размер196.62 Kb.
    Формат файлаdocx
    Имя файлаПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ.docx
    ТипДокументы
    #504329

    ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

      1. Теоретические сведения



    Парная регрессия – уравнение связи двух переменных y и x:

    ,
    где – зависимая переменная (результативный признак),

    – независимая, объясняющая переменная (признак-фактор).

    Различают линейные и нелинейные регрессии.

    Линейная регрессия: .

    Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

    Регрессии, нелинейные по объясняющим переменным:

    • полиномы разных степеней

    ;

    • равносторонняя гипербола .

    Регрессии, нелинейные по оцениваемым параметрам:

    • степенная ;

    • показательная ;

    • экспоненциальная .

    Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонения фактически значений результативного признака от теоретических минимальна, то есть .

    Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно и :


    Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :

    ,

    и индекс корреляции - для нелинейной регрессии

    .

    Оценку качества построенной модели дает коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации.

    Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

    .

    Допустимый предел значений - не более 8 – 10 %.

    Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменяется результат от своей средней величины при изменении фактора на 1 % от своего среднего значения:



    Поскольку коэффициенты эластичности представляют экономический интерес, в таблице приведены формулы расчета коэффициентов эластичности для наиболее распространенных типов уравнений регрессии.

    Таблица

    Коэффициенты эластичности для ряда математических функций

    Вид функции,



    Первая производная,



    Коэффициент эластичности,



    1

    2

    3

    Линейная



    b


    Парабола второго порядка








    Гипербола







    Показательная







    Степенная







    Полулогарифмическая







    Логическая






    Обратная









    Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:



    где - общая сумма квадратов отклонений;

    - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);

    - остаточная сумма квадратов отклонений.

    Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент (индекс) детерминации :


    Коэффициент детерминации – квадрат коэффициента или индекса корреляции.

    тест – оценивает качество уравнения регрессии – состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического и критического (табличного) значений – критерия Фишера. определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:



    где - число единиц совокупности;

    - число парметров при переменных .

    – это максимальное возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - вероятность отвергнуть правильную гипотизу при условии, что она верна. Обычно принимается равной 0,05 или 0,01.

    Если то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если то гипотиза не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

    Для оценки статистической значимости коэффициентов регрессии и корреляции расчитывается - критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, то есть о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью - критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:



    Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:





    Сравнивая фактическое и критическое (табличное) значение - статистики - и - принимаем или отвергаем гипотезу .

    Связь между – критерием Фишера и - статистикой Стьюдента выражается равенством



    Если , то отклоняется, то есть и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора . Если , то гипотеза не отклоняется и признается случайная природа формирования и .

    Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:

    .

    Формулы для расчета доверительных интервалов имеют следующий вид
    .

    Если в границы доверительного интервала попадает ноль, то есть нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значение.

    Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения . Вычисляется средняя стандартная ошибка прогноза


    и строится доверительный интервал прогноза:



      1. Пример

    По группе предприятий, выпускающих один и тот же вид продукции, рассматривается функция издержек:



    где - издержки производства (тыс. д. е.);

    - объем выпуска продукции (тыс. ед.).

    Исходные данные и вспомогательные вычисления для расчета оценок параметров и приведены в табл. 1.

    Таблица 1



    предприятия

    Выпуск

    Продукции, тыс. ед.



    Затраты

    на производст-во, тыс. д.е.



















    1

    2

    3

    4

    5

    6

    7

    1

    2

    4

    3

    5

    3

    4

    30

    70

    150

    100

    170

    100

    150

    30

    140

    600

    300

    850

    300

    600

    1

    4

    16

    9

    25

    9

    16

    4,58

    1,30

    0,74

    0,02

    3,46

    0,02

    0,74

    6400

    1600

    1600

    100

    3600

    100

    1600

    31,68

    68,28

    141,48

    104,88

    178,08

    104,88

    141,48



    22

    770

    2820

    80

    10,86

    15000

    770,76

    Среднее

    значение


    3,14


    110


    402,86


    11,43


    1,55


    2142,86


    110,11



    Система нормальных уравнений МНК будет иметь вид




    Решая ее, получим:





    Тогда, уравнение регрессии



    Подставив в уравнение значения х, получим теоретические значения (последний столбец табл. 1).

    Коэффициент регрессии показывает, что при увеличении выпуска продукции на 1 тыс. единиц, затраты на производство по группе предприятий возрастут в среднем на 36,6 тыс. д. е.

    То, что , соответствует опережению изменения результата над изменением фактора.

    В рассматриваемом примере имеем





    Величина линейного коэффициента корреляции



    что достаточно близко к 1 и означает наличие очень тесной зависимости затрат на производство от величины объема выпущенной продукции.

    Для оценки качества линейной функции рассчитаем коэффициент детерминации



    Следовательно, уравнением регрессии объясняется 97,6 % дисперсии результативного признака, а на долю прочих факторов приходится лишь 2,4 % его дисперсии (то есть остаточная дисперсия).

    Так как близок к 1, следовательно, линейная модель хорошо аппроксимирует исходные данные и ее можно использовать для прогноза значений результативного признака.

    Для оценки существенности линейной регрессии рассчитаем:

    1. Общая сумма квадратов отклонений результативного признака

    .

    1. Факторная сумма квадратов

    .

    1. Остаточная сумма квадратов

    .

    1. Факторная дисперсия

    .

    1. Остаточная дисперсия

    .

    F – критерий

    Табличное значение критерия для числа степеней свободы и уровня значимости = 0,05 равно

    Поскольку (161,64>6,61), то можно сделать вывод о значимости уравнения регрессии (связь доказана). Оценка значимости уравнения регрессии обычно делается в виде таблицы дисперсного анализа.

    Таблица 2

    Дисперсный анализ результатов регрессии





    Источники

    вариации

    Число степеней

    свободы

    Сумма квадратов

    отклонений

    Дисперсия

    критерий

    фактический

    Табличный

    Общая

    Объясненная

    Остаточная

    7-1=6

    1

    7-2=5

    15000

    14548

    452

    -

    14548

    90

    161,64

    6,61


    Так как в линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров, рассчитаем по каждому параметру стандартные ошибки: и корреляции

    ;

    ;

    .

    Фактическое значение критерия Стьюдента:



    .

    Проверим справедливость равенства:



    (расхождения за счет округления).

    При числе степеней свободы и уровне значимости = 0,05 табличное значение

    Так как (2,57<12,71), то, следовательно, гипотезу о несущественности коэффициента регрессии можно отклонить. Доверительный интервал для коэффициента регрессии определяется как . 95 %-ные границы составят:

    ;

    .

    Так как то принимаем и считаем параметр случайно отличным от нуля.



    (14,11>2,57), следовательно, коэффициент корреляции существенно отличен от нуля и зависимость является достоверной.

    Для определения интервала прогноза по линейному уравнению регрессии рассчитаем:

    1. Точечный прогноз при прогнозном , составляющем 190 % от среднего уровня.

    ;

    .

    1. Средняя стандартная ошибка прогноза

    .

    Для прогнозируемого 95 %-ный доверительный интервал при заданном определяется выраженным:

    ;

    ;

    .

    Чтобы иметь общее суждение о качестве модели определим среднюю ошибку аппроксимации:

    ,

    что говорит о хорошем качестве уравнения регрессии, так как ошибка в пределах 5 - 7 % свидетельствует о хорошем подборе модели к исходным данным.


    написать администратору сайта