Главная страница
Навигация по странице:

  • Общее назначение множественной регрессии

  • Важность анализа остатков.

  • Пример решения задачи регрессионным анализом

  • 18 вопрос. 18. Регрессионный анализ. Назначение регрессионного анализа. Виды регрессионных моделей


    Скачать 270.28 Kb.
    Название18. Регрессионный анализ. Назначение регрессионного анализа. Виды регрессионных моделей
    Дата07.07.2021
    Размер270.28 Kb.
    Формат файлаdocx
    Имя файла18 вопрос.docx
    ТипЗадача
    #223556

    18. Регрессионный анализ. Назначение регрессионного анализа. Виды регрессионных моделей

    Используется, когда перед исследователем стоит задача не только обнаружить зависимость между изучаемыми показателями (Х и У), но и выразить эту связь в виде математической модели. Эти задачи решаются на основе регрессионного анализа.

    Регрессионный анализ тесно связан с другими статистическими методами — методами корреляционного анализа. В отличие от корреляционного анализа, который изучает направление и силу связи между признаками, регрессионный анализ изучает вид зависимости признаков, то есть параметры функции зависимости одного признака от одного или нескольких других признаков.

    Регрессия — изменение зависимой переменной (у) в зависимости от изменения одной (х) или нескольких независимых переменных (Хn).

    Х – это независимая переменная, которая называется предиктором, а зависимая переменная У — результативным признаком или откликом.

    Если число предикторов равно 1, регрессию называют простой, если число предикторов больше 1 — множественной.

    Регрессионный анализ предполагает решение двух задач.

    1. заключается в выборе независимых переменных, существенно влияющих на зависимую переменную, и определении формы уравнения регрессии.

    2. состоит в оценке изменения зависимой переменной на основании известных изменений независимых переменных.

    Зависимость между переменными может быть описана: линейным уравнением, уравнением параболы, гиперболы, степенного типа, логистической кривой.

    Для подбора вида зависимости между изучаемыми переменными оценивают график. Иногда примерный вид зависимости между переменными бывает известен из предыдущих исследований аналогичных данных.

    Самая простая форма уравнения регрессии — линейная (линейная функция y=f(x)) . Линейная регрессия с несколькими предикторами называется линейной множественной регрессионной моделью. Для линейной модели предполагается, что наблюдаемые величины связаны между собой зависимостью вида:

    yi =+ b0 +b1 x1i + b2 x2i + …+ bp x1p + ci

    где b1, b2, bp, b0— коэффициенты уравнения, вычисляемые при помощи систем нормальных уравнений; ci — независимая случайная величина с нулевым математическим ожиданием (иногда ci называют ошибками наблюдения).

    Общее назначение множественной регрессии (R) состоит в анализе связи между несколькими независимыми переменными и зависимой переменной

    Линия регрессии выражает наилучшее предсказание зависимой переменной (Y) по независимым переменным (X). Однако, природа непредсказуема и имеется существенный разброс наблюдаемых точек относительно подогнанной прямой (как это бывает на диаграмме рассеяния). Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.

    Интерпретация коэффициента множественной корреляции R

    Это неотрицательная величина, принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или b-коэффициентов. Служит для оценки тесноты связи.

    • Если b-коэффициент положителен, то связь этой переменной с зависимой переменной положительна;

    • если b-коэффициент отрицателен, то и связь носит отрицательный характер.

    • если b-коэффициент равен 0, связь между переменными отсутствует.

    Важность анализа остатков.

    Для проверки адекватности модели можно использовать график

    • Если остатки попадают в горизонтальную полосу с центром на оси абсцисс, модель можно рассматривать как адекватную (рис.а).

    • Если полоса расширяется, когда х или у возрастает (рис. b), это указывает на что необходимо преобразование переменной Y.

    • График, показывающий линейный тренд (рис. с), дает основание для введения в модель дополнительной независимой переменной.

    Пример графиков взят из лекции:



    Пример решения задачи регрессионным анализом: например, мы хотим построить уравнение, которое может связать диаметр ствола (Х) и высоту дерева (У), чтобы в будущем оценивать высоту деревьев без измерения, а только по диаметру. Через экселевские манипуляции мы создаем диаграмму точечную (диаграмма рассеивания), а затем добавляем линию тренда (выбрать более подходящий для диаграммы тип линии). Так же на экране появится уравнение регрессии и R, по которому мы и оценим тесноту связи.


    написать администратору сайта