Главная страница
Навигация по странице:

  • Вариант Таблица Результативный признак Y

  • Анализ данных

  • Пакет анализа . В главном меню выберите Сервис /Анализ данных /Регрессия

  • Номер наблюдения

  • Задание. Вариант Таблица


    Скачать 443.5 Kb.
    НазваниеВариант Таблица
    Дата11.11.2022
    Размер443.5 Kb.
    Формат файлаdoc
    Имя файлаЗадание.doc
    ТипДокументы
    #783226


    Задание 2.

    Выберите результативный и факторный признаки, соответствующие своему варианту (номеру по списку в журнале).

    Вариант

    Таблица

    Результативный признак Y

    Факторный признак X

    15

    1

    9

    8


    Используя данные (Y, X) Приложения 1 для соответствующего № варианта, выполните следующие задания:

      1. Постройте поле корреляции. Рассчитайте линейный коэффициент корреляции и поясните его смысл. Сделайте вывод о тесноте и направлении связи между Y и X. Оцените его статистическую значимость и построите его интервальную оценку. Найдите коэффициент детерминации и проверьте его статистическую значимость. Построите ковариационную и корреляционную матрицы. Сделайте выводы.

      2. Рассчитайте параметры линейного уравнения регрессии . Дайте экономическую интерпретацию коэффициентов регрессии b0 и b1. Протестируйте статистические гипотезы о достоверности коэффициентов регрессии b0 и b1 при уровне значимости α=0,05. Постройте доверительные интервалы для параметров b0 и b1 и прямую линию регрессии на корреляционном поле.

      3. Оцените качество уравнения регрессии, протестировав статистическую гипотезу о достоверности уравнения регрессии при уровне значимости α=0,05. Проверьте вычисления, используя надстройку Excel «Поиск решения». Вычислите среднюю и относительную ошибки аппроксимации.

      4. Найдите средние и частные коэффициенты эластичности. Сделайте выводов о возможности использования регрессионной модели для прогнозирования.

      5. По линейному уравнению регрессии найдите прогнозное значение признака Y при прогнозном значении X, составляющем 105% от его среднего уровня, оцените точность прогноза по стандартной ошибке и доверительному интервалу.

    Решение:

      1. Постройте поле корреляции. Рассчитайте линейный коэффициент корреляции и поясните его смысл. Сделайте вывод о тесноте и направлении связи между Y и X. Оцените его статистическую значимость и построите его интервальную оценку. Найдите коэффициент детерминации и проверьте его статистическую значимость. Построите ковариационную и корреляционную матрицы. Сделайте выводы.

    Построим поле корреляции и сформулировать гипотезу о форме связи:



    Рис.1 Поле корреляции

    По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь.

    Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:

    , 

    где , – выборочные дисперсии переменных x и y, – ковариация признаков. Соответствующие средние определяются по формулам:

    , 

    , 

    , 

    . 

    Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.):

    Таблица 1.




    x

    y

    xy

    x2

    y2



    e2

    1

    16839

    143302

    2413062378

    283551921

    20535463204

    340897,18

    39043856888,54

    2

    13298

    110850

    1474083300

    176836804

    12287722500

    66332,29

    1981826290,68

    3

    12424

    97293

    1208768232

    154355776

    9465927849

    -1436,62

    9747537687,69

    4

    13580

    193277

    2624701660

    184416400

    37355998729

    88198,23

    11041547045,96

    5

    10980

    71001

    779590980

    120560400

    5041142001

    -113402,65

    34004704946,91

    6

    15342

    98857

    1516664094

    235376964

    9772706449

    224821,60

    15867080522,53

    7

    12656

    46092

    583340352

    160174336

    2124472464

    16552,38

    872588997,48

    8

    14694

    97695

    1435530330

    215913636

    9544313025

    174576,46

    5910758531,72

    9

    15804

    117750

    1860921000

    249766416

    13865062500

    260644,53

    20418845569,29

    10

    22324

    1016780

    22698596720

    498360976

    1,03384E+12

    766197,50

    62791587196,42

    11

    13017

    62813

    817636821

    169442289

    3945472969

    44543,89

    333760398,54

    12

    13663

    97030

    1325720890

    186677569

    9414820900

    94633,95

    5741033,97

    13

    14770

    101861

    1504486970

    218152900

    10375663321

    180469,41

    6179281569,97

    14

    13592

    98311

    1336243112

    184742464

    9665052721

    89128,70

    84314638,98

    15

    13925

    126770

    1765272250

    193905625

    16070632900

    114949,12

    139733199,21

    16

    15358

    151331

    2324141498

    235868164

    22901071561

    226062,22

    5584755404,21

    17

    14548

    105411

    1533519228

    211644304

    11111478921

    163255,79

    3346020055,22

    Итого

    246814

    2736424

    47202279815

    3679746944

    1,23732E+12

    2736424,00

    217353939977,33

    Среднее значение

    14518,47

    160966,12

    2776604695,00

    216455702,59

    72783445318,47

    160966,12




    По данным таблицы находим:

    , ,

    , ,

    , .

    Таким образом, между оборотом розничной торговли (y) и среднедушевыми денежными доходами (в месяц) (x) существует прямая достаточно сильная корреляционная зависимость.

    Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:

    , 

    который имеет распределение Стьюдента с k=n–2 и уровнем значимости .

    В нашем случае

    и .

    Поскольку , то коэффициент корреляции существенно отличается от нуля.

    Для значимого коэффициента можно построить доверительный интервал, который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n<30), используют z-преобразование Фишера:

    

    Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией . Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное z-преобразование.

    Применяя z-преобразование для найденного коэффициента корреляции, получим

    .

    Доверительный интервал для M(z) будет иметь вид

    , 

    где tγ находится с помощью функции Лапласа Ф(tγ)=γ/2. Для γ=0,95 имеем tγ=1,96. Тогда

    ,

    или

    .

    Обратное z-преобразование осуществляется по формуле

    

    В результате находим

    .

    В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции ρ.

    Коэффициент детерминации для линейной модели равен квадрату коэффициента корреляции



    Это означает, что 72,7% вариации оборота розничной торговли (y) объясняется вариацией фактора x – среднедушевых денежных доходов (в месяц).

    Значимость уравнения регрессии проверяется при помощи F-критерия Фишера, для линейной парной регрессии он будет иметь вид

    , (1.10)

    где F подчиняется распределению Фишера с уровнем значимости α и степенями свободы k1=1 и k2= n–2.

    В нашем случае

    .

    Поскольку критическое значение критерия равно



    и , то признается статистическая значимость коэффициента детерминации.

    Построите ковариационную и корреляционную матрицы:

    Ковариационная Корреляционная


     

    x

    y

    x

    5669714,367




    y

    439622850,2

    46873354288




     

    x

    y

    x

    1




    y

    0,852779

    1



      1. Рассчитайте параметры линейного уравнения регрессии . Дайте экономическую интерпретацию коэффициентов регрессии b0 и b1. Протестируйте статистические гипотезы о достоверности коэффициентов регрессии b0 и b1 при уровне значимости α=0,05. Постройте доверительные интервалы для параметров b0 и b1 и прямую линию регрессии на корреляционном поле.

    По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:

    , 

    где b0 и b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:

    , 

    где – отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений:

    

    Решая систему (1.13) , найдем

    , 

    . 

    По данным таблицы (1.) находим

    ;

    .

    Получено уравнение регрессии: ,

    Параметр регрессии b1 позволяет сделать вывод, что с увеличением среднедушевых денежных доходов (в месяц) на 1 руб. оборот розничной торговли увеличивается в среднем на 77,54 млн.руб.

    Оценка параметра b0 = - 964778,7 показывает прогнозируемый уровень оборота розничной торговли, но только в том случае, если среднедушевые денежные доходы (в месяц) равны 0 руб. В геометрическом смысле значение коэффициента b0 = - 964778,7 определяет точку пересечения прямой регрессии с осью ординат и характеризует сдвиг линии регрессии вдоль оси Y.

    Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки статистической значимости каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии

    . (1.17)

    В нашем случае

    .

    Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента:

    , (1.18)

    где – стандартная ошибка коэффициента регрессии.

    Для коэффициента b1 оценку Стандартного отклонения можно получить по формуле:

    . (1.19)

    В нашем случае



    Следовательно,

    .

    Отметим, что для парной линейной регрессии t-критерий для коэффициента корреляции rxy и коэффициента регрессии b1 совпадают.

    Для коэффициента b0 оценку дисперсии можно получить по формуле:

    . (1.20)

    Тогда



    Критическое значение критерия было уже найдено . Поскольку , то коэффициент регрессии b1 значимо отличается от нуля. Следовательно, для него можно построить доверительные интервалы.

    Поскольку , то коэффициент регрессии b0 значимо отличается от нуля. Следовательно, для него можно построить доверительные интервалы.

    Определим предельные ошибки для каждого показателя:

    , ,

    где . В нашем случае

    , .

    В результате, получаем следующие доверительные интервалы для коэффициентов регрессии:

    и ,

    или

    и .



    Рис.2 Поле корреляции и линия регрессии

      1. Оцените качество уравнения регрессии, протестировав статистическую гипотезу о достоверности уравнения регрессии при уровне значимости α=0,05. Проверьте вычисления, используя надстройку Excel «Поиск решения». Вычислите среднюю и относительную ошибки аппроксимации.

    , (1.21)

    где F подчиняется распределению Фишера с уровнем значимости α и степенями свободы k1=1 и k2=n–2.

    В нашем случае

    .

    Поскольку критическое значение критерия равно



    и , то признается статистическая значимость построенного уравнения регрессии.

    Задачи регрессионного анализа можно решать с использованием компьютеров. Например, можно использовать программу Excel. Для этого достаточно ввести свои данные и использовать пакет Анализ данных. Опишем кратко последовательность действий:

    1. Проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа.

    2. В главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК.

    3. Заполните диалоговое окно ввода данных и параметров вывода:

    Входной интервал Y – диапазон, содержащий данные результативного признака;

    Входной интервал X – диапазон столбцов, содержащие значения факторов независимых признаков.

    Результаты регрессионного анализа представлены в таблице 1.3.

    Отметим, что в компьютерных программах вычисляется не критическое значение критерия, допустим Tкрит, а вероятность . Если P<α, то нет оснований отклонять нулевую гипотезу, если P>α, то нулевая гипотеза отклоняется.

    Таблица 2

    ВЫВОД ИТОГОВ



















    Регрессионная статистика
















    Множественный R

    0,852779302
















    R-квадрат

    0,727232538
















    Нормированный
    R-квадрат

    0,709048041
















    Стандартная ошибка

    120375,5069
















    Наблюдения

    17
















    ДИСПЕРСИОННЫЙ АНАЛИЗ
















     

    df

    SS

    MS

    F

    Значимость F




    Регрессия

    1

    5,79493E+11

    5,79493E+11

    39,99189637

    1,36494E-05




    Остаток

    15

    2,17354E+11

    14490262665










    Итого

    16

    7,96847E+11

     

     

     




























    Коэффициенты

    Стандартная ошибка

    t-статистика

    P-Значение

    Нижние 95%

    Верхние 95%

    Y-пересечение

    -964778,67

    180392,1331

    -5,348230311

    8,12631E-05

    -1349275,4

    -580281,95

    Переменная X

    77,5388

    12,26120287

    6,32391464

    1,36494E-05

    51,4046652

    103,67294


    Качество модели определяет средняя ошибка аппроксимации:

    .

    Качество построенной модели оценивается как не удовлетворительное, так как превышает 50%. В данных присутствуют выбросы.

      1. Найдите средние и частные коэффициенты эластичности. Сделайте выводов о возможности использования регрессионной модели для прогнозирования.

    Среднее значение коэффициента эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.

    Для линейного уравнения регрессии найдем средний коэффициент эластичности





    В нашем случае увеличение среднедушевых денежных доходов (в месяц) (от своего среднего значения) на 1% увеличивает в среднем оборот розничной торговли на 6,99%.

    Найдем частные коэффициенты эластичности по формуле


    Частный коэффициент эластичности показывает, на сколько процентов изменится зависимая переменная y при изменении j-го фактора на 1 %. Данный коэффициент не учитывает степень колеблемости факторов. 

    Значения частных коэффициентов эластичности приведены в таблице 3.

    Таблица 3

    Номер
    наблюдения


    Частный коэффициент эластичности Эi

    1

    9,11

    2

    9,30

    3

    9,90

    4

    5,45

    5

    11,99

    6

    12,03

    7

    21,29

    8

    11,66

    9

    10,41

    10

    1,70

    11

    16,07

    12

    10,92

    13

    11,24

    14

    10,72

    15

    8,52

    16

    7,87

    17

    10,70


    Полученные оценки уравнения регрессии не позволяют использовать его для прогноза.

      1. По линейному уравнению регрессии найдите прогнозное значение признака Y при прогнозном значении X, составляющем 105% от его среднего уровня, оцените точность прогноза по стандартной ошибке и доверительному интервалу.

    Прогнозное значение yp определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения xp. В нашем случае прогнозное значение среднедушевых денежных доходов (в месяц) составит: руб. , тогда прогнозное значение оборота розничной торговли составит:

    млн. руб.

    Средняя стандартная ошибка прогноза вычисляется по формуле:

    . (1.22)

    В нашем случае



    Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

    .

    Доверительный интервал прогноза

    ,

    или

    .

    Выполненный прогноз оборота розничной торговли оказался не надежным (γ=0,95), и достаточно не точным, т.к. относительная точность прогноза составила 9,84%.


    написать администратору сайта