Главная страница
Навигация по странице:

  • Вариант №7 Решение

  • 7 вариант. Имеются данные о значениях признаков x, y


    Скачать 97.33 Kb.
    НазваниеИмеются данные о значениях признаков x, y
    Дата14.11.2022
    Размер97.33 Kb.
    Формат файлаdocx
    Имя файла7 вариант.docx
    ТипДокументы
    #787148

    Имеются данные о значениях признаков x, y.

    1. Построить диаграмму рассеяния результирующей величины y и независимой переменной, сделать вывод о наличии и характере тренда.

    2. Построить линейную, квадратичную, гиперболическую и экспоненциальную модель. Наложить полученные линии тренда каждой модели на исходные точечные данные.

    3. Для каждой модели рассчитать среднюю ошибку аппроксимации и коэффициент детерминации. Сделать вывод о состоятельности полученных моделей.

    4. Оценить значимость уравнений регрессии с помощью F-критерия Фишера.

    5. Оценить значимость параметров линейной модели и коэффициента парной корреляции с помощью t-критерия Стьюдента.


    X

    Y

    1.0

    2.7

    1.5

    2.9

    2.0

    3.9

    2.5

    4.7

    3.0

    5.4

    3.5

    5.9

    4.0

    6.5

    4.5

    6.8

    5.0

    7.0

    5.5

    7.5
    Вариант №7

    Решение

    Построим точечную диаграмму рассеяния:



    По диаграмме рассеивания мы видим, что лучше всего будет близок линейной или полиномиальной модели.

    Линейная модель.

    Найдем аппроксимирующую функцию в виде






    X

    Y





    XY




    1

    2.7

    1

    7.29

    2.7




    1.5

    2.9

    2.25

    8.41

    4.35




    2

    3.9

    4

    15.21

    7.8




    2.5

    4.7

    6.25

    22.09

    11.75




    3

    5.4

    9

    29.16

    16.2




    3.5

    5.9

    12.25

    34.81

    20.65




    4

    6.5

    16

    42.25

    26




    4.5

    6.8

    20.25

    46.24

    30.6




    5

    7

    25

    49

    35




    5.5

    7.5

    30.25

    56.25

    41.25

    СУММ

    32.5

    53.3

    126.25

    310.71

    196.3

    Получаем систему линейных уравнений:



    Уравнение регрессии имеет вид:

    Добавим на диаграмму рассеяния линию линейного тренда



    Вычислим среднюю ошибку аппроксимации:




    X

    Y








    1

    2.7

    2.8127

    0.0417




    1.5

    2.9

    3.3721

    0.1628




    2

    3.9

    3.9315

    0.0081




    2.5

    4.7

    4.4909

    0.0445




    3

    5.4

    5.0503

    0.0648




    3.5

    5.9

    5.6097

    0.0492




    4

    6.5

    6.1691

    0.0509




    4.5

    6.8

    6.7285

    0.0105




    5

    7

    7.2879

    0.0411




    5.5

    7.5

    7.8473

    0.0463

    СУММ










    0.52



    В среднем расчетные значения отклоняются от фактических на 5.2%.

    Ошибка аппроксимации 5.2% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

    Вычислим коэффициент детерминации. Для этого сначала рассчитаем коэффициент парной корреляции:





    Тогда коэффициент детерминации



    Так как коэффициент парной корреляции и коэффициент детерминации близки к единице, то связь между рассматриваемыми признаками тесная и прямая.

    Оценим значимость линейного уравнения регрессии с помощью критерия Фишера



    Так как , то оцениваемые характеристики статистически значимы и надежны.

    Проверим статистическую значимость параметров a,b и с помощью критерия Стьюдента.

    Вычислим стандартные ошибки параметров линейной регрессии и коэффициента корреляции











    0.0127

    5.0625




    0.223

    3.0625




    0.0009

    1.5625




    0.0437

    0.5625




    0.122

    0.0625




    0.0843

    0.0625




    0.11

    0.5625




    0.00511

    1.5625




    0.0829

    3.0625




    0.121

    5.0625

    СУММА

    0.805

    20.625







    Далее рассчитываем фактические значения критерия для оцениваемых коэффициентов регрессии и коэффициента корреляции :





    Критические значения Стьюдента



    Параметр a и коэффициент статистически значимы, так как

    . Но для параметра b данное условие не выполняется, это значит что параметр статистически не значим и был сформирован случайно.

    Квадратическая модель

    Модель будет принимать вид






    X

    Y









    XY




    1.0

    2.7

    1

    1

    1

    2.7

    2.7




    1.5

    2.9

    5.063

    3.375

    2.25

    6.525

    4.35




    2.0

    3.9

    16

    8

    4

    15.6

    7.8




    2.5

    4.7

    39.063

    15.625

    6.25

    29.375

    11.75




    3.0

    5.4

    81

    27

    9

    48.6

    16.2




    3.5

    5.9

    150.063

    42.875

    12.25

    72.275

    20.65




    4.0

    6.5

    256

    64

    16

    104

    26




    4.5

    6.8

    410.063

    91.125

    20.25

    137.7

    30.6




    5.0

    7.0

    625

    125

    25

    175

    35




    5.5

    7.5

    915.063

    166.375

    30.25

    226.875

    41.25

    СУММА

    32.5

    53.3

    2498.313

    544.375

    126.25

    818.65

    196.3

    Для наших данных система имеет вид



    Уравнение квадратичной регрессии:





    Вычислим среднюю ошибку аппроксимации

    X

    Y





    1

    2.7

    2.4263

    0.1014

    1.5

    2.9

    3.2433

    0.1184

    2

    3.9

    3.9958

    0.0246

    2.5

    4.7

    4.684

    0.0034

    3

    5.4

    5.3077

    0.0171

    3.5

    5.9

    5.8671

    0.0056

    4

    6.5

    6.362

    0.0212

    4.5

    6.8

    6.7926

    0.0011

    5

    7.0

    7.1587

    0.0227

    5.5

    7.5

    7.4604

    0.0053

    СУММА

    53.3

    53.4779

    0.53



    В среднем расчетные значения отклоняются от фактических на 5.3%.

    Ошибка аппроксимации 5.3% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

    Вычислим коэффициент корреляции.




    Y








    2.7

    0.0749

    6.9169




    2.9

    0.1176

    5.9049




    3.9

    0.0092

    2.0449




    4.7

    0.0003

    0.3969




    5.4

    0.0085

    0.0049




    5.9

    0.0011

    0.3249




    6.5

    0.019

    1.3689




    6.8

    0.00001

    2.1609




    7.0

    0.0252

    2.7889




    7.5

    0.0016

    4.7089




    СУММА

    0.2574

    26.621



    Тогда коэффициент детерминации:

    Полученный коэффициент корреляции близок к единице, что показывает о сильной и прямой связи между признаками X и Y.

    Оценим значимость квадратичного уравнения регрессии с помощью критерия Фишера. Для квадратичной модели m=2.





    Так как , то оцениваемые характеристики статистически значимы и надежны.

    Гиперболическая модель

    Аппроксимирующая функция имеет вид . Делая замену








    X

    Y





    Y




    1.0

    2.7

    1

    1

    2.7




    1.5

    2.9

    0.6667

    0.4444

    1.9333




    2.0

    3.9

    0.5

    0.25

    1.95




    2.5

    4.7

    0.4

    0.16

    1.88




    3.0

    5.4

    0.3333

    0.1111

    1.8




    3.5

    5.9

    0.2857

    0.08163

    1.6857




    4.0

    6.5

    0.25

    0.0625

    1.625




    4.5

    6.8

    0.2222

    0.04938

    1.5111




    5.0

    7.0

    0.2

    0.04

    1.4




    5.5

    7.5

    0.1818

    0.03306

    1.3636

    СУММА

    32.5

    53.3

    4.0398

    2.2321

    17.8488







    Вычислим среднюю ошибку аппроксимации

    X

    Y





    1

    2.7

    1.67

    0.38

    1.5

    2.9

    3.72

    0.28

    2

    3.9

    4.74

    0.22

    2.5

    4.7

    5.35

    0.14

    3

    5.4

    5.76

    0.07

    3.5

    5.9

    6.1

    0.03

    4

    6.5

    6.28

    0.03

    4.5

    6.8

    6.45

    0.05

    5

    7.0

    6.58

    0.06

    5.5

    7.5

    6.69

    0.11

    СУММА

    53.3

    53,35

    1.37



    Найденное значение , значит гипотезу о гиперболической модели отвергаем.

    Экспоненциальная модель

    Аппроксимирующая функция имеет вид . Логарифмированием и заменой линеаризируем модель:








    X

    Y












    1.0

    2.7

    0.9933

    1

    0.9865

    0.9933




    1.5

    2.9

    1.0647

    2.25

    1.1336

    1.5971




    2.0

    3.9

    1.361

    4

    1.8523

    2.722




    2.5

    4.7

    1.5476

    6.25

    2.3949

    3.8689




    3.0

    5.4

    1.6864

    9

    2.8439

    5.0592




    3.5

    5.9

    1.775

    12.25

    3.1505

    6.2123




    4.0

    6.5

    1.8718

    16

    3.5036

    7.4872




    4.5

    6.8

    1.9169

    20.25

    3.6746

    8.6262




    5.0

    7.0

    1.9459

    25

    3.7866

    9.7296




    5.5

    7.5

    2.0149

    30.25

    4.0598

    11.082

    СУММА

    32.5

    53.3

    16.1774

    126.25

    27.3864

    57.3776







    Добавим на диаграмму рассеяния линию экспоненциального тренда.



    Вычислим среднюю ошибку аппроксимации

    X

    Y





    1

    2.7

    2.99

    0.11

    1.5

    2.9

    3.35

    0.16

    2

    3.9

    3.77

    0.03

    2.5

    4.7

    4.23

    0.1

    3

    5.4

    4.76

    0.07

    3.5

    5.9

    5.34

    0.1

    4

    6.5

    6

    0.08

    4.5

    6.8

    6.75

    0.01

    5

    7.0

    7.58

    0.08

    5.5

    7.5

    8.51

    0.14

    СУММА

    53.3

    53.28

    0.88



    Найденное значение , значит гипотезу о экспоненциальной модели отвергаем.

    Вывод:
    В результате изучения и подбора модели для наших данных, мы получили, что лучше всего связь между признаками x и y описывает линейная и квадратичная модель. Сравнивая ошибки аппроксимации мы получаем, что можно брать в расчет и линейную, и квадратичную модель, так как значения ошибок приблизительно равны.


    написать администратору сайта