Миниобранауки россии
Скачать 1.37 Mb.
|
Контрольное заданиеИсходные данные для 20 наблюдений приведены в таблице.
В соответствии со своим вариантом необходимо: построить 3 уравнения линейной регрессии, последовательно увеличивая число факторных переменных от одной до 3; определить оценки параметров в уравнениях регрессии; определить качество полученных уравнений регрессии и их статистическую значимость; оценить статистическую значимость параметров регрессии; построить графики остатков для полученных регрессий; выбрать лучшую модель; для этой модели рассчитать нормированные коэффициенты j По каждому пункту сделать выводы. Варианты задания определяются по списку следующим образом. В качестве независимой переменной используйте X0
В качестве независимой переменной используйте X1
В качестве независимой переменной используйте X2
9. Простая линейная регрессия Простая линейная регрессия используется для исследования зависимости двух переменных. Уравнение простой линейной регрессии можно записать в виде yi = a0 + a1xi + i(1) где 1,…n- независимые одинаково распределенные случайные величины, определяющие действие различных неучтенных факторов на изменение результирующего показателя Y. Для определения оценок параметров в уравнении (1) широко используется метод наименьших квадратов (МНК), суть которого заключается в следующем. Определим величину ei следующим образом: ei = yi – (a0 + a1xi). Величина ei называется отклонением (остатком) наблюдаемого значения результирующей переменной yi в i – ом наблюдении от расчетного. Отклонение ei является оценкой случайной компоненты i. Построим оценку параметров (a0, a1) так, чтобы сумма их квадратов отклонений была минимальной: (2) Сумму минимизируем по (a0, a1),приравнивая нулю соответствующие производные.В результате получим систему уравнений линейных относительно a0 и a1. Ее решение легко находится: (3) и (4) Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции ryx. Для линейной регрессии , Степень тесноты связи результирующей и факторных переменных можно оценить, используя шкалу Чеддока
Для определения статистической значимости показателя тесноты связи и существенности связи между результирующей и факторными переменными проводится дисперсионный анализ. Задача состоит в исследовании дисперсии результирующего показателя. Проверка гипотезы о существенности связи результирующей и факторных переменных в уравнения регрессии (статистической значимости множественного коэффициента корреляции) осуществляется с помощью F-критерия Фишера. Для проверки вычисляется F-статистика: где : Здесь - наблюдаемые значения y; - значения y, вычисленные при соответствующих значениях x; - среднее значение y. Из таблиц распределения Фишера определяется критическое значение Fdf1,df2,α при заданном уровне значимости α и степенях свободы df1 = 1, df2 = n-2, где уровень значимости α – вероятность совершения ошибки первого рода. Если Fpасч> Fdf1,df2,α , то полученное значение множественного коэффициента корреляции можно считать статистически значимым. В противном случае полагаем ryx = 0, что свидетельствует об отсутствии линейной зависимости между результирующей и факторными переменными в уравнения регрессии Задание: Сгенерировать 45 значений случайной величины ε, считая, что случайная компонента ε распределена нормально с нулевым математическим ожиданием и единичной дисперсией. Для вычисления ε использовать генератор случайных чисел. . Таблица1
Рассчитать 45 значений Y используя формулу Y = 11,5 + (0,14N)x + 2ε (5) где ε случайная компонента. Значения X возьмите из таблицы 1 Построить таблицу пар (Y,X), подставляя в уравнение (5) значения X из таблицы 1 и сгенерированные значения ε. N = Ваш номер по списку. Используя данные таблицы (Y,X) рассчитать коэффициенты a0 и a1, а также коэффициент корреляции ryx и записать уравнение регрессии. Сделать вывод о тесноте связи используя шкалу Чеддока. Рассчитать F – статистику Фишера и сделать вывод о статистической значимости коэффициента корреляции. Список литературы1. Гмурман, В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов / В.Е. Гмурман. – 10-е изд., стер. – М.: Высш. шк., 2004. – 479 с. 2. Ветров, А.Н. Статистические программные системы: учебное пособие ⁄ А.Н. Ветров, А.Л. Борисов, Ю.Г. Козлова. – Тверь: Тверской государственный технический университет, 2014. – 152 с. 3. Ветров, А.Н. Методические указания и задания к курсовой работе по дисциплине Теория вероятностей и статистика / А.Н. Ветров. – Тверь: ТвГТУ, 2017. – 25 с. 5. Дисперсионный двухфакторный анализ [Электронный ресурс] // refdb.ru: сайт. – Режим доступа: https://refdb.ru/look/1210036.html 5. Шеффе, Г. Дисперсионный анализ / Г. Шеффе. – М.: Наука, 1980. 512 с. |