Отчет. ОТЧЕТ. Задача По результатам корреляционного анализа (см задание 1) выбрать пару факторов, которые связаны наиболее тесно, обозначив их x и y соответственно.
![]()
|
1 2 Выводы: ![]() ![]() ![]() В нашем случае, гипотеза отвергается. ![]() ![]() ![]() В нашем случае гипотеза так же отвергается. Значит наши параметры статистически значимы. Построим доверительные интервалы для параметров. ![]() ![]() Выводы: Интерпретация значения θ0 напрямую отсутствует, доверительный интервал показывает, в каких границах он варьируется. Доверительный интервал для θ1 показывает, сколько в среднем один посетитель покупает томатов на сумму от 40 до 48 руб. Следовательно, предположение из уравнения прямой регрессии о том, что в среднем один покупатель приобретает томатов на 44 рублей соответствует доверительному интервалу. Задание 4 Таблица 7 – Вспомогательная таблица
На практике истинное значение ![]() ![]() Данная величина показывает долю объясненной дисперсии в общей дисперсии зависимой переменной. Гипотезы: ![]() ![]() ![]() Вывод: Так как F > F крит, то гипотеза ![]() Задание 5 Таблица 7 – Дисперсионный анализ
Вывод: В эту таблицу включены все основные результаты расчетов, проводимых при проверке значимости регрессионной модели, а именно TSS , RSS и ESS – элементы из разложения TSS=ESS+RSS ; F статистика Фишера, вычисляемая по формуле F= ![]() Исходя из расчетов можно сделать вывод что регрессионная модель значима, и ее можно использовать для прогнозирования. Задание 6 Таблица 8 - Точечный и интервальный прогноз
Выберем прогнозную точку ![]() Точечный прогноз: ![]() ![]() Это значит, что при 2220 человек в магазине, выручка от продажи томатов будет составлять ![]() Интервальный прогноз: ![]() t кр (0,05; 48) = 2,3139 Интервал для ![]() Вывод: Точечный прогноз ожидаемое значение зависимой переменной, показало, что выручка от продажи томатов будет составлять ![]() Интервальное прогнозирование интервал, в котором с известной доверительной вероятностью находится истинное значение зависимой переменной показало, что при 2220 посетителей, выручка от продажи томатов составит [101,794; 114,071] тыс. руб. Задание 7 Изменение доверительной вероятности оказывает существенное влияние и на интервальный прогноз. Так, при увеличении доверительной вероятности ширина доверительного интервала должна расти, а при уменьшении – сокращаться. Рассчитываем ошибку прогноза по формуле: ![]() Таблица 9 – Доверительный интервал и ошибка прогноза на всем диапазоне данных
Построим график: ![]() Рисунок 2 - Корреляционное поле, линия регрессии, 95% доверительный интервал Справедливость структуры модели становится под сомнение, так как 20 точек на графике наблюдений не попадают в доверительный интервал. Оценка стандартной ошибки прогнозирования должна быть рассчитана по другой формуле. Необходимо увеличить доверительный интервал. Рассчитываем ошибку прогноза по формуле: ![]() Таблица 10 - Доверительный интервал и ошибка прогноза на всем диапазоне данных
![]() Рисунок 3 - Корреляционное поле, линия регрессии, 95% доверительный интервал Справедливость структуры модели не становится под сомнение, так как 95% наблюдений попадают в доверительный интервал. Таким образом, с вероятностью 95% при прогнозируемом количестве посетителей в 2220 человек, выручка от продажи томатов будет находится в пределах найдено доверительного интервала. Задание 8 Используя данные корреляционного анализа, выявили наиболее тесную связь факторов. Ей стала связь между количеством посетителей и выручкой от продажи томатов. Далее по методу наименьших квадратов вычислили оценки неизвестных параметров для уравнений парной регрессии. Дали интерпретацию результатов и выбрали для дальнейшего анализа одно из уравнений. Записали и оценили уравнение ортогональной регрессии. Построили и проанализировали графическую интерпретацию всех трех моделей регрессии и исходных данных. Проверили на значимость всех параметров выбранной модели регрессии по критерию Стьюдента. Для значимых коэффициентов построили доверительные интервалы. Проверили значимость модели (уравнения регрессии) в целом с помощью критерия Фишера. Построили таблицу дисперсионного анализа. Выбрали прогнозную точку xП в стороне от основного массива данных. Выполнили точечный и интервальный прогнозы величины y в точке хП.. Построили 95% доверительный интервал для уравнения регрессии на всем диапазоне исходных данных. Изобразили в одной системе координат исходные данные, линию регрессии, 95% доверительный интервал, проанализировали полученный график. Рекомендации: Доверительный интервал для θ1 показывает, сколько в среднем один посетитель покупает томатов на сумму от 40 до 48 руб. Следовательно, предположение из уравнения прямой регрессии о том, что в среднем один покупатель приобретает томатов на 44 рублей соответствует доверительному интервалу. Если выручка от продажи томатов будет увеличиваться на 1 тыс. руб., то возможно среднее количество посетителей изменится в большую сторону на 20 людей. Интервальное прогнозирование показало, что при 2220 посетителей, выручка от продажи томатов составит [101,794; 114,071] тыс. руб. 1 2 |