Отчет. ОТЧЕТ. Задача По результатам корреляционного анализа (см задание 1) выбрать пару факторов, которые связаны наиболее тесно, обозначив их x и y соответственно.
Скачать 88.55 Kb.
|
1 2 Выводы: , следовательно, основная гипотеза отвергается, т.е параметр статистически значим. Если параметр является значимым, то соответствующая ему интерпретация не противоречит изучаемому процессу, т.е. если количество посетителей в среднем увеличивается, то выручка от продажи томатов в среднем увеличивается. В нашем случае, гипотеза отвергается. , следовательно, основная гипотеза отвергается, т.е параметр статистически значим. Если параметр является значимым, то соответствующая ему интерпретация не противоречит изучаемому процессу, т.е. что изменение средней выручки от продажи томатов происходит медленнее изменения среднего количества посетителей. В нашем случае гипотеза так же отвергается. Значит наши параметры статистически значимы. Построим доверительные интервалы для параметров. 0 = (5,844; 14,348) 1 = (0,040; 0,048) Выводы: Интерпретация значения θ0 напрямую отсутствует, доверительный интервал показывает, в каких границах он варьируется. Доверительный интервал для θ1 показывает, сколько в среднем один посетитель покупает томатов на сумму от 40 до 48 руб. Следовательно, предположение из уравнения прямой регрессии о том, что в среднем один покупатель приобретает томатов на 44 рублей соответствует доверительному интервалу. Задание 4 Таблица 7 – Вспомогательная таблица
На практике истинное значение , как правило, неизвестно. Поэтому для оценки качества уравнения регрессии используется его выборочный аналог, вычисляемый по формуле: 0,922 Данная величина показывает долю объясненной дисперсии в общей дисперсии зависимой переменной. Гипотезы: Вывод: Так как F > F крит, то гипотеза отвергается, коэффициент детерминации признается значимым, следовательно, модель признается значимой и ее можно использовать для прогнозирования. Задание 5 Таблица 7 – Дисперсионный анализ
Вывод: В эту таблицу включены все основные результаты расчетов, проводимых при проверке значимости регрессионной модели, а именно TSS , RSS и ESS – элементы из разложения TSS=ESS+RSS ; F статистика Фишера, вычисляемая по формуле F= ; Fкр – критическое значение статистики Фишера для соответствующего уровня доверительной вероятности. Исходя из расчетов можно сделать вывод что регрессионная модель значима, и ее можно использовать для прогнозирования. Задание 6 Таблица 8 - Точечный и интервальный прогноз
Выберем прогнозную точку , определим, сколько будет выручки от продаж томатов при 2220 человек. Точечный прогноз: Это значит, что при 2220 человек в магазине, выручка от продажи томатов будет составлять тыс. руб. Интервальный прогноз: t кр (0,05; 48) = 2,3139 Интервал для : [101,794; 114,071] Вывод: Точечный прогноз ожидаемое значение зависимой переменной, показало, что выручка от продажи томатов будет составлять тыс. руб. Интервальное прогнозирование интервал, в котором с известной доверительной вероятностью находится истинное значение зависимой переменной показало, что при 2220 посетителей, выручка от продажи томатов составит [101,794; 114,071] тыс. руб. Задание 7 Изменение доверительной вероятности оказывает существенное влияние и на интервальный прогноз. Так, при увеличении доверительной вероятности ширина доверительного интервала должна расти, а при уменьшении – сокращаться. Рассчитываем ошибку прогноза по формуле: Таблица 9 – Доверительный интервал и ошибка прогноза на всем диапазоне данных
Построим график: Рисунок 2 - Корреляционное поле, линия регрессии, 95% доверительный интервал Справедливость структуры модели становится под сомнение, так как 20 точек на графике наблюдений не попадают в доверительный интервал. Оценка стандартной ошибки прогнозирования должна быть рассчитана по другой формуле. Необходимо увеличить доверительный интервал. Рассчитываем ошибку прогноза по формуле: Таблица 10 - Доверительный интервал и ошибка прогноза на всем диапазоне данных
Рисунок 3 - Корреляционное поле, линия регрессии, 95% доверительный интервал Справедливость структуры модели не становится под сомнение, так как 95% наблюдений попадают в доверительный интервал. Таким образом, с вероятностью 95% при прогнозируемом количестве посетителей в 2220 человек, выручка от продажи томатов будет находится в пределах найдено доверительного интервала. Задание 8 Используя данные корреляционного анализа, выявили наиболее тесную связь факторов. Ей стала связь между количеством посетителей и выручкой от продажи томатов. Далее по методу наименьших квадратов вычислили оценки неизвестных параметров для уравнений парной регрессии. Дали интерпретацию результатов и выбрали для дальнейшего анализа одно из уравнений. Записали и оценили уравнение ортогональной регрессии. Построили и проанализировали графическую интерпретацию всех трех моделей регрессии и исходных данных. Проверили на значимость всех параметров выбранной модели регрессии по критерию Стьюдента. Для значимых коэффициентов построили доверительные интервалы. Проверили значимость модели (уравнения регрессии) в целом с помощью критерия Фишера. Построили таблицу дисперсионного анализа. Выбрали прогнозную точку xП в стороне от основного массива данных. Выполнили точечный и интервальный прогнозы величины y в точке хП.. Построили 95% доверительный интервал для уравнения регрессии на всем диапазоне исходных данных. Изобразили в одной системе координат исходные данные, линию регрессии, 95% доверительный интервал, проанализировали полученный график. Рекомендации: Доверительный интервал для θ1 показывает, сколько в среднем один посетитель покупает томатов на сумму от 40 до 48 руб. Следовательно, предположение из уравнения прямой регрессии о том, что в среднем один покупатель приобретает томатов на 44 рублей соответствует доверительному интервалу. Если выручка от продажи томатов будет увеличиваться на 1 тыс. руб., то возможно среднее количество посетителей изменится в большую сторону на 20 людей. Интервальное прогнозирование показало, что при 2220 посетителей, выручка от продажи томатов составит [101,794; 114,071] тыс. руб. 1 2 |