метод количественного анализа. ККЗ_МКА_Фомина СИ_ДО-308МВА. Московский финансовопромышленный университет Синергия
Скачать 0.51 Mb.
|
Основные статистические характеристики переменных
На основе таблицы по каждой переменной построены кривую распределения (полигоны накопленных частот). Они показаны на рисунках Проверим, есть ли связь между ценой пиццы и видом, к которому она относится (Cheese, Pepperoni или Chain). Так как один из показателей является количественным, а другой – качественным, будем использовать метод сопряженных таблиц, аналогичный примененному в задаче 3. Выдвигаем гипотезы. Основная гипотеза Н0: рассматриваемые признаки независимы. Альтернативная гипотеза Н1: цена и вид зависимы. Рис. 1 − Цена: относительная и накопленная частота Рис. 2 − Калорийность: относительная и накопленная частота Рис. 3 − Жирность: относительная и накопленная частота Таблица сопряженности с фактическими и теоретическими частотами представлена ниже К расчету зависимости вид − цена. Фактические и теоретические частоты
расчет теоретических частот проводился по формуле (1). Расчет значения представлен в табл К расчету зависимости вид − цена. Значение
Получаем Учитывая количество строк в таблицах сопряженности, равное 3, и количество столбцов, равное 6, получаем количество степеней свободы df = (3 − 1) · (6 − 1) = 10. Принимаем α = 0,05. Получаем Гипотеза H0 отвергается. Принимается гипотеза H1: между видом пиццы и ее ценой есть статистически значимая связь. Анализ таблицы сопряженности позволяет утверждать, что пицца Cheese самая дешовая, Pepperoni несколько дороже и Chain − самая дорогая. Проверим теперь наличие связи между калорийностью и жирностью. Так как оба эти показателя количественные, будем использовать инструмент «Регрессия» из Анализа данных Excel. После проведения расчетов был получен результат, изображенный на рис. Рис. − Жирность: относительная и накопленная частота В первую очередь обратим внимание на столбец «Коэффициенты», в нем представлены параметры полученного уравнения регрессии: . Их можно интерпретировать следующим образом. Пицца, не содержащая жира, будет иметь калорийность 250,57. Каждый дополнительный грамм жира будет добавлять 6,48 единиц калорийности. Построенная модель имеет достаточно высокое значение коэффициента детерминации (R-квадрат) − 0,8755. Это значит, что более 87% дисперсии результативного признака объясняется влиянием независимой переменной. Адекватность модели можно определить по значению критерия Фишера F и его значимости (Значимость F) Так как значение F больше критического, а Значимость F много меньше α = 0,05, модель можно считать адекватной и значимой . Вывод о статистической значимости коэффициентов уравнения можно сделать на основе сравнения t-статистик (критерий Стьюдента) с табличными и учитывая P-значения, которые так же меньше α = 0,05. Проведенное исследование позволяет утверждать, что между типом пиццы и ценой, а так же между калорийностью и жирностью существует устойчивая статистически значимая связь. |