контрольная. Задача 3 Ответ на практическую задачу 1. 5 Практическая задача 13
Скачать 0.61 Mb.
|
1 2 СодержаниеПрактическая задача 1. 3 Ответ на практическую задачу №1. 5 Практическая задача 2. 13 Ответ на практическую задачу №2. 14 Вариант №7 Практическая задача 1.1. Создание информационной базы исследования. Используя пакеты профессиональных статистических программ Statistica, SPSS или электронные таблицы Microsoft Excel, создайте лист для массива данных следующего вида:
Где, Субъект 1 - Республика Карелия Субъект 2 - Республика Коми Субъект 3 - Архангельская область Субъект 4 - Вологодская область Субъект 5 - Калининградская область Субъект 6 - Ленинградская область Субъект 7 - Мурманская область Субъект 8 - Новгородская область Субъект 9 - Псковская область Субъект 10 - г. Санкт-Петербург Субъект 11 - Республика Адыгея Субъект 12 - Республика Калмыкия Субъект 13 - Краснодарский край Субъект 14 - Астраханская область Субъект 15 - Волгоградская область Признак 1 - Общие коэффициенты рождаемости (число родившихся на 1000 человек населения) Признак 2 - Среднедушевые денежные доходы населения (в месяц; рублей) Признак 3 - Численность врачей всех специальностей на 10 000 человек населения, человек (на конец года) Признак 4 - Общий коэффициент брачности на 1000 человек населения 2. С помощью перечисленных ниже информационно-статистических систем, заполните полученную статистическую таблицу данными для анализа за 2015 год:
3. С помощью модуля визуализации постройте столбиковую диаграмму по Признаку 3. Проанализируйте результаты и сделайте выводы. 4. С помощью модуля визуализации постройте полосовую диаграмму по Признаку 4. Проанализируйте результаты и сделайте выводы. 5. С помощью модуля визуализации постройте диаграмму рассеивания (корреляционное поле), где в качестве координат по оси OX использован Признак 2, а по оси OY – Признак 1. Сделайте предположение о наличии, силе и характере взаимосвязи. 6. Рассчитайте парный линейный коэффициент корреляции между Признаком 1 и Признаком 2. Интерпретируйте результаты и сделайте выводы. 7. Используя пакеты профессиональных статистических программ Statistica, SPSS или надстройку «Анализ данных» системы Microsoft Excel, рассчитайте параметры парного линейного уравнения регрессии между результативным Признаком 1 и факторным Признаком 2, оцените его качество с помощью коэффициента детерминации. Интерпретируйте значение коэффициента детерминации. Проверьте уравнение на адекватность с помощью F-критерия Фишера, а параметры уравнения на значимость с помощью t-статистики Стьюдента. 8. Используя пакеты профессиональных статистических программ Statistica, SPSS или надстройку «Анализ данных» системы Microsoft Excel, постройте матрицу парных линейных коэффициентов корреляции между Признаками 1-4. 9. Используя пакеты профессиональных статистических программ Statistica, SPSS или надстройку «Анализ данных» системы Microsoft Excel, постройте множественное уравнение регрессии между результативным Признаком 1 и факторными Признаками 2-4, оцените его качество с помощью скорректированного коэффициента детерминации. Интерпретируйте значение скорректированного коэффициента детерминации. Проверьте уравнение на адекватность с помощью F-критерия Фишера, а параметры уравнения на значимость с помощью t-статистики Стьюдента. Ответ на практическую задачу №1.1,2.
3. Как видно из графика самая наибольшая численность врачей находится в Санкт-Петербурге и составляет 73,8 чел., а самое наименьшая численность – по Ленинградской области. 4. Такая же ситуация и с коэффициентом брачности: самый высокий коэффициент в Санкт-Петербурге, а самый наименьший в Ленинградской области 5. 6. Для расчета парного линейного коэффициента корреляции между общим коэффициентом рождаемости (y) и среднедушевыми денежными доходами населения (x) составим вспомогательную таблицу, а также воспользуемся функцией КОРРЕЛ в Exsel. Формула корреляции выглядит так: .
Между коэффициентом рождаемости и среднедушевыми денежными доходами связь очень слабая, т.к. r входит в диапазон от 0 до 0,3. 7. При помощи регрессионного анализа выясним как рождаемость может повлиять на денежные доходы населения. Данный анализ проведем с помощь Microsoft Exsel.
R-квадрат – коэффициент детерминации. В нашем примере – 0,0098, или 0,98%. Это означает, что расчетные параметры модели на 0,98% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5. В нашем примере – «плохо». Коэффициент 11,92842064 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели. Коэффициент 2,2861E-05 оказывает весомость переменной Х на Y. То есть среднедушевые денежные доходы населения в пределах данной модели не влияет на коэффициент рождаемости 2,2861E-05 (это небольшая степень влияния). Фактическое значение F-критерия найдем по формуле: Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Табличное значение критерия со степенями свободы k1=1 и k2=13, Fтабл = 4,67 Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна). В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05. H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности; H1: b ≠ 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента. Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике). Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений. Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля. Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α. tкрит (n-m-1;α/2) = (13;0,025) = 2,16 Поскольку 0 < 2,16, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь. Поскольку 6,84 > 2,16, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). 8.
Между значениями y и х1 обнаружена очень слабая прямая взаимосвязь. Между х1 и х2 имеется слабая прямая связь. Связь со значениями в столбце х3 средняя. 9. Используя значения в столбце «Коэффициенты» получаем уравнение линейной множественной регрессии в естественной форме: Полученное уравнение регрессии показывает взаимосвязь между коэффициентом рождаемости, среднедушевыми денежными доходами населения, численностью врачей на 10000 человек населения и коэффициентом брачности на 1000 человек населения. Из уравнения видно, что рост среднедушевых доходов ведет к снижению рождаемости на 0,000095. С ростом численности врачей рождаемость растет на 0,0471 и с ростом брачности также растет на 0,546. 1 2 |