Задания по Excel
Скачать 2.38 Mb.
|
Statistics 2 Final Spring 2022 Задания по Excel Не открывайте этот файл в браузере! Скачайте к себе! Для каждого результата в таблице Excel рядом напечатайте название. Важные числа (оценки, статистики) выделяйте цветом. После окончания вычислений вставьте файл Excel в файл Ворд. НЕ ПОСЫЛАЙТЕ ФАЙЛЫ ОТДЕЛЬНО. Свои ответы на вопросы пишите прямо здесь после каждого вопроса. Проверьте независимость переменных ASVAB2, ASVAB3, ASVAB4, ASVABC Переменные упомянутые выше являются зависимыми т.к. коэффициенты корреляции в таблице корреляции больше или меньше 0.5 и -0.5 В конце я приложил файл с выполнеными мной всеми заданиям. В заданиях ниже я прикреплял файлы по мере выполнений заданий Малая регрессия. С помощью Пакета Анализа найдите зависимость EARNINGS от: AGE, EMPSTAT, S, HOURS, MALE. Выпишите в Ворде оцененное уравнение, используя текстовые функции, которые мы изучали. Есть ли среди независимых переменных малозначимые? Почему? EARNINGS=0,005AGE-1,304EMPSTAT+1,218S-0,086HOURS+3,735MALE Есть переменная которая малозначимая AGE потому что p-value выше 0.1 я ее подсветил красным. Какой процент изменения EARNINGS объясняется регрессией? 64% изменения earnings описывается регрессией потому что r^2 равен примерно 0.64 я его также подсветил в файле красным Большая регрессия. С помощью Пакета Анализа найдите зависимость EARNINGS от: AGE, EMPSTAT, S, HOURS, MALE, ASVAB2, ASVAB3, ASVAB4, ASVABC, ETHHISP, ETHBLACK. Есть ли среди независимых переменных малозначимые? Да, есть empstat и ethhisp. Я их подсветил их p-value красным Есть ли переменные, которые при переходе от малой регрессии к большой стали малозначимыми? Да, empstat. Дайте формулу и значение статистики, определяющей совместную значимость переменных, добавленных в большой регрессии, и критическое значение этой статистики. Напишите проверяемые гипотезы. Каков вывод? Постройте матрицу корреляций переменных, использованных в большой регрессии. Какие пары переменных могут вызвать подозрение на мультиколлинеарность? Почему? Пары переменных ASVAB2, ASVAB3, ASVAB4, ASVABC с S потому что корреляция между всему переменными больше 0.5 Также пары ASVAB3, ASVAB4, ASVABC с ASVAB2; ASVAB4, ASVABC с ASVABC И ASBVABC с ASVAB4 по той же причине что и первые пары переменных. Сравнение средних. Постройте две выборки: одна заработков мужчин и другая – заработков женщин. Поместите эти выборки на новую страницу и там же найдите t statistics для проверки значимости разницы между доходами мужчин и женщин. В Ворде укажите разницу и p-value. Среднее заработка мужчин 14,79 среднее заработка женщин 11,62 Разница = 14.79-11.62 = 3,17 Выполните регрессию EARNINGS на MALE и константу. Выпишите результат и укажите, какой коэффициент указывает разницу в доходах между мужчинами и женщинами, вместе с p-value. Близок ли полученный результат к результату из пункта 5? Оцененный коэффициент Male указывает разницу который равен 3.17205 что близко к результату сравнений через t-statistics p-value = 4,5063132897116E-21 Скопируйте переменные AGE, EARNINGS на отдельную страницу. Упорядочьте данные по возрастанию AGE. Постройте линейный график зависимости EARNINGS по вертикальной оси и AGE по горизонтальной оси. Вставьте полученный график в Ворд (Excel может построить график далеко внизу, и тогда я не смогу его увидеть). Видите ли вы зависимость заработка от возраста? Нет, зависимости не наблюдается На той же странице постройте карманы для переменной EARNINGS и затем постройте гистограмму для этой переменной. Какие выводы можно из нее сделать? Вставьте гистограмму в Ворд. Вывод такой что EARNINGS не раномерно распределен. Постройте точечный график (scattergram) зависимости между EARNINGS и HOURS. Вставьте график в Ворд. Какие точки отстоят далеко от остальных (outliers)? Может ли такое быть в жизни? Точки которые ушли дальше 100 по горизонтальной оси это outliers. Да, такое может быть в реальной жизни На той же странице постройте тест для проверки переменной EARNINGS на нормальность. В Ворде выпишите формулу статистики, гипотезы и результат их проверки с помощью вашего теста. JB = N/6 * (Skewness^2+1/4*(Kurtosis-3)^2) H0: Переменная нормально распределена и JB = 0 H1: Переменная не нормально распределена и JB не равно 0 Для EARNINGS JB = 690532.3 то есть H0 может быть отвергнута Ниже файл с выполненными мной всеми заданиями. Бонус Объясните, вместе с формулами, определение величины . |