3 задачи 04.04.22. Среднедушевой прожиточный минимум в день одного трудоспособного, руб
Скачать 192.71 Kb.
|
Вариант 10
Требуется: Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации . С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после . Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор. Решение Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу: Таблица 2
Найдем средние квадратические отклонения признаков: Вычисление параметров линейного уравнения множественной регрессии. Для нахождения параметров линейного уравнения множественной регрессии необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , : либо воспользоваться готовыми формулами: ; ; . Рассчитаем сначала парные коэффициенты корреляции: Рассчитаем парные коэффициенты корреляции: Определим коэффициенты регрессии по формулам: Таким образом, получили следующее уравнение множественной регрессии: Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% выработка продукции на одного рабочего увеличивается в среднем на 1,03 тыс.руб., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1%выработка продукции на одного рабочего увеличивается в среднем на 0,06 тыс.руб. После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака: Таблица 3
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам: Т.е. уравнение будет выглядеть следующим образом: Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации. Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности: . Вычисляем: Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,70% или 0,13% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора . Коэффициенты парной корреляции мы уже нашли: Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. >0.7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. При двух факторах частные коэффициенты корреляции рассчитываются следующим образом: Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи. Аналогичный результат получим при использовании других формул: Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом. Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 96.5% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом. Скорректированный коэффициент множественной детерминации определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 96%) детерминированность результата в модели факторами и . Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера: . В нашем случае фактическое значение -критерия Фишера: Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул: ; . Найдем и . Имеем Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует. Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора . Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии: По формулам находим параметры регрессии Получено уравнение регрессии: y=-5,46+2,30x |