пее. 7. варианты контрольных работ и методические указания по их выполнению
Скачать 1.15 Mb.
|
При выполнении контрольной работы надо соблюдать следующие правила: указывать вариант контрольной работы; расчеты производить с помощью компьютерных пакетов (Excel, Statistica, SPSS, и др. по выбору студента); представлять решения задач подробно, со всеми формулами, расчетами и пояснениями. проверять правильность примененных методов решения задач; формулировать четкие, грамотные, обоснованные выводы; в конце контрольной работы необходимо привести перечень использованной литературы и поставить свою личную подпись; кроме распечатанного варианта контрольной работы необходимо представить дискету с файлом расчетов. Контрольная работа, выполненная не по своему варианту, не зачитывается. Выполненная контрольная работа представляется в университет для рецензирования. Правильно выполненная работа зачитывается. Если по зачтенной работе рецензентом будут сделаны замечания, необходимо разобраться в них, внести требуемые исправления и представить соответствующие доработки преподавателю. Студенты, не получившие зачет по контрольной работе, к сдаче экзамена не допускаются. На экзамене студенты должны быть готовы ответить на вопросы преподавателя по решению задач контрольной работы. Тема 1. Задачи эконометрики в области социально-экономических исследований. Основные этапы эконометрического моделирования. Название «эконометрика», введенное норвежским экономистом и статистиком Рагнаром Фришем, в буквальном переводе означает «измерения в экономике». Единое общепринятое определение эконометрики в настоящее время отсутствует, поэтому приведем высказывания известных ученых, дающие представление об этой науке. «Эконометрика – это раздел экономики, занимающийся разработкой и применением статистических методов для измерений взаимосвязей между экономическими переменными» (Р.Фишер и др.) Э.Маленво интерпретировал эконометрику как «любое приложение математики или статистических методов к изучению экономических явлений». Существует и более узкая трактовка эконометрики. «Эконометрика - самостоятельная экономико-математическая научная дисциплина, позволяющая на базе положений экономической теории и исходных данных экономической статистики, используя необходимый математико-статистический инструментарий, придавать конкретное количественное выражение общим (качественным) закономерностям, обусловленным экономической теорией» (Айвазян С.А., Мхитарян В.С.). Из сказанного выше следует, что главное назначение эконометрики – модельное описание конкретных количественных взаимосвязей, существующих между анализируемыми показателями. В соответствии с целями можно выделить две основные задачи, решаемые с помощью эконометрики: прогноз экономических и социально-экономических показателей, характеризующих состояние и развитие изучаемой системы; моделирование возможных сценариев социально-экономического развития изучаемой системы. Существует три основных класса моделей, которые применяются для анализа или прогноза. Модели временных рядов, включающие модели: - тренда: y(t)= T(t)+t, где T(t) – временной тренд заданного параметрического вида, t - случайная компонента; - сезонности y(t)= S(t)+t, где S(t) – периодическая (сезонная) компонента, t - случайная компонента; - тренда и сезонности y(t)= T(t)+ S(t)+t, (аддитивная); y(t)= T(t)·S(t)+t, (мультипликативная); Регрессионные модели с одним уравнением В таких моделях зависимая переменная y представляется в виде функции y = f(x1,… , xn), где x1, … , xn - независимые (объясняющие) переменные. В зависимости от вида функции f(x1,… , xn) модели делятся на линейные и нелинейные. Системы одновременных уравнений Эти модели описываются системами одновременных уравнений, которые могут состоять из тождеств и регрессионных уравнений, каждое из которых может, кроме объясняющих переменных, включать в себя также объясняемые переменные из других уравнений системы. Примером системы одновременных уравнений является модель спроса и предложения, когда объем спроса на товар (Qd) определяется его ценой (P) и доходом потребителя (I), объем предложения (Qs) – его ценой (P) и достигается равновесие между спросом и предложением: При эконометрическом моделировании мы встречаемся с двумя типами данных: пространственные данные (набор показателей экономических переменных в один и тот же момент времени) и временные ряды (серия наблюдений одной и той же случайной величины в последовательные моменты времени). Весь процесс эконометрического моделирования можно разделить на шесть основных этапов: постановочный (на этом этапе формируется цель исследования, определяется набор участвующих в модели экономических переменных); априорный (проводится анализ экономической сущности изучаемого объекта, формирование и формализация известной до начала исследования (априорной) информации); параметризация (осуществляется непосредственно моделирование, т.е. выбор общего вида модели, в том числе состава переменных и формы их связи); информационный (собирается необходимая статистическая информация - наблюдаемые значения экономических переменных); идентификация модели (на .том этапе проводится статистический анализ модели и оценка ее параметров); верификация модели (проверяется истинность, адекватность модели, т.е. соответствие моделируемому реальному экономическому объекту). На первых трех этапах весьма важной является проблема спецификации модели, включающая выражение в математической форме выявленных связей и соотношений, установление состава объясняющих переменных (в том числе и лаговых), формулировка исходных предпосылок и ограничений модели и ряд других вопросов. Спецификация опирается на имеющиеся экономические теории, специальные знания, а также на интуитивные представления об анализируемом экономическом объекте. От проблемы идентификации модели (которая заключается в выборе и реализации методов статистического оценивания ее неизвестных параметров) следует отличать проблему ее идентифицируемости, т.е. проблему возможности получения однозначно определенных параметров модели, заданной системой одновременных уравнений. Широкому внедрению эконометрических методов способствовало развитие информационных технологий. Компьютерные эконометрические пакеты сделали эти методы более доступными. Наиболее трудоемкая работа по вычислению различных статистик, параметров, построению таблиц и графиков в основном выполняется компьютером, а исследователю остается работа по постановке задачи, выбору соответствующей модели и метода ее решения, а также интерпретации результатов. Тема 2. Классическая и обобщенная линейные модели множественной регрессии. Экономические явления определяются, как правило, большим числом совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной переменной Y от нескольких объясняющих переменных X1, X2, …,Xn. Эта задача решается с помощью множественного регрессионного анализа. Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, включающего отбор факторов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: они должны быть количественно измеримы (качественным факторам необходимо придать количественную определенность); между факторами не должно быть высокой корреляционной, а тем более функциональной зависимости, т.е. наличия мультиколлинеарности. Включение в модель мультиколлинеарных факторов может привести к следующим последствиям: затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом виде», поскольку факторы связаны между собой; параметры линейной регрессии теряют экономический смысл; оценки параметров ненадежны, имеют большие стандартные ошибки и меняются с изменением объема наблюдений. Пусть Y=(y1, y2, …,yn)т – матрица-столбец значений зависимой переменной размера n; – матрица значений объясняющих переменных; β=(β0, β1, …,βm)т – матрица-столбец (вектор) параметров размера m+1; ε=(ε1, …,εn)т – матрица-столбец (вектор) остатков размера n. Тогда в матричной форме модель множественной линейной регрессии запишется следующим образом: Y = Xβ + ε. (1) Оценка этой модели по выборке: Y = Xb + e, (2) где b=(b0, b1, …,bm)т – матрица-столбец (вектор) оценок параметров размера Для оценки параметров уравнения регрессии (вектора b) применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки: В модели (1) ε – случайный вектор, X – неслучайная (детерминированная) матрица. Математическое ожидание величины остатков равно нулю: М(ε)=0n. Дисперсия остатков εiпостоянна для любого i (условие гомоскедастичности), остатки εiи εj при i≠j не коррелированы: М(εεТ)=σ2En. ε – нормально распределенный случайный вектор, т.е. εN(0n; σ2En). r(X) = m+1<n. Столбцы матрицы Х должны быть линейно независимыми (ранг матрицы Х максимальный, а число наблюдений n превосходит ранг матрицы). Модель (1), в которой зависимая переменная, остатки и объясняющие переменные удовлетворяют предпосылкам 1-5 называется классической нормальной линейной моделью множественной регрессии. Если не выполняется только предпосылка 4, то модель называется классической линейной моделью множественной регрессии (КЛММР). Согласно методу наименьших квадратов неизвестные параметры выбираются таким образом, чтобы сумма квадратов отклонений фактических значений от значений, найденных по уравнению регрессии, была минимальной: (Y-Xb)(Y-Xb)Т → min Решением этой задачи является вектор b = (XТX)-1XТY. Полученная оценка параметров модели должна быть несмещенной, состоятельной и эффективной, то есть иметь наименьшее рассеяние относительно оцениваемого параметра. По теореме Гаусса-Маркова при выполнении предпосылок регрессионного анализа оценка метода наименьших квадратов b = (XТX)-1XТY является наиболее эффективной, то есть обладает наименьшей дисперсией в классе линейных несмещенных оценок. Оценка адекватности модели множественной регрессии. Одной из наиболее эффективных оценок адекватности модели является коэффициент детерминации R2, определяемый формулой: . Коэффициент детерминации характеризует долю вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющих переменных. Чем ближе R2 к единице, тем лучше построенная регрессионная модель описывает зависимость между объясняющими и зависимой переменной. Следует иметь в виду, что при включении в модель новой объясняющей переменной, коэффициент детерминации увеличивается, хотя это и не обязательно означает улучшение качества регрессионной модели. В этой связи лучше использовать скорректированный (поправленный) коэффициент детерминации , рассчитываемый по формуле: , где n – число наблюдений, m – число параметров при переменных x. Из формулы следует, что с включением в модель дополнительных переменных разница между значениями и R2 увеличивается. Таким образом, скорректированный коэффициент детерминации может уменьшаться при добавлении в модель новой объясняющей переменной, не оказывающей существенного влияния на результативный признак. Но использование только коэффициента детерминации для выбора наилучшего уравнения регрессии может оказаться недостаточным. Средняя относительная ошибка аппроксимации рассчитывается по формуле: . Значимость уравнения регрессии в целом сводится к проверке гипотезы об одновременном равенстве нулю всех коэффициентов регрессии при факторных признаках, т.е. гипотезы: Н0: b1 = b2 =…= bm =0. Если данная гипотеза не отклоняется, то делается вывод о том, что совокупное влияние всех факторных признаков х1, х2,… хm, включенных в модель, на зависимую переменную y можно считать статистически несущественным. Проверка данной гипотезы осуществляется на основе дисперсионного анализа. Основной идеей дисперсионного анализа является разложение общей суммы квадратов отклонений результативной переменной y от среднего значения на «объясненную» и «остаточную»: .
Для приведения дисперсий к сопоставимому виду, определяют дисперсии на одну степень свободы. Результаты вычислений заносят в специальную таблицу дисперсионного анализа:
В данной таблице n – число наблюдений, m – число параметров при переменных x. Сравнивая полученные оценки объясненной и остаточной дисперсии на одну степень свободы, определяют значение F-критерия Фишера, используемого для оценки значимости уравнения регрессии: . С помощью F-критерия проверяется нулевая гипотеза о равенстве дисперсий Н0: sR2 = s2. Если нулевая гипотеза справедлива, то объясненная и остаточная дисперсии не отличаются друг от друга. Для того, чтобы уравнение регрессии было значимо в целом (гипотеза Н0 была опровергнута) необходимо, чтобы объясненная дисперсия превышала остаточную в несколько раз. Критическое значение F-критерия определяется по таблице Фишера-Снедекора. Расчетное значение сравнивается с табличным, и если оно превышает табличное (Fрасч >Fтабл), то гипотеза Н0отвергается, и уравнение регрессии признается значимым. Если Fрасч Расчетное значение F-критерия связано с коэффициентом детерминации R2 следующим соотношением: , где m – число параметров при переменных x; n – число наблюдений. Оценка значимости коэффициентов регрессии сводится к проверке гипотезы о равенстве нулю коэффициента регрессии при соответствующем факторном признаке, т.е. гипотезы: Н0: bj =0. Проверка гипотезы проводится с помощью t-критерия Стьюдента. Для этого определяется расчетное значение t-критерия: , где bj – коэффициент регрессии при xi; – средняя квадратическая ошибка коэффициента регрессииbj. сравнивается с табличным tтабл при заданном уровне значимости α и числе степеней свободы (n-2). Если расчетное значение превышает табличное, то гипотезу о несущественности коэффициента регрессии можно отклонить. Рассмотрим интерпретацию параметров модели линейной множественной регрессии. В линейной модели множественной регрессии =b0 + b1∙x1 + … + bm∙xm коэффициенты регрессии bj характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне. На практике часто бывает необходимо сравнить влияние на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии βjи коэффициенты эластичности Эj (j=1, 2, …, m). Уравнение регрессии в стандартизованной форме: , где , – стандартизованные переменные. В результате такого нормирования средние значения всех стандартизованных переменных равны нулю, а дисперсии равны единице, т.е. = =…= =0, = =…= =1. Коэффициенты «чистой» регрессии связаны со стандартизованными коэффициентами следующим соотношением: . Стандартизованные коэффициенты показывают, на сколько стандартных отклонений (сигм) изменится в среднем результат, если соответствующий фактор xi изменится на одно стандартное отклонение (одну сигму) при неизменном среднем уровне других факторов. Сравнивая стандартизованные коэффициенты друг с другом, можно ранжировать факторы по силе их воздействия на результат. Средние коэффициенты эластичности вычисляются по формуле: . Коэффициент эластичности показывает, на сколько процентов (от средней) изменится в среднем Y при увеличении только фактора Xj на 1%. Рассмотрим пример построения модели множественной регрессии с помощью средств приложения Microsoft Excel. Пример1. По данным, представленным в таблице 2, изучается зависимость балансовой прибыли предприятия торговли (тыс. руб.) от следующих факторов: - объем товарных запасов, тыс. руб.; - фонд оплаты труда, тыс. руб.; - издержки обращения, тыс. руб.; - объем продаж по безналичному расчету, тыс. руб. Таблица 2
Задание: Для заданного набора данных постройте линейную модель множественной регрессии. Оцените точность и адекватность построенного уравнения регрессии. Выделите значимые и незначимые факторы в модели. Постройте уравнение регрессии со статистически значимыми факторами. Дайте экономическую интерпретацию параметров модели. Решение. Для получения отчета по построению модели в среде EXCEL необходимо выполнить следующие действия: В меню Данные выбираем команду Анализ данных. На экране появится окно |