Разработка многофакторной модели цели изучения
Скачать 360.49 Kb.
|
РАЗРАБОТКА МНОГОФАКТОРНОЙ МОДЕЛИЦели изученияИзучение зависимости изменения признака от окружающих факторов определяет основное содержание теории корреляции.В этой связи основные цели изучения теории корреляции следует определить следующим образом:– получить представление о последовательности задач (в виде этапов) в процессе разработки многофакторной эконометрической модели объекта исследования;– знать состав основных требований, предъявляемых к отбору факторов, и последовательность операций в процессе многофакторного моделирования объекта анализа;– уметь оценивать степень взаимозависимости исследуемой системы факторов на основе построения матрицы коэффициентов парной корреляции.Основные вопросыЭТАПЫ РАЗРАБОТКИ МОДЕЛИ. – Изучение объекта исследования. Формирование перечня факторов, определяющих поведение объекта исследования. Выбор результирующего показателя. Анализ динамики факторов. Графическая интерпретация факторов. Описательная статистика. МАТРИЦА ПАРНЫХ КОРРЕЛЯЦИЙ. – Разработка сводной таблицы факторов. Матрица парных коэффициентов. Оценка коэффициентов корреляции. Последовательность анализа факторов. Оценка мультиколлинеарности. Исключение факторов. Алгоритм построения матрицы. ДИСПЕРСИОННЫЙ АНАЛИЗ. – Алгоритм регрессионного анализа эконометрической модели. Оценка показателей регрессионной статистики. Дисперсионный анализ – проверка значимости уравнения регрессии. Анализ коэффициентов уравнения регрессии. Прогнозирование результатов.Разработка многофакторной эконометрической модели требует разрешения определенного круга задач (этапов):– изучение объекта исследования на основе учебно-методических изданий, периодических источников и статистической информации. На основе обзора учебно-методической и научной литературы здесь представляется развернутая характеристика объекта исследования, его структура, тенденции развития.– обоснование и составление перечня факторов, определяющих поведение объекта исследования.Изучение особенностей и специфики объекта исследования позволяет перейти ко второму этапу – составлению перечня факторов, которые могут служить основой построения прогнозной модели.– выбор результирующего показателя, характеризующего состояние объекта исследования. В качестве результирующего показателя выбирается обобщающий и наиболеезначимый параметр, характеризующий состояние объекта исследования.– анализ динамики факторов (показателей) и оценка степени их влияния на результирующий показатель. Результаты обработки статистической информации по каждому фактору (показателю) в отдельности следует представить в табличной и графической форме. – разработка сводной таблицы показателей (признаков) в целях построения многофакторной корреляционно-регрессионной модели. В целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида – построение матрицы парных коэффициентов корреляции, характеризующих степень тесноты связи между отдельными признаками (факторами). Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции.– отбор ключевых факторов с целью проведения многофакторного корреляционно-регрессионного анализа;Отбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.Анализ полученной матрицы осуществляется в два этапа.Первый шаг – анализ коэффициентов, отражающих тесноту связи зависимой переменной (результативный признак) с каждым из факторов с целью исключения незначимых переменных. Второй шаг – анализ оставшихся столбцов матрицы с целью выявления мультиколлинеарности. – построение регрессионной таблицы для анализа выбранных признаков и зависимой переменной. На этом этапе необходимо, исключив факторы, для которых не соблюдаются приведенные выше условия, построить новую регрессионную таблицу. – разработка корреляционно-регрессионной модели изменения прогнозируемого показателя. Метод регрессии используется для анализа воздействия на отдельную зависимую переменную (результирующий показатель) значений независимых переменных (значимых факторов), что позволяет представить корреляционную связь между признаками в виде некоторой функциональной зависимости, называемой уравнением регрессии, или корреляционно-регрессионной моделью. – формирование и оценка результатов прогноза на основе ранее разработанной регрессионной модели. Полученная модель может использоваться для прогнозирования изменения государственных расходов при определенных факторных значениях. Оценивая изменения значений тех или иных факторов модели, можно спрогнозировать результативный признак.Государственные расходыГосударственные расходы – это неотъемлемая часть финансовых отношений, обусловленная распределением доходов государства. Специфика государственныхрасходов заключается в обеспечении потребностей общества в области развития экономики и социальной сферы и осуществления государственного управления.Величину и структуру расходов федерального бюджета обусловливает целый ряд факторов: государственное устройство, внешняя и внутренняя политика, уровень экономики, благосостояние населения, размер государственного сектора в экономике и ряд других. В современных условиях в связи с проведением активной государственной политики неизбежно происходит значительное увеличение расходов.Перечень факторовВ целях построения аналитическо-прогнозной модели динамики уровня государственных расходов следует сконцентрировать внимание на следующих факторах, определяющих уровень государственных расходов:– динамика затрат на исследования в научной сфере;– динамика государственных расходов на оборону;– динамика рождаемости;– динамика государственных доходов;– динамика изменения уровня инфляции;– динамика изменения цен за баррель нефти;– динамика расходов государства на образование;– динамика общего внешнего долга;– динамика расходов государства на здравоохранение;– динамика изменения курса доллара.Матрица парных корреляцийВ целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида Y=f(x1,x2,x3,…,xn).Y– динамика изменения государственных расходов;x1– динамика изменения затрат на НИОКР;x2– динамика изменения расходов на оборону;x3– динамика изменения рождаемости;x4– динамика изменения доходов государства;x5– динамика изменения инфляции;x6– динамика изменения цен за баррель нефти;x7– динамика изменения затрат на образование;x8– динамика изменения внешнего долга;x9– динамика затрат на здравоохранение;x10– динамика изменения курса доллара.Динамика факторов, в процентах к предыдущему году
Динамика изменений выбранных факторов, оказывающих влияние на структуру государственных расходов, представлена в таблице. Динамика расходов по статьям противоречива. Наблюдается значительное сокращение средств на социальную сферу. Динамика изменения государственных расходов, в процентах предыдущему году
Особенность динамики и структуры бюджетных расходов заключается в том, что относительно устойчивый рост наблюдается в части позиций: обороноспособность, безопасность и правоохранительная деятельность, охрана окружающей среды и обслуживание государственного и муниципального долга. Сводная таблица показателей
Для проведения многофакторного корреляционно-регрессионного анализа предлагается использовать ряд показателей в таблице. Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции. Матрица парных коэффициентов корреляции
Результат расчета парных коэффициентов корреляции между факторными признаками представлен в таблице. В узлах матрицы находятся парные коэффициенты корреляции, характеризующие тесноту взаимосвязи между признаками (по горизонтали и по вертикали). Чем больше их абсолютная величина, тем большее влияние оказывает соответствующий факторный признак на результативный показатель. ОТБОР ФАКТОРОВОтбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.Иначе говоря, степень изолированного влияния анализируемого фактора на результативный признак, определяемая с помощью коэффициента парной корреляции ryxi – один из критериев включения факторов в модель.В первую очередь отбираются факторы, удовлетворяющие условию ryxi > 0,5 (определяется эмпирически).ОТБОР ФАКТОРОВМультиколлинеарность – наличие сильной корреляции между независимыми переменными (тесная межфакторная корреляция признаков). В математическом аспекте мультиколлинеарность приводит к слабой обусловленности матрицы системы нормальных уравнений, т.е. близости ее определителя к нулю, а в содержательном аспекте – к искажению смысла коэффициентов регрессии и затруднению выявления наиболее существенно влияющих факторов. Считается, что две переменные линейно зависимы, если парный коэффициент корреляции между ними по абсолютной величине превышает 𝑟>0,8 (устанавливается эмпирически). В этой ситуации один из анализируемойпары факторов следует исключить из модели.Игровой примерВ рассматриваемом игровом примере (слайд 14) есть значения коэффициентов корреляции (в первом столбце матрицы), которые близки к нулю, поэтому следует взвесить возможность их исключения из дальнейшего анализа.В полученной матрице значений парных коэффициентов корреляции (Слайд 14) представленное условие соблюдается, значит – предложенные факторы не дублируют дуг друга и достаточно независимы.АЛГОРИТМ АНАЛИЗА КОРРЕЛЯЦИИ1. Представить (записать) значения анализируемых переменных в книге EXCEL в виде столбцов.2. Построить диаграммы рассевания с целью проверки зависимости между признаками.Выбрать «Диаграммы» → «Точечная».3. Выполнить: «Сервис» → «Анализ данных» → «Корреляция».4. Отметить «Входной интервал»5. Группирование – «по столбцам»;6. Установить «галочку» в окне «Метки в первой строке», если исходные данные имеют шапку.7. Указать, где должен быть размещен отчет – «Выходной интервал».РАЗРАБОТКА МОДЕЛИАнализ качества модели регрессии базируется на основных положениях дисперсионного анализа: общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие – объясненную и не объясненную уравнением регрессии:или упрощенная форма записи: Анализ остатковАнализ качества модели регрессии базируется на основных положениях дисперсионного анализа: общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие – объясненную и не объясненную уравнением регрессии представленным в таблице Регрессионная статистика
Первая таблица в отчете EXCEL – регрессионная статистика. С целью снижения влияния количества переменных (с учетом числа независимых переменных и размером выборки) определяется нормированный R квадрат или скорректированный коэффициент детерминации. Пример регрессионного анализа
По исходным данным рассчитываем ∑y, ∑x, ∑y·x, ∑x², ∑y²: Пример регрессионного анализаРассчитаем С иb: C=Y-b·X = 1.7605+0.298·1.7370 = 2.278126 Получим линейное уравнение: Y=2.278-0.298·X Выполнив его потенцирование, получим: y=102.278·x-0.298 Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата уx. По ним рассчитаем показатели: тесноты связи - индекс корреляции pxy и среднюю ошибку аппроксимации A.Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.Анализ качества модели основан на оценке коэффициента детерминации
МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Нормированный R-квадрат или скорректированный коэффициент детерминации
Дисперсионный анализ
Объясненная регрессией сумма квадратов отклонений: Необъясненная регрессией сумма квадратов отклонений: Общая сумма квадратов: Таблица дисперсионного анализаОценка значимости уравнения регрессии определяется по значению F-распределения: Уравнение регрессии значимо на уровне , если расчетное значение больше критического (табличного значения). Табличное значение критерия можно найти с помощью функции «FРАСПОБР» или «F.ОБР.ПХ». Пример дисперсионного анализа
Процедура дисперсионного анализа. Находим групповые средние: Если fнабл>fкр, то фактор оказывает существенное воздействие и его следует учитывать, в противном случае он оказывает незначительное влияние, которым можно пренебречь. Для расчета Rнабл и Rф могут быть использованы также формулы: ( Пример дисперсионного анализа
Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант: Для расчета R общ. составляем таблицу: АНАЛИЗ КОЭФФИЦИЕНТОВ РЕГРЕССИИТретья таблица содержит оценки параметров уравнения регрессии.1. Коэффициенты уравнения регрессии.2. Величина стандартной ошибки коэффициентов уравнения регрессии.3. t-статистика – расчетные значения t-критерия, необходимые для проверки значимости коэффициентов регрессии.4. P-значение – оценка уровня значимости, который соответствует t-статистике.Если P-значение меньше стандартного уровня значимости, то соответствующий коэффициент статистически значим.Если значение t-статистики – велико, а соответствующая величина P-значения меньше 0,05, то можно считать, что коэффициент регрессии значим.В противном случае, если значение t-статистики – мало, а соответствующая величина P-значения выше 0,05, то коэффициент считается незначимым.5. Нижние (Верхние) 95% – границы доверительных интервалов для коэффициентов уравнения регрессии.Качество регрессионной модели обусловливает адекватность уравнения эмпирическим (полученным в ходе наблюдений) данным.Пример анализа коэффициентов регрессииРассчитать среднее арифметическое, стандартное отклонение и количество человек в каждой группе.Вычисляем эмпирическое значения по формуле t-критерия Стьюдента для независимых выборокВычисляем степени свободы.Определяем по таблице критических значений t-Стьюдента уровень значимости.Значение 6,09 больше чем значение 3,473 следовательно уровень значимости меньше 0,001Если уровень значимости меньше 0,05 делается вывод о наличи различий между группами.Результат корреляционно-регрессионного анализаРезультат корреляционно-регрессионного анализа – определение значений коэффициентов. На основе полученного ряда коэффициентов можно составить уравнение регрессии. ОЦЕНКА РЕЗУЛЬТАТОВ |