Разработка многофакторной модели цели изучения

Название	Разработка многофакторной модели цели изучения
Дата	01.04.2021
Размер	360.49 Kb.
Формат файла
Имя файла	R_ITOG_3_19 (1) (1).pptx
Тип	Документы #190497

РАЗРАБОТКА МНОГОФАКТОРНОЙ МОДЕЛИ

Цели изучения

Изучение зависимости изменения признака от окружающих факторов определяет основное содержание теории корреляции.

В этой связи основные цели изучения теории корреляции следует определить следующим образом:

– получить представление о последовательности задач (в виде этапов) в процессе разработки многофакторной эконометрической модели объекта исследования;

– знать состав основных требований, предъявляемых к отбору факторов, и последовательность операций в процессе многофакторного моделирования объекта анализа;

– уметь оценивать степень взаимозависимости исследуемой системы факторов на основе построения матрицы коэффициентов парной корреляции.

Основные вопросы

ЭТАПЫ РАЗРАБОТКИ МОДЕЛИ. – Изучение объекта исследования. Формирование перечня факторов, определяющих поведение объекта исследования. Выбор результирующего показателя. Анализ динамики факторов. Графическая интерпретация факторов. Описательная статистика. МАТРИЦА ПАРНЫХ КОРРЕЛЯЦИЙ. – Разработка сводной таблицы факторов. Матрица парных коэффициентов. Оценка коэффициентов корреляции. Последовательность анализа факторов. Оценка мультиколлинеарности. Исключение факторов. Алгоритм построения матрицы. ДИСПЕРСИОННЫЙ АНАЛИЗ. – Алгоритм регрессионного анализа эконометрической модели. Оценка показателей регрессионной статистики. Дисперсионный анализ – проверка значимости уравнения регрессии. Анализ коэффициентов уравнения регрессии. Прогнозирование результатов.

Разработка многофакторной эконометрической модели требует разрешения определенного круга задач (этапов):

– изучение объекта исследования на основе учебно-методических изданий, периодических источников и статистической информации. На основе обзора учебно-методической и научной литературы здесь представляется развернутая характеристика объекта исследования, его структура, тенденции развития.

– обоснование и составление перечня факторов, определяющих поведение объекта исследования.

Изучение особенностей и специфики объекта исследования позволяет перейти ко второму этапу – составлению перечня факторов, которые могут служить основой построения прогнозной модели.

– выбор результирующего показателя, характеризующего состояние объекта исследования. В качестве результирующего показателя выбирается обобщающий и наиболее

значимый параметр, характеризующий состояние объекта исследования.

– анализ динамики факторов (показателей) и оценка степени их влияния на результирующий показатель. Результаты обработки статистической информации по каждому фактору (показателю) в отдельности следует представить в табличной и графической форме. – разработка сводной таблицы показателей (признаков) в целях построения многофакторной корреляционно-регрессионной модели. В целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида – построение матрицы парных коэффициентов корреляции, характеризующих степень тесноты связи между отдельными признаками (факторами). Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции.

– отбор ключевых факторов с целью проведения многофакторного корреляционно-регрессионного анализа;

Отбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.

Анализ полученной матрицы осуществляется в два этапа.

Первый шаг – анализ коэффициентов, отражающих тесноту связи зависимой переменной (результативный признак) с каждым из факторов с целью исключения незначимых переменных. Второй шаг – анализ оставшихся столбцов матрицы с целью выявления мультиколлинеарности. – построение регрессионной таблицы для анализа выбранных признаков и зависимой переменной. На этом этапе необходимо, исключив факторы, для которых не соблюдаются приведенные выше условия, построить новую регрессионную таблицу. – разработка корреляционно-регрессионной модели изменения прогнозируемого показателя. Метод регрессии используется для анализа воздействия на отдельную зависимую переменную (результирующий показатель) значений независимых переменных (значимых факторов), что позволяет представить корреляционную связь между признаками в виде некоторой функциональной зависимости, называемой уравнением регрессии, или корреляционно-регрессионной моделью. – формирование и оценка результатов прогноза на основе ранее разработанной регрессионной модели. Полученная модель может использоваться для прогнозирования изменения государственных расходов при определенных факторных значениях. Оценивая изменения значений тех или иных факторов модели, можно спрогнозировать результативный признак.

Государственные расходы

Государственные расходы – это неотъемлемая часть финансовых отношений, обусловленная распределением доходов государства. Специфика государственных

расходов заключается в обеспечении потребностей общества в области развития экономики и социальной сферы и осуществления государственного управления.

Величину и структуру расходов федерального бюджета обусловливает целый ряд факторов: государственное устройство, внешняя и внутренняя политика, уровень экономики, благосостояние населения, размер государственного сектора в экономике и ряд других. В современных условиях в связи с проведением активной государственной политики неизбежно происходит значительное увеличение расходов.

Перечень факторов

В целях построения аналитическо-прогнозной модели динамики уровня государственных расходов следует сконцентрировать внимание на следующих факторах, определяющих уровень государственных расходов:

– динамика затрат на исследования в научной сфере;

– динамика государственных расходов на оборону;

– динамика рождаемости;

– динамика государственных доходов;

– динамика изменения уровня инфляции;

– динамика изменения цен за баррель нефти;

– динамика расходов государства на образование;

– динамика общего внешнего долга;

– динамика расходов государства на здравоохранение;

– динамика изменения курса доллара.

Матрица парных корреляций

В целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида Y=f(x1,x2,x3,…,xn).

Y– динамика изменения государственных расходов;

x1– динамика изменения затрат на НИОКР;

x2– динамика изменения расходов на оборону;

x3– динамика изменения рождаемости;

x4– динамика изменения доходов государства;

x5– динамика изменения инфляции;

x6– динамика изменения цен за баррель нефти;

x7– динамика изменения затрат на образование;

x8– динамика изменения внешнего долга;

x9– динамика затрат на здравоохранение;

x10– динамика изменения курса доллара.

Динамика факторов, в процентах к предыдущему году

Номер фактора	Период
	2005	2006	2007	…	2013	2014	2015
X1	117,75	125,14	128,49	…	107,12	113,06	117,15
X2	137,92	119,44	137,70	…	108,34	106,54	170,02
X3	96,90	102,76	107,51	…	100,26	102,43	102,07
X4	77,76	120,35	120,64	…	109,22	105,48	111,14
X5	92,93	82,49	131,89	…	97,95	176,26	81,87
X6	132,50	142,00	120,20	…	100,40	97,70	49,60
X7	42,10	129,26	129,50	…	112,60	105,43	176,63
X8	193,03	120,58	121,77	…	118,09	114,54	82,25
X9	129,15	104,37	136,99	…	101,52	109,26	107,34
X10	102,56	94,07	94,08	…	107,76	171,89	117,57

Динамика изменений выбранных факторов, оказывающих влияние на структуру государственных расходов, представлена в таблице. Динамика расходов по статьям противоречива. Наблюдается значительное сокращение средств на социальную сферу.

Динамика изменения государственных расходов, в процентах предыдущему году

Период
2005	2006	2007	2008	…	2012	2013	2014	2015
116,1	125,2	147,3	107,5	…	117,9	106,5	104,3	111,2

Особенность динамики и структуры бюджетных расходов заключается в том, что относительно устойчивый рост наблюдается в части позиций: обороноспособность, безопасность и правоохранительная деятельность, охрана окружающей среды и обслуживание государственного и муниципального долга.

Сводная таблица показателей

Период	Y	x1	x2	…	x9	x9	x10
2005	116,08	117,75	137,92	…	193,03	129,15	102,56
2006	125,16	125,14	119,44	…	120,58	104,37	94,07
2007	147,40	128,49	137,80	…	121,77	136,99	94,08
2008	107,51	116,17	118,12	…	148,28	115,42	101,19
2009	128,52	112,60	101,06	…	103,32	107,62	120,22
2010	109,55	107,83	103,42	…	97,19	103,61	102,66
2011	107,79	116,63	120,32	…	104,76	121,36	102,36
2012	117,91	114,64	114,76	…	110,32	118,12	94,34
2013	106,54	107,12	108,34	…	118,09	101,52	107,76
2014	104,28	113,06	106,54	…	114,54	109,26	171,89
2015	111,25	117,15	170,02	…	82,25	107,34	117,57

Для проведения многофакторного корреляционно-регрессионного анализа предлагается использовать ряд показателей в таблице.

Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции.

Матрица парных коэффициентов корреляции

	Y	x1	x2	x3	…	x7	x8	x9	x10
Y	1				…
x1	0,71	1			…
x2	0,17	0,50	1		…
x3	0,47	0,40	-0,03	1	…
x4	0,27	0,38	0,03	0,56	…
x5	-0,05	0,04	-0,15	0,34	…
x6	0,45	0,33	-0,37	0,09	…
x7	0,07	0,20	0,39	0,52	…	1
x8	0,04	0,21	0,04	-0,27	…	-0,76	1
x9	0,52	0,61	0,36	0,21	…	-0,30	0,50	1
x10	-0,38	-0,33	-0,18	-0,15	…	-0,02	-0,18	-0,30	1

Результат расчета парных коэффициентов корреляции между факторными признаками представлен в таблице.

В узлах матрицы находятся парные коэффициенты корреляции, характеризующие тесноту взаимосвязи между признаками (по горизонтали и по вертикали). Чем больше их абсолютная величина, тем большее влияние оказывает соответствующий факторный признак на результативный показатель.

ОТБОР ФАКТОРОВ

Отбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.

Иначе говоря, степень изолированного влияния анализируемого фактора на результативный признак, определяемая с помощью коэффициента парной корреляции ryxi – один из критериев включения факторов в модель.

В первую очередь отбираются факторы, удовлетворяющие условию ryxi > 0,5 (определяется эмпирически).

ОТБОР ФАКТОРОВ

Мультиколлинеарность – наличие сильной корреляции между независимыми переменными (тесная межфакторная корреляция признаков). В математическом аспекте мультиколлинеарность приводит к слабой обусловленности матрицы системы нормальных уравнений, т.е. близости ее определителя к нулю, а в содержательном аспекте – к искажению смысла коэффициентов регрессии и затруднению выявления наиболее существенно влияющих факторов. Считается, что две переменные линейно зависимы, если парный коэффициент корреляции между ними по абсолютной величине превышает 𝑟>0,8 (устанавливается эмпирически). В этой ситуации один из анализируемой

пары факторов следует исключить из модели.

Игровой пример

В рассматриваемом игровом примере (слайд 14) есть значения коэффициентов корреляции (в первом столбце матрицы), которые близки к нулю, поэтому следует взвесить возможность их исключения из дальнейшего анализа.

В полученной матрице значений парных коэффициентов корреляции (Слайд 14) представленное условие соблюдается, значит – предложенные факторы не дублируют дуг друга и достаточно независимы.

АЛГОРИТМ АНАЛИЗА КОРРЕЛЯЦИИ

1. Представить (записать) значения анализируемых переменных в книге EXCEL в виде столбцов.

2. Построить диаграммы рассевания с целью проверки зависимости между признаками.

Выбрать «Диаграммы» → «Точечная».

3. Выполнить: «Сервис» → «Анализ данных» → «Корреляция».

4. Отметить «Входной интервал»

5. Группирование – «по столбцам»;

6. Установить «галочку» в окне «Метки в первой строке», если исходные данные имеют шапку.

7. Указать, где должен быть размещен отчет – «Выходной интервал».

РАЗРАБОТКА МОДЕЛИ

Анализ качества модели регрессии базируется на основных положениях дисперсионного анализа: общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие – объясненную и не объясненную уравнением регрессии:
или упрощенная форма записи:

Анализ остатков

Регрессионная статистика

Показатель в формате EXCEL	Обозначение и наименование	Примечания и пояснения
Множественный R	– множественный коэффициент корреляции	Оценивает связь между факторами
R-квадрат	– коэффициент детерминации	Отражает, какая доля вариации результативного признака учтена в модели
Нормированный R-квадрат		Отражает квадрат или скорректированный коэффициент детерминации.
Стандартная ошибка		Отражает среднеквадратическое отклонение от модели
Наблюдения	n	Отражает количество наблюдений

Первая таблица в отчете EXCEL – регрессионная статистика.

С целью снижения влияния количества переменных (с учетом числа независимых переменных и размером выборки) определяется нормированный R квадрат или скорректированный коэффициент детерминации.

Пример регрессионного анализа

Для расчета параметров a и b линейной регрессии y=a+b·x решаем систему нормальных уравнений относительно а и b:

	y	x	yx	x2	y2	yx	y-yx	Ai
l	68,8	45,1	3102,88	2034,01	4733,44	61,3	7,5	10,9
2	61,2	59,0	3610,80	3481,00	3745,44	56,5	4,7	7,7
3	59,9	57,2	3426,28	3271,84	3588,01	57,1	2,8	4,7
4	56,7	61,8	3504,06	3819,24	3214,89	55,5	1,2	2,1
5	55,0	58,8	3234,00	3457,44	3025,00	56,5	-1,5	2,7
6	54,3	47,2	2562,96	2227,84	2948,49	60,5	-6,2	11,4
7	49,3	55,2	2721,36	3047,04	2430,49	57,8	-8,5	17,2
Итого	405,2	384,3	22162,34	21338,41	23685,76	405,2	0,0	56,7
Ср. знач. (Итого/n)	57,89 y	54,90 x	3166,05 x·y	3048,34 x²	3383,68 y²	X	X	8,1
s	5,74	5,86	X	X	X	X	X	X
s2	32,92	34,34	X	X	X	X	X	X

По исходным данным рассчитываем ∑y, ∑x, ∑y·x, ∑x², ∑y²:

Пример регрессионного анализа

Рассчитаем С иb: C=Y-b·X = 1.7605+0.298·1.7370 = 2.278126 Получим линейное уравнение: Y=2.278-0.298·X Выполнив его потенцирование, получим: y=102.278·x-0.298 Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата уx. По ним рассчитаем показатели: тесноты связи - индекс корреляции pxy и среднюю ошибку аппроксимации A.

Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.

Анализ качества модели основан на оценке коэффициента детерминации

Коэффициент детерминацииотражает долю вариации результативного признака, находящегося под влиянием изучаемых факторов, иными словами, определяет, какая доля вариации результативного признака учтена в модели и обусловлена влиянием на него факторов, включенных в модель.
Чем R^2 (ближе к единице), тем выше качество модели.

МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Мера линейной зависимости между переменной (у) и факторами – множественный коэффициент корреляции:

Нормированный R-квадрат или скорректированный коэффициент детерминации

Стандартное отклонение для остатков как стандартная ошибка:

Дисперсионный анализ

Объясненная регрессией сумма квадратов отклонений:

Необъясненная регрессией сумма квадратов отклонений:

Общая сумма квадратов:

Таблица дисперсионного анализа

Оценка значимости уравнения регрессии определяется по значению F-распределения:

Уравнение регрессии значимо на уровне , если расчетное значение больше критического (табличного значения).

Табличное значение критерия можно найти с помощью функции

«FРАСПОБР» или «F.ОБР.ПХ».

Пример дисперсионного анализа

N	П1	П2	П3	П4
1	145	210	195	155
2	140	200	190	150
3	150	190	240	180
4	190	195	210	175
x	156.25	198.75	208.75	165

Процедура дисперсионного анализа.

Находим групповые средние:

Если fнабл>fкр, то фактор оказывает существенное воздействие и его следует учитывать, в противном случае он оказывает незначительное

влияние, которым можно пренебречь. Для расчета Rнабл и Rф могут быть использованы также формулы:

(

Пример дисперсионного анализа

Общая средняя: Rобщ = 99225 + 158225 + 175825 + 109550 - 4 • 4 • 182.192 = 11748.44 Находим Rф по формуле (5): Rф = 4(156.252 + 198.752 + 208.752 + 1652) - 4 • 182.192 = 7792.19 Получаем Rост: Rост = Rобщ - Rф = 11748.44 - 7792.19 = 3956.25 Определяем факторную и остаточную дисперсии:

N	П21	П22	П23	П24
1	21025	44100	38025	24025
2	19600	40000	36100	22500
3	22500	36100	57600	32400
4	36100	38025	44100	30625
∑	99225	158225	175825	109550

Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант:

Для расчета R общ. составляем таблицу:

АНАЛИЗ КОЭФФИЦИЕНТОВ РЕГРЕССИИ

Третья таблица содержит оценки параметров уравнения регрессии.

1. Коэффициенты уравнения регрессии.

2. Величина стандартной ошибки коэффициентов уравнения регрессии.

3. t-статистика – расчетные значения t-критерия, необходимые для проверки значимости коэффициентов регрессии.

4. P-значение – оценка уровня значимости, который соответствует t-статистике.

Если P-значение меньше стандартного уровня значимости, то соответствующий коэффициент статистически значим.

Если значение t-статистики – велико, а соответствующая величина P-значения меньше 0,05, то можно считать, что коэффициент регрессии значим.

В противном случае, если значение t-статистики – мало, а соответствующая величина P-значения выше 0,05, то коэффициент считается незначимым.

5. Нижние (Верхние) 95% – границы доверительных интервалов для коэффициентов уравнения регрессии.

Качество регрессионной модели обусловливает адекватность уравнения эмпирическим (полученным в ходе наблюдений) данным.

Пример анализа коэффициентов регрессии

Рассчитать среднее арифметическое, стандартное отклонение и количество человек в каждой группе.

Вычисляем эмпирическое значения по формуле t-критерия Стьюдента для независимых выборок

Вычисляем степени свободы.

Определяем по таблице критических значений t-Стьюдента уровень значимости.

Значение 6,09 больше чем значение 3,473 следовательно уровень значимости меньше 0,001

Если уровень значимости меньше 0,05 делается вывод о наличи различий между группами.

Результат корреляционно-регрессионного анализа

Результат корреляционно-регрессионного анализа – определение значений коэффициентов.

На основе полученного ряда коэффициентов можно составить уравнение регрессии.