Главная страница
Навигация по странице:

  • Матрица парных корреляций

  • Динамика факторов, в процентах к предыдущему году

  • Динамика изменения государственных расходов, в процентах предыдущему году

  • Сводная таблица показателей

  • Матрица парных коэффициентов корреляции

  • Регрессионная статистика

  • Пример регрессионного анализа

  • Анализ качества модели основан на оценке коэффициента детерминации

  • Таблица дисперсионного анализа

  • Пример дисперсионного анализа

  • Процедура дисперсионного анализа

  • АНАЛИЗ КОЭФФИЦИЕНТОВ РЕГРЕССИИ

  • Результат корреляционно-регрессионного анализа

  • Разработка многофакторной модели цели изучения


    Скачать 360.49 Kb.
    НазваниеРазработка многофакторной модели цели изучения
    Дата01.04.2021
    Размер360.49 Kb.
    Формат файлаpptx
    Имя файлаR_ITOG_3_19 (1) (1).pptx
    ТипДокументы
    #190497

    РАЗРАБОТКА МНОГОФАКТОРНОЙ МОДЕЛИ

    Цели изучения

    Изучение зависимости изменения признака от окружающих факторов определяет основное содержание теории корреляции.

    В этой связи основные цели изучения теории корреляции следует определить следующим образом:

    – получить представление о последовательности задач (в виде этапов) в процессе разработки многофакторной эконометрической модели объекта исследования;

    – знать состав основных требований, предъявляемых к отбору факторов, и последовательность операций в процессе многофакторного моделирования объекта анализа;

    – уметь оценивать степень взаимозависимости исследуемой системы факторов на основе построения матрицы коэффициентов парной корреляции.

    Основные вопросы

    ЭТАПЫ РАЗРАБОТКИ МОДЕЛИ. – Изучение объекта исследования. Формирование перечня факторов, определяющих поведение объекта исследования. Выбор результирующего показателя. Анализ динамики факторов. Графическая интерпретация факторов. Описательная статистика. МАТРИЦА ПАРНЫХ КОРРЕЛЯЦИЙ. – Разработка сводной таблицы факторов. Матрица парных коэффициентов. Оценка коэффициентов корреляции. Последовательность анализа факторов. Оценка мультиколлинеарности. Исключение факторов. Алгоритм построения матрицы. ДИСПЕРСИОННЫЙ АНАЛИЗ. – Алгоритм регрессионного анализа эконометрической модели. Оценка показателей регрессионной статистики. Дисперсионный анализ – проверка значимости уравнения регрессии. Анализ коэффициентов уравнения регрессии. Прогнозирование результатов.

    Разработка многофакторной эконометрической модели требует разрешения определенного круга задач (этапов):

    – изучение объекта исследования на основе учебно-методических изданий, периодических источников и статистической информации. На основе обзора учебно-методической и научной литературы здесь представляется развернутая характеристика объекта исследования, его структура, тенденции развития.

    – обоснование и составление перечня факторов, определяющих поведение объекта исследования.

    Изучение особенностей и специфики объекта исследования позволяет перейти ко второму этапу – составлению перечня факторов, которые могут служить основой построения прогнозной модели.

    – выбор результирующего показателя, характеризующего состояние объекта исследования. В качестве результирующего показателя выбирается обобщающий и наиболее

    значимый параметр, характеризующий состояние объекта исследования.

    – анализ динамики факторов (показателей) и оценка степени их влияния на результирующий показатель. Результаты обработки статистической информации по каждому фактору (показателю) в отдельности следует представить в табличной и графической форме. – разработка сводной таблицы показателей (признаков) в целях построения многофакторной корреляционно-регрессионной модели. В целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида – построение матрицы парных коэффициентов корреляции, характеризующих степень тесноты связи между отдельными признаками (факторами). Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции.

    – отбор ключевых факторов с целью проведения многофакторного корреляционно-регрессионного анализа;

    Отбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.

    Анализ полученной матрицы осуществляется в два этапа.

    Первый шаг – анализ коэффициентов, отражающих тесноту связи зависимой переменной (результативный признак) с каждым из факторов с целью исключения незначимых переменных. Второй шаг – анализ оставшихся столбцов матрицы с целью выявления мультиколлинеарности. – построение регрессионной таблицы для анализа выбранных признаков и зависимой переменной. На этом этапе необходимо, исключив факторы, для которых не соблюдаются приведенные выше условия, построить новую регрессионную таблицу. – разработка корреляционно-регрессионной модели изменения прогнозируемого показателя. Метод регрессии используется для анализа воздействия на отдельную зависимую переменную (результирующий показатель) значений независимых переменных (значимых факторов), что позволяет представить корреляционную связь между признаками в виде некоторой функциональной зависимости, называемой уравнением регрессии, или корреляционно-регрессионной моделью. – формирование и оценка результатов прогноза на основе ранее разработанной регрессионной модели. Полученная модель может использоваться для прогнозирования изменения государственных расходов при определенных факторных значениях. Оценивая изменения значений тех или иных факторов модели, можно спрогнозировать результативный признак.

    Государственные расходы

    Государственные расходы – это неотъемлемая часть финансовых отношений, обусловленная распределением доходов государства. Специфика государственных

    расходов заключается в обеспечении потребностей общества в области развития экономики и социальной сферы и осуществления государственного управления.

    Величину и структуру расходов федерального бюджета обусловливает целый ряд факторов: государственное устройство, внешняя и внутренняя политика, уровень экономики, благосостояние населения, размер государственного сектора в экономике и ряд других. В современных условиях в связи с проведением активной государственной политики неизбежно происходит значительное увеличение расходов.

    Перечень факторов

    В целях построения аналитическо-прогнозной модели динамики уровня государственных расходов следует сконцентрировать внимание на следующих факторах, определяющих уровень государственных расходов:

    – динамика затрат на исследования в научной сфере;

    – динамика государственных расходов на оборону;

    – динамика рождаемости;

    – динамика государственных доходов;

    – динамика изменения уровня инфляции;

    – динамика изменения цен за баррель нефти;

    – динамика расходов государства на образование;

    – динамика общего внешнего долга;

    – динамика расходов государства на здравоохранение;

    – динамика изменения курса доллара.

    Матрица парных корреляций

    В целях проведения многофакторного анализа необходимо перейти к функциональной зависимости вида Y=f(x1,x2,x3,…,xn).

    Y– динамика изменения государственных расходов;

    x1– динамика изменения затрат на НИОКР;

    x2– динамика изменения расходов на оборону;

    x3– динамика изменения рождаемости;

    x4– динамика изменения доходов государства;

    x5– динамика изменения инфляции;

    x6– динамика изменения цен за баррель нефти;

    x7– динамика изменения затрат на образование;

    x8– динамика изменения внешнего долга;

    x9– динамика затрат на здравоохранение;

    x10– динамика изменения курса доллара.

    Динамика факторов, в процентах к предыдущему году


    Номер фактора

    Период

    2005

    2006

    2007



    2013

    2014

    2015

    X1

    117,75

    125,14

    128,49



    107,12

    113,06

    117,15

    X2

    137,92

    119,44

    137,70



    108,34

    106,54

    170,02

    X3

    96,90

    102,76

    107,51



    100,26

    102,43

    102,07

    X4

    77,76

    120,35

    120,64



    109,22

    105,48

    111,14

    X5

    92,93

    82,49

    131,89



    97,95

    176,26

    81,87

    X6

    132,50

    142,00

    120,20



    100,40

    97,70

    49,60

    X7

    42,10

    129,26

    129,50



    112,60

    105,43

    176,63

    X8

    193,03

    120,58

    121,77



    118,09

    114,54

    82,25

    X9

    129,15

    104,37

    136,99



    101,52

    109,26

    107,34

    X10

    102,56

    94,07

    94,08



    107,76

    171,89

    117,57

    Динамика изменений выбранных факторов, оказывающих влияние на структуру государственных расходов, представлена в таблице. Динамика расходов по статьям противоречива. Наблюдается значительное сокращение средств на социальную сферу.

    Динамика изменения государственных расходов, в процентах предыдущему году


    Период

    2005

    2006

    2007

    2008



    2012

    2013

    2014

    2015

    116,1

    125,2

    147,3

    107,5



    117,9

    106,5

    104,3

    111,2

    Особенность динамики и структуры бюджетных расходов заключается в том, что относительно устойчивый рост наблюдается в части позиций: обороноспособность, безопасность и правоохранительная деятельность, охрана окружающей среды и обслуживание государственного и муниципального долга.

    Сводная таблица показателей


    Период

    Y

    x1

    x2



    x9

    x9

    x10

    2005

    116,08

    117,75

    137,92



    193,03

    129,15

    102,56

    2006

    125,16

    125,14

    119,44



    120,58

    104,37

    94,07

    2007

    147,40

    128,49

    137,80



    121,77

    136,99

    94,08

    2008

    107,51

    116,17

    118,12



    148,28

    115,42

    101,19

    2009

    128,52

    112,60

    101,06



    103,32

    107,62

    120,22

    2010

    109,55

    107,83

    103,42



    97,19

    103,61

    102,66

    2011

    107,79

    116,63

    120,32



    104,76

    121,36

    102,36

    2012

    117,91

    114,64

    114,76



    110,32

    118,12

    94,34

    2013

    106,54

    107,12

    108,34



    118,09

    101,52

    107,76

    2014

    104,28

    113,06

    106,54



    114,54

    109,26

    171,89

    2015

    111,25

    117,15

    170,02



    82,25

    107,34

    117,57

    Для проведения многофакторного корреляционно-регрессионного анализа предлагается использовать ряд показателей в таблице.

    Один из подходов к отбору факторов основан на анализе матрицы коэффициентов парной корреляции.

    Матрица парных коэффициентов корреляции


     

    Y

    x1

    x2

    x3



    x7

    x8

    x9

    x10

    Y

    1



    x1

    0,71

    1



    x2

    0,17

    0,50

    1



    x3

    0,47

    0,40

    -0,03

    1



    x4

    0,27

    0,38

    0,03

    0,56



    x5

    -0,05

    0,04

    -0,15

    0,34



    x6

    0,45

    0,33

    -0,37

    0,09



    x7

    0,07

    0,20

    0,39

    0,52



    1

    x8

    0,04

    0,21

    0,04

    -0,27



    -0,76

    1

    x9

    0,52

    0,61

    0,36

    0,21



    -0,30

    0,50

    1

    x10

    -0,38

    -0,33

    -0,18

    -0,15



    -0,02

    -0,18

    -0,30

    1

    Результат расчета парных коэффициентов корреляции между факторными признаками представлен в таблице.

    В узлах матрицы находятся парные коэффициенты корреляции, характеризующие тесноту взаимосвязи между признаками (по горизонтали и по вертикали). Чем больше их абсолютная величина, тем большее влияние оказывает соответствующий факторный признак на результативный показатель.

    ОТБОР ФАКТОРОВ

    Отбор факторов, которые включаются в уравнение регрессии, – один из важнейших этапов построения модели регрессии.

    Иначе говоря, степень изолированного влияния анализируемого фактора на результативный признак, определяемая с помощью коэффициента парной корреляции ryxi – один из критериев включения факторов в модель.

    В первую очередь отбираются факторы, удовлетворяющие условию ryxi > 0,5 (определяется эмпирически).

    ОТБОР ФАКТОРОВ

    Мультиколлинеарность – наличие сильной корреляции между независимыми переменными (тесная межфакторная корреляция признаков). В математическом аспекте мультиколлинеарность приводит к слабой обусловленности матрицы системы нормальных уравнений, т.е. близости ее определителя к нулю, а в содержательном аспекте – к искажению смысла коэффициентов регрессии и затруднению выявления наиболее существенно влияющих факторов. Считается, что две переменные линейно зависимы, если парный коэффициент корреляции между ними по абсолютной величине превышает 𝑟>0,8 (устанавливается эмпирически). В этой ситуации один из анализируемой

    пары факторов следует исключить из модели.

    Игровой пример

    В рассматриваемом игровом примере (слайд 14) есть значения коэффициентов корреляции (в первом столбце матрицы), которые близки к нулю, поэтому следует взвесить возможность их исключения из дальнейшего анализа.

    В полученной матрице значений парных коэффициентов корреляции (Слайд 14) представленное условие соблюдается, значит – предложенные факторы не дублируют дуг друга и достаточно независимы.

    АЛГОРИТМ АНАЛИЗА КОРРЕЛЯЦИИ

    1. Представить (записать) значения анализируемых переменных в книге EXCEL в виде столбцов.

    2. Построить диаграммы рассевания с целью проверки зависимости между признаками.

    Выбрать «Диаграммы» → «Точечная».

    3. Выполнить: «Сервис» → «Анализ данных» → «Корреляция».

    4. Отметить «Входной интервал»

    5. Группирование – «по столбцам»;

    6. Установить «галочку» в окне «Метки в первой строке», если исходные данные имеют шапку.

    7. Указать, где должен быть размещен отчет – «Выходной интервал».

    РАЗРАБОТКА МОДЕЛИ

    Анализ качества модели регрессии базируется на основных положениях дисперсионного анализа: общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие – объясненную и не объясненную уравнением регрессии:
    или упрощенная форма записи:

    Анализ остатков


    Анализ качества модели регрессии базируется на основных положениях дисперсионного анализа: общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие – объясненную и не объясненную уравнением регрессии представленным в таблице

    Регрессионная статистика


    Показатель в формате EXCEL

    Обозначение и наименование

    Примечания и пояснения

    Множественный R

    – множественный коэффициент корреляции

    Оценивает связь между факторами

    R-квадрат

    – коэффициент детерминации

    Отражает, какая доля вариации результативного признака учтена в модели

    Нормированный R-квадрат

    Отражает квадрат или скорректированный коэффициент детерминации.

    Стандартная ошибка



    Отражает среднеквадратическое отклонение от модели

    Наблюдения

    n

    Отражает количество наблюдений

    Первая таблица в отчете EXCEL – регрессионная статистика.

    С целью снижения влияния количества переменных (с учетом числа независимых переменных и размером выборки) определяется нормированный R квадрат или скорректированный коэффициент детерминации.

    Пример регрессионного анализа

    • Для расчета параметров a и b линейной регрессии y=a+b·x  решаем систему нормальных уравнений относительно а и b: 

    y

    x

    yx

    x2

    y2

    yx

    y-yx

    Ai

    l

    68,8

    45,1

    3102,88

    2034,01

    4733,44

    61,3

    7,5

    10,9

    2

    61,2

    59,0

    3610,80

    3481,00

    3745,44

    56,5

    4,7

    7,7

    3

    59,9

    57,2

    3426,28

    3271,84

    3588,01

    57,1

    2,8

    4,7

    4

    56,7

    61,8

    3504,06

    3819,24

    3214,89

    55,5

    1,2

    2,1

    5

    55,0

    58,8

    3234,00

    3457,44

    3025,00

    56,5

    -1,5

    2,7

    6

    54,3

    47,2

    2562,96

    2227,84

    2948,49

    60,5

    -6,2

    11,4

    7

    49,3

    55,2

    2721,36

    3047,04

    2430,49

    57,8

    -8,5

    17,2

    Итого

    405,2

    384,3

    22162,34

    21338,41

    23685,76

    405,2

    0,0

    56,7

    Ср. знач. (Итого/n)

    57,89 y

    54,90 x

    3166,05 x·y

    3048,34 x²

    3383,68 y²

    X

    X

    8,1

    s

    5,74

    5,86

    X

    X

    X

    X

    X

    X

    s2

    32,92

    34,34

    X

    X

    X

    X

    X

    X

    По исходным данным рассчитываем ∑y, ∑x, ∑y·x, ∑x², ∑y²:


    Пример регрессионного анализа

    Рассчитаем С иb: C=Y-b·X = 1.7605+0.298·1.7370 = 2.278126 Получим линейное уравнение: Y=2.278-0.298·X Выполнив его потенцирование, получим: y=102.278·x-0.298 Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата уx. По ним рассчитаем показатели: тесноты связи - индекс корреляции pxy и среднюю ошибку аппроксимации A.

    Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.

    Анализ качества модели основан на оценке коэффициента детерминации

    • Коэффициент детерминацииотражает долю вариации результативного признака, находящегося под влиянием изучаемых факторов, иными словами, определяет, какая доля вариации результативного признака учтена в модели и обусловлена влиянием на него факторов, включенных в модель.
    • Чем R^2 (ближе к единице), тем выше качество модели.

    МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

    • Мера линейной зависимости между переменной (у) и факторами – множественный коэффициент корреляции:

    Нормированный R-квадрат или скорректированный коэффициент детерминации

    • Стандартное отклонение для остатков как стандартная ошибка:

    Дисперсионный анализ








    Объясненная регрессией сумма квадратов отклонений:

    Необъясненная регрессией сумма квадратов отклонений:

    Общая сумма квадратов:

    Таблица дисперсионного анализа


    Оценка значимости уравнения регрессии определяется по значению F-распределения:

    Уравнение регрессии значимо на уровне , если расчетное значение больше критического (табличного значения).

    Табличное значение критерия можно найти с помощью функции

    «FРАСПОБР» или «F.ОБР.ПХ».

    Пример дисперсионного анализа


    N

    П1

    П2

    П3

    П4

    1

    145

    210

    195

    155

    2

    140

    200

    190

    150

    3

    150

    190

    240

    180

    4

    190

    195

    210

    175

    x

    156.25

    198.75

    208.75

    165



    Процедура дисперсионного анализа.

    Находим групповые средние:

    Если fнабл>fкр, то фактор оказывает существенное воздействие и его следует учитывать, в противном случае он оказывает незначительное

    влияние, которым можно пренебречь. Для расчета Rнабл и Rф могут быть использованы также формулы:

     (  

    Пример дисперсионного анализа

    • Общая средняя: Rобщ = 99225 + 158225 + 175825 + 109550 - 4 • 4 • 182.192 = 11748.44 Находим Rф по формуле (5): Rф = 4(156.252 + 198.752 + 208.752 + 1652) - 4 • 182.192 = 7792.19 Получаем Rост: Rост = Rобщ - Rф = 11748.44 - 7792.19 = 3956.25 Определяем факторную и остаточную дисперсии:

    N

    П21

    П22

    П23

    П24

    1

    21025

    44100

    38025

    24025

    2

    19600

    40000

    36100

    22500

    3

    22500

    36100

    57600

    32400

    4

    36100

    38025

    44100

    30625



    99225

    158225

    175825

    109550

    Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант:

    Для расчета R общ. составляем таблицу:

    АНАЛИЗ КОЭФФИЦИЕНТОВ РЕГРЕССИИ

    Третья таблица содержит оценки параметров уравнения регрессии.

    1. Коэффициенты уравнения регрессии.

    2. Величина стандартной ошибки коэффициентов уравнения регрессии.

    3. t-статистика – расчетные значения t-критерия, необходимые для проверки значимости коэффициентов регрессии.

    4. P-значение – оценка уровня значимости, который соответствует t-статистике.

    Если P-значение меньше стандартного уровня значимости, то соответствующий коэффициент статистически значим.

    Если значение t-статистики – велико, а соответствующая величина P-значения меньше 0,05, то можно считать, что коэффициент регрессии значим.

    В противном случае, если значение t-статистики – мало, а соответствующая величина P-значения выше 0,05, то коэффициент считается незначимым.

    5. Нижние (Верхние) 95% – границы доверительных интервалов для коэффициентов уравнения регрессии.

    Качество регрессионной модели обусловливает адекватность уравнения эмпирическим (полученным в ходе наблюдений) данным.

    Пример анализа коэффициентов регрессии

    Рассчитать среднее арифметическое, стандартное отклонение и количество человек в каждой группе.

    Вычисляем эмпирическое значения по формуле t-критерия Стьюдента для независимых выборок

    Вычисляем степени свободы.

    Определяем по таблице критических значений t-Стьюдента уровень значимости.

    Значение 6,09 больше чем значение 3,473 следовательно уровень значимости меньше 0,001

    Если уровень значимости меньше 0,05 делается вывод о наличи различий между группами.

    Результат корреляционно-регрессионного анализа


    Результат корреляционно-регрессионного анализа – определение значений коэффициентов.

    На основе полученного ряда коэффициентов можно составить уравнение регрессии.

    ОЦЕНКА РЕЗУЛЬТАТОВ



    написать администратору сайта