Главная страница

Лекция Статистическое изучение взаимосвязи социально экономических явлений


Скачать 0.51 Mb.
НазваниеЛекция Статистическое изучение взаимосвязи социально экономических явлений
Дата06.11.2022
Размер0.51 Mb.
Формат файлаpdf
Имя файлаlec_5_1.pdf
ТипЛекция
#773411

1
Лекция 5. Статистическое изучение взаимосвязи социально-
экономических явлений
Исследование объективно существующих связей между социально- экономическими явлениями и процессами является важнейшей задачей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это такая связь явлений и процессов, когда изменение одного из них – причины ведет к изменению другого - следствия.
Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных. Статистика разработала множество методов изучения связей. Выбор метода изучения связи зависит от познавательной цели и задач исследования.
Признаки по их сущности и значению для изучения взаимосвязи делятся на
факторные и результативные. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами.
Признаки, изменяющиеся под действием факторных признаков, называются
результативными.
В статистике различают функциональную и стохастическую зависимости.
Функциональной называют такую зависимость, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.
Иначе говоря, корреляция – это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению.
Характеристики и критерии связи по степени тесноты показаны в табл. 1.

2
Таблица 1
Количественные критерии оценки тесноты связи
Величина показателя связи
Характер связи
До

0,3 практически отсутствует

0,3 –

0,5 слабая

0,5 –

0,7 умеренная

0,7 –

1,0 сильная
По направлению выделяют связь прямую и обратную. Прямая – это связь, при которой с увеличением или с уменьшением значений факторного признака происходит соответственно увеличение или уменьшение значений результативного признака. Обратная – это связь, при которой с увеличением значений факторного признака происходит, наоборот, уменьшение значений результативного признака, а с уменьшением значений факторного признака происходит увеличение результативного.
Для выявления наличия связи, ее характера и направления в статистике используются разные методы, например, метод приведения параллельных данных или графический.
Метод приведения параллельных данных (сопоставление двух параллельных
рядов)
Метод основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.
Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного признака.
Результативный признак (функцию) в дальнейшем будем обозначать через у, а факторный признак – через х.
Пример
Для 20 туристических фирм были установлены затраты на рекламу
(факторный признак) и количество туристов, воспользовавшихся услугами каждой фирмы (результативный признак). В табл. 2 фирмы ранжированы по величине затрат на рекламу.

3
Таблица 2
Порядковые номера фирм
Затраты на рекламу, усл. ден. ед. x
Количество туристов, воспользо- вавшихся услугами фирмы, чел. y
Порядковые номера фирм
Затраты на рекламу, усл. ден. ед. x
Количество туристов, воспользо- вавшихся услугами фирмы, чел. y
1 8
800 11 10 920 2
8 850 12 10 1060 3
8 720 13 10 950 4
9 850 14 11 900 5
9 800 15 11 1200 6
9 880 16 11 1150 7
9 950 17 11 1000 8
9 820 18 12 1200 9
10 900 19 12 1100 10 10 1000 20 12 1000
Можно видеть, что в целом для всей совокупности фирм увеличение затрат на рекламу приводит к увеличению количества туристов, пользующихся услугами фирмы, хотя в отдельных случаях наличие такой зависимости может и не усматриваться.
Например, сопоставим данные по фирмам с порядковыми номерами 7 и 11.
Здесь мы видим даже обратное соотношение: у фирмы 11 количество туристов меньше, чем у фирмы 7, хотя затраты на рекламу выше, чем у фирмы 7 на 1 усл. ден. ед. Это подтверждает то, что в каждом отдельном случае количество туристов, воспользовавшихся услугами фирмы, будет зависеть не только от размера затрат на рекламу, но и от того, как сложатся прочие факторы, определяющие величину результативного признака.
В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака, величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между признаками.
Графический метод
В этом случае взаимосвязь двух признаков изображается с помощью поля
корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее точки будут группироваться вокруг определенной линии, выражающей форму связи.

4
Рис. 1. График корреляционного поля. Зависимость числа клиентов фирмы (у) от ее затрат на рекламу (х)
Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи между признаками. Если же имеется тенденция неравномерного изменения значений результативного признака, и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием кри- волинейной корреляционной связи.
Наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие параллельных рядов. В таких случаях целесообразнее воспользоваться для установления факта наличия связи статистическими таблицами –
корреляционными или групповыми.
Виды анализа взаимосвязи социально-экономических явлений
Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков
(при многофакторной связи).
В статистике принято различать следующие варианты корреляции:
1. Парная корреляция - связь между двумя признаками (результативным и факторным, или двумя факторными).
2. Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
3. Множественная корреляция - зависимость результативного от двух или более факторных признаков, включенных в исследование.
Регрессия тесно связана с корреляцией и позволяет исследовать аналитическое выражение взаимосвязи между признаками.
Основная задача регрессионного анализа заключается в определении
аналитического выражения связи, в котором изменение одной величины

5
(называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных
признаков).
По аналитическому выражению выделяют связи линейные и нелинейные.
Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии вида
y
a ax
x
 
0 1
, то её называют
линейной связью. Если же связь может быть выражена уравнением какой-либо кривой линии, то такую связь называют нелинейной.
Теоретической линией регрессии называется линия, вокруг которой группируются точки корреляционного поля и которая указывает основную тенденцию связи.Теоретическая линия регрессии должна отображать изменение средних величин результативного признака у по мере изменения величин факторного признака х при условии полного взаимопогашения всех прочих, случайных по отношению к фактору х, причин.
Следовательно, эта линия должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии регрессии равнялась нулю, а сумма квадратов этих отклонении была бы минимальной величиной.
Приблизительное представление о линии связи можно получить на основе эмпирической линии регрессии (рис. 2).
Рис. 2. Зависимость успеваемости студентов (у) от количества пропущенных семинаров (х)
Эмпирическая линия строится по наблюдаемым значениям признаков и обычно является ломаной линией, имеет более или менее значительный излом.
Объясняется это тем, что влияние прочих неучтенных факторов, оказывающих воздействие на вариацию результативного признака, в средних погашается не полностью, в силу недостаточно большого количества наблюдений. Поэтому эмпирической линией связи для выбора и обоснования типа теоретической кри- вой можно воспользоваться при условии, что число наблюдений будет достаточно велико.
Одним из элементов исследований является сопоставление различных
уравнений зависимости, основанное на использовании критериев качества аппроксимации эмпирических данных разными вариантами теоретических

6
кривых. Чаще всего для характеристики связей экономических показателей используют следующие типы функций (
x
y
- оценка результативного признака y):

линейную
bx
a
y
x


;

гиперболическая
x
b
a
y
x
1


;

показательную
x
x
ab
y

;

параболическую
2
cx
bx
a
y
x



;

степенную
b
x
x
a
y

;

логарифмическую
x
b
a
y
x
lg


Рассмотрим подробнее случай использования для аппроксимации эмпирических данных линейной функции. Этот случай носит название линейной регрессии.
Парная линейная регрессия
В этом случае результативный признак зависит от одного факторного признакаи линия регрессии описывается выражением:
x
a
a
y
x
1 0


,
(1) где a
1
– параметр называемый, коэффициентом регрессии.
Оценка параметров уравнения линейной регрессии (a
0
, a
1
) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров
a
0
и a
1
функции (1), при которых минимизируется сумма квадратов отклонений эмпирических значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
S =


n
i 1
(
y
i

y
x
)
2

min
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

















n
i
n
i
i
i
i
n
i
i
n
i
n
i
i
i
0
y
x
=
x
a
+
x
a
y
=
x
a
+
na
1 1
2 1
1 0
1 1
1
(2) где n - объем исследуемой совокупности (число единиц наблюдения).
В уравнении регрессии параметр a
0
показывает усредненное влияние на
результативный признак неучтенных в уравнении факторных признаков.

7
Коэффициент регрессии a
1
показывает, насколько в среднем изменяется
значение результативного признака при увеличении факторного признака
на единицу собственного измерения.
Можно решить систему уравнений (2), в результате получим:
̅̅̅̅̅̅ ̅ ̅
̅̅̅ ̅
̅̅̅ ̅ ̅
̅̅̅̅̅̅
̅̅̅ ̅
Пример. Составитьлинейное уравнение регрессии зависимости балансовой прибыли от объема реализованной продукции 10 предприятий города (данные представлены в табл. 3). Определить параметры уравнения и проанализировать их.
Таблица 3
Показатели деятельности предприятий города
№ п/п
Объем реализованной продукции
(млн. руб.) x
Балансовая прибыль
(млн. руб.)
y
1 49,1 14,1 2
48,3 12,7 3
48,1 12,2 4
47,8 12,1 5
47,6 11,7 6
47,5 11,6 7
45,6 10,8 8
45,3 10,5 9
48,1 10,7 10 44,6 9,9
Решение
В качестве факторного (изменяющегося) признака выберем объем
реализованной продукции, а за результативный признак (который изменяется под действием факторного) выберем балансовую прибыль. На основе качественного анализа таблицы 1 можем предположить, что между объемом реализованной продукции и балансовой прибылью существует прямая связь, так как с уменьшением объема реализованной продукции балансовая прибыль также уменьшается.
Запишем уравнение парной линейной регрессии:
x
a
a
y
x
1 0


Параметры a
0
и a
1
определим, найдя решение системы нормальных уравнений
(см. формулы (2)) по методу наименьших квадратов. Дополнительные расчеты представлены в таблице 4.

8
Таблица 4
Крупнейшие предприятия города (дополнительные расчеты)
№ п/п
Объем реализованной продукции (млн. руб.) x i
Балансовая прибыль
(млн. руб.) y i
xy
x
2
y
2
̅
1 49,1 14,1 692,3 2410,8 198,8 12,0 2
48,3 12,7 613,4 2332,9 161,3 11,9 3
48,1 12,2 586,8 2313,6 148,8 11,8 4
47,8 12,1 578,4 2284,8 146,4 11,8 5
47,6 11,7 556,9 2265,8 136,9 11,7 6
47,5 11,6 551,0 2256,3 134,6 11,7 7
45,6 10,8 492,5 2079,4 116,6 11,3 8
45,3 10,5 475,7 2052,1 110,3 11,3 9
48,1 10,7 514,7 2313,6 114,5 11,8 10 44,6 9,9 441,5 1989,2 98,0 11,1
Итог о
472
116,3
5503,2
22298,5
1366,2
116,4
Используя данные дополнительных расчетов, составим систему уравнений:

















n
i
n
i
i
i
i
n
i
i
n
i
n
i
i
i
0
y
x
=
x
a
+
x
a
y
=
x
a
+
na
1 1
2 1
1 0
1 1
1







2
,
5503 5
,
22298 472 3
,
116 472 10 1
0 1
a
+
a
a
+
a
0
Решив систему уравнений, получим значения параметров
a
0
и a
1
:
a
0

2,2; a
1

0,2

Тогда уравнение регрессии принимает вид:
x
y
x
2
,
0 2
,
2


Свободный член уравнения a
0

2,2
характеризует величину балансовой прибыли, не зависящую от объема реализованной продукции.
Коэффициент регрессии
a
1

0,2
показывает, что при увеличении объема реализованной продукции на 1 млн. руб., балансовая прибыль увеличится на 0,2 млн. руб.
После того, как составлено уравнение регрессии на основе фактической информации по данным о 10 предприятиях города, рассчитаем теоретические значения путем подстановки в уравнение регрессии фактических данных об объеме реализованной продукции вместо значений
x
:

9
.
Основное значение построенного уравнения регрессии – это его практическое применение в целях планирования и прогнозирования экономических показателей. Если в данное уравнение регрессии вместо фактических данных об объеме реализованной продукции подставить планируемые показатели, то получим планируемые показатели балансовой прибыли, т.е. будем планировать балансовую прибыль в зависимости от объема реализованной продукции.
Допустим, что для первого предприятия объем реализованной продукции в следующем году увеличится и составит 60 млн. руб., рассчитаем величину балансовой прибыли для этого предприятия:
2
,
14 60 2
,
0 2
,
2




x
y
(млн. руб.).
Для второго предприятия объем реализованной продукции в следующем году уменьшится и составит 40 млн. руб., тогда величина балансовой прибыли составит:
2
,
10 40 2
,
0 2
,
2




x
y
(млн. руб.).
Аналогичные прогнозные расчеты можно произвести и для других предприятий города.
Принятие решений на основе уравнений регрессии
Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относится исследуемое явление. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков.
Чем больше абсолютное значение коэффициента регрессии, тем
значительнее влияние факторного признака на результативный признак.
Знак коэффициента регрессии говорит о характере влияния на
результативный признак. Если коэффициент регрессии имеет знак плюс, то с увеличением фактора результативный признак возрастает. Если коэффициент регрессии имеет знак минус, то с его увеличением результативный признак
уменьшается.
Для рассмотренного примера коэффициент регрессии a
1

0,2. Это значит, что то с увеличением факторного признакарезультативный признак возрастает.


написать администратору сайта