Главная страница
Навигация по странице:

  • - факторные

  • При прямолинейной

  • Метод приведения параллельных данных

  • однофакторный корреляционный

  • Итого 55 x 73 y 2 385 x 2 565 y 451 xy 73,0

  • Статистика Курс лекций 22 год. Курс лекций по дисциплине Статистика Ставрополь 2022 Тема 1 Предмет, метод и задачи статистики


    Скачать 4.1 Mb.
    НазваниеКурс лекций по дисциплине Статистика Ставрополь 2022 Тема 1 Предмет, метод и задачи статистики
    Дата27.02.2023
    Размер4.1 Mb.
    Формат файлаpdf
    Имя файлаСтатистика Курс лекций 22 год.pdf
    ТипКурс лекций
    #958823
    страница9 из 21
    1   ...   5   6   7   8   9   10   11   12   ...   21
    Тема 9 Статистическое изучение взаимосвязей
    9.1. Сущность и виды взаимосвязей между социально-экономическими явлениями
    9.2. Методы изучения связей
    9.3 Однофакторный и многофакторный регрессионный анализ
    9.4 Однофакторный и многофакторный корреляционный анализ
    9.5 Непараметрические методы изучения связей
    9.1 Сущность и виды взаимосвязей между социально-экономическими явлениями
    Исследование объективно существующих связей между социально- экономическими явлениями и процессами является важнейшей задачей статистики. В процессе статистического изучения взаимосвязей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на изменение изучаемых явлений и процессов. Причинно-следственные отношения – это такая связь явлений и процессов, когда изменение одного из них– причины ведет к изменению другого – следствия.
    Признаки по их значению для изучения взаимосвязи делятся на два класса:
    - факторные признаки (факторы) – признаки, являющиеся причиной изменения других, связанных с ними признаков;
    - результативные признаки – признаки, изменяющиеся под действием факторных признаков.
    В статистике различают функциональную и стохастическую зависимости. Функциональной (жестко детерминированной) называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.
    Характерной особенностью функциональных связей является то, что в каждом отдельном случае известен полный перечень факторов, определяющих значение зависимого (результативного) признака, а также точный механизм их влияния, выраженный определенным уравнением.
    Чаще всего функциональные связи наблюдаются в явлениях, описываемых математикой, физикой и другими точными науками. В социально-экономических явлениях они встречаются достаточно редко, примером функциональной связи может служить связь между заработной платой и количеством изготовленных деталей при простой сдельной оплате труда.
    В социально-экономической жизни чаще всего взаимосвязь между признаками носит вероятностный характер. Например, уровень
    производительности труда рабочих может определяться целым комплексом факторов: квалификацией, стажем работы, уровнем механизации и автоматизации производства, интенсивностью труда, простоями, состоянием здоровья работника, его настроением, атмосферным давлением и др. При этом связь между признаками становится стохастической.
    Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем, при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.
    Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице (причем не известен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком).
    В зависимости от направления действия функциональные и стохастические связи могут быть прямыми и обратными. Прямая – это связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака. Так, рост объемов производства способствует увеличению прибыли предприятия.
    В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так, снижение себестоимости единицы производимой продукции влечет за собой рост рентабельности.
    По аналитическому выражению (форме) связи могут быть прямолинейными и нелинейными (криволинейными). При прямолинейной
    связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически — прямой линией. Отсюда ее более короткое название —
    линейная связь.
    При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно или же направление его изменения меняется на обратное.
    Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).
    По количеству факторов, действующих на результативный признак, связи различаются однофакторные(один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются
    парными (так как рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все
    факторы действуют комплексно, т.е. одновременно и во взаимосвязи, например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками.
    9.2. Методы изучения связей
    Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных, графический, аналитических группировок, корреляции, регрессии.
    Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Для этого факторы, характеризующие результативный признак, располагают в возрастающем или убывающем порядке, а затем прослеживают изменение величины результативного признака. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды).
    При использовании графического метода взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат– результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
    Чтобы выявить зависимость с помощью метода аналитических
    группировок, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного, можно выявить направление, характер и тесноту связи между ними.
    Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками(при парной связи) и между результативным и множеством факторных признаков
    (при многофакторной связи).
    Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.
    Регрессия тесно связана с корреляцией и позволяет исследовать аналитическое выражение взаимосвязи между признаками.
    Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой
    зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).
    Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую.
    В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.
    9.3 Однофакторный и многофакторный регрессионный анализ
    Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ.
    Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.
    Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
    Наиболее частое применение в регрессионном анализе имеют линейные связи.
    Уравнение однофакторной (парной) линейной корреляционной связи
    имеет вид:
    0 1
    y
    a
    a x


    (9.1)
    где
    y
    - теоретические значения результативного признака, полученные по уравнению регрессии; a
    0
    , а
    1
    коэффициенты (параметры) уравнения регрессии.
    Поскольку a
    0
    является средним значением у в точке х = 0, экономическая интерпретация часто затруднена или вообще невозможна.
    Коэффициент парной линейной регрессии
    а
    1
    называется
    коэффициентом регрессии, он показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, знак а
    1
    указывает направление этого изменения.

    Параметры уравнения а
    0
    , а
    1
    находят методом наименьших квадратов
    в основу которого положено требование минимальности сумм квадратов отклонений эмпирических данных y
    i
    от выровненных
    2 2
    ˆ
    (
    )
    (
    )
    min
    0 1
    y
    y
    y
    a
    a x
    i
    i
    i


     



    (9.2)
    Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
    ;
    0 1
    2 0
    1
    na
    a
    x
    y
    a
    x
    a
    x
    xy
       



      
     
    
    (9.3)
    .
    Параметры уравнения парной линейной регрессии могут быть исчислены по следующим формулам:
    (
    )(
    )
    , или
    ;
    1 1
    2 2
    2
    (
    )
    0 1
    y
    y x
    x
    xy
    x y
    a
    a
    x
    x
    x
    x
    a
    y
    a x









     
    (9.4)
    Определив значения а
    0

    1
    и подставив их в уравнение связи
    0 1
    y
    a
    a x


    находим значения
    y
    , зависящие только от заданного значения х.
    Для удобства интерпретации параметра а
    1
    используют коэффициент
    эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:
    Э
    1
    x
    a
    y

    (9.5)
    Для практического использования моделей регрессии очень важна их
    адекватность, т. е. соответствие фактическим статистическим данным.
    Пример 9.1. Рассмотрим построение однофакторного уравнения регрессии, характеризующей зависимость производительности труда (у, результативный признак) от стажа работы (х, факторный признак) по данным табл. 9.1 (графа 1- 3).
    Данные 10 рабочих, занятых производством радиоэлектронных изделий, ранжированы по стажу их работы. Сопоставление данных параллельных рядов признаков х и у (табл. 9.1) показывает, что с возрастанием признака х (стажа работы), растет, хотя и не всегда, результативный признак у (производительность труда). Следовательно, между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.
    Для уточнения формы связи между рассматриваемыми признаками используем графический метод. Нанесем на график точки, соответствующие значениям х, у, получим корреляционное поле, а соединив их отрезками, - ломаную регрессии (рис. 9.1).

    Анализируя ломаную линию, можно предположить, что возрастание выработки у идет равномерно, пропорционально росту стажа работы рабочих
    х. В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь (см. пунктирную линию на рис. 8.1), которая может быть выражена простым линейным уравнением регрессии:
    0 1
    y
    a
    a x


    ,
    где
    yi
    — теоретические расчетные значения результативного признака
    (выработки одного рабочего, шт.), полученные по уравнению регрессии;
    а
    0

    1
    — неизвестные параметры уравнения регрессии;
    х — стаж работы рабочих, годы.
    Таблица 9.1 - Распределение рабочих бригады по выработке и стажу работы
    Исходные данные
    Расчетные значения
    Номер
    рабочего
    Стаж
    работы,
    годы (х)
    Дневная
    выработка
    рабочего, шт.
    (y)
    х
    2
    y
    2
    х у
    yi
    1
    2
    3
    4
    5
    6
    7
    4-й
    1 4
    1 16 4
    4,6 6-й
    2 5
    4 25 10 5,2 3-й
    3 6
    9 36 18 5,8 1-й
    4 7
    16 49 28 6,4 2-й
    5 7
    25 49 35 7,0 7-й
    6 8
    36 64 48 7,6 9-й
    7 8
    49 64 56 8,2 10-й
    8 9
    64 81 72 8,8 8-й
    9 10 81 100 90 9,4 5-й
    10 9
    100 81 90 10,0
    Итого
    55
    x


    73
    y


    2 385
    x


    2 565
    y


    451
    xy


    73,0

    Рис. 9.1 - Зависимость выработки одного рабочего y от стажа работы х
    Пользуясь расчетными значениями (см. табл. 9.1), исчислим параметры для данного уравнения регрессии:
    45,1 40,15 0, 6;
    1 2
    38, 5 30, 25 2
    7, 3 0, 6 5, 5 4, 0.
    0 1
    xy
    x y
    a
    x
    x
    a
    y
    a x







     




    Следовательно, регрессионная модель зависимости выработки от стажа работы для данного примера может быть записана в виде следующего уравнения регрессии:
    4, 0 0, 6
    y
    x


    Это уравнение характеризует зависимость среднего уровня выработки рабочими бригады от стажа работы. Расчетные значения , найденные по данному уравнению, приведены в табл. 9.1. Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм
    y
    y

     
    (при этом возможно некоторое расхождение вследствие округления расчетов).
    В рассмотренном уравнении
    4, 0 0, 6
    y
    x


    параметр а
    1
    – коэффициент регрессии, а
    1
    = 0,6. Следовательно, возрастание на 1 год стажа работы приводит к увеличению рабочим дневной выработки в среднем на 0,6 изделия.
    Для удобства интерпретации параметра а
    1
    используют коэффициент эластичности, который показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле (9.5).
    В рассматриваемом примере
    5, 5
    Э 0,6 0, 45 7,3



    . Следовательно, с возрастанием стажа работы на 1 % следует ожидать повышения производительности труда в среднем на 0,45 %. Этот вывод справедлив
    только для изучаемой совокупности рабочих при конкретных условиях работы.
    Явления общественной жизни складываются под воздействием не одного, а целого ряда факторов, т. е. эти явления многофакторны.Между факторами существуют сложные взаимосвязи, поэтому их влияние комплексное и его нельзя рассматривать как простую сумму изолированных влияний.
    Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии.
    Многофакторный регрессионный анализпозволяет оценить меру влияния на исследуемый результативный показатель каждого из включенных в модель (уравнение) факторов при фиксированном положении (на среднем уровне) остальных факторов.
    Построение моделей множественной регрессии требует, прежде всего, осуществить выбор аналитической формы связи результативного признака от нескольких факторных признаков, которая называется многофакторным
    (множественным) уравнением регрессии.
    Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. На практике основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.
    Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.
    Проблема отбора факторных признаков может быть решена на основе интуитивно-логических или многомерных математико-статистических методов анализа.
    После выбора типа аппроксимирующей функции и отбора факторов приступают к многофакторному регрессионному анализу, задачей которого является построение уравнения множественной регрессии и нахождение его неизвестных параметров а
    0

    1
    ,...,а
    п
    .
    Линейное уравнение множественной регрессии имеет вид:
    ,
    ,...,
    0 1 1 2 2 1 2
    a
    a x
    a x
    a x
    y x x
    x
    n n
    n



     
    (9.6)
    Параметры уравнения множественной регрессии, как и в случае парной регрессии, находят по способу наименьших квадратов. Затем с помощью корреляционного анализа осуществляют проверку адекватности полученной модели. Адекватную модель экономически интерпретируют.
    Для решения множественной линейной регрессии с п – факторами система нормальных уравнений такова:

    ;
    0 1
    1 2
    2 2
    ;
    0 1
    1 1
    2 1 2 1
    2 0
    1 1
    2 2
    a n
    a
    x
    a
    x
    a
    x
    y
    n
    n
    a
    x
    a
    x
    a
    x x
    a
    x
    yx
    n
    n
    a
    x
    a
    x x
    a
    x x
    a
    x
    yx
    n
    n
    n
    n
    n
    n
      

     

     


         
     

     





     


     

     
    
    (9.7)
    Вручную целесообразно выполнять построение и анализ только двух-, максимум трехфакторных моделей. Для п >3 все расчеты рекомендуется осуществлять на компьютерах по специальным программам, предусматривающим исчисление параметров уравнения и показателей, используемых для проверки его адекватности.
    Построение и анализ двухфакторной регрессионной модели рассмотрим на конкретном примере.
    Пример 9.2.По выборочным данным, представленным в табл. 9.2, о выработке деталей за смену 20 рабочими цеха требуется выявить зависимость производительности труда у от двух факторов: внутрисменных простоев x
    1
    и квалификации рабочих х
    2
    Теоретический анализ исходных данных позволяет установить наличие причинно-следственной связи факторных признаков (внутрисменных простоев и квалификации рабочих) с результативным показателем - производительностью труда.
    Таблица 9.2 – Данные о производительности труда, внутрисменных простоях и квалификации рабочих
    Порядковый номер
    рабочего
    Внутрисменные
    простои, мин x
    1
    Квалификация рабочего
    (тарифный разряд) х
    2
    Дневная
    выработка
    рабочего, шт. y
    1 5
    3 86 2
    8 4
    88 3
    15 5
    94



    19 20 2
    77 20 14 4
    92
    1   ...   5   6   7   8   9   10   11   12   ...   21


    написать администратору сайта