Тема 9. 9. статистическое изучение связи между явлениями
Скачать 309.3 Kb.
|
Тема 9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ 1. Функциональные и статистические зависимости 2. Статистические методы выявления связи 3. Аналитическое выражение корреляционной зависимости 4. Оценка тесноты связи между явлениями Функциональные и статистические зависимости Формы проявления взаимосвязей наблюдаемых процессов и явлений классифицируются в статистике по ряду оснований. По степени полноты выделяют функциональную (полную) и корреляционную (неполную) связи. При функциональной связи каждому значению факторного признака Х соответствует одно строго определенное значение результативного признака У (например, прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции. Корреляционная связь между факторным признаком Хи результативным У проявляется не в каждом конкретном случае (строго функционально, а лишь в среднем по совокупности. При этом каждому значению фактора соответствует не одно значение результата, а распределение значений, варьирующих около средней величины (например, зависимость издержек обращения от объема товарооборота помимо объема товарооборота (Хна сумму издержек обращения (У) влияют и другие неучтенные факторы. По направлению выделяют прямую и обратную связи. Прямая – связь, при которой факторный и результативный признаки изменяются водном и том же направлении – по мере увеличения или уменьшения факторного признака значения результативного соответственно увеличиваются или уменьшаются. В случае обратной связи значения результативного признака изменяются под действием факторного, нов противоположном направлении по сравнению с изменением факторного признака (например, по мере снижения цены объем спроса, как правило, увеличивается. По аналитическому выражению выделяют связи линейные и нелинейные. Статистическую связь называют линейной, если она может быть приближенно выражена математическим уравнением прямой линии. А если статистическая связь может быть выражена уравнением какой-либо кривой линии (параболы, гиперболы и т.д.), то ее называют нелинейной. Если характеризовать связи сточки зрения количества взаимодействующих факторов, то связь двух признаков принято называть парной, связь более двух признаков – множественной. ВОПРОС Прямая зависимость между факторными результативным признаками устанавливается, если имеется согласованность в изменении факторного и результативного признаков с увеличением значений факторного признака увеличиваются значения результативного признака с увеличением значений факторного признака уменьшаются значения результативного увеличится значение результативного признака 2. Статистические методы выявления связи В статистике используют следующие методы выявления взаимосвязей 1. Метод сопоставления параллельных данных заключается в построении двух или нескольких рядов статистических величин, которые сравнивают между собой, что позволяет не только подтвердить связь, но и выявить ее направление. 2. Балансовый метод заключается в построении балансов-таблиц, в которых итог одной части равен итогу другой (например, баланс производства какого-либо продукта и его потребления. 3. Метод аналитических группировок (см. тему 2). 4. Графический метод предполагает построение корреляционного поля – графика, где по оси абсцисс откладываются значения Ха по оси ординат - значения У. По расположению точек, их концентрации в определенном направлении можно судить о наличии или отсутствии связи, а также ее направлении. 5. Корреляционно-регрессионный анализ включает решение задач двух видов. Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения уравнения регрессии. ВОПРОС Задача корреляционного анализа – определение формы зависимости между признаками среднего значения признака в совокупности степени рассеивания признака в совокупности тесноты связи между признаками 3. Аналитическое выражение корреляционной зависимости Рассмотрим применение приемов корреляционного анализа на конкретном примере табл. 1). Таблица 1 Товарооборот и издержки обращения десяти предприятий (млн руб) Товарооборот 20 28 5 6 8 17 19 25 13 26 Издержки обращения 0,8 1,0 0,2 0,4 0,3 0,7 0,6 0,9 0,6 0,9 При рассмотрении вопросов подбора формы связи особое внимание уделяется глубокому теоретическому анализу изучаемого процесса, установлению причинно-следственных связей. Наиболее распространенным приемом выявления формы связи являются графические изображения. Графический анализ исходных данных (рис. 1) показывает, что с увеличением товарооборота растут, как правило, и издержки обращения. 0 0,2 0,4 0,6 0,8 1 1,2 0 5 10 15 20 25 Товарооборот, млн.р. И зде р ж ки обращениям лн р. Рис. 1. Зависимость издержек обращения от товарооборота После того как установлено, что зависимость между признаками есть, нужно установить теоретическую форму связи, те. вид математической функции f x , которая наилучшим образом описывает поведение изучаемого признака. Допустим, что между рассматриваемыми показателями существует прямолинейная связь. Уравнение линейной связи в общем виде можно записать так x a a y x 1 Это уравнение, выражающее зависимость У от X, называется уравнением регрессии. Найти уравнение регрессии означает определить параметры аи а. Их оценивают при помощи метода наименьших квадратов, который дает следующую систему нормальных уравнений , , 2 1 0 где х - значения факторного признака, в нашем примере суммы товарооборота табл. 1, строка 1); у - значения результативного признака - суммы издержек обращения (табл. 1, строка 2); n - число парных значений факторного и результативного признаков. Для составления и решения системы линейных уравнений, те. определения параметров воспользуемся данными табл. 2, в которой рассчитаем необходимые компоненты х, ух, ху, исходные данные предварительно ранжируем (располагаем по возрастанию значений факторного признака - товарооборота) и заполняем таблицу 2. Таблица 2 Расчетная таблица параметров уравнения регрессии Номер предприятия Товарооборот, млн. руб. (х) Издержки обращения, млн. руб. (ух 2ху x y у 2 А 1 2 3 4 5 6 1 5 0,2 25 1,0 0,28 0,04 Окончание табл. 2 А 1 2 3 4 5 6 2 6 0,4 36 2,4 0,31 0,16 3 8 0,3 64 2,4 0,37 0,09 4 13 0,6 169 7,8 0,52 0,36 5 17 0,7 289 11,9 0,65 0,49 6 19 0,6 361 11,4 0,71 0,36 7 20 0,8 400 16,0 0,74 0,64 8 25 0,9 625 22,5 0,90 0,81 9 26 0,9 676 23,4 0,93 0,81 10 28 1,0 784 28,0 0,99 1,00 Итого 167 6,4 3429 126,8 6,40 4,76 В гр таблицы 2 вносим квадраты переменных хи т.д.), в гр - произведение Хна У (5 0,2; 6 0,4; и т.д.). Итоговые показатели граф (1-4) подставляем в систему нормальных уравнений xy x a x a y x a na 2 1 0 1 0 10 167 8 , 126 3249 167 4 , 6 167 10 1 0 Каждый член первого уравнения умножаем на 167, второго - на 10 и из второго вычитаем первое 2 , 199 6404 1268 32490 1670 8 , 1068 27889 1670 1 1 0 1 Параметра. Подставим его значение в первое уравнение и найдем параметра а о+ 0,031 167 = 6,4 а о+ 5,177 = 6,4 а о = 12 , 0 10 177 , 5 Уравнение регрессии примет вид x y = 0,12 + х. Подставляя в него значениях, найдем выравненные или теоретические значения x y . Так, при товарообороте 5 млн. руб. (х) теоретическое значение суммы издержек составит 1 x y = 0,12 + 0,031 5 = 0,28. При товарообороте 6 млн. руби т.д. Теоретические значения помещены в таблице 2, гр. Сумма выравненных значений должна быть равна сумме фактических значений результативного признака ( y y x ); 6,4 = 6,4. Если такого равенства нетто следует проверить правильность всех предшествующих расчетов. Экономический смысл имеет параметра- коэффициент регрессии, показывающий насколько единиц в среднем изменится У при увеличении X на единицу. В рассмотренном примере увеличение товарооборота на 1 млн руб. ведет в среднем к росту издержек обращения на 0,031 млн руб. ВОПРОС Коэффициент регрессии показывает как изменяется факторный признак с изменением результативного на единицу значение результативного показателя тесноту связи как изменяется результативный признак с изменением факторного на единицу 4. Оценка тесноты связи между явлениями В случае установления линейной зависимости между факторными результативным) признаками для оценки тесноты связи между ними рассчитывают линейный коэффициент корреляции 2 2 2 2 ) ( ) ( y y n x x n y x xy n у х ху r y х xy Линейный коэффициент корреляции может принимать любые значения от -1 до +1. Чем ближе по модулю значение этого коэффициента к 1, тем более тесная связь предполагается между признаками Хи У. Если r ху = 0, то это не всегда говорит об отсутствии связи вообще - часто это означает отсутствие линейной связи. В таком случае нужно использовать нелинейные зависимости (уравнение гиперболы, уравнение логарифмической кривой, экспоненциальную зависимость и др. Для качественной оценки тесноты связи между признаками используется шкала Чэддока (табл. 3). Таблица 3 Оценка тесноты связи по шкале Чэддока Показания тесноты связи 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99 Характеристика тесноты связи Слабая Умеренная Заметная Высокая Весьма высокая Знак при линейном коэффициенте корреляции указывает направление связи «+» - прямая связь «-» - обратная связь. Рассчитаем линейный коэффициент корреляции для рассмотренного примера, для этого воспользуемся данными итоговой строки таблицы 2: ; 68 , 12 10 8 , 126 n ху ху ; 7 , 16 10 167 n х х 64 , 0 10 4 , 6 n у у Средние квадратические отклонения по признакам Хи У найдем по формулам ; ) ( 2 2 x x x 2 2 ) ( Среднюю величину из квадратов переменных Х рассчитываем, подставив в формулы итоги гр таблицы 2: ; 9 , 342 10 3429 2 2 n х х 476 , 0 10 76 , 4 2 2 n у у Следовательно, средние квадратические отклонения будут равны 257 , 0 4096 , 0 476 , 0 2 64 , 0 476 , 0 ; 8 89 , 278 9 , 342 2 7 , 16 Линейный коэффициент корреляции составит 969 , 0 056 , 2 992 , 1 056 , 2 686 , 10 68 , 12 257 , 0 8 64 , 0 7 , 16 Согласно таблице Чэддока, при r = 0,969 зависимость результативного признака от факторного очень высокая. Следовательно, найденное уравнение регрессии x y = 0,12 + х можно использовать для прогноза суммы издержек при наличии данных об изменении суммы товарооборота. ВОПРОС Если коэффициент корреляции равен 0,78, связь между признаками: прямая тесная прямая средняя обратная сильная обратная средняя |