курс лекций по статистике. 5fan_ru_Статистика. Курс лекций. Лекция 2 Сводка и группировка материалов статистического наблюдения Тема 2 Статистическая совокупность и её характеристики Лекция 3 Абсолютные, относительные и средние величины
Скачать 1.46 Mb.
|
Непараметрические методы оценки связи.2. 1. Коэффициенты оценки связи качественных признаков, представленных двумя градациями. 2.2. Коэффициенты оценки связи качественных признаков, представленных несколькими градациями. 2.3. Коэффициент корреляции знаков. 2.4. Ранговая корреляция. Коэффициент ранговой корреляции Спирмена; Коэффициент конкордации 2.5. Коэффициент Фехнера. 1. Понятие и виды статистической связи Все явления общественной жизни взаимосвязаны, взаимозависимы и взаимообусловлены. Статистика рассматривает экономический закон как существенную и устойчивую связь между определенными явлениями и процессами. Познавая связи, статистика познает законы. А их знание позволяет управлять общественным развитием. Основой изучения связей является качественный анализ. Задачи статистики состоят в выявлении связи, определении ее направления и тесноты (силы). Наиболее же общая задача – это прогнозирование и регулирование социально-экономических явлений на основе полученных представлений о связях между явлениями. Взаимосвязанные признаки подразделяются на факторные признаки – те, которые влияют на изменение других процессов и результативные – те, которые изменяются под воздействием других признаков. Виды и формы связей, различаемые в статистике.Функциональная связь (зависимость) между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует вполне определенное значение другой. Например, между радиусом круга и его площадью существует функциональная зависимость, которая выражается формулой . Однако на практике часто встречаются и такие виды связей между величинами, которые нельзя отнести к функциональным. Для статистической связи характерно то, что одному и тому же значению факторного признака может соответствовать сколько угодно различных значений результативного признака. Например, урожайность пшеницы зависит от дозы вносимых удобрений, но если различные хозяйства будут вносить одну и ту же дозу удобрений на гектар, урожайность у них будет разная. Здесь связь проявляется лишь при достаточно большом количестве наблюдений и лишь в форме средней величины. Она не является точной зависимостью одного признака от другого. Корреляционная связь является частным случаем статистической связи В статистике связи также классифицируются по направлению. Если с увеличением одного показателя, второй также возрастает, то связь между ними является прямой или положительной. Например, с увеличением спроса на какой-либо товар, увеличивается его предложение. Если же с увеличением одного показателя, второй снижается, то связь между ними называется обратной или отрицательной. Так увеличение цены на товар приводит, как правило, к снижению спроса на него. по степени их тесноты (по силе). Функциональная связь является полной, а статистическая – неполной и неточной связью. по форме различают линейные и нелинейные связи. Линейные связи моделируются линейной функцией регрессии . Нелинейные связи могут моделироваться полиномами разных степеней, показательными, логарифмическими и другими функциями. Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.
Выявление, обнаружение и изучение объективно существующих связей между явлениями и различными показателями, характеризующими социально-экономические процессы, является важнейшей задачей всякого научного исследования. Статистическое исследование зависимостей позволяет вскрыть причинно-следственные отношения между явлениями, чтобы выявить факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, при которых изменение одного из них – причины – ведет к изменению другого – следствия. Особое значение при исследовании причинно-следственных связей имеет выявление временной последовательности: причина всегда должна предшествовать следствию. Между сложными группами причин и следствий возможны многозначные связи, в которых одна причина будет вызывать то одно, то другое следствие или одно следствие будет иметь несколько разных причин. Чем сложнее изучаемое явление, тем труднее выявить причинно-следственные связи между ними. Особенностью причинно-следственных связей в социально-экономических явлениях является их транзитивность (опосредованная зависимость). Для изучения, измерения и моделирования взаимосвязей между явлениями статистикой применяются различные методы: метод сопоставления параллельных рядов; балансовый метод; графический метод; методы аналитических группировок; дисперсионный анализ; корреляционно-регрессионный анализ. 2. Непараметрические методы оценки связи Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов. Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических методов оценки связи. Рассмотрим некоторые из них. 2.1. Коэффициенты оценки связи качественных признаков, представленных двумя градациями. Для оценки тесноты зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков, используют коэффициент ассоциации Кас и коэффициент контингенции Ккон. Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
Здесь - частоты взаимного сочетания (комбинации) двух альтернативных признаков и ; – общая сумма частот. Коэффициент ассоциации (коэффициент ) можно рассчитать по формуле . Коэффициент контингенции (тетрахорический показатель связи, предложен Пирсоном в 1901 году) рассчитывается по формуле:
Пример 1. В одном из отделений Сбербанка России исследовалась связь между наличием вклада и семейным положением вкладчиков на 01.01.2002 г. результаты обследования характеризуются следующими данными:
Вывод: наличие или отсутствие сбережений в обследуемом отделении Сбербанка России не зависит от семейного положения потенциальных вкладчиков. Коэффициенты оценки связи качественных признаков, представленных несколькими градациями. Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (). Для исследования такого рода связи первичную статистическую информацию располагают в форме (многопольной корреляционной) таблицы:
Здесь - частоты взаимного сочетания двух атрибутивных признаков. Коэффициент взаимной сопряженности или полихорический показатель связи, предложенный Пирсоном, определяется по формуле , где - показатель (взаимной) среднеквадратической сопряженности: ,
Этого недостатка лишен коэффициент взаимной сопряженности Чупрова А.А.: , где - число групп первого и второго признаков (по каждому из признаков). Пример 2. С помощью коэффициента взаимной сопряженности проанализируйте зависимость распределения сотрудников строительной фирмы ООО «Скат» по категориям от уровня их образования:
, Вывод: связь близка к умеренной. Пример 3. Приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей. С помощью коэффициента взаимной сопряженности проанализируйте зависимость занятости детей от занятости родителей, или выясните, существует ли преемственность в профессии детей.
, Коэффициент корреляции знаков. В социальных исследованиях нередко встречаются случаи, когда коррелирующие признаки выражаются не числами, а знаками: наличие признака – знаком плюс, отсутствие – знаком минус. В таких случаях для измерения корреляции используется формула: , где – число совпадений положительных знаков в общей серии испытаний, отнесенное к их числу , т.е. ; – частости положительных знаков для каждого признака отдельно. Коэффициент корреляции знаков изменяется от 0 до 1. Чем сильнее связь между признаками, тем этот показатель ближе к единице. Пример 4. Выясняли зависимость между упрямством детейи строгостью требований родителей . Под наблюдением находилось 15 учащихся и их родителей из разных семей. Результаты наблюдений приведены в таблице.
. Вывод: обнаружена заметная сопряженность между признаками. 2.4. Ранговая корреляция. Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена и Кендалла . Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками при условии упорядочения их значений или ранжировании по степени убывания или возрастания признака. 1. Выборочный коэффициент ранговой корреляции Спирмена (1904 год) рассчитывается по формуле: , где – квадрат разности рангов; – число наблюдений (число пар рангов).
Пример 5. По данным группы предприятий одной из отраслей промышленности установить зависимость между величиной балансовой прибыли и объемом реализованной продукции.
Вывод: между величиной балансовой прибыли и объемом реализованной продукции обнаружена связь, близкая к умеренной. Пример 6. По данным итогов торгов на биржевом рынке установить зависимость средней цены сделки от номинальной стоимости акции с помощью коэффициента Спирмена.
2. Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации ), который вычисляется по формуле: , где – количество факторов; – число наблюдений; – отклонение суммы квадратов рангов от средней квадратов рангов
Пример 7. Оценить тесноту связи между уставным капиталом, числом выставленных акций и числом занятых на предприятиях, выставивших акции на аукционы (2001 год)
Вывод: в выборочной совокупности обнаружена слабая связь между рассматриваемыми признаками; на уровне значимости принимается нулевая гипотеза о статистической незначимости коэффициента конкордации. Коэффициент Фехнера. Простейшим непараметрическим показателем тесноты связи между двумя количественными признаками является коэффициент Фехнера, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле где - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; - соответственно количество несовпадений. Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0. Пример 8. По каждому из 10 предприятий известна совокупная выработка (тыс. руб.) и численность сотрудников:
Используя коэффициент Фехнера, сделайте вывод о наличии или отсутствии связи между показателями. Решение Для расчета коэффициента Фехнера необходимо найти его знаки разностей (отклонений) каждого из показателей от их среднего значения, а затем подсчитать число совпадений (С) и несовпадений (Н) Расчёты выполним в таблице:
Анализ расчетов показывает, что число совпадении , а число несовпадений знаков разностей , следовательно, , т.е. наблюдается умеренная положительная связь между показателя |