|
Статистика учебник. Тарновская ли. Статистика учебное пособие
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 3. Проведено собственно-случайное бесповторное обследование заработной платы сотрудников аппарата управления двух финансовых корпораций. Обследовано одинаковое число сотрудников. Дисперсия заработной платы для финансовых корпораций одинакова, а численность аппарата управления больше впервой корпорации. Средняя ошибка выборки а) больше впервой корпорации б) больше во второй корпорации в) в обеих корпорациях одинакова г) данные не позволяют сделать вывод. 4. Поданным го выборочного обследования, дисперсия средней заработной платы сотрудников первого туристического агентства – 225, а второго – 100. Численность сотрудников первого туристического агентства в четыре раза больше, чем второго. Ошибка выборки больше а) в первом туристическом агентстве б) во втором туристическом агентстве в) ошибки одинаковы г) предсказать результат невозможно. 5. Численность выборки, которая позволила бы оценить долю брака в партии хлебобулочных изделий из 10000 единиц с точностью допри м уровне значимости, составляет а) 2500; б) 826; вне хватает данных г) 2000. 6. Необходимый объем выборки прямо пропорционален а) величине допустимой ошибки при выборочном наблюдении б) количеству признаков генеральной совокупности в) коэффициенту вариации генеральной совокупности г) дисперсии признака 7. Формула x t Δ = ⋅μ % используется для расчета а) средней ошибки выборки б) относительной ошибки результатов в) предельной ошибки выборки г) уточнения средней ошибки выборки. 8. Формула 2 2
2 Δ σ x x t n = используется для расчета а) средней ошибки выборки б) относительной ошибки результатов в) расчета численности случайной повторной выборки Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. г) величины допустимой ошибки при выборочном наблюдении. 9. Для каких целей используется критерий Стьюдента в теории малой выборки а) для определения возможных пределов ошибки б) для уточнения результатов выборки в) распространения результатов выборки на генеральную совокупность г) оценки полноты выборки 10. Серийная выборка – это … а) отбор единиц из генеральной совокупности без системности б) упорядоченный выбор из генеральной совокупности в) выбор из генеральной совокупности, разбитой на несколько типических групп г) собственно-случайный или механический отбор серий, внутри которых производится сплошное обследование единиц.
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ГЛАВА 8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ 8.1. Методы изучения связи социальных явлений Исследуя природу, общество, экономику, необходимо считаться с взаимосвязью наблюдаемых явлений. Полнота описания определяется количественными характеристиками причинно-следственных связей между ними. Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную полную и корреляционную неполную связи. При функциональной связи величине факторного признака соответствует одно или несколько значений функции. Этот вид связи часто проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции. Корреляционная связь (неполная) проявляется в среднем, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Каждому значению аргумента соответствуют случайно распределенные значения функции. По направлению связи бывают – прямыми положительными, когда зависимая переменная растет с увеличением факторного признака – обратными отрицательными, при которых рост факторного признака сопровождается уменьшением функции. Относительно своей аналитической формы связи бывают линейными и нелинейными В первом случае между признаками в среднем проявляются линейные отношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно. Если характеризуется связь двух признаков, то ее называют парной. Если изучается связь более двух переменных, то ее называют множе- ственной Задачи корреляционного анализа сводятся к измерению тесноты связи между признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Методы оценки тесноты связи подразделяются – на параметрические (корреляционные – непараметрические.
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Параметрические (корреляционные) основаны на использовании оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. Непараметрические методы не накладывают ограничений на законы распределения изучаемых величин [1, 3–8]. 8.2. Парная множественная корреляция Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы (табл. 8.1). Таблица 8.1 В основу группировки положены два признака x и y. Частоты ij f графика показывают количество сочетаний x и y. Если ij f расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания допустимо утверждение о связи между x и y. При этом, если ij f концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь. Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точками. При отсутствии тесных связей имеет место беспорядочное расположение точек y x 1 y 2 y …. z y Итого i y х 11 f 12 f … z f 1 ∑ z f j 1 1 1 y х 21 f 22 f … z f 2 ∑ z j f 1 2 2 y ... … … … … … … х 1 k f 2 k f … Итого ∑ = k i i f 1 1 ∑ = k i i f 1 2 … ∑ k iz f 1 n y х 1 x 2 x … z x x –
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 сна графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Если между x и y графика есть корреляция, тов размещении точек наблюдается определенная закономерность они размещены в форме полосы или эллипса, оси которых не параллельны осям координат. При наличии связи точки размещены или в виде эллипса, неориентированного вдоль осей координат (случай линейной зависимости – рис. 8.1), либо в виде неправильной полосы (случай нелинейной связи – рис. 8.2). Рис. 8.1. Прямая линейная связь Рис. 8.2. Прямая нелинейная связь При отсутствии связей имеет место беспорядочное расположение точек на графике. Теснота корреляционной связи между факторными и результативными признаками может исчисляться с помощью линейного коэффициента корреляции. Линейный коэффициент корреляции (r) был впервые введен вначале х гг. XIX в. Пирсоном, Эджвортом и Велдоном и характеризует тесноту и направление связи между двумя коррелируемы- ми признаками в случае наличия между ними линейной зависимости. В теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента σ σ ) y ( ) ( y x y x x r ⋅ − ⋅ − = (8.1) Преобразования данной формулы позволяют получить следующие формулы линейного коэффициента корреляции y x n y y x x r σ σ ) ( ) ( ⋅ ⋅ ∑ − ⋅ − = , (8.2) или , ) ( ) ( ) ( ) ( 2 2 ∑ − ⋅ ∑ − ∑ − ⋅ − = y y x x y y x x r (8.3) где n – число наблюдений.
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Производя расчет по итоговым значениям переменных, линейный коэффициент корреляции можно вычислить по формуле ( ) [ ] ( ) [ ] 2 2 2 2 ∑ ∑ − ⋅ ∑ ∑ − ∑ ∑ ∑ ⋅ − ⋅ = y y n x x n y x xy n r (8.4) Коэффициент корреляции может быть выражен через дисперсии слагаемых) или σ σ y x y x y x r ⋅ − = (8.6) Приведенные соотношения для коэффициента корреляции применяются при изучении совокупностей малого объема Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Легко доказать, что условие r = 0 является необходимыми достаточным для того, чтобы величины x и y были независимы. Линейный коэффициент корреляции изменяется в пределах от –1 до +1. Принято считать, что если − ÷ = 0,7 это средняя связь, при − > сильная, или тесная, связь. Когда связь функциональная. Значимость линейного коэффициента корреляции проверяется на основе критерия Стьюдента: 2) ( 1 2 2 − − = n r r t p (8.7) При большом числе наблюдений (n > 100) используется следующая формула критерия Стьюдента: 1 2 n r r t p ⋅ − = (8.8) Если расчетное значение к (табличное, то это свидетельствует о значимости линейных коэффициентов корреляции, а следовательно и о статистической существенности зависимости между параметрами. Для статистически значимого линейного коэффициента корреляции можно построить интервальные оценки с помощью распределения Фи- шера: 1 1 ln 2 1 r r z − + ⋅ = (8.9)
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Пример. На основе выборочных данных о деловой активности однотипных коммерческих структур оценить тесноту связи между прибылью тыс. р) (y) и затратами нар. произведенной продукции (x). Расчетные данные для определения коэффициента корреляции приведены в табл. 8.2. Таблица 8.2 № п/п y x yx y 2 x 2 1 2 3 4 5 6 221 1 070 1 001 606 779 789 96 77 77 89 82 81 21 216 82 390 77 077 53 934 63 878 63 909 48 841 1 144 900 1 002 000 367 236 606 841 622 520 9 216 5 929 5 929 7 921 6 724 6 561 Сумма 4 466 502 362 404 3 792 338 42 280 Средняя 744,33 83,67 60 400,67 63 2056,33 7 046,67 Решение Используя формулу коэффициента корреляции , σ σ y x y x xy r ⋅ ⋅ − = (8.10) получаем 0,98. 46 78029,3 83,67 744,33 60400,67 46; (83,67) 7046,67 ) ( σ 78029,3; (744,3) 632056,3 ) ( σ 2 2 2 2 2 2 2 Проверка значимости коэффициента корреляции 14,036. 2 6 2 0,98) ( 1 0,98 2 1 Так как кр t t p можно сделать заключение о значимости данного коэффициента корреляции. В случае наличия линейной и нелинейной зависимостей между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение Различают эмпирическое и теоретическое корреляционное отношение. Эмпирическое корреляционное отношениерассчитывается поданным группировки, когда межгрупповая дисперсия ( 2 δ ) характеризует отклонения групповых средних результативного показателя от общей средней Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. , σ δ σ 1 σ σ η 2 2 2 2 2 2 2 = σ − = σ − = (8.11) где η – корреляционное отношение − σ 2 общая дисперсия 2 σ – средняя из частных (групповых) дисперсий − 2 δ межгрупповая дисперсия (дисперсия групповых средних. Все эти дисперсии являются дисперсиями результативного признака. Теоретическое корреляционное отношениеопределяется по формуле , σ δ η 2 2 = (8.12) где − 2 δ дисперсия выравненных значений результативного признака, рассчитанных по уравнению регрессии − 2 σ дисперсия эмпирических (фактических) значений результативного признака. Дисперсии выравненных и эмпирических значений результативного признака рассчитываются по формулам ( ) ( ) σ σ ; 2 δ δ 2 2 2 yxnyyynyxy= ∑ − = = ∑ − = (8.13) Тогда ( ) ( ) ∑ − ∑ − = 2 2 η yyyyx (8.14) объясняется влиянием факторного признака. Корреляционное отношение изменяется в пределах от 0 дои анализ степени тесноты связи полностью соответствует линейному коэффициенту корреляции. Корреляционное отношение является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции. Множественный коэффициент корреляции рассчитывается при наличии линейной связи между результативными несколькими факторными признаками, а также между каждой парой факторных признаков. В случае оценки связи между результативными двумя факторными признаками ( x1 ) и ( x2 ) множественный коэффициент корреляции можно определить по формуле Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 2 1 2 1 2 1 2 1 2 1 2 2 2 1 2 x x r x x r yx r yx r yx r yx r x y/x R − ⋅ ⋅ − + = , (8.15) где r – парные коэффициенты корреляции между признаками. Множественный коэффициент корреляции изменяется в пределах от 0 дои по определению положителен 1 0 ≤ ≤ R . Приближение коэффициента к единице свидетельствует о сильной зависимости между признаками. Проверка значимости коэффициента множественной корреляции осуществляется на основе критерия Фишера – Снедекора: ) (1 3 1 2 1 2 2 2 1 2 1 x y/x R n x y/x R F p − − = (8.16) Если р > кр (табличное, это свидетельствует о значимости коэффициента множественной корреляции. Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками – хи х при фиксированном значении других факторных признаков, те. когда влияние х исключается и оценивается связь между хи х в чистом виде. В случае зависимости y от двух факторных признаков – хи х – коэффициент частной корреляции следующий ( ) ( ) ; 1 1 / 2 2 2 1 2 2 2 1 1 2 1 x x r y x r r x x r yx r x yx r yx − ⋅ − ⋅ − = (8.17) ( ) ( ) , 1 1 / 2 2 2 1 1 2 1 1 2 1 2 x x r y x r x x r y x r yx r x yx r − ⋅ − ⋅ − = (8.18) где r – парные коэффициенты корреляции между указанными в индексе переменными. Проверка значимости аналогична проверке значимости для парных коэффициентов [1, 7–12]. 8.3. Методы изучения связи социальных явлений Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки. Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. При исследовании связи числовой мате Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. риал располагают в виде таблиц сопряженности. Для вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, те. состоящим из двух качественно отличных друг от друга значений признака (например хороший – плохой. Для вычисления коэффициентов ассоциации и контингенции приведена табл. 8.3. Таблица 8.3 a b a +b c d c+d a +c b+d a+b+c+d Коэффициенты определяются по формулам ассоциации (8.19) контингенции ( ) ( ) ( ) ( ) d c c a d b b a bc ad k K + ⋅ + ⋅ + ⋅ + − = (8.20) Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если 0,5 ≥ а К или 0,3. ≥ k К Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона – Чупрова. Этот коэффициент вычисляется последующим формулам ; 1 2 2 ϕ + ϕ = π K (8.21) ( )( ) , 1 1 2 1 2 ч − − ϕ = К К К (8.22) где φ 2 – показатель взаимной сопряженности φ – определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки (вычитая из этой суммы 1, получим величину φ 2 ); К – число значений (групп) первого признака К – число значений (групп) второго признака. Чем ближе величины и К ч к 1, тем связь теснее. В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам, например рангам, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи. Данные коэффициенты исчисляются при условии,
|
|
|