Главная страница
Навигация по странице:

  • У х1х2 = 19,4368 - 3,8121х 1 – 0,2253х 2

  • 5. Непараметрические методы анализа .

  • Таблица для вычисления коэффициентов ассоциации и контингенции

  • ассоциации

  • Итого

  • Вспомогательная таблица для расчёта коэффициента взаимной сопряжённости

  • Зависимость освоения «Статистики» от типа школы, которую закончили студенты

  • Статистика - лекция - Корреляция. Статистическое изучение взаимосвязи социальноэкономических явлений. Корреляционнорегрессионный анализ


    Скачать 0.86 Mb.
    НазваниеСтатистическое изучение взаимосвязи социальноэкономических явлений. Корреляционнорегрессионный анализ
    АнкорСтатистика - лекция - Корреляция.doc
    Дата27.05.2017
    Размер0.86 Mb.
    Формат файлаdoc
    Имя файлаСтатистика - лекция - Корреляция.doc
    ТипИсследование
    #8080
    страница6 из 7
    1   2   3   4   5   6   7


    Из второго уравнения вычтем первое, а из третьего – второе, получим:

    -8,6441а2=1,9477

    а2 = - 0,2253
    Величину параметра а1 определим из следующего уравнения:



    0,2496а1 + 0,2839 ·(- 0,2253) = - 1,0155

    0,2496а1 - 0,0640 = - 1,0155

    0,2496а1 = -1,0155 + 0,0640

    а1 = - 0,9515: 0,2496

    а1 = - 3,8121
    Величину параметра а0 определим из следующего уравнения:



    а0 + 5,4341 · (- 3,8121) + 23,275 · (- 0,2253) = - 6,5224

    а0 - 20,7153 – 5,2439 = - 6,5224

    а0 = - 6,5224 + 20,7153 + 5,2439

    а0 = 19,4368

    Таким образом, получаем уравнение, выражающее корреляционную зависимость между численностью безработных, численностью занятых в условиях, не отвечающих санитарным нормам, и естественным приростом (убылью) населения в расчёте на 1000 жителей в анализируемых областях:

    Ух1х2 = 19,4368 - 3,8121х1 – 0,2253х2
    В данном уравнении регрессии параметр а0 = 19,4368 показывает усреднённое влияние на результативный признак неучтённых (невыделенных для исследования) факторов; параметр а1 = - 3,8121 – коэффициент регрессии, который показывает, что с увеличением численности безработных на 1% - естественный прирост (убыль) населения в расчёте на 1000 жителей уменьшается на 3,8 человека; параметр а2 = - 0,2253 – коэффициент регрессии, который показывает, что с увеличением численности занятых в условиях, не отвечающих санитарным нормам, на 1% - естественный прирост (убыль) населения в расчёте на 1000 жителей уменьшается на 0,2 человека.
    г) Вычислим коэффициенты парной корреляции , ,

    найдём по формуле:

    , где






    найдём по формуле:

    , где





    найдём по формуле:



    Вычисленные коэффициенты парной корреляции показывают тесноту связи между численностью безработных, численностью занятых в условиях, не отвечающих санитарным нормам, и естественным приростом (убылью) населения в расчёте на 1000 жителей в анализируемых областях. Так,

    = - 0,884 показывает, что между численностью безработных (Х1) и естественным приростом (убылью) населения в расчёте на 1000 жителей в нашей задаче наблюдается высокая (по шкале Чеддока), обратная (т. к. знак «-») зависимость, т. е. с ростом численности безработных естественный прирост уменьшается.

    = - 0,387 показывает, что между численностью занятых в условиях, не отвечающих санитарным нормам (Х2) и естественным приростом (убылью) населения в расчёте на 1000 жителей наблюдается умеренная (по шкале Чеддока), обратная (т. к. знак «-») зависимость, т. е. с ростом численности занятых в условиях, не отвечающих санитарным нормам, естественный прирост в анализируемых областях уменьшается.

    = 0,132 показывает, что между численностью безработных (Х1) и численностью занятых в условиях, не отвечающих санитарным нормам (Х2), наблюдается слабая (по шкале Чеддока), прямая (т. к. знак «+») зависимость, т. е. с ростом численности занятых в условиях, не отвечающих санитарным нормам, численность безработных увеличивается, и, наоборот.
    д) Множественный коэффициент корреляции для двух факторных (Х1 и Х2) при­знаков вычисляется по формуле:

    , где

    rух - парные коэффициенты корреляции между признаками.
    Следовательно, в нашей задаче, множественный коэффициент корреляции равен:



    Коэффициент множественной корреляции изменяется в пределах от 0 до 1 и по определению положителен: 0 ≤ R≤1.

    Приближение Rк единице свидетельствует о сильной зависимости между признаками.

    Следовательно, вычисленный коэффициент множественной корреляции характеризует, о том, что между численностью безработных, численностью занятых в условиях, не отвечающих санитарным нормам, и естественным приростом (убылью) населения в расчёте на 1000 жителей в анализируемых областях существует сильная взаимосвязь.


    е) Вычислим частные коэффициенты корреляции, которые характеризуют степень тес­ноты связи между двумя признаками х1 и х2 при фиксированном значении других (k - 2) факторных признаков, то есть когда влияние х1 исключает­ся, то есть оценивается связь между х1 и х2 в "чистом виде".

    В случае зависимости у от двух факторных признаков х1 и х2 ко­эффициенты частной корреляции имеют вид:


    ,

    где r – парные коэффициенты корреляции между указанными в индексе переменными.
    В первом случае исключено влияние факторного признака х2, во втором – х1.

    В нашей задаче:



    Значит, между численностью безработных (Х1) и естественным приростом (убылью) населения в расчёте на 1000 жителей (У) при фиксированном значении показателя Х2 наблюдается высокая (по шкале Чеддока), обратная (т. к. знак «-») зависимость.


    Следовательно, между численностью занятых в условиях, не отвечающих санитарным нормам (Х2), и естественным приростом (убылью) населения в расчёте на 1000 жителей (У) при фиксированном значении показателя Х1 наблюдается заметная (по шкале Чеддока), обратная (т. к. знак «-») зависимость.
    5. Непараметрические методы анализа.
    Как мы изучили на предыдущих занятиях, для изучения тесноты связи между Х и У используется коэффициент (индекс) корреляции.

    В некоторых случаях мы можем встретиться с такими качествами, которые не поддаются выражению числом единиц.

    Эти обстоятельства заставляют прибегать к использованию т. н. непараметрических методов, позволяющих измерить интенсивность связи как между количественными признаками, так и между качественными.

    При исследовании тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффици­енты ассоциации (Ка) и контингенции (Кк) . Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каж­дое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (табл. 8).

    Таблица 8

    Таблица для вычисления коэффициентов ассоциации и контингенции

    a

    b

    a + b

    с

    d

    с + d

    а + с

    b + d

    a+b+с+d

    Коэффициенты вычисляются по формулам:

    ассоциации:

    контингенции:

    Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0,5 или Кк>0,3.

    Пример 1: Оцените наличие связи между студентами группы, распределённых по полу, и заинтересованностью их предметом «Статистика» (табл. 9), рассчитав Ка и Кк. (Данные получаем на основании опроса, проведенного в классе.)

    Таблица 9

    Статистика, как предмет изучения

    Пол

    Всего

    Мужской

    Женский

    Интересный

    3

    15

    18

    Неинтересный

    2

    15

    17

    Итого

    5

    30

    35

    Ка = Кк =

    Вывод: Т. к. Ка < 0,5 и Кк < 0,3 то заинтересованность статистикой не зависит от пола студентов.

    Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно при­менение коэффициентов взаимной сопряженности Пирсона и Чупрова, которые вычисляются по следующим формулам:

    ; ,

    Где:

    - показатель взаимной сопряжённости;

    - определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки минус 1:

    ,

    где К1- число значений (групп) первого признака

    К2- число значений (групп) второго признака
    Чем ближе Кп и Кч, тем связь теснее.

    Таблица 10

    Вспомогательная таблица для расчёта коэффициента взаимной сопряжённости

    Х У

    I

    I I

    I I I

    Всего

    I





    nху

    nх

    I I








    nх

    I I I








    nх

    Итого

    nу

    nу

    nу

    n



    Пример 2. Оцените зависимость освоения курса «Статистика» от типа школы, которую окончили студенты данной группы (табл. 11) (исходные данные получаем путём опроса студентов группы непосредственно на занятии).

    Таблица 11

    Зависимость освоения «Статистики» от типа школы, которую

    закончили студенты

    Тип школы

    Освоение курса «Статистика»

    Итого

    Хорошее

    Среднее

    Плохое

    Лицей, гимназия, специализированные школы, классы

    5

    2

    3

    10

    Общеобразовательная городская школа

    5

    6

    9

    20

    Общеобразовательная

    сельская школа

    2

    1

    2

    5

    Итого

    12

    9

    14

    35

    Решение: Кп =;

    1 + =+

    +0,316+0,693+0,146=1,055

    = 1,055-1=0,055

    Кп ==0,228

    Кч = ==0,164

    Чем Кп и Кч ближе к 1, тем связь сильнее.
    Вывод: Освоение курса «Статистика» не зависит от типа школы, которую закончили студенты.
    Для определения тесноты связи как между количественными, так и между качественными признаками при условии, что значения этих признаков могут быть упорядочены (проранжированы) по степени убывания или возрастания признака используют коэффициент корреляции рангов Спирмена, который рассчитывается по формуле:

    ,

    где di – квадраты разности величин x и y.

    n - число наблюдений (число пар рангов)

    Используя данные примера 2 по нелинейной корреляционной зависимости, рассчитаем коэффициент Спирмена. Для этого построим таблицу 12.

    Таблица 12
    1   2   3   4   5   6   7


    написать администратору сайта