Главная страница
Навигация по странице:

  • (доля объектов с интересующим нас признаком)

  • Н(0)

  • СЛУЧАЙ 1. Выборки независимые

  • Если

  • После рекламы До рекламы

  • метод указаний. Метод указания_Таблица сопряженности. Срсп анализ качественных признаков. Таблицы сопряженности


    Скачать 41.59 Kb.
    НазваниеСрсп анализ качественных признаков. Таблицы сопряженности
    Анкорметод указаний
    Дата27.10.2022
    Размер41.59 Kb.
    Формат файлаdocx
    Имя файлаМетод указания_Таблица сопряженности.docx
    ТипДокументы
    #757469

    СРСП - Анализ качественных признаков. Таблицы сопряженности



    Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?

    В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.

    Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.

    Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).

    В общем случае Н(0) формулируется следующим образом:

    • в генеральных совокупностях доля объектов с интересующими нас признаками одинакова

    • или частота встречаемости одного признака не зависит от частоты встречаемости другого признака

    • или какой-либо фактор не влияет на частоту встречаемости признака (признаков)

    СЛУЧАЙ 1. Выборки независимые

    Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности





    Первая признак (первая градация)

    Первый признак (вторая градация)

    Всего

    Второй признак (первая градация)

    Частота встречаемости

    a

    Частота встречаемости

    b

    a +b

    Второй признак (вторая градация)

    Частота встречаемости

    c

    Частота встречаемости

    d

    с+d




    n1=a+c

    n2=b+d

    n =a+b+c+d


    Критерием для проверки нулевой гипотезы является хи-квадрат Пирсона с поправкой Йетса

    Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов, n – число строк (Приложение 5).
    Если то Н(0) принимается,

    В случае принимается Н(1)

    Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциации Юла Q(аналог коэффициента корреляции)

    Qлежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.
    Работа с преподавателем

    Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.

    В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?

    Зададим уровень значимости α=0,05

    Сформулируем Н(0): в генеральной совокупности доля больных тромбозом не зависит от приема аспирина.

    Занесем результаты испытания в таблицу.





    Тромбоз есть

    Тромбоза нет




    Плацебо

    18

    7

    25

    Аспирин

    6

    13

    19

    Всего

    24

    20

    44

    Посчитаем значение критерия хи-квадрат с поправкой Йетса



    Q=0,7

    Мы задали 5% -ный уровень значимости α = 0,05 . Тогда критическое значение = 3,84 (по таблице для f=1). Полученное значение χ2=5,56 больше, чем критическое, следовательно, мы отвергаем Н(0) гипотезу о том, что аспирин не влияет на проявление тромбоза шунта. Следовательно, мы можем утверждать с вероятностью 95%, что использование аспирина эффективно снижает риск тромбоза в генеральной совокупности.

    Q=0,7 показывает сильную связь между приемом аспирина и вероятностью тромбоза.
    Случай 2. Выборки зависимые

    Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)

    Подсчитывается сколько раз данное свойство встречается:

    • и «до» и «после», (+,+)

    • только «до» (+,-)

    • только «после» (-,+)

    • ни «до» ни «после» (-,-)







    Наличие признака «после»

    Наличие признака «до»

    нет (-)

    есть (+)

    есть (+)

    a

    Число изменений от (+) к (-)

    c

    Число сохранивших (+)

    нет (-)

    b

    Число сохранивших (-)

    d

    Число изменений от (–) к (+)

    • Н(0) – доля объектов с интересующим нас признаком «после» не изменилась по сравнению с «до»

    • Вычисляем критерий хи-квадрат Мак-Нимара





    Если то Н(0) принимается

    • Если то принимаем Н(1),


    Работа с преподавателем. Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.

    Сформулируем Н(0): рекламная компания, проведенная в генеральной совокупности, не повлияет на долю курящих.

    Или - соотношение курящих и некурящих среди членов генеральной совокупности после рекламной компании не изменится.

    Зададим уровень значимости α=0,01

    Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты





    После рекламы

    До рекламы

    Не курят (-)

    Курят (+)

    Курят (+)

    32 (курили , но не стали курить)

    25 (курили и курят)

    Не курят (-)

    43 (не курили и не курят)

    0 (не курили, но стали курить)




    Мы задали 1% -ный уровень значимости α = 0,01 . Тогда критическое значение = 6,64 (по таблице для f=1). Полученное значение χ2=30 больше, чем критическое, следовательно:

    мы отвергаем нулевую гипотезу и принимаем альтернативную о том, что с вероятностью 99 % рекламная компания повлияет на соотношение курящих и некурящих в популяции (генеральной совокупности).
    Контрольные вопросы

    1. Для каких целей используются таблицы сопряженности

    2. Структура таблицы сопряженности

    3. Сформулирйте нулевую гипотезу для общего случая

    4. Какие данные заносятся в таблицу сопряженности в случае зависимых выборок

    5. Какие критерии используются при анализе таблицы сопряженности


    написать администратору сайта