Статистический анализ медико-биологических данных. А. М. Никифорова мчс россии Н. В. Макарова Статистический анализ медикобиологических данных с использованием пакетов статистических программ Statistica, spss, ncss, systat методическое пособие
Скачать 2.36 Mb.
|
Mantel-Haenszel Test Report Filter age_work_gr>1 Counts Variable count Strata Count Section (описаниеданных) Sample Strata dose_gr A B C D Odds Ratio 1 1 247 1017 60 504 2.0401 2 2 340 1424 59 595 2.4079 3 3 268 1207 14 167 2.6486 A: age_work_gr = 2, ind_death = 1 («умер») B: age_work_gr = 2, ind_death = 2 («жив») C: age_work_gr = 3, ind_death = 1 D: age_work_gr = 3, ind_death = 2 85 Strata Detail Section (относительныериски OR идоверительные 95% интервалы длянихвотдельныхстратахподозе) Strata Lower 95.0% C.L. 1/2- Corrected Odds Ratio Upper 95.0% C.L. Exact Test Proportion Exposed Proportion Diseased 1 1.4937 2.0342 2.7910 0.0000 0.6915 0.1679 2 1.7805 2.4001 3.2623 0.0000 0.7295 0.1650 3 1.4729 2.6079 4.8477 0.0002 0.8907 0.1703 Результаты вычислений для каждой из страт (таблиц 2×2). 1/2-Corrected Odds Ratio – это отношение шансов, вычисленное с использованием Delta Value, а затем скорректированное с помощью специальной итерационной процедуры. Lower и Upper 95.0% C.L. – доверительный интервал для отношения шансов в каждой страте. Вычисляется по формулам, приведенным в Приложении. Exact Test - точный тест Фишера для таблицы 2×2. Проверяется нулевая гипотеза Н 0 : OR=1. Она отвергается, если значение теста меньше выбранного уровня значимости. Proportion Exposed – доля экспонированных фактором риска лиц во всей таблице, в данном случае – доля лиц из 2 возрастной группы в каждой страте. Proportion Diseased – доля «случаев» во всей таблице, в данном случае – пропорция умерших. Внашемпримеревсериски OR(i) значимопревышают 1. Mantel-Haenszel Statistics Section Lower Estimated Upper Chi-Square Prob Method 95.0% C.L. Odds Ratio 95.0% C.L. Value DF Level MH C.C. 1.8808 2.2825 2.7700 69.83 1 0.000000 MH 1.8827 2.2825 2.7673 70.53 1 0.000000 Robins 1.8754 2.2825 2.7780 Woolf 1.8651 2.2705 2.7639 66.78 1 0.000000 Heterogeneity Test 0.93 2 0.628853 Рекомендуется следующий порядок рассуждений на основе полученных результатов: 1 – прежде всего проверяется гипотеза об однородности (равенстве) отношений шансов во всех стратах (Heterogeneity Test). В данном случае эта гипотеза принимается (р = 0.629). 2 - используется MH C.C. проверка гипотезы о том, что все отношения шансов равны 1. В нашем примере эта гипотеза отвергается (p < 0.0000005). 86 3 – для оценки доверительного интервала и R MH предлагается использовать оценку Робинса. Таким образом, R MH (2-3) = 2.2825, доверительный интервал (1.8754, 2.7780). Отдельно укажем содержание каждой из строк. MH C.C. – метод Мантеля-Ханзела с поправкой на непрерывность, используется для вычисления R MH и доверительного интервала для риска, а также проверки гипотезы о том, что все риски в отдельных стратах равны 1 против альтернативной гипотезы, что хотя бы один из рисков отличен от 1. MH - метод Мантеля-Ханзела вычисления R MH , доверительного интервала для риска и проверки гипотезы о равенстве всех рисков в стратах 1, но без поправки на непрерывность. Robins – модификация Робинса метода Мантеля-Ханзела, Она касается только вычисления доверительного интервала, поэтому в данной строке отсутствуют значения выборочной статистики и р-значения. Оценка объединенного риска в этой строке совпадает с риском MH C.C. Woolf – объединенный риск (R w ) по методу Вульфа. Heterogeneity Test – разработанный Вульфом тест для проверки общей гипотезы об однородности рисков в стратах: нулевая гипотеза предполагает, что все риски равны между собой, но не обязательно равны 1. Соответствующие формулы даны в Приложении. При сравнении 1 и 2 уровней фактора «age_work_group» получим: Риски однородны, все отличны от 1, R MH (1-2) = 1.3614, доверительный интервал (1.1919, 1.5549). При сравнении 1 и 3 уровней фактора «age_work_group» получим: Риски однородны, все отличны от 1, R MH (1-3) = 3.1714, доверительный интервал (2.5608, 3.9276). Таким образом, все полученные риски значимо превышают 1. 12.Б. В качестве фактора риска выбирается полученная доза, а в качестве мешающего параметра – возраст участия в работах. Сравнивая 1 и 2 уровни изучаемого фактора, получим: риски однородны, но каждый статистически не отличается от 1. Значимого влияния фактора «доза» нет. Strata Detail Section Strata Lower 95.0% C.L. 1/2-Corrected Odds Ratio Upper 95.0% C.L. Exact Test Proportion Exposed Proportion Diseased 1 0.8082 1.0583 1.3847 0.6894 0.4065 0.2526 2 0.8439 1.0174 1.2260 0.8523 0.4174 0.1939 3 0.8085 1.2004 1.7829 0.3839 0.4631 0.0977 87 Mantel-Haenszel Statistics Section Lower Estimated Upper Chi-Square Prob Method 95.0% C.L. Odds Ratio 95.0% C.L. Value DF Level MH C.C. 0.9087 1.0519 1.2177 0.46 1 0.497938 MH 0.9154 1.0519 1.2088 0.51 1 0.475685 Robins 0.9154 1.0519 1.2088 Woolf 0.9154 1.0519 1.2089 0.51 1 0.475536 Heterogeneity Test 0.60 2 0.740698 При сравнении 2 и 3 уровней фактора «dose_group» получим те же результаты. Mantel-Haenszel Statistics Section Lower Estimated Upper Chi-Square Prob Method 95.0% C.L. Odds Ratio 95.0% C.L. Value DF Level MH C.C. 0.9590 1.1120 1.2894 1.98 1 0.159733 MH 0.9626 1.1120 1.2846 2.08 1 0.149158 Robins 0.9627 1.1120 1.2845 Woolf 0.9623 1.1117 1.2842 2.07 1 0.150312 Heterogeneity Test 0.40 2 0.819819 При сравнении 1 и 3 уровней фактора «dose_group» также получим, что влияние дозы статистически незначимо. Mantel-Haenszel Statistics Section Lower Estimated Upper Chi-Square Prob Method 95.0% C.L. Odds Ratio 95.0% C.L. Value DF Level MH C.C. 0.9885 1.1581 1.3568 3.30 1 0.069188 MH 0.9919 1.1581 1.3523 3.45 1 0.063379 Robins 0.9921 1.1581 1.3519 Woolf 0.9905 1.1567 1.3507 3.38 1 0.065881 Heterogeneity Test 1.07 2 0.586868 После проведения анализа влияния двух факторов на уровень смертности ликвидаторов за период наблюдения 1986-2005 гг. можно сделать вывод, что полученная доза не оказывает заметного влияния на этот уровень, в отличие от возраста ликвидаторов. 4.4. Стандартизация Еще одним методом, позволяющим исключить влияние мешающих параметров на исследуемый показатель, является стандартизация. Наиболее часто на практике производится стандартизация по возрасту. Необходимость применения стандартизации покажем на примере. По данным из сборника Комитета по здравоохранению Администрации Санкт-Петербурга «Анализ медицинских данных государственного статистического наблюдения» (В.М.Дорофеев и др., СПб, 2003), в 2001 году показатель общей смертности на 1000 человек 88 населения СПб занимал 26 место среди 89 субъектов РФ и был на 5.1% выше среднего по России. Однако стандартизованный показатель (стандартизация по европейскому стандарту) занимал 67 место и был ниже среднего по стране. Эти данные приведены в следующей таблице и на рисунках. Таблица 4.4. Обычные и стандартизованные показатели общей смертности Территория Обычные показатели Стандартизованные показатели М Ж Все М Ж Все РФ 17.9 13.7 15.7 20.9 10.3 14.8 СПб 18.2 15.2 16.5 19.4 9.9 13.8 0 5 10 15 20 25 Мужчины , обычные показатели Мужчины , стандартиз .показатели РФ СПб Рис. 4.1. Показатели смертности мужчин РФ и СПб в 2001 89 0 2 4 6 8 10 12 14 16 Женщины , обычные показатели Женщины , стандартиз .показатели РФ СПб Рис. 4.2. Показатели смертности женщин РФ и СПб в 2001 г. Таким образом, исключение влияния на результат возрастного распределения населения на территории приводит к изменению выводов о соотношении показателей смертности. Для формализации методов стандартизации используется следующая таблица. Таблица 4.5. Исходные данные для проведения стандартизации Группы мешающего параметра Изучаемая популяция Стандартная популяция Кол-во объектов под риском Кол-во случаев Уровень Кол-во объектов под риском Кол-во случаев Уровень 1 n 1 r 1 p 1 N 1 R 1 P 1 2 n 2 r 1 p 2 N 2 R 2 P 2 … K n k r k p k N k R k P k Всего n r P N R P Если в качестве мешающего параметра выступает возраст, то группы 1, 2. …, k – могут быть стандартными возрастными группами с диапазоном 5 или 10 лет (например, 20-29, 30-39,…) или сконструированными в целях исследования группами с другим диапазоном (например, 7 лет). Различают несколько методов стандартизации. Чаще всего 90 используется прямая стандартизация, но также существуют методы непрямой и обратной стандартизации, оценка максимального правдоподобия, метод Юла и некоторые другие. Выбор варианта стандартизации в основном определяется целью ее проведения и наличием необходимой информации. В основном задачи, для которых применяются методы стандартизации, описываются схемой 8. Это означает, что изучаемый нами фактор действует только на выборку, и мы сравниваем распространенность явления в выборке с распространенностью в популяции, с помощью стандартизации исключая влияние мешающих параметров. Для решения задач, соответствующих схеме 7 (сравнение распространенности явления в двух выборках), из всех методов стандартизации может использоваться только один – прямая стандартизация. Схема 8. Методика применения стандартизации N N N N 4 4 4 4 P 14 P 04 N N N N 3 3 3 3 P 13 P 03 N N N N 2 2 2 2 P 12 P 02 P 01 N N N N 1 1 1 1 P 11 P 1 Распространен- ность явления в популяции P 0 91 Прямая стандартизация Обозначим символом t i = N i /N долю i-ой группы мешающего параметра в общем объеме стандартной популяции. Тогда стандартизованный уровень i k i i ст п p t p × = ∑ =1 (4.7) Стандартная ошибка прямого стандартизованного уровня Ст.ош.(р п.ст. ) = ∑ = − × k i i i i i n p p t 1 2 ) 1 ( (4.8) Сравнительный индекс (CMI для смертности, CII для первичной заболеваемости) при сравнении со стандартной популяцией CMI = P t p k i i i ∑ =1 = р п.ст. /P (4.9) Стандартная ошибка сравнительного индекса (относительного риска) в этом случае Ст.ош.(CMI) = ∑ = − k i i i i i n P р p N 1 2 2 ) 1 ( (4.10) Пример 13. (Данные Комитета по здравоохранению Администрации Санкт-Петербурга «Анализ медицинских данных государственного статистического наблюдения» (В.М.Дорофеев и др., СПб, 2003) и учебника «Демография», Медков В.М., Москва, Инфра-М, 2004). Известны повозрастные показатели смертности мужского населения в СПб, общие показатели смертности в 2001 г. в России и СПб (17.9 и 18.18 на 1000 человек населения, соответственно) и структура мужского населения России. 92 Таблица П13-1. Повозрастные уровни смертности мужчин в СПб на 1000 человек и возрастная структура мужского населения России в 2001 году Возраст Повозрастные показатели смертности в СПб (p i ) Возрастная структура в России (t i ) Показатели смертности в СПб с учетом доли в возрастной структуре (t i *p i ) 0-1 10.79 0.0096 0.104 1-4 0.86 0.0478 0.041 5-9 0.47 0.0578 0.027 10-14 0.41 0.0868 0.036 15-19 1.66 0.0894 0.148 20-24 4.09 0.0807 0.330 25-29 5.53 0.0773 0.427 30-34 4.86 0.0713 0.347 35-39 8.21 0.0824 0.677 40-44 13.28 0.0907 1.204 45-49 18.47 0.0810 1.496 50-54 28.70 0.0643 1.845 55-59 31.43 0.0319 1.003 60-64 42.41 0.0536 2.273 65-69 53.47 0.0332 1.775 70-74 73.54 0.0307 2.258 75-79 92.36 0.0123 1.136 80-84 125.77 0.0049 0.616 85+ 170.75 0.0039 0.666 Всего Общийпоказатель смертности 18.18 1. Стандартизованный показатель смертности 16.409 Эти данные позволяют вычислить прямой стандартизованный уровень смертности для СПб (16.4) и сравнительный индекс CMI: CMI = 16.409/17.9 = 0.92 Однако вычислить ошибки уровня и сравнительного индекса по этим данным невозможно – неизвестны структура и количество мужского населения СПб. Пример 14. (Данные НРЭР Северо-Запада). По данным НРЭР о смертности ликвидаторов, проживающих в СПб и Ленинградской области (сравнимые по численности когорты) можно построить следующий график. 93 Рис. П14-1. Динамика общей смертности ликвидаторов Ленинградской области и Санкт Петербурга Начиная с 2000 г. наблюдаются резкие отличия в общих показателях смертности ликвидаторов этих двух субъектов РФ. Для того, чтобы выяснить, объясняются ли эти отличия различной возрастной структурой в регионах, вычислим повозрастные уровни смертности. Повозрастные уровни смертности в Ленинградской области также превышают соответствующие показатели Санкт-Петербурга, однако соотношения повозрастных уровней отличаются. Для получения единой характеристики этого превышения возможно как вычисление объединенных рисков, так и стандартизация. Таблица П14-1. Повозрастные уровни смертности на 1000 человек и возрастная структура ликвидаторов в 2000 - 2004 гг. Возраст СПб Ленобласть 2000 2001 2002 2003 2004 2000 2001 2002 2003 2004 Количествоумерших 30-34 0 0 0 0 0 1 0 0 0 0 35-39 1 0 0 0 0 1 1 1 1 0 40-44 1 1 0 0 1 4 2 4 3 3 45-49 6 4 4 2 0 10 7 9 10 6 50-54 7 11 13 10 13 5 12 16 19 12 55-59 6 8 9 14 4 3 2 6 8 16 60-64 5 10 5 4 4 4 4 5 4 11 65-69 3 2 6 6 7 0 0 0 2 4 70-90 2 2 4 6 5 1 1 0 0 0 94 Возраст СПб Ленобласть 2000 2001 2002 2003 2004 2000 2001 2002 2003 2004 Количествонаблюдаемых 30-34 139 82 37 8 3 61 37 14 3 2 35-39 327 333 308 268 207 170 147 138 121 94 40-44 495 435 398 374 371 307 263 238 195 183 45-49 793 710 669 627 580 557 504 457 416 358 50-54 1000 1050 1011 974 894 527 592 629 634 558 55-59 391 485 628 761 871 169 209 239 303 405 60-64 440 467 407 355 357 81 91 114 113 128 65-69 112 131 220 296 367 22 21 30 44 54 70-90 86 117 137 152 172 7 9 10 12 18 Повозрастнаясмертность 30-34 0.00 0.00 0.00 0.00 0.00 16.39 0.00 0.00 0.00 0.00 35-39 3.06 0.00 0.00 0.00 0.00 5.88 6.80 7.25 8.26 0.00 40-44 2.02 2.30 0.00 0.00 2.70 13.03 7.61 16.81 15.39 16.39 45-49 7.57 5.63 5.98 3.19 0.00 17.95 13.89 19.69 24.04 16.76 50-54 7.00 10.48 12.86 10.27 14.54 9.49 20.27 25.44 29.97 21.51 55-59 15.35 16.50 14.33 18.40 4.59 17.75 9.57 25.11 26.40 39.51 60-64 11.36 21.41 12.29 11.27 11.20 49.38 43.96 43.86 35.40 85.94 65-69 26.79 15.27 27.27 20.27 19.07 0.00 0.00 0.00 45.46 74.07 70-90 23.26 17.09 29.20 39.47 29.07 142.86 111.11 0.00 0.00 0.00 В данном примере возможно провести прямую стандартизацию. В качестве стандартного возрастного распределения разумно взять среднюю за рассматриваемый период возрастную структуру в двух регионах. Однако, исходя из того, что младшая и старшая из рассматриваемых возрастных групп в отдельные годы являются малочисленными (что влечет за собой большую величину стандартной ошибки стандартизованного показателя), объединим их с соседними возрастными группами. Получим следующие коэффициенты (t i ): Возраст Средняявозрастнаяструктураза период (t i ) 30-39 0.089 40-44 0.115 45-49 0.200 50-54 0.278 55-59 0.157 60-64 0.090 65-90 0.071 95 При пересчете показателей смертности с учетом стандартной возрастной структуры получим следующие результаты: 2000 2001 2002 2003 2004 Общийпоказательсмертности СПб 8.20 9.97 10.75 11.01 8.90 Ленобласть 15.25 15.48 21.94 25.53 28.89 Стандартизованныйпоказательсмертности СПб 9.18 9.96 10.12 9.34 7.69 Ленобласть 19.27 18.09 21.39 24.95 28.57 Стандартнаяошибкастандартизованного показателясмертности СПб 5.17 4.34 4.11 3.82 3.43 Ленобласть 13.13 12.11 8.98 11.06 12.32 Сравнительныйиндексстандартизованных показателейсмертности CMI 2.1 1.8 2.1 2.7 3.7 Стандартная ошибка стандартизованного показателя смертности весьма велика, особенно для Ленобласти. Это не удивительно, учитывая малые количество наблюдений для младших и старших возрастных групп. Единственный способ улучшения этой ситуации – укрупнение возрастных групп и исключение крайних малочисленных групп. Поэтому рассмотрим 10-летние возрастные интервалы, начиная с 35 лет. Получим следующую структуру стандарта (средняя в двух регионах за период 2000-2004 гг.). Возраст Средняявозрастнаяструктуразапериод |