Главная страница

Статистический анализ медико-биологических данных. А. М. Никифорова мчс россии Н. В. Макарова Статистический анализ медикобиологических данных с использованием пакетов статистических программ Statistica, spss, ncss, systat методическое пособие


Скачать 2.36 Mb.
НазваниеА. М. Никифорова мчс россии Н. В. Макарова Статистический анализ медикобиологических данных с использованием пакетов статистических программ Statistica, spss, ncss, systat методическое пособие
Дата08.03.2023
Размер2.36 Mb.
Формат файлаpdf
Имя файлаСтатистический анализ медико-биологических данных.pdf
ТипМетодическое пособие
#975186
страница8 из 15
1   ...   4   5   6   7   8   9   10   11   ...   15
Mantel-Haenszel Test Report
Filter age_work_gr>1
Counts Variable count
Strata Count Section (описаниеданных)
Sample
Strata dose_gr
A
B
C
D Odds Ratio
1 1
247 1017 60 504 2.0401 2
2 340 1424 59 595 2.4079 3
3 268 1207 14 167 2.6486
A: age_work_gr = 2, ind_death = 1 («умер»)
B: age_work_gr = 2, ind_death = 2 («жив»)
C: age_work_gr = 3, ind_death = 1
D: age_work_gr = 3, ind_death = 2

85
Strata Detail Section (относительныериски OR идоверительные 95%
интервалы длянихвотдельныхстратахподозе)
Strata Lower
95.0% C.L.
1/2-
Corrected
Odds Ratio
Upper
95.0% C.L.
Exact Test Proportion
Exposed
Proportion
Diseased
1 1.4937 2.0342 2.7910 0.0000 0.6915 0.1679 2
1.7805 2.4001 3.2623 0.0000 0.7295 0.1650 3
1.4729 2.6079 4.8477 0.0002 0.8907 0.1703
Результаты вычислений для каждой из страт (таблиц 2×2).
1/2-Corrected Odds Ratio –
это отношение шансов, вычисленное с использованием Delta Value, а затем скорректированное с помощью специальной итерационной процедуры.
Lower
и Upper 95.0% C.L. – доверительный интервал для отношения шансов в каждой страте. Вычисляется по формулам, приведенным в
Приложении.
Exact Test - точный тест Фишера для таблицы 2×2. Проверяется нулевая гипотеза Н
0
: OR=1. Она отвергается, если значение теста меньше выбранного уровня значимости.
Proportion Exposed –
доля экспонированных фактором риска лиц во всей таблице, в данном случае – доля лиц из 2 возрастной группы в каждой страте.
Proportion Diseased –
доля «случаев» во всей таблице, в данном случае
– пропорция умерших.
Внашемпримеревсериски OR(i) значимопревышают 1.
Mantel-Haenszel Statistics Section
Lower Estimated Upper Chi-Square
Prob
Method 95.0% C.L. Odds Ratio 95.0% C.L.
Value
DF
Level
MH C.C.
1.8808 2.2825 2.7700 69.83 1 0.000000
MH
1.8827 2.2825 2.7673 70.53 1 0.000000
Robins
1.8754 2.2825 2.7780
Woolf
1.8651 2.2705 2.7639 66.78 1 0.000000
Heterogeneity Test
0.93 2 0.628853
Рекомендуется следующий порядок рассуждений на основе полученных результатов:
1 – прежде всего проверяется гипотеза об однородности (равенстве) отношений шансов во всех стратах (Heterogeneity Test). В данном случае эта гипотеза принимается (р = 0.629).
2 - используется MH C.C. проверка гипотезы о том, что все отношения шансов равны 1. В нашем примере эта гипотеза отвергается (p <
0.0000005).

86 3 – для оценки доверительного интервала и R
MH
предлагается использовать оценку Робинса.
Таким образом, R
MH
(2-3)
= 2.2825, доверительный интервал (1.8754,
2.7780).
Отдельно укажем содержание каждой из строк.
MH C.C. – метод Мантеля-Ханзела с поправкой на непрерывность, используется для вычисления R
MH
и доверительного интервала для риска, а также проверки гипотезы о том, что все риски в отдельных стратах равны 1 против альтернативной гипотезы, что хотя бы один из рисков отличен от 1.
MH - метод Мантеля-Ханзела вычисления R
MH
, доверительного интервала для риска и проверки гипотезы о равенстве всех рисков в стратах 1, но без поправки на непрерывность.
Robins – модификация Робинса метода Мантеля-Ханзела, Она касается только вычисления доверительного интервала, поэтому в данной строке отсутствуют значения выборочной статистики и р-значения. Оценка объединенного риска в этой строке совпадает с риском MH C.C.
Woolf – объединенный риск (R
w
) по методу Вульфа.
Heterogeneity Test – разработанный Вульфом тест для проверки общей гипотезы об однородности рисков в стратах: нулевая гипотеза предполагает, что все риски равны между собой, но не обязательно равны 1.
Соответствующие формулы даны в Приложении.
При сравнении 1 и 2 уровней фактора «age_work_group» получим:
Риски однородны, все отличны от 1, R
MH
(1-2)
= 1.3614, доверительный интервал (1.1919, 1.5549).
При сравнении 1 и 3 уровней фактора «age_work_group» получим:
Риски однородны, все отличны от 1, R
MH
(1-3)
= 3.1714, доверительный интервал (2.5608, 3.9276).
Таким образом, все полученные риски значимо превышают 1.
12.Б. В качестве фактора риска выбирается полученная доза, а в качестве мешающего параметра – возраст участия в работах.
Сравнивая 1 и 2 уровни изучаемого фактора, получим: риски однородны, но каждый статистически не отличается от 1. Значимого влияния фактора «доза» нет.
Strata Detail Section
Strata Lower
95.0% C.L.
1/2-Corrected
Odds Ratio
Upper
95.0% C.L.
Exact
Test
Proportion
Exposed
Proportion
Diseased
1 0.8082 1.0583 1.3847 0.6894 0.4065 0.2526 2
0.8439 1.0174 1.2260 0.8523 0.4174 0.1939 3
0.8085 1.2004 1.7829 0.3839 0.4631 0.0977

87
Mantel-Haenszel Statistics Section
Lower Estimated
Upper Chi-Square
Prob
Method 95.0% C.L. Odds Ratio 95.0% C.L.
Value
DF Level
MH C.C.
0.9087 1.0519 1.2177 0.46 1 0.497938
MH
0.9154 1.0519 1.2088 0.51 1 0.475685
Robins
0.9154 1.0519 1.2088
Woolf
0.9154 1.0519 1.2089 0.51 1 0.475536
Heterogeneity Test
0.60 2 0.740698
При сравнении 2 и 3 уровней фактора «dose_group» получим те же результаты.
Mantel-Haenszel Statistics Section
Lower Estimated
Upper Chi-Square
Prob
Method 95.0% C.L. Odds Ratio 95.0% C.L.
Value
DF
Level
MH C.C.
0.9590 1.1120 1.2894 1.98 1 0.159733
MH
0.9626 1.1120 1.2846 2.08 1 0.149158
Robins
0.9627 1.1120 1.2845
Woolf
0.9623 1.1117 1.2842 2.07 1 0.150312
Heterogeneity Test
0.40 2 0.819819
При сравнении 1 и 3 уровней фактора «dose_group» также получим, что влияние дозы статистически незначимо.
Mantel-Haenszel Statistics Section
Lower Estimated
Upper Chi-Square
Prob
Method 95.0% C.L. Odds Ratio 95.0% C.L.
Value
DF
Level
MH C.C.
0.9885 1.1581 1.3568 3.30 1 0.069188
MH
0.9919 1.1581 1.3523 3.45 1 0.063379
Robins
0.9921 1.1581 1.3519
Woolf
0.9905 1.1567 1.3507 3.38 1 0.065881
Heterogeneity Test
1.07 2 0.586868
После проведения анализа влияния двух факторов на уровень смертности ликвидаторов за период наблюдения 1986-2005 гг. можно сделать вывод, что полученная доза не оказывает заметного влияния на этот уровень, в отличие от возраста ликвидаторов.
4.4.
Стандартизация
Еще одним методом, позволяющим исключить влияние мешающих параметров на исследуемый показатель, является стандартизация.
Наиболее часто на практике производится стандартизация по возрасту.
Необходимость применения стандартизации покажем на примере.
По данным из сборника Комитета по здравоохранению
Администрации Санкт-Петербурга «Анализ медицинских данных государственного статистического наблюдения» (В.М.Дорофеев и др.,
СПб, 2003), в 2001 году показатель общей смертности на 1000 человек

88 населения СПб занимал 26 место среди 89 субъектов РФ и был на 5.1% выше среднего по России. Однако стандартизованный показатель
(стандартизация по европейскому стандарту) занимал 67 место и был ниже среднего по стране. Эти данные приведены в следующей таблице и на рисунках.
Таблица 4.4. Обычные и стандартизованные показатели общей смертности
Территория
Обычные показатели
Стандартизованные показатели
М
Ж
Все
М
Ж
Все
РФ
17.9 13.7 15.7 20.9 10.3 14.8
СПб
18.2 15.2 16.5 19.4 9.9 13.8
0
5
10
15
20
25
Мужчины
, обычные показатели
Мужчины
,
стандартиз
.показатели
РФ
СПб
Рис. 4.1. Показатели смертности мужчин РФ и СПб в 2001

89
0
2
4
6
8
10
12
14
16
Женщины
, обычные показатели
Женщины
,
стандартиз
.показатели
РФ
СПб
Рис. 4.2. Показатели смертности женщин РФ и СПб в 2001 г.
Таким образом, исключение влияния на результат возрастного распределения населения на территории приводит к изменению выводов о соотношении показателей смертности.
Для формализации методов стандартизации используется следующая таблица.
Таблица 4.5. Исходные данные для проведения стандартизации
Группы мешающего параметра
Изучаемая популяция
Стандартная популяция
Кол-во объектов под риском
Кол-во случаев
Уровень Кол-во объектов под риском
Кол-во случаев
Уровень
1 n
1 r
1 p
1
N
1
R
1
P
1 2 n
2 r
1 p
2
N
2
R
2
P
2

K n
k r
k p
k
N
k
R
k
P
k
Всего n r
P
N
R
P
Если в качестве мешающего параметра выступает возраст, то группы 1, 2. …, k – могут быть стандартными возрастными группами с диапазоном 5 или 10 лет (например, 20-29, 30-39,…) или сконструированными в целях исследования группами с другим диапазоном (например, 7 лет).
Различают несколько методов стандартизации. Чаще всего

90 используется прямая стандартизация, но также существуют методы непрямой и обратной стандартизации, оценка максимального правдоподобия, метод Юла и некоторые другие. Выбор варианта стандартизации в основном определяется целью ее проведения и наличием необходимой информации. В основном задачи, для которых применяются методы стандартизации, описываются схемой 8. Это означает, что изучаемый нами фактор действует только на выборку, и мы сравниваем распространенность явления в выборке с распространенностью в популяции, с помощью стандартизации исключая влияние мешающих параметров. Для решения задач, соответствующих схеме 7 (сравнение распространенности явления в двух выборках), из всех методов стандартизации может использоваться только один – прямая стандартизация.
Схема 8. Методика применения стандартизации
N
N
N
N
4 4
4 4
P
14
P
04
N
N
N
N
3 3
3 3
P
13
P
03
N
N
N
N
2 2
2 2
P
12
P
02
P
01
N
N
N
N
1 1
1 1
P
11
P
1
Распространен- ность явления в популяции
P
0

91
Прямая стандартизация
Обозначим символом t i
= N
i
/N долю i-ой группы мешающего параметра в общем объеме стандартной популяции. Тогда стандартизованный уровень
i
k
i
i
ст п
p
t
p
×
=

=1
(4.7)
Стандартная ошибка прямого стандартизованного уровня
Ст.ош.(р п.ст.
) =

=

×
k
i
i
i
i
i
n
p
p
t
1 2
)
1
(
(4.8)
Сравнительный индекс (CMI для смертности, CII для первичной заболеваемости) при сравнении со стандартной популяцией
CMI =
P
t
p
k
i
i
i

=1
= р п.ст.
/P
(4.9)
Стандартная ошибка сравнительного индекса (относительного риска) в этом случае
Ст.ош.(CMI) =

=

k
i
i
i
i
i
n
P
р
p
N
1 2
2
)
1
(
(4.10)
Пример 13. (Данные Комитета по здравоохранению Администрации
Санкт-Петербурга «Анализ медицинских данных государственного статистического наблюдения» (В.М.Дорофеев и др., СПб, 2003) и учебника «Демография», Медков В.М., Москва, Инфра-М, 2004).
Известны повозрастные показатели смертности мужского населения в
СПб, общие показатели смертности в 2001 г. в России и СПб (17.9 и
18.18 на 1000 человек населения, соответственно) и структура мужского населения России.

92
Таблица П13-1. Повозрастные уровни смертности мужчин в СПб на
1000 человек и возрастная структура мужского населения России в 2001 году
Возраст
Повозрастные показатели смертности в СПб
(p i
)
Возрастная структура в
России (t i
)
Показатели смертности в
СПб с учетом доли в возрастной структуре
(t i
*p i
)
0-1
10.79 0.0096 0.104
1-4
0.86 0.0478 0.041
5-9
0.47 0.0578 0.027
10-14
0.41 0.0868 0.036
15-19
1.66 0.0894 0.148
20-24
4.09 0.0807 0.330
25-29
5.53 0.0773 0.427
30-34
4.86 0.0713 0.347
35-39
8.21 0.0824 0.677
40-44
13.28 0.0907 1.204
45-49
18.47 0.0810 1.496
50-54
28.70 0.0643 1.845
55-59
31.43 0.0319 1.003
60-64
42.41 0.0536 2.273
65-69
53.47 0.0332 1.775
70-74
73.54 0.0307 2.258
75-79
92.36 0.0123 1.136
80-84
125.77 0.0049 0.616
85+
170.75 0.0039 0.666
Всего
Общийпоказатель смертности
18.18
1.
Стандартизованный показатель смертности
16.409
Эти данные позволяют вычислить прямой стандартизованный уровень смертности для СПб (16.4) и сравнительный индекс CMI:
CMI = 16.409/17.9 = 0.92
Однако вычислить ошибки уровня и сравнительного индекса по этим данным невозможно – неизвестны структура и количество мужского населения СПб.
Пример 14. (Данные НРЭР Северо-Запада). По данным НРЭР о смертности ликвидаторов, проживающих в СПб и Ленинградской области (сравнимые по численности когорты) можно построить следующий график.

93
Рис. П14-1. Динамика общей смертности ликвидаторов Ленинградской области и Санкт Петербурга
Начиная с 2000 г. наблюдаются резкие отличия в общих показателях смертности ликвидаторов этих двух субъектов РФ. Для того, чтобы выяснить, объясняются ли эти отличия различной возрастной структурой в регионах, вычислим повозрастные уровни смертности.
Повозрастные уровни смертности в Ленинградской области также превышают соответствующие показатели Санкт-Петербурга, однако соотношения повозрастных уровней отличаются. Для получения единой характеристики этого превышения возможно как вычисление объединенных рисков, так и стандартизация.
Таблица П14-1. Повозрастные уровни смертности на 1000 человек и возрастная структура ликвидаторов в 2000 - 2004 гг.
Возраст
СПб
Ленобласть
2000 2001 2002 2003 2004 2000 2001 2002 2003 2004
Количествоумерших
30-34 0
0 0
0 0
1 0
0 0
0 35-39 1
0 0
0 0
1 1
1 1
0 40-44 1
1 0
0 1
4 2
4 3
3 45-49 6
4 4
2 0
10 7
9 10 6
50-54 7
11 13 10 13 5
12 16 19 12 55-59 6
8 9
14 4
3 2
6 8
16 60-64 5
10 5
4 4
4 4
5 4
11 65-69 3
2 6
6 7
0 0
0 2
4 70-90 2
2 4
6 5
1 1
0 0
0

94
Возраст
СПб
Ленобласть
2000 2001 2002 2003 2004 2000 2001 2002 2003 2004
Количествонаблюдаемых
30-34 139 82 37 8
3 61 37 14 3
2 35-39 327 333 308 268 207 170 147 138 121 94 40-44 495 435 398 374 371 307 263 238 195 183 45-49 793 710 669 627 580 557 504 457 416 358 50-54 1000 1050 1011 974 894 527 592 629 634 558 55-59 391 485 628 761 871 169 209 239 303 405 60-64 440 467 407 355 357 81 91 114 113 128 65-69 112 131 220 296 367 22 21 30 44 54 70-90 86 117 137 152 172 7
9 10 12 18
Повозрастнаясмертность
30-34 0.00 0.00 0.00 0.00 0.00 16.39 0.00 0.00 0.00 0.00 35-39 3.06 0.00 0.00 0.00 0.00 5.88 6.80 7.25 8.26 0.00 40-44 2.02 2.30 0.00 0.00 2.70 13.03 7.61 16.81 15.39 16.39 45-49 7.57 5.63 5.98 3.19 0.00 17.95 13.89 19.69 24.04 16.76 50-54 7.00 10.48 12.86 10.27 14.54 9.49 20.27 25.44 29.97 21.51 55-59 15.35 16.50 14.33 18.40 4.59 17.75 9.57 25.11 26.40 39.51 60-64 11.36 21.41 12.29 11.27 11.20 49.38 43.96 43.86 35.40 85.94 65-69 26.79 15.27 27.27 20.27 19.07 0.00 0.00 0.00 45.46 74.07 70-90 23.26 17.09 29.20 39.47 29.07 142.86 111.11 0.00 0.00 0.00
В данном примере возможно провести прямую стандартизацию. В качестве стандартного возрастного распределения разумно взять среднюю за рассматриваемый период возрастную структуру в двух регионах. Однако, исходя из того, что младшая и старшая из рассматриваемых возрастных групп в отдельные годы являются малочисленными (что влечет за собой большую величину стандартной ошибки стандартизованного показателя), объединим их с соседними возрастными группами. Получим следующие коэффициенты (t
i
):
Возраст
Средняявозрастнаяструктураза период (t
i
)
30-39 0.089 40-44 0.115 45-49 0.200 50-54 0.278 55-59 0.157 60-64 0.090 65-90 0.071

95
При пересчете показателей смертности с учетом стандартной возрастной структуры получим следующие результаты:
2000
2001
2002
2003
2004
Общийпоказательсмертности
СПб
8.20 9.97 10.75 11.01 8.90
Ленобласть
15.25 15.48 21.94 25.53 28.89
Стандартизованныйпоказательсмертности
СПб
9.18 9.96 10.12 9.34 7.69
Ленобласть
19.27 18.09 21.39 24.95 28.57
Стандартнаяошибкастандартизованного показателясмертности
СПб
5.17 4.34 4.11 3.82 3.43
Ленобласть
13.13 12.11 8.98 11.06 12.32
Сравнительныйиндексстандартизованных показателейсмертности
CMI
2.1 1.8 2.1 2.7 3.7
Стандартная ошибка стандартизованного показателя смертности весьма велика, особенно для Ленобласти. Это не удивительно, учитывая малые количество наблюдений для младших и старших возрастных групп.
Единственный способ улучшения этой ситуации – укрупнение возрастных групп и исключение крайних малочисленных групп.
Поэтому рассмотрим 10-летние возрастные интервалы, начиная с 35 лет.
Получим следующую структуру стандарта (средняя в двух регионах за период 2000-2004 гг.).
Возраст
Средняявозрастнаяструктуразапериод
1   ...   4   5   6   7   8   9   10   11   ...   15


написать администратору сайта