Статистический анализ медико-биологических данных. А. М. Никифорова мчс россии Н. В. Макарова Статистический анализ медикобиологических данных с использованием пакетов статистических программ Statistica, spss, ncss, systat методическое пособие
Скачать 2.36 Mb.
|
Nonparametrics в программе Statistica получим: Gamma = 0.33, p-level < 0.003. Таким образом, можно сказать, что существует ранговая связь между исследуемыми показателями в профессиональной группе «рабочие». Для сравнения силы ранговой связи показателей у «рабочих» и «ИТР- администрации» вычислим коэффициент ранговой корреляции для таблицы П4-1. Gamma = 0.64, p-level < 0.00001. Таким образом, связь в группе «рабочие» значительно слабее, нежели в группе «ИТР-администрация». Различные коэффициенты связи, в данном случае φ и γ, по абсолютной величине находятся в одном и том же диапазоне – от 0 до 1, но 43 вычисляются они разным образом. Поэтому для сравнения силы связи в нескольких группах лучше вычислять коэффициенты одного вида для всех групп. Расчетысиспользованиемстатистическихпакетов. Расчеты производятся теми же средствами, как в случае проверки гипотезы однородности. 2.5. ПроверкагипотезыналичиялинейноготрендаН т . При анализе изменения параметров ряда биномиальных распределений (обработка таблиц перекрестного табулирования двух показателей, из которых первый имеет ровно два возможных значения, а значений второго показателя более двух и они упорядочены) иногда требуется оценить, имеется ли тренд возрастания или убывания параметров. В качестве примера можно привести анализ тренда уровней смертности в зависимости от возраста или дозовой нагрузки. В этой задаче критерий χ 2 применяется к таблице сопряженности 2 ×k (таблица 2.4), причем каждой серии поставлена в соответствие дозовая нагрузка х 1 , х 2 , …, х k . В зависимости от смысла задачи числа {х i } i=1,…,k могут представлять собой или последовательные натуральные числа, или середину возрастного интервала, или соответствующую серии дозу препарата и т.д. Линейный тренд – это регрессия пропорций {n 1i / n •i } на дозы {х i }. Грубый анализ данных таблицы состоит в проверке гипотезы о том, что пропорции, соответствующие k столбцам таблицы, не отличаются (формула (2.5), вычисление χ 2 в (k-1)). Однако при таком анализе не используется информация об упорядоченности столбцов по дозовой нагрузке. Таблица 2.4. Подготовка данных для проверки линейного тренда Серия Значение 1 2 … k Сумма А n 11 n 12 … n 1k n 1•· не А n 21 n 22 … n 2k n 2•· Сумма n •1 n •2 … n •k N Дозовая нагрузка х 1 х 2 … х k 44 Для проверки нулевой гипотезы Н 0 : в пропорциях отсутствует линейный тренд против альтернативной гипотезы Н т : есть линейный тренд - вычисляется статистика критерия ∑ ∑ ∑ ∑ = = • • • • = = • • ∗ ∗ − ∗ ∗ − ∗ ∗ ∗ − ∗ = k i k i i i i i k i k i i i i i в N n x N x n N n N n N n x n n x 1 1 2 2 1 1 1 1 2 1 1 2 ) ) ( ( ) 1 ( ) ( χ (2.8) В предположении нулевой гипотезы критерий распределен как χ 2 (1). Гипотеза об отсутствии тренда принимается на уровне α, если χ 2 в < χ 2 1- α (1) В противном случае гипотеза отклоняется (принимается альтернативная гипотеза о наличии линейного тренда). Разность χ 2 в (d-1) и χ 2 в (1), распределенная как χ 2 (d-2), используется для проверки значимости отклонения пропорций от линейного тренда. Пример 5. (Данные Т.И.Шевченко, НИС Медицинский регистр). Проведено психологическое тестирование 97 пожарных по методике ТОР Залевского. Было обнаружено увеличение доли лиц с высоким уровнем актуальной ригидности (АР) при возрастании возраста и стажа обследованных. С учетом возраста и стажа сформировано 5 групп. Получена следующая таблица. Таблица П5-1 Номер Значение 1 2 3 4 5 Сумма Высокий уровень АР 1 3 2 5 7 18 Низкий и умеренный уровень АР 23 23 9 14 10 79 Сумма 24 26 11 19 17 97 % лиц с высоким уровнем АР 4.2 11.5 18.2 26.3 41.2 Код группы по стажу и возрасту 1 2 3 4 5 45 Рис. П5-1. Линейный тренд по коду группы Результатыпроверкиналичиялинейноготрендаспомощью статистическихпрограмм. SYSTAT →Tables → Crosstabs → Two-way… (задать Cochran's test of linear trend в выборе Statistics…) Test statistic Value df Prob Pearson Chi-square 10.649 4 0.031 Cochran's Linear Trend 10.366 1 0.001 WARNING: More than one-fifth of fitted cells are sparse (frequency < 5). Significance tests computed on this table are suspect. В первой строке таблицы – статистика Пирсона хи-квадрат для проверки однородности столбцов таблицы (с 4 степенями свободы). Во второй строке, с названием «линейный тренд Кокрейна», статистика Пирсона хи-квадрат для проверки наличия линейного тренда (с 1 степенью свободы). Выведено предупреждение о том, что в таблице слишком много малых частот. Тесты показывают значимое отклонение от равенства пропорций по столбцам и наличие линейного тренда. 46 Более четко данные выводы приведены в программе NCSS, но в этой программе проверка наличия линейного тренда проводится с помощью другой статистики (описание в Приложении). NCSS → Descriptive Statistics → Cross Tabulation Armitage Test for Trend in Proportions Ho: p1 = p2 = p3 = ... = pk Armitage S -666 Standard Error of S 210.2 Z-Value (Standardized S) -3.168 Prob (Ha: Increasing Trend – альтернативная гипотеза – возрастающийтренд) 0.001 Reject Ho - отвергаетсянулевая гипотеза Prob (Ha: Decreasing Trend) 0.999 Accept Ho Prob (Ha: Any Trend) 0.002 Reject Ho WARNING: At least one cell had an expected value less than 5. В данном тесте, в отличие от статистики Пирсона хи-квадрат, проверяются также и односторонние альтернативные гипотезы: о наличии увеличивающегося и уменьшающегося линейного тренда. В данном примере подтверждено наличие возрастающего тренда. 47 ГЛАВА 3. СРАВНЕНИЕЧАСТОТСОБЫТИЙ Частным, но наиболее распространенным случаем задачи о сравнении распределений дискретных показателей является получение статистических выводов о частоте появления определенного события. В качестве события может рассматриваться наличие конкретного заболевания, например ИБС, у отдельного испытуемого из выборки или когорты; наличие определенных особенностей заболевания у каждого наблюдаемого из группы больных, - например, наличие очаговых изменений в легких у больных ХОБЛ. Как правило, исследователя интересует не только частота события, но и сравнение ее с частотой в другой выборке или в популяции. На Схеме 5 приведены основные типы задач. При внешней схожести задач, соответствующих типам I (выборка-популяция) и II (выборка-выборка), способы их решения существенно отличаются. Схема 5. Основные типы задач сравнения частот событий Статистически решение этих задач сводится к оценке параметров биномиальных распределений, то есть вероятности осуществления некоторого события (А) по данным одной или нескольких серий испытаний (выборок), и сравнении этих параметров между собой или с Тип II: выборка - выборка Тип I: популяция - выборка Популяция Проверкагипотез: Р 1 = Р 2 ? Р 1 < > Р 2 ? Проверкагипотез: Р 0 = Р ? Р 0 < > Р ? Выборка 2 Выборка 1 Р 2 ввыборке 2 Р 1 ввыборке 1 Выборка Р в выборке Р 0 в популяции 48 параметром популяции. Для этого нужно осуществить проверку гипотез о величине и соотношении параметров. 3.1. Оценкапараметровбиномиальныхраспределенийи проверкагипотез Формально задачи I типа сводятся к следующему описанию: ►Проведена серия из n испытаний, в которой событие А появилось x раз. Согласуется ли частота появления события в данной серии с заранее известной частотой p? Как правило, слова «серия из n испытаний» означают, что у нас есть выборка объема n. Для оформления задач используется таблица 3.1, являющаяся частным случаем таблицы 2.1 (глава 2). Таблица 3.1. Подготовка данных для проверки гипотезы согласия Ряд значений Выборочное распределение Ожидаемое распределение – распределение в выборке, если бы частота события А равнялась р. А x np не А n-x n(1-p) Сумма n n Пример 6. В поселке N в течение года родились 20 младенцев, из них 3 мальчика. Известно, что в среднем вероятность появления на свет мальчика в генеральной совокупности (по стране) равна 0.51. Можно ли утверждать, что выборочное распределение согласуется с генеральным (распределением в популяции)? Пример 7. (Данные НРЭР по Северо-Западному региону РФ и Комитета по здравоохранению администрации СПб). Среди ликвидаторов СПб в возрастной группе 40-44 лет в 2000 г. умер 1 человек из 501 наблюдаемых. В базовом распределении (по СПб, аналог генеральной совокупности) повозрастной уровень смертности для мужчин 40-44 лет составил в 2000 г. составил 13 человек на 1000 населения. Можно ли утверждать, что выборочное распределение согласуется с базовым (генеральным) на уровне 0.05? Задачи II типа могут быть сформулированы так: ►Проведены две серии испытаний. Можно ли утверждать, что частоты появления события А в этих сериях совпадают, т.е. что эти серии выбраны из одной генеральной совокупности, распределенной по биномиальному закону? 49 ►Проведено несколько серий испытаний в разных условиях. Можно ли утверждать, что условия проведения испытаний повлияли на частоту появления события А? Таблица 3.2 для этих задач является частным случаем таблицы 2.2 (глава 2). Таблица 3.2. Подготовка данных для проверки гипотезы однородности Ряд значений Выборочное распределение 1 Выборочное распределение 2 Выборочное распределение 3 А x 1 x 2 x 3 не А n 1 -x 1 n 2 -x 2 n 3 -x 3 Сумма n 1 n 2 n 3 Пример 8. (данные НРЭР по Северо-Западному региону РФ) Среди ликвидаторов СПб в возрастной группе 40-44 лет в 1990 г. умерло 8 человек из 875 наблюдаемых, в 1995 г. умерло 6 человек из 672 наблюдаемых и в 2000 г. умер 1 человек из 501 наблюдаемого. Можно ли утверждать, на уровне значимости 0.05, что за этот период повозрастной уровень смертности не менялся? В примерах 6, 7 и 8 подлежит оценке параметр частоты встречаемости некоторого события в одной или нескольких выборках и сравнение полученных оценок между собой или с другими, известными заранее, величинами. В качестве модели используется выборка из генеральной совокупности, описываемой биномиальным законом распределения, т.е. при решении указанных и подобных им задач мы будем предполагать, что для каждого элемента выборки интересующее нас событие может осуществиться с одной и той же определенной вероятностью. Можно сказать, что моделирование биномиальным распределением применимо, если изучаемое явление представляет собой характеристику или качество каждого элемента выборки: или оно есть, или его нет (в примерах – для человека это пол или факт смерти). Поэтому при сравнении уровней заболеваемости в нескольких выборках методы, основанные на оценках параметра биномиального распределения, применимы только в случаях бесповторных заболеваний (редких или хронических). Для решения задач I и II типов применяются различные методы расчетов. Они могут быть осуществлены вручную, с помощью формул, приведенных в «Приложении», или же с помощью стандартных статистических программ. Здесь описаны расчеты с использованием 50 пакетов SPSS, NCSS, SYSTAT, STATISTICA v.5.x, 6.1 и приложений к ней, написанных на Statistica Basic. 3.2. Расчетыдлязадач I типасиспользованиемстатистических пакетов Оценка выборочного значения параметра биномиального распределения (вероятности появления события в каждом испытании) и сравнение его с параметром генеральной совокупности (популяции). Сравнение можно проводить или с помощью вычисления доверительного интервала для оцениваемого параметра, или с помощью проверки гипотез о совпадении и отличии параметров. В зависимости от объема выборки при решении этой задачи могут использоваться как приближенные (нормальная аппроксимация), так и точные формулы (Приложение. Доверительный интервал для параметра биномиального распределения р). Для вычислений можно использовать известные программы: SPSS → → → → Analyze → → → → Nonparametric Tests → → → → Binomial… - для переменной из файла данных вычисляется оценка параметра и сравнивается с введенным значением параметра генеральной совокупности. Приводится р-значение статистики, полученное на основе нормальной аппроксимации, поэтому для малых выборок или редких событий программа неприменима. NCSS → → → → Proportions… → → → → Proportion - 1. – вводится число успехов (событий), число наблюдений, параметр генеральной совокупности и уровень значимости. Может использоваться для любых выборок, поскольку приводятся и точные, и приближенные оценки. Выбор нужной оценки и нужного статистического вывода из полученного списка – задача пользователя. Программа NCSS. Результаты вычислений дляПримера 6: Число успехов (Number of Successes) – количество родившихся мальчиков. Их доля в выборке (Sample Proportion) – Р, доля в популяции (Hypothesized Proportion) – Р0. One Proportion Report Data Section ( описаниевходныхданныхивычислениечастоты) Sample Size (n) Number of Successes (X) Sample Proportion (P) Hypothesized Proportion (P0) Confidence Alpha Hypothesis Alpha 20 3 0.150 0.51 0.05 0.05 51 Confidence Limits Section (Доверительный интервал для частоты. Используется и точный метод, и аппроксимация нормальным распределением) Lower 95% Upper 95% Calculation Confidence Sample Confidence Method Limit Proportion (P) Limit Exact (Binomial) 0.032 0.150 0.379 Approximation (Uncorrected) 0.000 0.150 0.306 Approximation (Corrected) 0.000 0.150 0.331 Wilson Score 0.052 0.150 0.360 На основании результатов, приведенных в этом разделе, можно сделать вывод об отличии Р и Р0: границы доверительных интервалов параметра Р, вычисленные любым из методов, не накрывают значение Р0. Hypothesis Test Section (Проверка гипотез. Проверяется нулевая гипотеза Н0: Р=Р0 против двусторонней альтернативной гипотезы Н1 и односторонних альтернативных гипотез Н2 и Н3) Alternative Hypothesis Exact (Binomial) Normal Approximation using (P0) Normal Approximation using (P) Prob Level Decision (5%) Z- Value Prob Level Decision (5%) Z- Value Prob Level Decision (5%) Н1: P<>P0 0.001 Reject H0 -3. 0.003 Reject H0 -4.2 0.000 Reject H0 Н2: P 0.001 Reject H0 -3. 0.001 Reject H0 -4.2 0.000 Reject H0 Н3: P>P0 0.999 Accept H0 -3. 0.999 Accept H0 -4.2 0.999 Accept H0 По результатам, приведенным в разделе «Проверка гипотез», также можно утверждать, что Р и Р0 отличаются: - отвергается гипотеза Н0 о равенстве параметров Р = Р0 при двусторонней альтернативной гипотезе Н1: параметры Р < > Р0 неравны и при односторонней альтернативной гипотезе Н2: параметр Р < Р0, Р0 Р Доверительный интервал 52 т.е. науровнезначимостиα < 0.002 принимаетсярешениеотом, что Р < Р0, и эти выводы совпадают для точного и приближенных вычислений, однако применимо только точное из-за малого объема выборки. Программа bin_coef_ru.stb (приложение к Statistica v 5.x). Для этой программы Входнаяинформация – таблица Количество событий X Параметр генеральной совокупности p Количество наблюдений n Выходнаяинформация: Доверительный 95% интервал для оценки параметра биномиального распределения выборки (частоты) и его сравнение с параметром генеральной совокупности р. ►В данной программе вычисления производятся, в зависимости от величины x и n, или по приближенным (нормальная аппроксимация), или по точным формулам, без участия пользователя. Поэтому существенных ограничений здесь нет. Входнаятаблица (Пример 6) Исходное распределение p сравнения Событий 3 0.51 Наблюдений 20 Выходная таблица 95% доверительный интервал р лев.граница р прав.граница р p сравнения Оценки 0.15 0.032 0.379 0.51 Вывод: на уровне значимости 0.05 можно утверждать, что вероятность появления мальчика в этом поселке отличается от 0.51 (значимо меньше), т.е. выборка имеет распределение, отличное от распределения генеральной совокупности. При решении примера 7 после вычисления параметра базового распределения можно проводить вычисления так же, как и в примере 6. Для вычислений могут быть использованы те же программы. Также можно использовать программу binomial_ru.stb (приложение к Statistica v 5.x). В этом случае предварительные вычисления не нужны. Входнаяинформация – таблица |