Информационный материал1 (1). Семинар 1 Основные статистические показатели, используемые для измерения заболеваемости. Исходные данные
Скачать 1.85 Mb.
|
Отношения правдоподобия.Для интерпретации диагностических тестов является полезным еще один тип показателей. Эти показатели обычно называются отношениями правдоподобия (likelihood ratios (LR)). Отношения правдоподобия равняется вероятности наличия определенного результата некоего теста для человека с заболеванием, деленное на вероятность этого же результата теста для человека без заболевания. Для таких тестов, как тест с тонкоигольчатой биопсией, которые могут быть классифицированы как дихотомические, отношения правдоподобия определяются как для положительных, так и для отрицательных результатов теста. Отношение правдоподобия для положительных результатов теста (LR+) равняется вероятности положительного результата теста для человека с заболеванием, деленное на вероятность положительного результата теста для человека без заболевания. Математически отношение правдоподобия можно рассчитать следующим образом: В этой формуле чувствительность и специфичность опять таки выражается в пропорциях, а не в процентах Возможное наименьшее значение отношения правдоподобия возникает тогда, когда числитель является минимальным (чувствительность равняется нулю), в этом случае значение LR+ становится нулевым. Максимальное значение LR+ возникает тогда, когда знаменатель является минимальным. Специфичность равняется 1, поэтому 1 – специфичность = 0, в результате этого LR+ начинает стремиться к положительной бесконечности. LR+ = 1 указывает на абсолютно бесполезный тест, поскольку он не помогает разделить лиц с/ и без интересующего нас заболевания, в связи с тем, что вероятность положительного результата теста одинаково равна у больных и у здоровых людей. Значения LR+ больше 1 соответствует ситуации, когда человек, пораженный заболеванием, с большей вероятностью будет иметь положительный результат теста, по сравнению со здоровым человеком. Чем больше значение LR+ , тем сильнее связь между положительным результатом теста и заболеванием. Отношение правдоподобия для отрицательного результата теста (LR- ) – это вероятность отрицательного результата теста для больного человека, деленная на вероятность отрицательного результата теста для здорового человека. Математически LR- рассчитывается следующим образом: Влияние валидности теста на оценку показателей заболеваемости в популяции Только тест обладающий 100% чувствительность и специфичностью может без ошибочно определить показатели заболеваемости (инцидентности, превалентности). На практике когда тесты используются для оценки заболеваемости определенной болезнью, их низкая валидность означает, что часть лиц будет неправильно классифицирована на больных и здоровых. Низкая чувствительность означает, что люди с данной болезнью будут ошибочно отнесены к разряду лиц, ее не имеющих. Это приведет к недооценке превалентности или инцидентности. Низкая специфичность, с другой стороны, означает, что некоторые люди будут ошибочно отнесены к разряду лиц, имеющих эту болезнь. Это приведет к переоценке превалентности или инцидентности. В обоих случаях возникнет ошибка классификации (разновидность информационной (или связанной с измерением) систематической ошибки). Направление ошибки зависит от того, чего больше: ложноположительных или ложноотрицательных результатов. Количество этих ложных результатов определяется и чувствительностью, и специфичностью, а также количеством людей с заболеванием и без него в популяции. Количество ложноположительных результатов – это ложноположительный показатель, умноженный на количество людей, не имеющих заболевания, а количество ложноотрицательных результатов – это ложноотрицательный показатель, умноженный на количество лиц с заболеванием. Если метод измерения обладает одинаковой чувствительностью и специфичностью в обеих группах – т.е. если его достоверность(валидность) не различается – то такая ошибочная классификация называется недифференцированной. То есть при этом ошибка классификации будет одинаковой (не различаться, не дифференцироваться) в сравниваемых группах. При сравнении двух групп с помощью метода, специфичность и чувствительность которого одинаковы в обеих группах, ошибочная классификация всегда уменьшит разницу между этими группами. Поддифференцированной ошибочной классификацией– понимают последствия применения в сравниваемых группах тестов с разной валидностью (чувствительностью, специфичностью или и тем, и другим). Если чувствительность и специфичность теста различны в сравниваемых группах, то смещение может быть любой направленности. При этом истинное различие между группами обследуемых может быть искусственно занижено, завуалировано или увеличено, или может изменяться его направление; может быть выявлено различие, которого нет на самом деле. Ошибочная классификация может также проявляться по-разному при использовании одного и того же теста, если, по какой-либо причине, его валидность различна в сравниваемых группах. Воспроизводимость теста.Воспроизводимость (repeatability) теста – это его способность одинаково измерять какие-либо явления, процессы, состояния в серии повторных измерений. Абсолютно одинаковые оценки, каких-либо параметров здоровья, при повторных обследованиях встречаются относительно редко. Причины (различий вариабельности) показателей связаны с истинной (объективной, биологической) и с субъективной вариабельностью. Истинная вариабельность результатов связана с особенностями процесса жизнедеятельности организма обследуемого. Известно, что даже у здоровых лиц, многие показатели варьируют в течение небольшого промежутка времени между исследованиями. Субъективная вариабельность объясняется погрешностями персонала или погрешностями теста (техники). Как сильно могут влиять погрешности персонала на вариабельность результатов, наглядно показывает проверка умения измерять АД на специальных тренажерах, задающих определенные и постоянные параметры АД. Практически всегда, лица, не прошедшие специальную тренировку, по-разному измеряли заданные параметры АД. Даже у одного врача в серии измерений получались существенные варьирующие результаты. Еще больший разброс результатов измерения одного признака, наблюдается при применении разных технических средств, например разных аппаратов измерения АД. Субъективная вариабельность порождает случайные и систематические ошибки измерений. Для оценки степени воспроизводимости теста проводят серию испытаний с изучением вариабельности полученных результатов. Чтобы свести к минимуму субъективную вариабельность, соответствующий персонал, участвующий в проведении эпидемиологического исследования, должен быть тщательно подготовлен. Подготовка персонала, прежде всего, предусматривает его обучение особенностям использования соответствующих стандартизованных методов. Обучение должны проводить высококвалифицированные специалисты. Окончательная проверка и закрепление полученных навыков происходит при применении выбранного метода обследования в отношении специально подобранной группы лиц. «Специально подобранные» в данном случае означает, что они по набору индивидуальных характеристик будут сходны с теми, кого предстоит обследовать в планируемом эпидемиологическом исследовании. Кроме обучения технике метода, персонал должен быть, если это необходимо, подготовлен относительно стандартных условий применения метода, например, температуры помещения, положения тела обследуемого, его физической активности и т.д. Субъективная вариабельность бывает особенно велика, когда погрешности персонала соединяются с погрешностями метода (теста). Рис. 5.4. Концентрация креатинина в одной порции крови по результатам 10 шведских лабораторий, проанализировавших одну и ту же пробу 16 раз. Источник: А.Альбом, С Норелл. «Введение в современную эпидемиологию» 1996. На рис. 5.4. продемонстрированы результаты биохимического анализа на концентрацию креатинина в крови. Как следует из представленных данных, большинство лабораторий завышают результаты по сравнению с эталоном. При этом в лабораториях № 8 и 9 отмечается большой разброс полученных результатов. Результаты проведенного исследования показывают, как важно стандартизировать методики теста и условия его проведения. Поскольку от результатов теста зависит постановка диагноза, валидность тестов может существенно повлиять на результаты эпидемиологического исследования. Валидность теста.Чувствительность, специфичность и воспроизводимость теста определяют его достоверность или валидность (validity). Достоверность или валидность отдельного теста означает:
К сожалению, точная оценка составляющих валидности и ее самой в целом, чаще всего, представляет значительные трудности или невозможна. При проведении эпидемиологических исследований следует твердо придерживаться правила не изменять валидность применяемых методов. В противном случае, уменьшение или увеличение валидности приведет к значительной вариабельности результатов и, как следствие, к ошибочным выводам. В заключение отметим, что неполная и недостоверная информация, независимо от объективных или субъективных обстоятельств ее получения, не может служить оправданием низкого качества выводов данного исследования. СкринингСкрининг (просеивание, screening), - обследование (чаще всего - массовое) лиц, считающих себя здоровыми, с целью выявления у них не распознанного ранее заболевания. Скрининг также применяют для выявления у здоровых лиц факторов риска, (в основном факторов риска хозяина) например, курения, вредных пищевых привычек, пограничных результатов лабораторного обследования и т.д . Скрининг осуществляется помощью скрининговых тестов, которые, как и любые тесты могут проводиться: в виде опроса, физикального обследования (например, осмотра кожных покровов, пальпации отдельных органов и т.д.), лабораторного исследования и других методов. Несмотря на общность цели необходимо различать:
Чаще всего скрининг используется как профилактическая мера и в этом случае после выявления лиц подозрительных на заболевание, назначается их дальнейшее тщательное обследование и при необходимости лечение. В противном случае применение скрининговых тестов как профилактической меры не имеет смысла. Во многих странах скрининг как мера профилактики предусматривает периодическое обследование людей, которое проводится преимущественно в медицинских учреждениях по возрастным показаниям, с учетом наиболее частой патологии в соответствующем возрасте и принадлежности обследуемого к определенной группе риска. Ценность скрининга, проводимого в профилактических целях определяется его влиянием на показатели заболеваемости, временной потери трудоспособности, инвалидности, смертности и соотношением экономических затрат и экономической выгоды. В эпидемиологических исследованиях скрининг является не профилактической мерой, а используется как элемент организации исследований, а именно:
В зависимости от численности обследуемых лиц, от их профессиональной или иной индивидуальной характеристики, в зависимости от набора используемых скрининговых тестов, различают:
К любым скрининговым тестам предъявляются определенные требования, в частности:
Понятия чувствительности, специфичности и валидности скрининговых тестов, аналогичны этим же понятиям, относящимся к диагностическим тестам, уже описанным в этой главе. При проведении скрининга необходимо учитывать низкую распространенность большинства болезней. При этом, после выявления больных, среди обратившихся к врачу, распространенность данной болезни среди оставшихся здоровых лиц, становится еще меньше. Именно поэтому скрининговые тесты должны, прежде всего, иметь высокую чувствительность, чтобы не пропустить оставшиеся редкие случаи болезни. Но эти тесты должны быть и высокоспецифичны, чтобы не получить большое число ложноположительных результатов. При повторных скринингах, особенно если они проводятся с небольшим интервалом, число выявленных больных будет снижаться, поскольку в последующих скринингах, будут, в основном, выявляться новые (свежие) случаи болезни. Оценка достоверности (валидности) скринигового теста проводится с помощью все той же таблицы «два на два» Хотя формулы чувствительности, специфичности и других характеристик скринингового и диагностического теста одинаковы, оценка этих параметров для скринингового теста отличается, поскольку нет другого скринингового теста, принимаемого за «золотой стандарт». Ориентировочная оценка скринингового теста проводится по результатам (наличие/отсутствие болезни), полученным с помощью клинического обследования, проведенного сразу же после обследования скрининговым тестом. Окончательная оценка проводится двумя способами:
Идеальный скрининговый тест должен быть валидным, прост в исполнении и относительно дешев – как, например, целенаправленный опрос, или измерение артериального Задача 1 Адаптировано из книги Дж. Х. Абрамсон, З.Х. Абрамсон «Осмысление эпидемиологических данных» Болезнь Д – распространенное заболевание, вызываемое действием фактора Т. Оно характеризуется продолжительным бессимптомным периодом, после чего наступает прогрессирующее расстройство функции центральной нервной системы, которое приводит к неспособности без посторонней помощи заниматься повседневной деятельностью. Диагноз можно поставить как, до так и после манифестации симптомов, с помощью точных, но дорогостоящих и трудоемких тестов. В исследовании, где использовался более простой новый тест, произвольно названный тест А, показатель распространенности этого заболевания в популяции составил 18.4 на 100. Валидность теста А оценивали, применяя его у 100 пациентов с болезнью Д и у 400 людей, у которых, как было известно, эта патология отсутствовала; при этом было получено 80 положительных результатов в 1-ой группе и 8-во 2-ой.
Задача 2 Доктор В., будучи неудовлетворенным результатами теста А, предложил новый тест для выявления болезни Д. Этот тест, названный в честь разработчика тестом В, обладает чувствительностью 99% и специфичностью 86%. Теперь для определения распространенности болезни в городе К. используется тест В, и его результаты сравниваются с результатами теста (при использовании теста А) в городе П.; последний показатель, равен 18.4%, а показатель истинной распространенности в г. П в 3 раза больше, чем в г. К. Задание 1 Оцените ожидаемые результаты сравнения болезни распространенности болезни Д. в городе. П. (тест А) и в городе К. (тест В). Сделайте предположение о величине отношения показателя распространенности в городе П. к показателю распространенности болезни Д. в городе К. 2 Рассчитайте ожидаемые результаты оценки распространенности болезни Д. в городе К. (истинная распространенность болезни Д. в г. К. 7%, население 10000). Рассчитайте отношение показателей болезни Д. в городе П. (тест А) и К. (тест В). Задача 3 Оцените достоверность диагностических тестов в следующих исследованиях:
Задача 4 Для выявления болезни Д предлогается два теста –тест А (чувствительность 80%, специфичность 98%) и тест В (чувствительность –99%, специфичность – 86%). Задание 1. Определите тест, который лучше подходит для проведения скрининга. 2. Какая дополнительная информация (кроме чувствительности и специфичности) необходима при выборе скринингового теста? Задача 5 В таблице представлены ожидаемые применения результаты теста А для выявления болезни Д. в городе г. П. Ожидаемые результаты Теста А(чувствительность 80%, специфичность 98%) при его применении для выявления болезни Д в городе П. (истинная распространенность 21%)
Задание 1. Используя эти данные, рассчитайте прогностическую значимость положительного теста, прогностическую значимость отрицательного теста, количество положительных тестов на выявленный случай и общее количество тестов на выявленный случай. (См приложение) 2. Рассчитайте эти же показатели для теста А, но используя его ожидаемые результаты в г. М, где распространенность болезни Д– только 1%, а не 21% как в г. А. Вам следует построить таблицу, основываясь на знании того, что показатель распространенности равен 1%, чувствительности - 80%, а специфичности – 98%. Оцените полученные результаты. |