чувствительность, достоверность, точность, специфичность. Рамн а. Ф. Цыб Статистические методы анализа в клинической практике. Елисеева И. И., Юзбашев М. М. Е51 Общая теория статистики
Скачать 96.53 Kb.
|
ИСТОЧНИКИ: Румянцев П.О., Саенко В.А., Румянцева У.В., Чекин С.Ю. ГУ-Медицинский радиологический научный центр РАМН, г. Обнинск (директор - академик РАМН А.Ф. Цыб) - Статистические методы анализа в клинической практике. Елисеева И.И., Юзбашев М.М. Е51 Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2004. — 656 с: ил. ISBN 5-279-02414-7 Показатель достоверности различий обозначается р (probability, в англоязычной литературе встречается обозначение Р или P). Величиной р (или «пи-величина», англ. «Р-value») для конкретной выборки называют вероятность получения по крайне мере таких же или ещё больших отличий наблюдаемого от ожидаемого, чем в данной конкретной выборке, при условии, что выдвинутая гипотеза верна. С помощью статистических расчетов вычисляется значение р, которое затем сравнивается с заранее выбранным уровнем значимости, часто обозначаемому греческой буквой α (альфа). Обычно в биомедицинских исследованиях уровень значимости устанавливается на уровне α≤0,05 (≤ 5%) . Для демонстрации достоверности различия часто используется наглядный метод доверительных интервалов. Напомним, что доверительный интервал устанавливается на уровне ±1,96 стандартной ошибки, в который попадает 95% данных при условии их нормального или близкого к нему распределения. Если доверительный интервал интересующего нас параметра в изучаемой группе «накрывает» значение среднего в группе сравнения, то априори следует вывод о том, что наблюдаемое различие является статистически недостоверным. Если среднее значение параметра в контрольной группе лежит вне доверительного интервала изучаемой группы, то скорее всего различие является достоверным. Существуют разные методы определения доверительного интервала:
Необходимые формулы для следующих расчетов: 1. Среднее арифметическое значение 2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы (для выборки, имеющей нечетное число значений) 3. Размах – разница между максимальным и минимальным значениями в выборке 4. Дисперсия – используется для более точного оценивания вариации данных 5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения. 6. Коэффициент вариации – отражает степень разбросанности значений корректировок 7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней
Доверительный интервал определяется следующим образом: минимальное значение - из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО. Формула доверительного интервала:
При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Формула доверительного интервала: n - объем выборки; - критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝, числом степеней свободы n-1, которое определяется по специальным статистическим таблицам либо с помощью MS Excel ( →"Статистические"→ СТЬЮДРАСПОБР); ∝ - уровень значимости. Способом оценить информативность и разрешающую способность диагностического метода является оценка его чувствительности, специфичности и точности. Эти показатели отражают шансы поставить правильный диагноз заболевания у больных и здоровых людей. Их сравнивают с аналогичными показателями общепринятого («золотого») стандарта диагностического теста. Чувствительность определяется как доля пациентов действительно имеющих заболевание среди тех, у кого тест был положительным. Специфичность определяется как доля людей, не имеющих заболевания среди всех, у кого тест оказался отрицательным. Точность показывает долю «правильных срабатываний теста» среди всех обследованных и является совокупным показателем информативности теста. Организация данных для оценки информативности диагностического теста
Чувствительность = а / (а+в) Специфичность = г / (г+б) Точность = (а+г) / (а+б+в+г) а - истинно положительный результат; б - ложноположительный результат; в - ложноотрицательный результат; г - истинно отрицательный результат. Исходя из значений чувствительности и специфичности, рекомендуется построение характеристической кривой (ROC-кривая; англ. Receiver Operating Characteristic (ROC) curve), которая показывает зависимость количества верно диагностированных положительных случаев от количества неверно диагностированных отрицательных случаев (ось Х=специфичность, ось Y=чувствительность). Идеальный диагностический тест должен иметь Г-образную форму характеристической кривой и проходящей через верхний левый угол, в котором доля истинно положительных случаев ложноположительных случаев равна 0.Наоборот, чем меньше кривая напоминает форму буквы «Г», т.е. чем ближе она проходит к диагонали графика ("бесполезный тест"), тем эффективность теста меньше. Например : Количественную оценку характеристической кривой можно провести, рассчитав площадь под ней (англ. Area Under Curve, AUC). Приблизительная шкала значений AUC, отражающая качество диагностического теста такова: AUC=0,9-1,0 – отличное качество AUC=0,8-0,9 – высокое качество AUC=0,7-0,8– хорошее качество AUC=0,6-0,7– среднее качество AUC=0,5-0,6– плохое (неудовлетворительное) качество. |