Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
Стентон Гланц Медико-биологическая Электронная книга ÑÒÀÒÈÑÒÈÊÀ Primer of BIOSTATISTICS FOURTH EDITION Stanton A. Glantz, Ph.D. Professor of Medicine Member, Cardiovascular Reserch Institute Member, Institute for Health Policy Studies University of California, San Francisco McGRAW-HILL Health Professions Division New York St. Louis San Francisco Auckland Bogota Caracas Lisbon Madrid Mexico City Milan Montreal New Delhy San Juan Singapore Sydney Tokyo Toronto Стентон Гланц Медико-биологическая Перевод с английского доктора физ.-мат. наук Ю. А. Данилова под редакцией Н. Е. Бузикашвили и Д. В. Самойлова п р а к т и к а Москва 1999 ÑÒÀÒÈÑÒÈÊÀ ББК 28 Г52 Данное издание выпущено в рамках программы Центрально-Европей- ского Университета «Books for Civil Society» при поддержке Центра по развитию издательской деятельности (OSI — Budapest) и Института «Открытое общество. Фонд Содействия» (OSIAF — Moskow). Технический редактор А. В. Комельков Художники Е. Р. Гор, О. Л. Лозовская Корректоры Н.Н. Юдина, Е. М. Заглядимова Издательский дом «Практика», 119048, Москва, а/я 421 Лицензия ЛР № 065635 от 19.01.1998 Подписано в печать 19.10.1998. Формат 60 ґ 90/16. Объем 29 бум. л. Тираж 5000 экз. Заказ № 1403. Отпечатано в полном соответствии с качеством предоставленных диапозитивов в ОАО «Можайский полиграфический комбинат» 143200, Можайск, ул. Мира, д. 93. С. Гланц. Медико-биологическая статистика. Пер. с англ. — М., Практика, 1998. — 459 с. Г52 В книге описаны все основные методы, которыми пользуется современная ста- тистика, как параметрические, так и непараметрические: анализ различий, свя- зей, планирование исследования, анализ выживаемости. Просто и наглядно — при этом вполне строго — автор описывает принцип каждого метода, дает чет- кую схему применения, обязательно указывает на ограничения и возможные ошибки. Изящные иллюстрации и остроумный разбор примеров, взятых из ме- дицинских публикаций, делают чтение легким и увлекательным. Врачам-прак- тикам книга поможет грамотно, критически читать медицинскую литературу. Для врачей-исследователей книга станет руководством по планированию, про- ведению и обработке результатов исследований. ISBN 0-07-024268-2 (англ.) ISBN 5-89816-009-4 (русск.) © 1994 by McGraw-Hill, Inc © Перевод на русский язык, Издательский дом «Практика», 1999 Посвящается Марше Гланц 6 Оглавление Предисловие 12 1 Статистика и клиническая практика 17 Ограничение финансирования и статистика 17 Достоверность и статистическая значимость 20 Доверяй, но проверяй 22 Ошибки вечны? 25 2 Как описать данные 27 Среднее 30 Стандартное отклонение 30 Нормальное распределение 31 Медиана и процентили 32 Выборочные оценки 36 Насколько точны выборочные оценки 37 Выводы 44 Задачи 45 7 3 Сравнение нескольких групп: дисперсионный анализ 47 Случайные выборки из нормально распределенной совокупности 48 Две оценки дисперсии 53 Критическое значение F 56 Три примера 63 Задачи 75 4 Сравнение двух групп: критерий Стьюдента 81 Принцип метода 82 Стандартное отклонение разности 85 Критическое значение t 88 Выборки произвольного объема 96 Продолжение примеров 97 Критерий Стьюдента с точки зрения дисперсионного анализа 99 Ошибки в использовании критерия Стьюдента 101 Критерий Стьюдента дая множественных сравнений 104 Критерий Ньюмена—Кейлса 108 Критерий Тьюки 112 Множественные сравнения с контрольной группой 113 Что означает Р 117 Задачи 119 5 Анализ качественных признаков 122 Новости с Марса 123 Точность оценки долей 127 Сравнение долей 132 Таблицы сопряженности: критерий χ 2 139 Точный критерий Фишера 150 Задачи 155 6 Что значит «незначимо»: чувствительность критерия 161 Эффективный диуретик 162 8 Два рода ошибок 166 Чем определяется чувствительность? 167 Чувствительность дисперсионного анализа 181 Чувствительность таблиц сопряженности 184 Практические трудности 186 Зачем вычислять чувствительность? 187 Задачи 190 7 Доверительные интервалы 193 Доверительный интервал для разности средних 194 Интервал шире—доверия больше 200 Проверка гипотез с помощью доверительных интервалов 202 Доверительный интервал для среднего 205 Доверительный интервал для разности долей 206 Доверительный интервал для доли 211 Доверительный интервал для значений 216 Задачи 219 8 Анализ зависимостей 221 Уравнение регрессии 225 Оценка параметров уравнения регрессии по выборке 227 Сравнение двух линий регрессий 244 Корреляция 250 Коэффициент ранговой корреляции Спирмена 261 Чувствительность коэффициента корреляции 266 Сравнение двух способов измерения: метод Блэнда—Алтмана 270 Заключение 274 Задачи 275 9 Анализ повторных измерений 285 Парный критерий Стьюдента 286 Новый подход к дисперсионному анализу 294 Дисперсионный анализ повторных измерений 305 Качественные признаки: критерий Мак-Нимара 314 Задачи 318 10 Непараметрические критерии 323 9 Параметрические и непараметрические методы. Какой выбрать? 324 Сравнение двух выборок: критерий Манна—Уитни 327 Сравнение наблюдений до и после лечения: критерий Уилкоксона 338 Сравнение нескольких групп: критерий Крускала—Уоллиса 346 Повторные измерения: критерий Фридмана 354 Выводы 364 Задачи 365 11 Анализ выживаемости 372 Пассивное курение на Плутоне 373 Кривая выживаемости 376 Сравнение двух кривых выживаемости 386 Критерий Гехана 395 Чувствительность и объем выборки 396 Заключение 398 Задачи 398 12 Как построить исследование 402 Каким критерием воспользоваться 403 Рандомизация и слепой метод 405 Достаточно ли рандомизации? 413 Кого мы изучаем 417 Как улучшить положение 419 Приложения A. Формулы для вычислений 423 Б. Диаграммы чувствительности дисперсионного анализа 430 B. Решения задач 439 Предметный указатель 456 10 ТАБЛИЦЫ КРИТИЧЕСКИХ ЗНАЧЕНИЙ 3.1. Критические значения F 60 4.1. Критические значения t 94 4.3. Критические значения q 110 4.4. Критические значения q ′ 114 5.7. Критические значения χ 2 148 6.4. Процентили стандартного нормального распределения 191 8.6. Критические значения коэффициента ранговой корреляции Спирмена 264 10.7. Критические значения W 343 10.10. Критические значения Q для попарного сравнения групп 352 10.11. Критические значения Q для сравнения с контрольной группой 353 10.14. Критические значения критерия Фридмана 358 УСЛОВНЫЕ ОБОЗНАЧЕНИЯ α уровень значимости (вероятность ошибки I рода); коэф- фициент сдвига в уравнении регрессии α′ уровень значимости при множественном сравнении а выборочная оценка коэффициента сдвига β вероятность ошибки II рода; коэффициент наклона в урав- нении регрессии b выборочная оценка коэффициента наклона δ величина эффекта (изменение количественного признака) d выборочная оценка величины эффекта ϕ параметр нецентральности F критерий F Н критерий Крускала—Уоллиса k число сравнений l интервал сравнения т число групп µ среднее по совокупности N число членов совокупности п объем выборки (численность группы) 11 Р вероятность справедливости нулевой гипотезы р доля ˆp выборочная оценка доли Q критерий Данна q ′ критерий Даннета q критерий Ньюмена—Кейлса; критерий Тьюки r коэффициент корреляции Пирсона r s коэффициент ранговой корреляции Спирмена Σ суммирование σ стандартное отклонение σ 2 дисперсия S вариация (сумма квадратов отклонений) S(t) выживаемость s выборочная оценка стандартного отклонения s 2 выборочная оценка дисперсии s a стандартная ошибка коэффициента сдвига s b стандартная ошибка коэффициента наклона ˆp s стандартная ошибка доли s y|x остаточное стандартное отклонение X s стандартная ошибка среднего Т критерий Манна—Уитни t критерий Стьюдента t α критическое значение t при уровне значимости α ν число степеней свободы ν вну внутригрупповое число степеней свободы (знаменателя) ν меж межгрупповое число степеней свободы (числителя) W критерий Уилкоксона χ 2 критерий χ 2 2 r χ критерий Фридмана ˆy значение уравнения регрессии Х значение количественного признака X выборочное среднее z критерий z (величина со стандартным нормальным распределением) Предисловие После окончания докторантуры мне часто случалось помогать друзьям и коллегам разобраться с тем или иным статистичес- ким вопросом. Постепенно потребность в кратких интуитивно понятных и в то же время достаточно строгих объяснениях при- вела к появлению двухчасовой лекции включавшей даже демон- страцию слайдов. Эта лекция охватывала использование ста- тистических методов в медицине, ошибки в их применении и способы избежать этих ошибок. Лекции оказались настолько ус- пешными, что теперь уже мне пришлось выслушать многочис- ленные предложения написать вводный курс по статистике. Так возникла эта книга. Адресована она студентам медикам, научным работникам, преподавателям и врачам практикам. Ее с равным успехом можно использовать и для самостоятельного изучения и в качестве учебного пособия. Например, она по- служила основой курса медицинской статистики в Калифорний- ском университете в Сан Франциско. Курс объемом 81 лекци- онный час включал первые восемь глав книги. Кроме того, еже- недельно проводился семинар. Книга также использовалась при чтении краткого курса статистики для студентов стоматологи- 13 ческого факультета. Этот курс охватывал материал первых трех глав. Кроме того книга пригодилась мне при чтении интенсив- ного курса, который занимал полсеместра и был рассчитан на основательное усвоение всего материала. Среди многочислен- ных слушателей были студенты старших курсов, аспиранты и научные сотрудники. Эта книга имеет несколько отличий от других вводных кур- сов статистики – именно эти отличия похоже и обусловили ее популярность. Во-первых, в книге отчетливо проведена мысль, что резуль- таты многих биологических и медицинских работ основаны на не правильном использовании статистических методов и спо- собны только ввести в заблуждение. Большинство ошибок свя- зано с неправомерным использованием критерия Стьюдента. Причина такой концентрации, вероятно, кроется в том, что в пору учебы будущие исследователи не успели узнать о суще- ствовании других статистических методов (в учебниках, по ко- торым они учились, первая глава обычно посвящена критерию Стьюдента). Напротив, дисперсионный анализ, если и излага- ется, то, как правило, в последней главе, до которой редко кто добирается. Между тем медицинские данные чаще требуют именно дисперсионного анализа, и именно он служит основой для всех параметрических критериев, – поэтому свою книгу я начинаю изложением дисперсионного анализа и лишь затем, как частный случай, разбираю критерий Стьюдента. Во-вторых, насколько можно судить по публикациям, в меди- цинских исследованиях крайне важно умение правильно срав- нить результаты, полученные по нескольким группам. Поэтому в книге подробно описаны методы множественного сравнения. В-третьих, я считал, что книга по медицинской статистике не должна быть калькой даже с хорошего и логически стройного учебника математической статистики. Как показывает много- летняя практика, выслушав традиционный курс математической статистики, в котором методам проверки гипотез предшествует теория оценивания студент, увы, не обретет понимания связи ста- тистических методов с медицинскими задачами. Поэтому я из- брал иной способ подачи материала. Стержень книги образуют проверка гипотез и оценка эффективности лечения. Я глубоко ПРЕДИСЛОВИЕ 14 убежден, что именно такой подход дидактически и практичес- ки отвечает задачам медицинских исследований. Большинство использованных в книге примеров заимство- вано из реальных медицинских исследований. В ряде случаев мне пришлось пойти на упрощение данных, например, сделать равными объемы выборок. Эти упрощения позволили сосредо- точиться на существе излагаемых методов, не отвлекаясь на тех- нические детали. При этом если в тексте рассматривается слу- чай выборок равного объема, то в приложении вы найдете фор- мулы на случай выборок произвольного объема. Готовя к печати первое издание этой книги, я задумывал его как введение, знакомящее с идеями, понятиями и методами ста- тистики, – введение, за чтением которого последует более уг- лубленное изучение традиционных курсов. Мои надежды оп- равдались, но, кроме того, оказалось, что многие исследователи стали пользоваться книгой как практическим пособием. Это по- будило меня во втором издании более широко осветить методы множественного сравнения. В третьем издании обсуждение чув- ствительности критериев было пополнено рассмотрением пла- нирования и анализа экспериментов. Наконец, в четвертом из- дании, которое вы держите в руках, появилась новая глава, по- священная анализу выживаемости. Помимо того, методы мно- жественного сравнения пополнились критерием Тьюки, а в раз- дел, посвященный регрессионному анализу, были включены метод сравнения кривых регрессии и метод Блэнда-Алтмана для сравнения двух способов измерения. Надо сказать, что некоторые пожелания читателей не нашли отражения в новом издании. И сделано это было совершенно сознательно. Часть читателей советовала вместо неявного ис- пользования понятий теории вероятностей дать строгое изло- жение ее основ. Другие предлагали дополнить книгу изложени- ем многомерных статистических методов. В частности, предла- галось изложить методы множественной регрессии. Важность этих методов для меня вполне очевидна. Однако попытка рас- смотреть их в рамках данной книги существенно изменила бы ее содержание. Что до пожеланий большей формальности, то они противоречат идее понятности и наглядности, то есть той 15 идее, из которой выросла эта книга и которая принесла ей ус- пех*. К появлению книги причастны многие люди, которым я ис- кренне признателен. Первым человеком, от которого еще в сту- денческую пору я услышал понятное и практически ориенти- рованное изложение статистики, был Джулиен Хоффман. Бла- годаря ему я сумел прочувствовать эту науку, а мое понимание статистических методов стало глубже. Его неиссякаемому ин- тересу и готовности к обсуждению тонкостей я обязан тем, что узнал и – важнее – ощутил статистику настолько, чтобы заду- маться о написании книги. Филипп Уилкинсон и Мэрион Не- стле предложили отличные примеры и высказали массу полез- ных замечаний по рукописи. Стараниями Мэри Джиаммоны текст стал более понятным для студентов. Она же помогла по- добрать задачи для первого издания. В работе над задачами для следующих изданий участвовали Брайан Слинкер и Джим Лай- твуд. Вирджиния Эрнстер и Сьюзен Сакс не только высказали множество полезных замечаний, но и «обкатали» первоначаль- ный вариант рукописи, использовав его в качестве основного пособия для 300 своих студентов. Мои ассистенты Брайан Слин- кер, Кен Рессер, Б. С. Апплйард и другие высказали множество тонких замечаний, которые помогли сделать материал книги более доходчивым. Мэри Хуртадо с поразительной быстротой и точностью пе- репечатала рукопись. Томас Саммер, Соня Бок и Майкл Матри- гали помогли мне в окончательном редактировании текста в си- стеме UNIX. Дейл Джонсон подготовил иллюстрации. Я признателен Национальному институту здравоохранения, удостоившему меня в 1977г гранта, который позволил не толь- ко свободно развивать мои научные идеи, но и работать над кни- гой, первое издание которой увидело свет в 1981 г. * Вместе с Б. Слинкером мы опубликовали специальный вводный курс, це- ликом посвященный множественной регрессии и многомерному диспер- сионному анализу (S. A. Glantz, B. К. Slinker Primer of Applied Regression and Analysis of Variance New York McGraw Hill 1990). Написан он в том же свободном стиле, что я настоящая книга. ПРЕДИСЛОВИЕ 16 С тех пор многое изменилось. Важность грамотного исполь- зования статистических методов осознается все шире. И, хотя ошибки не исчезли, все больше журналов прилагают усилия к их искоренению. Во многих из них рецензирование включает отдельный этап проверки статистической правильности пред- лагаемых работ. Приведу подтверждение, наиболее ощутимое для меня. Я являюсь внештатным редактором Journal of the American College of Cardiology, и моя работа состоит в выявле- нии статистических ошибок в поступающих работах. Доля ста- тей, содержащих ошибки, как и раньше, составляет около по- ловины, но теперь уже половины предлагаемых к публикации, а не опубликованных работ. Наконец, я признателен многим читателям этой книги, сту- дентам и преподавателям статистики, которые нашли время при- слать мне вопросы, комментарии и предложения, как улучшить содержание книги. Насколько возможно, я постарался выпол- нить их пожелания при подготовке четвертого издания. Многие из приведенных в книге иллюстраций – прямые по- томки тех слайдов, которые я когда-то показывал на своих лек- циях. Кстати, будет совсем не плохо, если, читая книгу, вы во- образите, что попали на такую лекцию. Большинство слушате- лей проникались критическим духом. И, как мне рассказывали, после моих выступлений перед докторантами из Калифорнийс- кого университета те доставляли немало неприятностей после- дующим докладчикам, указывая на ошибки в использовании ста- тистических методов. Надеюсь, что предлагаемая книга сдела- ет читателя более критичным и поможет улучшить медицинс- кую литературу, а, в конечном счете, и саму медицину. Стентон А. Гланц Глава 1 |