Лекция 2. Статистика, изучающая вопросы, связанные с медициной, гигиеной и общественным здравоохранением, носит название
Скачать 89.25 Kb.
|
Следует заметить, что при определении средней арифметической (М) учитывают все элементы ряда, рассчитывая δ, надо брать не все случаи, а на единицу меньше (n-1), при n ≤30. При нормальном распределении при различных значениях средней и среднеквадратического отклонения, всегда: - 68,3% наблюдений находятся в пределах ±1δ; - 95,5% наблюдений находятся в пределах ±2δ; - 99,7% - в пределах ±3δ. И только 0,3% (3 случая на 1000) наблюдений имеют значения, отличные от среднего больше чем на 3δ. Среднее квадратическое отклонение имеет совершенно исключительное значение в статистике и используется в качестве абсолютной меры разнообразия, а также эта величина положена в основу почти всех характеристик изменчивости, распределения, корреляции, регрессии и дисперсионного анализа. При помощи δ определяют типичность средней величины и меру ее точности. Если 95% всех вариант находятся в пределах М±2δ, то средняя является характерной для данного ряда, и не требуется увеличивать число наблюдений в выборочной совокупности. В медицине с величиной М±δ связано понятие нормы и патологии, отклонения от средней (в любую сторону) больше, чем на ±δ, но меньше, чем на ±2δ, считается субнормальным (выше или ниже нормы). При отклонении от средней больше, чем на ±2δ, варианты (показатели) считаются значительно отличающимися от нормы, т.е. патологическими. Практическое значение среднего квадратического отклонения заключается в том, что зная М и δ, можно построить вариационные ряды. Правило 3δ применяется в народном хозяйстве при определении стандартов (для массового пошива одежды, обуви, производства мебели и т.д.). В медицинской статистике правило 3δ применяется при изучении физического развития человека, оценке деятельности учреждений здравоохранения, комплексной оценке здоровья населения и т.д. Среднее квадратическое отклонение является основной абсолютной мерой вариабельности варьирующих признаков, однако, при сравнении разнообразия двух или более совокупностей среднее квадратическое отклонение применяется при соблюдении двух условий: 1.Сравниваются только однородные совокупности (одноименные) или признаки. 2.Средние уровни сравниваемых признаков значительно отличаются друг от друга. При несоблюдении этих условий δ не может быть использована для сравнения разнообразия и в этом случае в качестве относительной меры вариабельности применяется коэффициент вариации. Коэффициент вариации рассчитывается по формуле: Коэффициент вариации в известной мере является критерием надежности средней арифметической. Если СV≥40%, то средняя арифметическая неустойчива и ненадежна. Оценка степени колеблемости изучаемых признаков по коэффициенту вариации может быть произведена по следующей схеме:
При нормальном распределении коэффициент вариации обычно не превышает 45 - 50% и часто бывает гораздо ниже этого уровня. В случаях же асимметричных распределений он может быть довольно высоким, достигающим 100% и выше. При проведении различных медико-биологических исследований в практической или научной деятельности врача преимущественно пользуются выборочным методом сбора информации. В этом случае к выборочной совокупности предъявляют два основных требования: ·она должна обладать основными характерными чертами генеральной совокупности, то есть быть максимально на нее похожей; ·она должна быть достаточной по объему (числу наблюдений), чтобы более точно выразить особенности генеральной совокупности. И, все-таки, какой бы репрезентативной не была выборочная совокупность, она отличается от генеральной потому, что в процессе выборки допускаются случайные ошибки - ошибки выборки, которые показывают, на сколько отличаются величины, полученные при выборочном методе исследования, от величин, которые могли бы быть получены приизучении генеральной совокупности. Для того, чтобы исследователь имел право перенести выводы, сделанные на результатах выборочной совокупности, на всю генеральную совокупность, определяются показатели достоверности. Ошибки выборочного исследования связаны с выбором единиц наблюдения. Это ошибки типичности, репрезентативности. Репрезентативность- это соответствие данных выборочной и всей (генеральной) совокупностей. Если результаты получены на основе достаточного за количеством и качественно однородного материала, то можно считать, что они достаточно точно характеризуют исследуемое явление. Оценить достоверность результатов выборочного исследования означает определить, в какой мере сделанные для него выводы (результаты) можно перенести на генеральную совокупность. То есть, на основании части явления рассуждать о явлении в целом и основных присущих ему закономерностях. В этом случае мы говорит о достоверности полученных данных. Достоверность- это степень соответствия полученных показателей отображаемой действительности. Для оценки достоверности результатов каких-нибудь выборочных исследований определяют среднюю ошибку относительной или средней величины (ошибку репрезентативности). Ошибка репрезентативности (m) - это мера достоверности, которая показывает, на сколько отличается величина, полученная при выборочном методе исследования, от величин, которые могли бы быть получены при сплошном методе исследований того же явления. Средняя ошибка для соответствующих показателей при значительном числе наблюдений (n>30) может быть рассчитана на основании следующих формул: где: - среднеквадратическое отклонение; n - число наблюдений в выборочной совокупности. При малом числе наблюдений (менее 30) вместо n используется (n-1); P - относительный показатель; q - величина, обратная относительному показателю, т. е. вероятность того, что данное явление не будет зарегистрировано. Сумма двух противоположных вероятностей равно единице: P + q= 1. Если показатель рассчитан на 100 (%), то q= 100 - P; если на 1000 (‰), то q= 1000 - Pи т. д. Ошибка позволяет определить пределы, в которых с соответствующей степенью вероятности безошибочного прогноза находится истинное значение искомого показателя, т.е. доверительные границы. Доверительный интервал (∆) - показатель, с помощью которого с определенной вероятностью безошибочного прогноза (Рт) можно получить границы колебаний средней или относительной величины в генеральной совокупности(доверительные границы). Доверительный интервал ∆=.±tm. И соответственно доверительные границы средней и относительной величин определяют по формулам: где: Мген. и Рген. - значения средней и относительной величин в генеральной совокупности; Мвыб. и Рвыб. - значения средней и относительной величин, рассчитанных для выборочной совокупности; и - средние ошибки соответствующих показателей; t - критерий достоверности (или вероятности). Вероятность безошибочного прогноза (Рt) - это вероятность, с которой можно утверждать, что в генеральной совокупности средняя или относительная величины будут находиться в пределах Мвыб+tmМ или Рвыб±tmp. Определенной степени вероятности безошибочного прогноза соответствует константное значение критерия «t», величина которого при n>30 определяется по таблице интеграла вероятности (например, при Рt=0,95 → t=2,0; при Рt=0,99 → t=3,0 и т.д.). При n<30 используется краткая таблица критических значений критерия «t» Стьюдента. В медико-биологических и социально-гигиенических исследованиях минимальной достаточной вероятностью безошибочного прогноза является 95,5% (Pt=0,95), что допускает вероятность ошибки р=0,05. И только в наиболее ответственных случаях, когда необходимо сделать особенно важные в теоретическом или практическом отношении выводы, когда от результатов исследования зависит принятие решения, достаточной вероятностью считается 99,7% (Pt=0,99 или р=0,01). Таким образом, при определенной степени вероятности безошибочного прогноза (а ее задают на этапе планирования статистического исследования) и строго соответствующем ей критерии «t» величина доверительного интервала зависит от величины ошибки репрезентативности, значение которой уменьшается при увеличении числа наблюдений. В медико-биологических исследованиях часто возникают ситуации, когда при сравнении отдельных параметров необходимо оценить значимость различий между ними. Значимая (достоверная) разница между отдельными показателями выборочного исследования свидетельствует о возможности перенесения полученных выводов на генеральную совокупность. Наиболее распространенный метод оценки достоверности разности между сравниваемыми выборочными результатами - метод непрямой разности, в основе которого лежит расчет коэффициента достоверности различий «t» (критерия Стьюдента): - для средних величин; - для относительных величин. Разница между сравниваемыми выборочными величинами существенна и статистически достоверна с вероятностью безошибочного прогноза ≥95,5%, если величина критерия «t» равна или больше 2 (при n>30). В наиболее ответственных случаях t≥3 (Pt≥0,99, р≤0,01). Ошибка репрезентативности, доверительные границы, критерий Стьюдента могут быть рассчитаны не только для относительной и средней арифметической величин, но и для любого параметрического критерия, полученного в результате выборочного наблюдения. При этом критерий Стьюдента используется в основном для нормального альтернативного распределения. Основное правила статистики - «сравнивай сравниваемое» предполагает сопоставление обобщающих показателей (относительных, средних), полученных на однородных статистических совокупностях. Однако нередко бывают случаи, когда необходимо сравнивать показатели здоровья населения: - в различные исторические периоды времени или в динамике, - на различных территориях или предприятиях, - в различных городах, административных районах или населенных пунктах, отличающихся друг от друга различным составом населения (возрастным, половым, профессиональным, стажевым и т.п.). При установлении отличий, рационально использовать статистический прием преобразования обобщающих коэффициентов в показатели, пригодные для сравнения в совокупностях, неодинаковых по своему составу. Таким приемом и является метод стандартизации. Использование этого метода позволяет расчетным путем устранить влияния различий структур сравниваемых совокупностей на обобщающие коэффициенты. Уравнивая состав изучаемых групп населения, стандартизованные показатели дают ответ на вопрос, каковы были бы соотношения обобщающих коэффициентов, если бы группы населения имели одинаковый состав, т.е. имели одинаковую структуру. Стандартизация - метод расчета условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости состава групп. Рассчитанные при помощи метода стандартизации показатели условны, потому что они, устраняя влияние того или иного фактора на истинные показатели, указывают, какими были бы эти показатели, если бы влияние данного фактора отсутствовало. Следовательно, стандартизованные показатели могут быть использованы только с целью сравнения. Существуют различные способы расчета стандартизованных показателей: ♦прямой, ♦косвенный, ♦обратный. Выбор способа (метода) получения стандартизованных показателей зависит от наличия первичного материала. Способ прямой стандартизации избирают: vЕсли имеются сведения как о составе (возрастном, половом, профессиональном, стажевым и др.) сравниваемых групп населения, так и о распределении изучаемого явления (заболеваний, случаев рождений, смертельных исходов, инвалидности и др.) среди них и, следовательно, можно вычислить повозрастные, по полу, по отдельным профессиям и стажу работы коэффициенты, т.е. имеется числитель и знаменатель интенсивного показателя. Способ косвенной стандартизации применяют в двух случаях: vЕсли имеются данные о распределении населения по возрастно-половым или другим изучаемым признакам, но нет сведений о распределении изучаемого явления среди этих групп населения, т.е. отсутствует числитель интенсивного показателя. vЕсли число умерших, родившихся, больных и т.п. в отдельных группах населения малы и, следовательно, погрупповые коэффициенты смертности, рождаемости, заболеваемости недостаточно достоверны. Например, при изучении заболеваемости или смертности от отдельных болезней. В тех случаях, когда сведения о структуре населения отсутствуют, т.е. нет знаменателя для расчета интенсивного показателя, целесообразно применять так называемый обратный способ вычисления стандартизованных коэффициентов, не требующий данных о составе населения и ограничивающийся только сведениями о составе изучаемого явления. Все методы (способы) стандартизации дают в основном одинаковый результат. Наиболее точным способом является косвенный, наглядным - прямой. Обратный метод стандартизации следует применять только тогда, когда нельзя использовать ни косвенный, ни прямой. Он менее точен. Всегда, однако, надо иметь в виду, что величина стандартизованных коэффициентов зависит от применяемого стандарта. Поэтому, когда требуется не сравнение, а знание реальных размеров изучаемого явления (заболеваемости, смертности), необходимо прибегать к обычным интенсивным показателям. В практике здравоохранения чаще всего используется прямой метод стандартизации. Одним из важных аспектов анализа различных медицинских явлений представляется оценка их изменений во времени - в динамике: за 100, 10-ти или 5-ти летний период, по годам, месяцам, дням недели, сезонам года и даже по минутам или секундам, как, например, в ходе хирургической операции. Особенно большое значение для медицинской практики имеют сведения об изменениях результативных показателей здоровья обслуживаемого населения (динамика острой инфекционной заболеваемости, хронической патологии, общей или младенческой смертности, рождаемости, миграции, инвалидности и пр.) и показателей деятельности системы здравоохранения (динамика посещаемости амбулаторно-поликлинических учреждений, обеспеченности медицинскими кадрами, качества диспансерной работы и пр.). Анализ таких данных по периодам времени предусматривает, во-первых, определение тенденции развития явлений и, во-вторых, с помощью методов медицинской статистики позволяет измерить размеры произошедших изменений и количественно охарактеризовать направления их развития. Другими словами, найдено математическое описание динамики изменений, установлена связь между величинами, характеризующими это движение. Ряд однородных величин, показывающих изменение величины явления (признака) во времени - называется динамическим рядом. Он состоит из определенных периодов времени, за которые анализируется явление, и статистических величин (абсолютных или производных), которые называются уровнями ряда. Ряд, состоящий из абсолютных чисел, называется простым. Ряд, в котором уровни представлены относительными или средними величинами называется сложным. Динамический ряд может быть двух типов: ♦ моментный и ♦ интервальный. Моментный ряд представлен числами, характеризующими величину явления на определенный момент времени, т.е. на определенную дату (например, данные о численности коек, населения, врачей за ряд лет, результаты медицинских осмотров и т.д.). Уровни моментного ряда не подлежат дроблению или укрупнению, они получены путем единовременного наблюдения на определенный момент времени (дату). Интервальный ряд состоит из чисел накопленных за определенный период времени путем текущего наблюдения (в течение недели, месяца, года, нескольких лет). Такой ряд можно разделить на более дробные периоды (год - на кварталы; месяцы - на недели) или укрупнить (например, по 2, 3 и более лет). Примерами интервальных динамических рядов могут быть ряды, в которых представлены данные о смертности населения, рождаемости, заболеваемости, травматизме и т.д. Выбор величины периода для интервального ряда (год, месяц, неделя, день, час и т.д.) в известной мере определяется степенью изменчивости явления. Чем медленнее изменяется явление во времени, тем крупнее могут быть периоды наблюдения. Первый член ряда является начальным уровнем, а последний - конечным. Различают настоящий, предыдущий и последующий уровни. Каждый уровень может быть в определенный момент анализа настоящим, предыдущим или последующим. 30> |