Главная страница

тема 3,4. Средние величины


Скачать 142.87 Kb.
НазваниеСредние величины
Дата12.04.2023
Размер142.87 Kb.
Формат файлаdocx
Имя файлатема 3,4.docx
ТипЗакон
#1056148

Врачи разных специальностей широко используют средние величины при:

-изучении физического развития различных групп населения (средний рост, вес, окружность грудной клетки и т.д.);

-характеристике физиологического состояния органов и систем организма человека (средняя частота пульса, средняя величина артериального давления, жизненной емкости легких, среднее содержание белка крови и т.д.);

-изучении закономерностей течения различных процессов в здоровом и больном организме;

-оценке эффективности применения лекарственных препаратов;

-гигиенической характеристике внешней среды (среднее содержание пыли и газов в воздухе производственных помещений и в атмосфере, средний уровень шума, вибрации и т.д.).

Средние величины используются, если необходимо получить среднюю характеристику изучаемого количественного признака из вариационного ряда.

Средние величины используются, если результаты исследований многочисленны, причем они могут быть представлены как в качественном, так и количественном выражении. Чаще мы имеет дело с результатами исследований, которые представлены в количественном выражении.

Вариационный ряд - ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности (в восходящем или убывающем порядке).

Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р). Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией.

Вариационные ряды делятся:

- на прерывные и непрерывные - по характеру количественного признака,

-  простые и взвешенные - по частоте встречаемости вариант.

В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном - одна и та же варианта встречается несколько раз (р>1).

Если количественный признак носит непрерывный характер, (т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд) называется непрерывным.

Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют  прерывным или дискретным.

Различают несколько видов средних величин:

● средняя арифметическая, ● средняя геометрическая,

● средняя гармоническая, ● средняя квадратическая,

● средняя прогрессивная, ● мода, ● медиана и д.р.

В мед. статистике наиболее часто пользуются средними арифметическими величинами.
----------------------------------------------------------------------------------------------------Средняя арифметическая величина (М или ) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности.

Основными способами расчета М являются: 

● среднеарифметический способ ● способ моментов (условных отклонений)

Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

где:М - средняя арифметическая величина;

V - значение варьирующего признака (варианты);

Σ - указывает действие - суммирование; n - общее число наблюдений.

Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название - взвешенный вариационный ряд, а рассчитываемая средняя величина - средней арифметической взвешенной.

Средняя арифметическая взвешенная определяется по формуле:

где n - число наблюдений, равное сумме частот - Σр.

Способ моментов. Этот более простой способ вычисления средней арифметической взвешенной величины применяется при большом числе наблюдений и вариантах, выраженных большими числами. Он основан на том, что алгебраическая сумма отклонений отдельных вариант вариационного ряда от средней арифметической равна нулю, т.е. Σ(- d)=Σ(+ d), где d - истинные отклонения варианты от истинной средней арифметической величины. Данное свойство средней используется при проверке правильности ее расчетов. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно.

Средняя арифметическая по способу моментов определяется по формуле:

где: А - условно принятая средняя;

а - условное отклонение каждой варианты от условной средней (V - А);

i - величина интервала, т.е. разность между соседними вариантами.

Следует обратить внимание на то, что если величина интервала (i) между соседними вариантами равна единице, формула расчета средней арифметической по способу моментов имеет следующий вид:

Именно такая формула представлена во многих учебниках. Если величина интервала меньше или больше единицы, то для упрощения расчетов разность между соседними вариантами принимают за единицу, фактическое же значение этой разности вводится в последующем в формулу, и она приобретает следующий вид:

Мода (Мо) - наиболее часто встречающаяся варианта в вариационном ряду.

Медиана (Ме) - непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана - основную массу.

Средняя величина может быть рассчитана не только на основе абсолютных данных, но и среди показателей. При одинаковых числах наблюдений ее находят как среднюю простую, т.е. достаточно суммировать размеры показателей и затем поделить на их число. При разных числах наблюдений среднюю величину среди показателей следует определять всегда как среднюю взвешенную.

Средняя величина, рассчитанная математическим путем, - это величина, вокруг которой расположены на разном удалении варианты, вошедшие в вариационный ряд, из которого она была рассчитана. Чем ближе друг к другу по значению отдельные варианты, тем меньше колеблемость (рассеянность) вариационного ряда, тем типичнее для характеристики изучаемого признака его средняя величина. О таком вариационном ряде говорят, что он компактный, однородный.

Если же варианты значительно удалены от своей средней арифметической - налицо большое варьирование, а возможно и неоднородная совокупность, и рассчитанная в этой совокупности средняя величина не будет отображать типичных для изучаемого явления черт.

Являясь важнейшей статистической характеристикой, средняя арифметическая ничего не говорит о величине варьирования характеризуемого признака. Вот почему при статистической обработке вариационного ряда, кроме расчета средних величин необходимо установить размеры варьирования или разнообразия значений изучаемого признака (его изменчивости или колеблемости).

К показателям разнообразия (вариации, колеблемости) относятся:

-амплитуда (Am), лимит (lim) -среднее квадратическое отклонение (δ)

-дисперсия (δ2) -коэффициент вариации (CV)

Различают показатели колеблемости, характеризующие:

·границы изучаемой совокупности (lim, Am);

·внутреннюю ее структуру (δ, δ2, CV).

Амплитуда (размах вариации) - разность лимитов (крайних вариант) (Am=Vmax - Vmin). С помощью этого показателя можно оценить колеблемость вариационного ряда, но при сравнении с амплитудой второго вариационного ряда.

Ими можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30). Но они не характеризуют внутреннюю структуру вариационного ряда, не учитывают колебания между значениями вариант.

Среднее квадратическое отклонение (δ) - именованная величина, поэтому она должна иметь размерность общую для вариант и средней арифметической величины. Это наиболее точная мера варьирования, колеблемости вариационного ряда (изучаемого признака.

Существует несколько способов расчета среднего квадратического отклонения: среднеарифметический, способ моментов и по амплитуде вариационного ряда.

Среднеарифметический способ расчета

Когда число наблюдений небольшое (n≤30), а все частоты в вариационном ряду р=1, применяется формула:

где d - истинные отклонения вариант от истинной средней (V - М). При р>1 используется формула:

При большом числе наблюдений (n>30) в знаменателе обеих формулах берут n, а не n-1.

Следует заметить, что при определении средней арифметической (М) учитывают все элементы ряда, рассчитывая δ, надо брать не все случаи, а на единицу меньше (n-1), при n ≤30.

При нормальном распределении при различных значениях средней и среднеквадратического отклонения, всегда:

- 68,3% наблюдений находятся в пределах ±1δ;

- 95,5% наблюдений находятся в пределах ±2δ; - 99,7% - в пределах ±3δ.

И только 0,3% (3 случая на 1000) наблюдений имеют значения, отличные от среднего больше чем на 3δ.

Среднее квадратическое отклонение имеет совершенно исключительное значение в статистике и используется в качестве абсолютной меры разнообразия, а также эта величина положена в основу почти всех характеристик изменчивости, распределения, корреляции, регрессии и дисперсионного анализа.

При помощи δ определяют типичность средней величины и меру ее точности. Если 95% всех вариант находятся в пределах М±2δ, то средняя является характерной для данного ряда, и не требуется увеличивать число наблюдений в выборочной совокупности.

В медицине с величиной М±δ связано понятие нормы и патологии, отклонения от средней (в любую сторону) больше, чем на ±δ, но меньше, чем на ±2δ, считается субнормальным (выше или ниже нормы). При отклонении от средней больше, чем на ±2δ, варианты (показатели) считаются значительно отличающимися от нормы, т.е. патологическими.

Практическое значение среднего квадратического отклонения заключается в том, что зная М и δ, можно построить вариационные ряды.

Правило 3δ применяется в народном хозяйстве при определении стандартов (для массового пошива одежды, обуви, производства мебели и т.д.). В медицинской статистике правило 3δ применяется при изучении физического развития человека, оценке деятельности учреждений здравоохранения, комплексной оценке здоровья населения и т.д.

Среднее квадратическое отклонение является основной абсолютной мерой вариабельности варьирующих признаков, однако, при сравнении разнообразия двух или более совокупностей среднее квадратическое отклонение применяется при соблюдении двух условий:

1.Сравниваются только однородные совокупности (одноименные) или признаки.

2.Средние уровни сравниваемых признаков значительно отличаются друг от друга.

 При несоблюдении этих условий δ не может быть использована для сравнения разнообразия и в этом случае в качестве относительной меры вариабельности применяется коэффициент вариации.

Коэффициент вариации рассчитывается по формуле:

Коэффициент вариации в известной мере является критерием надежности средней арифметической.

Если СV≥40%, то средняя арифметическая неустойчива и ненадежна.

Оценка степени колеблемости изучаемых признаков по коэффициенту вариации может быть произведена по следующей схеме:

СV (в %)

Степень колеблемости

(рассеяние вариант около средней

арифметической величины)

менее 10

малая

от 10 до 20

средняя

более 20

сильная

 

При нормальном распределении коэффициент вариации обычно не превышает 45 - 50% и часто бывает гораздо ниже этого уровня. В случаях же асимметричных распределений он может быть довольно высоким, достигающим 100% и выше.

При проведении различных медико-биологических исследований в практической или научной деятельности врача преимущественно пользуютсявыборочным методом сбора информации.

В этом случае к выборочной совокупности предъявляют два основных требования:

·она должна обладать основными характерными чертами генеральной совокупности, то есть быть максимально на нее похожей;

·она должна быть достаточной по объему (числу наблюдений), чтобы более точно выразить особенности генеральной совокупности.

 

И, все-таки, какой бы репрезентативной не была выборочная совокупность, она отличается от генеральной потому, что в процессе выборки допускаются случайные ошибки - ошибки выборки, которые показывают, на сколько отличаются величины, полученные при выборочном методе исследования, от величин, которые могли бы быть получены приизучении генеральной совокупности.

Для того, чтобы исследователь имел право перенести выводы, сделанные на результатах выборочной совокупности, на всю генеральную совокупность, определяются показатели достоверности.

Ошибки выборочного исследования связаны с выбором единиц наблюдения. Это ошибки типичности, репрезентативности.
Выборочная совокупность - часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности.


При проведении выборочного исследования мы можем встретиться с общими ошибками и ошибками выборки. Общие ошибки могут иметь как системный характер (методические ошибки, недостатки измерительной аппаратуры), так и случайный (ошибки исследователя). Ошибки же выборочного исследования связаны с выбором единиц наблюдения. Это ошибки типичности, репрезентативности.

Репрезентативность - это соответствие данных выборочной и всей (генеральной) совокупностей.

В процессе анализа рассчитанные показатели (средняя длительность лечения, частота осложнений, уровень летальности и другие) рассматривают как обобщающие величины. Если результаты получены на основе  достаточного за количеством и качественно однородного материала  (требования к выборочной совокупности, являющиеся сущностью понятия репрезентативности), то можно считать, что они достаточно точно характеризуют исследуемые явления.

Следовательно, оценить достоверность результатов выборочного исследования означает определить, в какой мере сделанные для него выводы (результаты) можно перенести на генеральную совокупность. То есть, на основании части явления рассуждать о явлении в целом и основных присущих ему закономерностях. В этом случае мы говорит о достоверности полученных данных.
-------------------------------------------------------------------------------------------------------------

Достоверность - это степень соответствия полученных показателей отображаемой действительности.

Для оценки достоверности результатов каких-нибудь выборочных исследований определяют среднюю ошибку относительной или средней величины (ошибку репрезентативности).

при определенной степени вероятности безошибочного прогноза (а ее задают на этапе планирования статистического исследования) и строго соответствующем ей критерии «t» величина доверительного интервала зависит от величины ошибки репрезентативности, значение которой уменьшается при увеличении числа наблюдений.

Практическая ценность использования средней ошибки заключается не только в определении доверительных границ для конкретного показателя, а и в оценке его достоверности. 

Ошибка репрезентативности (m) - это мера достоверности, которая показывает, на сколько отличается величина, полученная при выборочном методе исследования, от величин, которые могли бы быть получены при сплошном методе исследований того же явления.

Средняя ошибка для соответствующих показателей при значительном числе наблюдений (n>30) может быть рассчитана на основании следующих формул:

где:  - среднеквадратическое отклонение;

 n - число наблюдений в выборочной совокупности. При малом числе наблюдений (менее 30) вместо n используется (n-1);

P - относительный показатель;

q - величина, обратная относительному показателю, т. е. вероятность того, что данное явление не будет зарегистрировано.

Сумма двух противоположных вероятностей равно единице: P + q= 1. Если показатель рассчитан на 100 (%), то q= 100 - P; если на 1000 (‰), то q= 1000 - Pи т. д.

Ошибка позволяет определить пределы, в которых с соответствующей степенью вероятности безошибочного прогноза находится истинное значение искомого показателя, т.е. доверительные границы.

Доверительный интервал (∆) - показатель, с помощью которого с определенной вероятностью безошибочного прогноза (Рт) можно получить границы колебаний средней или относительной величины в генеральной совокупности(доверительные границы). ∆=.±tm.

Доверительные границы средней и относительной величин определяют по формулам:

где: Мген. и Рген.  - значения средней и относительной величин в генеральной совокупности;

Мвыб. и Рвыб. - значения средней и относительной величин, рассчитанных для выборочной совокупности;

 и  - средние ошибки соответствующих показателей;

t - критерий достоверности (или вероятности).

Вероятность безошибочного прогнозаt) - это вероятность, с которой можно утверждать, что в генеральной совокупности средняя или относительная величины будут находиться в пределах Мвыб+tmМ или Рвыб±tmp.

Определенной степени вероятности безошибочного прогноза соответствует константное значение критерия «t», величина которого при n>30 определяется по таблице интеграла вероятности (например, при Рt=0,95 → t=2,0; при Рt=0,99 → t=3,0 и т.д.).

При n<30 используется краткая таблица критических значений критерия «t» Стьюдента.

В медико-биологических и социально-гигиенических исследованиях минимальной достаточной вероятностью безошибочного прогноза является 95,5% (Pt=0,95), что допускает вероятность ошибки р=0,05. И только в наиболее ответственных случаях, когда необходимо сделать особенно важные в теоретическом или практическом отношении выводы, когда от результатов исследования зависит принятие решения, достаточной вероятностью считается 99,7% (Pt=0,99 или р=0,01).

Таким образом, при определенной степени вероятности безошибочного прогноза (а ее задают на этапе планирования статистического исследования) и строго соответствующем ей критерии «t» величина доверительного интервала зависит от величины ошибки репрезентативности, значение которой уменьшается при увеличении числа наблюдений.

Достоверность показателя определяется на основе отношения его абсолютного значения к величине его средней ошибки . Показатель считается достоверным с вероятностью безошибочного прогноза ≥95,5%, если это отношение ≥2; с вероятностью безошибочного прогноза ≥97,7%, если это отношение ≥3. Если отношение абсолютного значения показателя к его средней ошибке составляет менее 2, то в этом случае показатель, рассчитанный для выборочной совокупности, считается недостоверным, т.е. таким, который не может быть использован для каких-либо суждений и выводов о всей генеральной совокупности. В нашем примере:
-------------------------------------------------------------------------------------------------------------

В медико-биологических исследованиях часто возникают ситуации, когда при сравнении отдельных параметров необходимо оценить значимость различий между ними. Значимая (достоверная) разница между отдельными показателями выборочного исследования свидетельствует о возможности перенесения полученных выводов на генеральную совокупность. Наиболее распространенный метод оценки достоверности разности между сравниваемыми выборочными результатами - метод непрямой разности, в основе которого лежит расчет коэффициента достоверности различий «t» (критерия Стьюдента):

 

Разница между сравниваемыми выборочными величинами существенна и статистически достоверна с вероятностью безошибочного прогноза ≥95,5%, если величина критерия «t» равна или больше 2 (при n>30). В наиболее ответственных случаях t≥3 (Pt≥0,99, р≤0,01).

Ошибка репрезентативности, доверительные границы, критерий Стьюдента могут быть рассчитаны не только для относительной и средней арифметической величин, но и для любого параметрического критерия, полученного в результате выборочного наблюдения. При этом критерий Стьюдента используется в основном для нормального альтернативного распределения.

Основное правила статистики - «сравнивай сравниваемое» предполагает сопоставление обобщающих показателей (относительных, средних), полученных на однородных статистических совокупностях.

Однако нередко бывают случаи, когда необходимо сравнивать показатели здоровья населения:

- в различные исторические периоды времени или в динамике,

- на различных территориях или предприятиях,

- в различных городах, административных районах или населенных пунктах, отличающихся друг от друга различным составом населения (возрастным, половым, профессиональным, стажевым и т.п.).

При установлении отличий, рационально использовать статистический прием преобразования обобщающих коэффициентов в показатели, пригодные для сравнения в совокупностях, неодинаковых по своему составу.

Таким приемом и является метод стандартизации. Использование этого метода позволяет расчетным путем устранить влияния различий структур сравниваемых совокупностей на обобщающие коэффициенты. Уравнивая состав изучаемых групп населения, стандартизованные показатели дают ответ на вопроскаковы были бы соотношения обобщающих коэффициентов, если бы группы населения имели одинаковый состав, т.е. имели одинаковую структуру.

Стандартизация - метод расчета условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости состава групп.

Рассчитанные при помощи метода стандартизации показатели условны, потому что они, устраняя влияние того или иного фактора на истинные показатели, указывают, какими были бы эти показатели, если бы влияние данного фактора отсутствовало. Следовательно, стандартизованные показатели могут быть использованы только с целью сравнения.

Существуют различные способы расчета стандартизованных показателей:

♦прямой, ♦косвенный, ♦обратный.

Выбор способа (метода) получения стандартизованных показателей зависит от наличия первичного материала.

Способ прямой стандартизации избирают:

V Если имеются сведения как о составе (возрастном, половом, профессиональном, стажевым и др.) сравниваемых групп населения, так и о распределении изучаемого явления (заболеваний, случаев рождений, смертельных исходов, инвалидности и др.) среди них и, следовательно, можно вычислить повозрастные, по полу, по отдельным профессиям и стажу работы коэффициенты, т.е. имеется числитель и знаменатель интенсивного показателя.

Способ косвенной стандартизации применяют в двух случаях:

V Если имеются данные о распределении населения по возрастно-половым или другим изучаемым признакам, но нет сведений о распределении изучаемого явления среди этих групп населения, т.е. отсутствует числитель интенсивного показателя.

V Если число умерших, родившихся, больных и т.п. в отдельных группах населения малы и, следовательно, погрупповые коэффициенты смертности, рождаемости, заболеваемости недостаточно достоверны. Например, при изучении заболеваемости или смертности от отдельных болезней.

В тех случаях, когда сведения о структуре населения отсутствуют, т.е. нет знаменателя для расчета интенсивного показателя, целесообразно применять так называемый обратный способ вычисления стандартизованных коэффициентов, не требующий данных о составе населения и ограничивающийся только сведениями о составе изучаемого явления.

Все методы (способы) стандартизации дают в основном одинаковый результат. Наиболее точным способом является косвенный, наглядным - прямой. Обратный метод стандартизации следует применять только тогда, когда нельзя использовать ни косвенный, ни прямой. Он менее точен.

Всегда, однако, надо иметь в виду, что величина стандартизованных коэффициентов зависит от применяемого стандарта. Поэтому, когда требуется не сравнение, а знание реальных размеров изучаемого явления (заболеваемости, смертности), необходимо прибегать к обычным интенсивным показателям.

В практике здравоохранения чаще всего используется прямой метод стандартизации.
-------------------------------------------------------------------------------------------------------------



Начало формы


написать администратору сайта