1. озз. Определение, разделы дисциплины, задачи, структура. Роль дисциплины в системе мед образования, практической деятельности врачаспециалиста и организаций здравоохранения
Скачать 2.59 Mb.
|
Ранговый метод корреляции Спирмена В ряде медико-социальных исследований приходится сталкиваться с ситуацией, когда учетные признаки характеризуются не точными числовыми значениями, а приближенными оценками большего или меньшего количества какого-либо свойства или явления. Когда отдельные единицы наблюдения располагают в порядке возрастания или убывания этих оценок, т.е. ранжируют, то номер каждой единицы наблюдения будет номером ее ранга. Порядок ранжирования должен быть выбран один и тот же для ряда X и для ряда Y. Он может быть возрастающим, когда ранг №1 присваивается наименьшему показателю, или убывающим, когда первое место присваивается самому большому показателю, а последнее ― самому маленькому. При наличии нескольких равных по величине показателей их порядковые номера (ранги) суммируются, сумма делится на число одинаковых показателей и полученный результат в виде ранга присваивается каждому из определяемых показателей. Когда анализируемые признаки взаимосвязаны, их распределения совпадают и разность их рангов минимальна, и наоборот. Одно из главных достоинств коэффициента корреляции рангов заключается в простоте вычислений. Применение этого коэффициента корреляции может быть рекомендовано в случаях: когда необходимо быстро, ориентировочно определить связь между какими-то признаками; когда распределение значений учетных признаков (в том числе и количественных) не соответствует нормальному распределению или распределение неизвестно. Существует несколько вариантов вычислений коэффициентов ранговой корреляции. Коэффициент корреляции рангов Спирмена вычисляется по формуле: , где d – разности между рангами (порядковыми номерами); п – число сопоставляемых пар. Ранговый коэффициент используется, например, при оценке зависимости интенсивности запаха воды (в баллах) открытого водоема (Y) и удаленности места забора проб от возможного источника загрязнения (X). Нецелесообразно вычислять коэффициент связи при числе коррелируемых пар меньше четырех. Коэффициент ранговой корреляции можно вычислять и тогда, когда данные носят полуколичественный, приближенный характер, отражая лишь общий порядок следования величин. Коэффициент сопряженности (контингенции) При изучении зависимости качественных признаков, когда имеют место так называемые альтернативные признаки, т.е. вариация двух противоположных возможностей («заболел ― не заболел» или «привит ― не привит» и др.), измерение связи может быть проведено в четырехпольной таблице путем вычисления коэффициентов сопряженности (контингенции). Когда получены статистические данные, характеризующие связь между двумя альтернативными признаками, то используются четырехклеточные таблицы сопряженности двух дихотомических признаков (разделенных надвое) с альтернативны ми значениями («+», «–»). Поля таблицы сопряженных признаков обозначаются «а», «b», «c», «d». Коэффициент сопряженности (современное название ― коэффициент контингенции) вычисляется по формуле: . Если известен критерий согласия 2 (хи-квадрат), то при небольшом числе (до 100 единиц) наблюдений коэффициент контингенции можно определить по формуле: . Коэффициент взаимной сопряженности Чупрова Показатель взаимосвязи Чупрова (К) предназначен для измерения связи между количественными признаками, располагающимися в таблицах размером S t =2, где S и t – соответственно число строк и столбцов (без итогов). Вычисление этого коэффициента основывается на измерении отклонений наблюдаемых частот в клетках таблицы от теоретических (ожидаемых) частот, которые задаются в предположении о независимости признаков. Математическая логика применения показателя К базируется на том, что, если теоретическое распределение говорит от независимости (не связанности) признаков, то отклонение фактического от теоретического распределения будет тем больше, чем больше признаки взаимосвязаны. Это отклонение оценивается с по мощью критерия , который включен в формулы в качестве основного элемента. Сам по себе критерий 2 может свидетельствовать о наличии или отсутствии взаимосвязи, однако его значение во многом зависит от числа наблюдений (n). Таким образом, его значения не могут использоваться для сравнения корреляционных связей в совокупностях с разным числом наблюдений. Этот недостаток устраняется при использовании коэффициента Чупрова (К), имеющего формулу: . Критерий Чупрова дает более точные результаты, когда таблица сопряженности имеет квадратную форму, причем число строк и столбцов не превышает 5x5 (без итогов). Так как расчет критерия К производится на основе 2 , то все ограничения 2 распространяются и на него. Статистические оценки значений критерия К производятся в тех же границах, что и обычных коэффициентов корреляции: от 0 до 1. Этим критериям, как правило, не приписывают никакого знака (+ или –), так как с математической точки зрения они являются результатом вычисления квадратного корня. Направление связи устанавливается из содержательного смысла таблицы с исходными данными. Если хотя бы один из признаков не может быть ранжирован (пол, национальность и т.п.), выяснение направления связи вообще теряет всякий смысл. Регрессионный анализ Иногда при анализе корреляционных связей важно установить, как количественно меняется один признак по мере изменения другого на единицу. В этих случаях регрессионный анализ осуществляется на основании вычисления и оценки коэффициентов регрессии (R). Поскольку изменчивых величин две (X и Y) и регрессия является двусторонней, то соответственно будут и два коэффициента регрессии Rxy и Rух, которые вычисляются по формулам: , , где rху – коэффициент корреляции; х и у – средние квадратические отклонения двух сравниваемых рядов. Коэффициент регрессии характеризует только линейную зависимость и имеет знак «плюс» при положительной и знак «минус» - при отрицательной связи. Между коэффициентами корреляции и регрессии имеется определенная связь, выражающаяся формулой: . Зная коэффициенты регрессии, можно легко определить коэффициенты корреляции. Коэффициент регрессии нашел широкое применение в статистике физического развития. Он показывает, например, насколько изменяется масса тела при увеличении роста на 1 см или возраста на 1 год. Аналогично при помощи коэффициента регрессии можно выяснить, как должна меняться окружность грудной клетки при изменении роста на 1 см. 13. Критерии параметрического метода оценки и способы их расчета (ошибка, репрезентативности средних и относительных величин, доверительные границы средних и относительных величин). Любое подмножество объектов генеральной совокупности называют выборочной совокупностью, или выборкой. Суть выборки состоит в том, что она, являясь частью генеральной совокупности, в определенной мере может характеризовать саму генеральную совокупность, т.е., обследуя часть объектов, можно сделать выводы обо всем их множестве. Как правило, генеральная совокупность имеет достаточно большое, а в идеале и бесконечное, количество элементов. Понятно, что чем больше объем выборки, тем лучше она представляет генеральную совокупность. Однако обследование больших выборок или проведение сплошных обследований зачастую просто невозможно или экономически нецелесообразно. Реально на практике репрезентативность (представительность, типичность) выборки обеспечивается способом отбора значений. Отбор должен гарантировать каждому возможному значению равные шансы быть выбранным, и тогда появление или не появление конкретного значения определяется его частотой в генеральной совокупности, т.е. вероятностью появления тех или иных значений. Вероятность случайного события А ― это отношение количества элементарных событий, благоприятствующих А к общему количеству элементарных событий. Оценка достоверности результатов исследования базируется на теоретических основах вероятности. Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность. В большинстве медицинских исследований врачу приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом ― на генеральную совокупность. Таким образом, оценка достоверности необходима для того, чтобы по части явления можно было бы судить о явлении в целом, о его закономерностях. Как бы тщательно ни производилась выборка, какой репрезентативной ни была бы выборочная совокупность (отобранная часть наблюдений), она неизбежно в какой-то мере будет отличаться от генеральной (общей, исчерпывающей) совокупности. Однако в нашем распоряжении имеются методы определения степени различий числовых характеристик обеих совокупностей и пределов возможных колебаний выборочных показателей при данном числе наблюдений. Как будет видно из последующего, число наблюдений играет при этом значительную роль: чем оно больше, тем точнее отображаются в выборке свойства генеральной совокупности и тем меньше размеры ошибки выборочных показателей. Теория выборочного метода, наряду с обеспечением репрезентативности выборочных показателей, практически сводится к оценке расхождений между числовыми характеристиками генеральной и выборочной совокупностей, т.е. к определению средних ошибок(ошибок репрезентативности). Эти ошибки неизбежны, так как они проистекают из сущности выборочного исследования. Генеральная совокупность может быть охарактеризована по выборочной совокупности только с некоторой погрешностью, измеряемой ошибкой репрезентативности. Ошибки репрезентативности нельзя смешивать с обычным представлением об ошибках ― методических, точности измерения, арифметических и др. По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности. Это единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Каждая средняя величина ― М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина ― Р (уровень летальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой ― т. На размеры средней ошибки влияет не только число наблюдений, но и степень колеблемости, изменчивости признака. Это совершенно очевидно из формулы, по которой определяется средняя ошибка средней величины (обозначаемая обычно буквой т): где n ― число наблюдений. Между размерами среднего квадратического отклонения (отражающего колеблемость явления) и размерами средней ошибки существует прямая связь; между числом наблюдений и величиной средней ошибки существует зависимость, обратная квадратному корню из числа наблюдений. Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается тр. Для определения средней ошибки относительной величины используется следующая формула: , где Р ― показатель, относительная величина, q ― разность между основанием показателя и самим показателем: так, если показатель выражен в процентах, то q = 100 – Р, если Р ― в промилле, то q – 1000 - Р, если Р ― в продецимилле, то q = 10000 – Р и т.д.; п ― число наблюдений. При числе наблюдений менее 30 в качестве знаменателя следует взять п – 1. Определяя для средней арифметической (или относительной) величины два крайних значения (минимально возможное и максимально возможное), находят пределы, в которых может быть искомая величина генерального параметра. Эти пределы называют доверительными границами. Доверительные границы ― границы средних (или относительных) величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность. Доверительные границы средней арифметической в генеральной совокупности определяют по формуле: Мген = Мвыб ± tmм. Доверительные границы относительной величины в генеральной совокупности определяют по формуле: Рген = Рвы6 ± tmр, где Мген и Рген – значения средней и относительной величин, полученных для генеральной совокупности; Мвы6 и Рвы6 ― значения средней и относительной величин, полученных для выборочной совокупности; mмmр ― ошибки репрезентативности выборочных величин; t ― доверительный критерий. При определении доверительных границ сначала надо решить вопрос о том, с какой степенью вероятности безошибочного прогноза необходимо представить доверительные границы средней или относительной величины. Для большинства медико-биологических и медико-социальных исследований достаточна вероятность безошибочного прогноза р = 95 % и более. Избрав такую степень вероятности, соответственно находят величину доверительного критерия (по специальной таблице). Таким образом, доверительный критерий t устанавливается заранее, при планировании исследования. Доверительные границы средней величины, вычисленные исходя из доверительной вероятности 0,95, составляют М ± 2т. Это означает, что в 95 из 100 аналогичных выборок значение М будет находиться в указанных пределах (или на 95% случаев гарантируется нахождение в этих пределах генеральной средней). При необходимости получения более надежных гарантий доверительности выборочного показателя используется доверительная вероятность 0,99 (99%), которой соответствует коэффициент t = 2,6. Утроенная средняя ошибка (t = 3) соответствует доверительной вероятности 0,997 (99,7%). Для получения наиболее высокой надежности результатов исследования прибегают к вероятности 0,999 (99,9%), соответствующей значению t = 3,3. Чем выше требования к доверительной вероятности (соответствие выборочной средней генеральной средней), тем шире должен быть обеспечивающий такую вероятность интервал, называемый доверительным интервалом. Необходимость в определении доверительного интервала возникает при желании по материалам выборочного исследования (например, распространенность хронических заболеваний в двух дошкольных учреждениях) дать прогноз о распространенности изучаемого явления (хронических заболеваний) среди всех детей, посещающих дошкольные учреждения. Интуитивно понятно, что если исследования будут продолжены дальше, то значение определяемого показателя несколько изменится в большую или меньшую сторону. Границы доверительного интервала как раз и показывают, в какой степени может измениться значение определяемого нами показателя с принятой нами вероятностью ошибки. При небольшом числе наблюдений для вычисления доверительных границ с указанными доверительными вероятностями (0,95; 0,99 и 0,999) значение коэффициента tнаходят по специальной таблице Стьюдента. Очевидно, что в реальных исследованиях желательно иметь как можно меньший доверительный интервал при достаточно высокой доверительной вероятности. Вопрос оценки различий между такими параметрами выборки, как средние величины, является одним из самых важных в статистике медико- биологических исследований. Многие исследования заканчиваются ответом именно на этот вопрос. Например, при оценке токсичности какого-либо вещества обычно берутся две группы лабораторных животных. Подбираются животные одинакового возраста, пола, одинакового содержания и т.п., т.е. делается все, чтобы эти группы животных представляли собой единую, как можно более однородную статистическую совокупность. Разница заключается только в том, что одна из групп животных (опытная) подвергается воздействию токсичного вещества, а другая (контрольная) ― нет. В любом случае, произошли после воздействия токсичного вещества изменения в опытной группе или нет, разница показателей обеих групп обязательно будет иметь место. Вопрос состоит в том, являются ли этот факт только следствием различий, существующих в группах даже при их выборке из одной генеральной совокупности, или разница возникла из-за того, что произошли существенные сдвиги физиологических функций животных опытной группы. Иначе говоря, принадлежат ли животные опытной и контрольной групп к той же самой генеральной совокупности или опытная группа принадлежит к другой генеральной совокупности (совокупности с измененными физиологическими параметрами)? Достоверность различия двух выборочных величин можно оценить с помощью доверительных границ. Если доверительные границы одной из этих величин не совпадают с доверительными границами другой величины, то различие между ними следует считать статистически значимым, существенным с тем уровнем вероятности, при котором были вычислены доверительные границы. Если доверительные границы одного показателя полностью или на большом протяжении совпадают с доверительными границами другого показателя, то различие между ними признается статистически не значимым, не существенным. В тех случаях, когда при сопоставлении доверительных границ трудно сделать определенное заключение о наличии или отсутствии существенных различий между средними величинами, следует прибегнуть к вычислению критерия значимости Стьюдента t по формуле: , где М1, и М2 — сравниваемые средние, т12 и, т22 квадраты их средних ошибок. При вычислении t целесообразно в качестве М1 брать большую среднюю. Если вычисленное значение t окажется меньше 2, то различие между средними признается случайным, статистически не значимым; при t > 2 это различие можно считать значимым с вероятностью > 0,95; (р< 0,05); при t> 2,6 ― значимым с вероятностью > 0,99 (р< 0,01) и при t > 3,3 ― с вероятностью > 0,999 (р< 0,001). При оценке достоверности относительных величин (статистических коэффициентов) средняя ошибка вычисляется по формуле: , где р ― величина коэффициента в %; q ― дополнение его до 100 (100-р), п― общее число наблюдений. Так же как и средняя ошибка средней арифметической, средняя ошибка выборочного статистического коэффициента прямо пропорциональна колеблемости этого показателя (рq) и обратно пропорциональна числу наблюдений (п). Средние ошибки статистических коэффициентов используются для вычисления доверительных границ последних по формуле: р ± tт, где р ― величина статистического коэффициента; t – доверительный коэффициент, соответствующий избранной вероятности; т – средняя ошибка статистического коэффициента. С помощью средних ошибок вычисляется критерий Стьюдента t для оценки значимости различия двух статистических коэффициентов: . Следует отметить, что значимость различий средних в малых выборках и относительных показателей, величина которых приближается к 0 или 100 %, оценивается с помощью специальных методов непараметрической статистики. |