Главная страница
Навигация по странице:

  • Дискриминантный анализ

  • Метод стандартизации

  • Прямой метод стандартизации

  • 1. озз. Определение, разделы дисциплины, задачи, структура. Роль дисциплины в системе мед образования, практической деятельности врачаспециалиста и организаций здравоохранения


    Скачать 2.59 Mb.
    Название1. озз. Определение, разделы дисциплины, задачи, структура. Роль дисциплины в системе мед образования, практической деятельности врачаспециалиста и организаций здравоохранения
    Анкорozz_otvety.doc
    Дата22.04.2017
    Размер2.59 Mb.
    Формат файлаdoc
    Имя файлаozz_otvety.doc
    ТипДокументы
    #5135
    страница7 из 36
    1   2   3   4   5   6   7   8   9   10   ...   36

    Критерий КраснелаУоллиса (проверка однородности нескольких групп)

    Если генеральная совокупность имеет распределение, отличное от

    нормального, то требуются критерии проверки однородности групп, которые не

    зависят от вида закона распределения (т.е. от всевозможных параметров). В

    частности, непараметрическим аналогом дисперсионного анализа является

    критерий Краснела―Уоллиса, основанный на рангах.

    Итак, однородность групп наблюдения – это нулевая гипотеза. Для построения

    критерия проверки нулевой гипотезы используем ранги. Общее число наблюдений

    по всем группам обозначим N:

    N= п1 + n2+ п3 + ... + nk,

    где п1,n2+ ... + nk, ― числа элементов по группам соответственно.

    Упорядочим все N элементов независимо от группы по возрастанию.

    Тогда каждый из элементов получает свой ранг ― номер места в упорядоченном

    ряду. Если среди элементов ряда имеются совпадающие, то всем им присваивается

    один и тот же ранг, равный среднему арифметическому их номеров, мест

    упорядоченного ряда. Заметим, что сумма всех N рангов, согласно

    формуле суммы арифметической прогрессии, равна:

    .

    Далее вычислим средние ранги по группам как средние арифметические

    соответствующих величин. Аналогично общий средний ранг равен:



    Если верна нулевая гипотеза, выборки однородны, то сами наблюдения, а

    следовательно, и ранги должны быть по величине рассредоточены по группам

    более или менее равномерно, т.е. средние ранги не должны существенно

    различаться между собой. При их сравнении можно использовать отклонения

    от общего среднего:



    Для суммарной характеристики таких отклонений с учетом численности

    групп введем случайную величину

    ,

    называемую статистикой Краскела—Уоллиса.

    Эта статистика Н ― критерий проверки нулевой гипотезы.

    Его структура такова, что распределение Н с ростом численности групп

    стремится к распределению 2с (k-1) степенями свободы (действительно,

    распределения средних стремятся к нормальному распределению);

    разности также распределены нормально; сумма квадратов таких

    величин имеет распределение 2 , а соответствующие значения параметров,

    необходимых

    для этого распределения, обеспечивают сомножители .

    Фактически, при численности каждой из групп 5 элементов уже

    обеспечивается удовлетворительное приближение. Итак, подставляя

    данные в приведенную выше формулу критерия Н, получаем Ннабл .Критическую

    точку распределения х2с Z = (k-1) степенями свободы находим при выбранном

    уровне значимости по специальной таблице. Если оказывается, что Ннабл меньше

    2крит, то на выбранном уровне значимости нулевая гипотеза об однородности

    выборок принимается (опытные данные этой гипотезе не противоречат).

    Если же Ннабл. больше 2крит, то нулевая гипотеза об однородности групп

    наблюдений отвергается, и группы следует сравнивать попарно.

    Критерий Краскела-Уоллиса используется в практической медицине

    при оценке эффективности различных лекарственных препаратов, методов лечения и т.д.
    Дискриминантный анализ

    Дискриминантный анализ позволяет построить так называемые решающие

    правила на основе оптимального набора диагностических признаков и определить

    группы больных, здоровых и группы риска. Цель дискриминантного анализа

    состоит в формировании одной или нескольких групп (классов) на основании

    выборок из генеральных совокупностей и выработке определенного решающего

    правила, с помощью которого производится отнесение вновь поступающих

    индивидуумов к какой-либо из указанных групп (классов).

    Дискриминантный анализ иногда называется кластер-анализом, или

    таксономией, или задачей автоматической классификации. Цель задачи:

    формирование индивидуумов в одно родные классы (группы, кластеры,

    таксоны), когда характеристики и число классов не заданы. При этом

    элементы внутри классов должны быть «сходны» между собой, а между

    классами ― «различны». Этот вид задач иногда называется «распознаванием

    образов с обучением». Решение задачи состоит из двух этапов: этапа

    обучения, т.е. выработки решающего правила, и собственно этапа

    дискриминации (распознавания), т.е. отнесения вновь поступающих

    индивидуумов при помощи правила, выработанного на первом этапе, к

    соответствующей группе.

    Перечень вопросов задачи должен раскрывать причины, вызывающие

    осложнения. Затем формируется обучающая последовательность: к одному

    классу этой последовательности относят тех больных, которые прошли курс

    лечения, не имея осложнений, к другому ― больных, перенесших

    осложнения. По этой последовательности строится решающее правило,

    которое, учитывая индивидуальные особенности больного, прогнозирует

    возможные осложнения при проведении лечения.

    С этой целью составляется анкета, учитывающая индивидуальные особенности

    больного и особенности течения его заболевания. По такому вопроснику

    составляется обучающая последовательность (класс): для каждого метода

    лечения отбирается группа больных, для которых известен результат лечения.

    При этой обучающей последовательности строится решающее правило,

    прогнозирующее попадание каждого больного после лечения в соответствующую

    группу (класс). Наличие решающего правила для каждого метода

    лечения дает возможность выбора с учетом наиболее благоприятных

    прогнозов результатов лечения.

    Таким образом, при решении перечисленных выше задач прослеживается

    одна и та же схема: специалисты-врачи оценивают состояние больного по

    субъективным симптомокомплексам, получая при этом многочисленную

    информацию, которая должна подлежать классификации (т.е.

    распределению по соответствующим классам). Классы образуют

    так называемые обучающие последовательности, на основе которых

    строится нужное решающее правило, т.е. решается задача дискриминации.

    Проблема классификации состоит в объединении индивидуумов в группы

    или классы по результатам клинического, социологического,

    психофизиологического, санитарно-гигиенического исследования.

    Математическое аналитическое представление о классах (группах) основано

    на понятиях близости или расстояния между отдельными индивидуумами.

    Введение некоторой метрики, определяющей расстояние между

    двумя точками (индивидуумами), дает возможность установить расстояние,

    при котором две точки считаются «близкими» или «далекими».

    Исходная информация приводится в виде матрицы-таблицы, у которой

    каждый объект (индивид), или так называемая операбельная таксономическая

    единица ― ОТЕ (будем обозначать его буквой Y) рассматриваемой

    совокупности (например, больной или здоровый), представлен в виде строки.

    Общее число строк равно числу объектов, подлежащих классификации.

    Пусть это число индивидов равно n. Каждый индивид описывается, как уже

    было указано, кодированными данными (будем обозначать их буквами

    X с индексами). Пусть общее число признаков равно р. Тогда мы исходную

    информацию всегда можем представить в виде таблицы.

    Для решения задачи классификации необходимо прежде всего количественно

    определить понятия сходства и разнородности. Что означает, например,

    «два объекта Yi, и Yj различны»? Задача была бы решена, если бы два

    объекта Yiи Yj, попадали в один и тот же класс всякий раз, когда

    расстояние (отдаленность) между соответствующими точками было

    бы «достаточно малым», и, наоборот, попадали бы в разные классы, если

    бы расстояние между точками было бы «достаточно большим».

    Основную единицу, используемую в каком-либо определенном

    исследовании классификаций, обычно называют операбельной таксономической

    единицей (ОТЕ), или единицей наблюдения. Это составной элемент объекта,

    являющийся носителем признаков, подлежащих регистрации, и основой

    счета. В медицинских исследованиях это, как правило, индивид (больной,

    умерший, родившийся, здоровый человек). Иногда единица наблюдения

    совпадает с единицей совокупности (например, при переписи населения).

    Единица совокупности ― первичный объект статистического наблюдения,

    являющийся носителем изучаемых признаков. Численность единиц

    совокупности определяет ее объем (п) и распространенность изучаемого

    явления, т.е. статистическая совокупность ― это группа фактов, событий,

    обладающих варьирующими признаками, но объединенных единой качественной

    основой (сущностью).

    Основные этапы, на которые распадается процедура формирования классов,

    состоят в следующем:

    Выбирают п индивидов (n ОТЕ), подлежащих классификации, и по

    каждому из них исследуют и кодируют соответствующее число

    признаков. Если признаков мало, то классификация очень

    «чувствительна» к произвольному выбору признаков.

    Сравнивают всех индивидов (ОТЕ) друг с другом для определения

    сходства или различия с помощью признаков. Один из

    простейших показателей сходства некоторой пары индивидов

    (ОТЕ) ― доля признаков, которые у них совпадают. Множество

    измеренных коэффициентов сходства можно представить в виде матрицы.

    На основе матрицы вычисленных коэффициентов сходства

    можно распределить всех индивидуумов по классам. Каждый индивид имеет

    «сходство» с другими индивидами внутри класса и «отличен» от индивидов

    других классов. В некоторых случаях, объединяя по несколько классов в

    группы более высокого ранга, можно получать иерархическую структуру.

    Последний этап ― проверка правильности классификации

    путем прогнозирования для новых индивидов (ОТЕ), т.е., по существу,

    решение задачи дискриминации.
    Метод стандартизации

    Основное правило статистики ― «сравнивать сравнимое» ― предполагает

    сопоставление обобщающих показателей, полученных на однородных

    статистических совокупностях. Однако нередко бывают случаи, когда

    необходимо сравнить показатели здоровья населения в районах с различной

    возрастно-половой структурой населения, показатели деятельности

    лечебно-профилактических учреждений с разным составом больных и т.п.

    Анализируя показатели общественного здоровья в различных группах населения,

    можно заметить, что уровень рождаемости будет выше там, где более высока

    доля женщин детородного возраста среди населения, больничная летальность

    будет выше в стационаре, где больше больных с тяжелыми формами

    заболеваний, показатель смертности будет выше в том населенном пункте,

    где больше удельный вес лиц пожилого возраста. Такая же проблема

    возникает при сравнении показателей в динамике, так как возрастной и

    половой состав групп населения с течением времени меняется. Наиболее

    правильным при анализе различных показателей здоровья считается

    сравнение специальных коэффициентов, но не всегда этого бывает достаточно.

    Использование метода стандартизации позволяет расчетным путем устранить

    влияние различных структур сравниваемых совокупностей на обобщающие

    коэффициенты. Стандартизация (англ. standard ― образец, эталон) в

    статистике ― это особый прием вычисления стандартизованных показателей,

    которые по статистической сущности являются общими интенсивными

    коэффициентами.

    Общие интенсивные коэффициенты (рождаемость, смертность,

    заболеваемость, инвалидность и т.д.) правильно отражают частоту

    распространения явления лишь в том случае, когда состав сравниваемых

    групп однороден. Если же сравниваемые совокупности (население, рабочие,

    больные и т.д.) имеют неоднородный состав (возрастно-половой,

    профессиональный, по тяжести и продолжительности заболеваний),

    то наиболее правильным способом анализа будет сопоставление

    стандартизованных (соответственно по возрасту, полу,

    профессиональному составу, тяжести и продолжительности заболеваний)

    коэффициентов.

    Метод стандартизации рационально применять при условии, когда имеющиеся

    различия в составе сравниваемых коллективов являются существенными и

    могут повлиять на размеры общих коэффициентов. Для элиминирования

    (исключения) влияния структуры сравниваемых совокупностей на

    коэффициенты их приводят к единому стандарту, т.е. при этом условно

    допускается, что состав сравниваемых коллективов одинаков. Целесообразно

    выбрать стандарт, близкий по существу к сравниваемым совокупностям,

    или в качестве стандарта принять состав одной из них.

    Стандартизованные коэффициенты показывают, каковы были бы общие

    интенсивные показатели (рождаемости, смертности, летальности, естественного

    прироста, плодовитости и др.), если бы на их величину не оказывала

    влияние неоднородность в составах сравниваемых коллективов.

    Стандартизованные коэффициенты являются условными величинами и

    применяются исключительно в целях сравнения, по ним нельзя давать такую

    же оценку, как по фактическим данным, в том числе оценивать достоверность

    различий. При изменении взятого стандарта изменяются и

    стандартизованные коэффициенты. Поэтому при анализе важны не сами

    абсолютные их значения, а степень различия коэффициентов между собой.

    В практике здравоохранения используют три метода стандартизации ― прямой,

    косвенный и обратный (метод Керриджа). В практической

    деятельности врача стандартизованные коэффициенты чаще рассчитываются

    по одному признаку, в научных целях можно получать стандартизованные

    коэффициенты с учетом изменения двух признаков, но этот метод является

    более сложным и используется редко.

    Прямой метод стандартизации применяется наиболее часто.

    При прямом методе стандартизации за стандарт принимается

    состав среды и предполагается, что он одинаков в обеих

    сравниваемых совокупностях. Единая структура позволяет определить

    «ожидаемое» число больных (умерших, инвалидов и т.д.) для каждой

    из сравниваемых совокупностей.

    Использование прямого метода стандартизации возможно, если:

    известны состав среды (совокупности) и состав

    явления по изучаемому признаку (т.е. можно

    рассчитать специальные интенсивные коэффициенты

    по возрасту, полу и любому другому изучаемому признаку);

    число наблюдений достаточно велико в каждой выделенной

    для изучения группировке (т.е. вычисленные специальные коэффициенты достоверны).

    Прямой метод расчета стандартизованных коэффициентов рациональнее

    проводить по трем основным последовательным этапам:

    I этап ― вычисление общих и специальных интенсивных коэффициентов;

    II этап ― выбор (или расчет) стандарта;

    III этап ― определение и оценка стандартизованных коэффициентов.

    Если за стандарт брать не относительные, а абсолютные цифры, то можно

    выделить 4 и даже 5 этапов вычисления стандартизованных коэффициентов:

    I этап ― расчет общих и специальных (по каждой группе – половой,

    возрастной и др.) интенсивных показателей (или средних величин) для двух

    сравниваемых совокупностей;

    II этап ― выбор и расчет стандарта;

    III этап ― расчет «ожидаемых величин» для каждой группы стандарта;

    IV этап― определение стандартизованных показателей;

    V этап ― сравнение групп по общим интенсивным (или средним) и

    стандартизованным показателям. Выводы.

    Целесообразно все эти расчетные операции представить в виде этапов

    стандартизации и оформить их в виде таблицы.

    За стандарт рациональнее принимать экстенсивные коэффициенты,

    вычисленные на то же основание, что и интенсивные коэффициенты

    (%, %о, %00, %000), определяемые на I этапе. Можно за стандарт принять

    и абсолютные данные, но тогда расчеты будут более трудоемкими.

    На практике используют три источника выбора стандарта:

    собственные данные по одной из изучаемых групп (наиболее быстрый

    способ получения стандартизованных коэффициентов);

    собственные данные в сумме по всем изучаемым группам

    (наиболее реальное отражение);

    данные извне (литературные, учетные и др.).

    Стандарт следует избирать каждый раз применительно к конкретному

    изучаемому материалу в связи с задачами, стоящими перед

    исследователем. Так, например, при сравнении младенческой смертности двух

    районов города за стандарт целесообразно принять возрастной или

    половой состав младенцев (детей до 1 года) города, а при сравнении

    младенческой смертности в городе и сельской местности ― возрастной

    или половой состав младенцев области.

    Вычисленные стандартизованные коэффициенты показывают, что если бы

    состав группы (населения, женщин, младенцев, работающих и т.д.) был

    одинаковым, то наблюдалось бы такое соотношение истинных показателей

    (общих или специальных интенсивных коэффициентов), как соотношение

    значений стандартизованных коэффициентов.
    1   2   3   4   5   6   7   8   9   10   ...   36


    написать администратору сайта