Главная страница
Навигация по странице:

  • Особенности

  • Ответы. Задача обработки мед данных принятие решения (постановка диагноза, получение эффекта от лекарства)


    Скачать 0.55 Mb.
    НазваниеЗадача обработки мед данных принятие решения (постановка диагноза, получение эффекта от лекарства)
    АнкорОтветы
    Дата26.02.2020
    Размер0.55 Mb.
    Формат файлаdocx
    Имя файлаotvety_na_zachet.docx
    ТипЗадача
    #110044
    страница1 из 16
      1   2   3   4   5   6   7   8   9   ...   16

    1. Источники и характеристика медико-биологических данных. Особенности медико-биологических объектов и данных.

    Основная задача обработки мед данных- принятие решения (постановка диагноза, получение эффекта от лекарства).

    Особенности: много источников (наблюдение, измерение, литература, опыты на животных).

    В основе использования любого метода анализа экспериментальны данных- предпосылки о свойстве предполагаемых объектов ( предположения о виде закона распределения исследуемых характеристик, свойства характеристик-независимость, однородность). Вся совокупность предпосылок= модель ситуации. Если она неизвестна или не соответствует действительности, проведение качественного анализа невозможно.

    Модель мб различной в зависимости от исследования, критерия оптимальности.

    Обоснованием модели ситуации является основой для проведения планирований и исследований. Такое обоснование предполагает предварительный анализ данных с целью изучения количественных особенностей изучаемых параметров и выдвижения гипотез о поведении изучаемого объекта. Чтобы адекватно анализировать мед био данные, необходимо учитывать их особенности.

    Особенности:

    1. Малые целенаправленные выборки

    Количество испытуемых при проведении клинических исследований часто ограничено, достаточно разнородный контингент больных, а не требуемой точностью и достоверностью. Формируя группу для проверки эффективности того или иного методы диагностического лечения, врачу приходится обходиться малым числом пациентов. В условиях малой подопытной группы, изучаемый эффект имеют тенденцию либо встречаться во всех случаях, либо не встречаться. это приводит к завышению/занижению оценки эффективности изучаемой методики.

    1. Вариабельность измеряемых параметров.

    Возникает за счет внутренних и межиндивидуальных различий. Различия у людей, находящихся в равных условиях. В вариабельность измеряемых параметров вносят вклад сам процесс измерения. Таким источником выразительности относятся: вариабельность инструмента измерения, ошибки, допускаемые в результате, ошибки между разными наблюдателями.

    1. Разнообразие реакция систем организма.

    Встречается психофизиологических исследованиях.

    1. Широкое использование категорированных данных.

    В отличие от классического случая когда измеряется и результатом является число. В Медицине используется шкалы порядков и категорий. Кроме того использование шкалы порядка может зависеть от мнения экспертов.

    5) Сложность применяемых методик исследования.

    На результат будет оказывать влияние классификация исследователя, его физические и эмоциональные состояния, условия проведения эксперимента.

    6) Многомерность данных характеристики биологических объектов.

    Число переменных, описываемых биологическую структуру может достигать десятки, сотни. возникают две основные задачи: 1. Организация структуры данных таким образом чтобы можно было адекватно оценить структуру организации всей системы. 2. Как отобрать наиболее информативные признаки для диагностики заболеваний.

    7) Вероятностная природа медицинских данных.

    Большинство биомедицинских решений базируется на подходах. получение любого статистического вывода основано на определении предположения об исходе статистической совокупности. Основные среди этих предположений является предположение о виде закона распределения. как только удастся идентифицировать закон распределения наблюдаемой величины, то: 1. Для последующего анализа данных можно использовать её множество методов доступных для данного закона распределения. 2. для характеристики свойств наблюдаемой величины достаточно использовать Малый набор числовых характеристик, вместо исходного массива измерений. нормальный закон распределения: закон ома: R=U/I. U-случайная величина, I - случайная величина, так как есть ,- шум Пусть т.е. ток мал. Получаем распределение Коши для него среднеквадратичное нельзя найти.

    Если закон распределения неизвестен, то необ использовать методы анализа данных, независимо от закона распределения или малочувствительных к нему.

    2.Организация многомерных данных. Типы данных и шкалы измерений.

    Количеством переменных описывающих биообъект достигает сотен причем измерены в разных шкалах.

    При этом общее число данных достигает значительного числа следовательно в таких случаях требуется использование различных методов сжатия исходной информации с выделением наиболее информативных параметров необходимых для исследования

    Типы данных и шкалы измерения

    1. Шкала номинальных переменных используются для качественных классификации например: пол, национальность

    2. шкала порядковых переменных позволяет упорядочить объекты указав какие из них в большей или меньшей степени обладают качествами выраженным данной переменной, например: верхний средний уровень, выше среднего уровня

    3. шкалы интервальных переменных позволяют не только упорядочить но и численно выразить различие между объектами например: температура 30° или 40°

    4. шкала относительных переменных отсутствует точка абсолютного 0 для таких переменных обосновано положения вида: x в 2 раза больше игрек

    3. Матрица данных. Пропуски данных.

    При предоставлении массивы данных важно выбирать такую форму, чтобы как можно меньше ограничивать себя в обработке и анализе. один из способов -это это представление данных в виде матрицы.



    -Значение j-го показателя, относящегося к i-му объекту. Переменные не делится на зависимое и независимое. Все показатели, входящие в матрицу можно разделить на три основные группы.

    1. Признаки, непосредственное измеряемые на объекте исследования (дискретная непрерывная случайная величина)

    2. Признаки, характеризующие условия измерения, эти признаки служат для выполнения однородных, в том или ином смысле, групп.

    3. Признаки, являющиеся результатом преобразование исходных данных. образование новых элементов из имеющихся может осуществляться двумя путями: 1. Задание какого-либо условия. 2. Пересчет числовых значений признаков по заданным формулам.

    Пример, Введение весовых коэффициентов(переход к нормированным значениям параметров, образование новой переменной из имеющихся).

    Необходимо учитывать, что использование исходных данные и их производные может приводить к возникновению сложных связей между ними. При формировании Матрицы данных необходимо также учитывать наличие в данных выбросов и пропусков. Наличие выбросов приводит к снижению значимости статистических выводов и снижению оценки, характеризующей объект исследования. Существуют два основных выброса данных, это выбросы, обусловленная природой самого явления, и выбросы связанные с ошибкой измерения.

    Первое не устраняется, в то время как второе требует устранения. Появление пропусков приводит к: потери информации об изучаемом процессе, так как многие многомерные методы анализа данных требует полного набора параметров всех объектов, пропуски могут привести к сдвигу полученного результата. При анализе необходимо учитывать природу пропусков. Их можно разделить на : 1. Не связан с самим экспериментом (поломка оборудования). утеря части данных. особенность таких пропусков является то что пропущенные значения принадлежат тому же множеству что и имеющиеся. 2. Связанные с экспериментом, например, события которые необходимо не наступило до окончания эксперимента. особенностью является то что они образуют дополнительные множество. В первом случае пропуски можно устранить, во втором нельзя. не учет их существенно искажает выводы.

    Контроль структуры пропусков можно осуществить с помощью двойного выбора. Суть заключается в следующем: по исходной выборке, содержащей пропуски, находится статистические характеристики. Затем из исходной выборке случайным образом выбирается подвыборки и все числовые значения вычисляются снова. Если не наблюдается смещение данных, то механизм пропуска данных можно игнорировать. Если смещение есть, то необходимо строить модель пропусков и с её учётом проводить дальнейшие исследования. Заполнение пропуска данных, если того требует метод анализа, может осуществляться различными методами наиболее часто встречается следующие:

    1. Заполнение с пристрастным подбором, когда пропуски заполняются значениями переменных других объектов выборки. Этот метод основан на том что объекты близкие по К параметру будут близкие по параметрам .

    2. Заполнение среднего, находящимися среднее по столбцу. 3. заполнение с помощью регрессии, когда пропущенные значения рассчитываются из уравнения регрессии между переменными, имеющими пропуски к некоторым другим переменным.

    4.Статистический анализ биомедицинских данных. Выборочный метод.

    Основная задача математической статистики заключается в получении выводов о массовых явлениях и процессах по данным наблюдения над ними либо экспериментов. Эти выводы относятся не к отдельным испытаниям, а представляют с собой утверждении общих характеристиках явления в предположении постоянства условий.

    Основными понятиями выборочного метода является: оценка числового параметра .. -Это функция выборочных данных. желательным свойства оценки является несмещенность состоятельность эффективность. Несмещенность- это мат ожидание истинного значения..

    Состоятельность- это оценка сходится к истинному значению . Эффективная оценка- это оценка которая обладает наименьшей дисперсией в определенном классе оценок. Кроме оценки в статистике используются квантового распределения, процентные точки, критические границы.

    Основными областями статистические методы являются:

    1. Повышение эффективности сбора данных (разработка регистрационных форм для сбора данных, планирование экспериментальных исследований)

    2.описание характеристик некоторых групп или ситуаций (сжатие данных, обобщение описание, наглядное представление)

    3. Получение обоснование выводов при изучении данных (проверка достоверности различий, выявление связей, проявление скрытых факторов).

    5. Методы и задачи статистического анализа.

    3 группы методов:

    1. Параметрические методы, основанные на предположение, что данные удовлетворяют строгим статистическим моделям. То есть предполагаются известными законом распределения случайной величины. В этом случае все полученные выводы базируются на критериях, при использовании которых используются параметры их распределения. Как правило эти методы очень чувствительны к отклонениям полученных данных от предполагаемой модели, а также к наличию данных выбросов или группы проколов. Однако если данные близки к выбранной модели, то получается на основе параметрических методов, обеспечивает наивысшую мощность.

    2. Робастовские методы. Основанный на Требование о том, чтобы получаемые оценки оставались эффективными, если данные эксперимента соответствует статистической модели и оставались мало чувствительными отклонение данных от выбранной модели.

    Исп модель:

    -предполагаемая модель

    -некая загрязняющая

    Изменяя можно делать модель, близкую к распределению.

    3. Непараметрические методы

    Используется когда невозможно надежно обосновать вид статистической модели.

    Общая идея чтобы распределение было в виде вариационного ряда.

    Задачи статистического анализа:

    1. Задача оценки параметров. Задача по вычислению числовых характеристик случайных величин, которые могут быть точечными и интервальными быть из-за данные статистической модели данных.

    2. Связанные с определением коэффициента модельных функций в случае детерминирование модели объекта исследования.

    3. Согласие. Широкий Круг задач решаемых путем проверки статистических гипотез. Основные группы задач согласия: ( согласие данных статистической модели, сравнение числовых характеристик случайной выборки, проверка идентичности распределение, задачи Независимости )

    3. Задачи многомерности анализа данных

    Анализ многомерности данных можно рассмотреть в двух аспектах:

    1)Анализ связи(влияние степени и характера связи между……………)

    2)Анализ структуры . Для описания структуры используется количественные показатели, используется факторный метод анализа.

    Если интерпретирует качественное представление всей совокупности данных, то основной метод-кластерный анализ.

    6. Точечные оценки параметров. Метод моментов.

    Есть 2 способа оценки параметров распределения: точечный, интервальный. Точечный показывает около которой находится неизвестный оцениваемый параметр. Интервального указывается интервал, в котором с некоторой достаточно большой вероятностью находится неизвестное значение параметра. Существуют различные методы получения точечных оценок (1-получить оценку другим методом если один из методов не позволяет это сделать,2- из нескольких методов можно выбрать такой, оценки которого не меняются при изменении закона распределения)

      1   2   3   4   5   6   7   8   9   ...   16


    написать администратору сайта