визуализация многомерных данных информатика. визуализация многомерных. Визуализация многомерных данных студент 5 курса 503 группы фармацевтического факультета
Скачать 168.47 Kb.
|
ВИЗУАЛИЗАЦИЯ МНОГОМЕРНЫХ ДАННЫХ Выполнил: студент 5 курса 503 группы фармацевтического факультета Шарипов Ф.А. 2022 г. Введение В настоящее время для оценки состояния объектов или процессов в различных областях знаний широко используются разного рода интегральные показатели, основное назначение которых - дать комплексную оценку выбранных характеристик объекта. Такие показатели просты в применении и служат своего рода индикаторами, так как их отклонения от некоторых заданных значений свидетельствуют об изменении состояния объекта и предполагают его дальнейший анализ. Чувствительность показателя к изменениям состояния объекта на различных уровнях его иерархической структуры напрямую связана с выбором уровня декомпозиции объекта, на основе которого строится интегральный показатель. Значение медицинской визуализации в здравоохранении постоянно возрастает, так как она позволяет повысить эффективность медицинской помощи и создать более комфортные условия для пациентов. Новаторские технологии визуализации позволяют раньше и точнее диагностировать заболевания, лечить их более целенаправленно с помощью более щадящих методов, а также тщательно наблюдать за результатами лечения. Визуализация многомерных данных Визуализация является одним из мощных средств интерпретации данных. Под визуализацией данных мы понимаем такой способ представления многомерного распределения данных на двумерной плоскости, при котором качественно отражены основные закономерности, присущие исходному распределению - его кластерная структура, топологические особенности, внутренние зависимости между признаками, информация о расположении данных в исходном пространстве и т.д. Однако исследователь при анализе данных довольно часто сталкивается с многомерностью их описания. Возникает проблема поиска подходящих способов графического представления многомерного объекта. Методы многомерного анализа - наиболее действенный количественный инструмент исследования процессов, описываемых большим числом характеристик . К ним относятся кластерный анализ, таксономия, распознавание образов, факторный анализ. В качестве основных применений методов визуализации можно указать следующие: а) наглядное представление геометрической метафоры данных; б) лаконичное описание внутренних закономерностей, заключенных в наборе данных; в) сжатие информации, заключенной в данных; г) восстановление пробелов в данных; д) решение задач прогноза и построения регрессионных зависимостей между признаками. Наиболее эффективным и несущим наибольший объем информации является представление данных в виде образов или картин. Восприятие человека устроено так, что его мозг, взаимодействуя с внешним миром, воспринимая и осмысливая поступающую информацию, настраивается на определенные образы или эталоны, которые легко, без необходимого приспособления и тренировки, воспринимаются им и требуют дополнительного кодирования. Основными преимуществами метода образного кодирования являются: - возможность согласования большого потока информации с пропускной способностью сенсорных анализаторов человека; - значительное сокращение объема ненужной информации; - существенное снижение необходимости в априорных сведениях об изучаемом объекте; - компактность в отношении занимаемой площади; - широкие возможности перестройки для обслуживания объектов различного назначения. Поскольку человек - существо социальное, то наибольшее значение для него приобретают контакты с другими людьми. Это приводит к тому, что человек обучается распознавать огромное количество лиц. По выражению лица, мимике мы мгновенно определяем эмоциональнее состояние человека, но на ряду с основными эмоциональными состояниями мы различаем десятки их оттенков. Причем малейшие изменения в лице могут быть сразу замечены окружающими. Этим определяется высокая информативность, как самого лица, так и его выражения. Эта информативность лица передается в фотографиях, рисунках, карикатурах и т.д. Анализ графической информации базируется на способности индивида интуитивно находить сходство и различия в объектах, при этом особенно хорошо запоминаются и распознаются черты лица. Указанные особенности человеческого восприятия эффективно используются в диаграммах «лица Чернова». Каждый объект представляет собой схематичное изображение лица, определенным чертам которого (ширине лица, длине носа, изгибу бровей, форме рта и т.д.) соответствуют относительные значения выбранных переменных (рис. 1). Таким образом, для отображения текущего состояния объекта в данной работе будет использован подход пиктографиков «Лица Чернова» В результате работы исследователя возникает описание объекта. Каждый объект обладает некоторыми характеристиками. Такой объект можно описать в виде вектора n-порядка, где каждый его элемент есть некоторая числовая характеристика. Собранные в исследовании данные можно рассматривать в качестве набора векторов (точек) в соответствующем многомерном пространстве. Обычно число объектов при описании системы измеряется сотнями, а число признаков десятками. Проанализировать данные, которые представлены числами очень трудно. Включение различных элементов визуализации, является хорошим способом представления информации. В случае, когда математическая модель изучаемой ситуации известна, можно с той или иной степенью точности заранее представить себе, как точки - наблюдения будут расположены в этом пространстве. Однако более типичной является ситуация, когда исследование геометрии расположения точек предшествует формированию гипотез и построению моделей. Математические методы, используемые, при изучении расположения точек, опираются на понятие расстояния между ними. Для визуализации могут быть использованы 1-, 2- и 3-мерные пространства отображений, но мы в своем рассмотрении практически целиком ограничимся способом визуализации с помощью 2-мерных поверхностей, поскольку именно в таком виде человек воспринимает геометрические структуры наиболее естественно и отношения между объектами выглядят наиболее наглядно. Современные компьютерные технологии используют широкий спектр методов визуализации информации. Методы визуализации позволяют исследователю одним взглядом обнаружить особенности, выявить закономерности и аномалии в больших объемах информации. Описание алгоритма метода «Лица Чернова»Методы когнитивной графики значительно расширяют возможности специалистов любой области знаний для выявления наиболее информативных показателей при обработке обширных баз данных и решении конкретных задач; позволяют обнаруживать порой принципиально новые факты, радикально меняющие известные взгляды. Из мировой практики известно применение техники лиц Чернова при анализе работы нефтяных компаний, обработке результатов геологической разведки, изучении влияния политики некоторых государств на развивающиеся страны и т.д. Первый отечественный пакет программ применялся при графическом изображении свойств программных изделий, при сравнении результатов измерения физических показателей людей и при сравнении экономических показателей работы промышленных предприятий. Схема построения лиц Чернова Основные варианты схем построения лиц Чернова приведены на рисунке 4 Набор конструктивных параметров лиц Чернова (таблица 6), соответствующий рисунку 4.2 (а), позволяет изображать точки пространства с размерностью N> 22. Смысловое значение параметров изображения на рисунке 4.2 (б) видно из рисунка. Существующие варианты построения лиц Чернова ориентированы в основном на сравнение объектов (или различных состояний одного объекта). Оценка отдельного состояния объекта с достаточной степенью точности требует большого опыта и сопряжена со сложностью оценки «на глаз» значений таких параметров, как половинная высота лица, эксцентриситеты образующих его эллипсов, угол наклона бровей и т.д. Набор конструктивных параметров лиц Чернова
Алгоритм построения пиктографиков «Лица Чернова» Для построения «Лиц Чернова» могут быть использованы различные подходы. В случае, когда необходимо отслеживать степень изменения отдельных параметров при построении пиктографика используются числовые значения параметров, привязанные к координатной плоскости. Данный подход реализован в пакете «STATISTICA». В нашем случае рассматривается только 3 градации параметров: норма, ниже нормы, выше нормы. Таким образом, наша задача заключается только в отслеживании качественных изменений. Для решения этой задачи, нами были введены эталонные графические образы (ЭГО) для каждой части пиктографика, приведенные в таблице 7. С помощью отдельных графических образов формируется пикторафик «Лица Чернова» в соответствии с алгоритмом, представленном на блок-схеме. Здесь приведен пример, в котором для построения «лиц» используются 9 информативных физиологических показателей, характеризующих состояние пациентов с заболеваниями щитовидной железы. Отношение параметров и элементов «лиц Чернова» в данном случае: - ОТ - овал лица; - ОБ - ухо; - избыток - глаз; - ДАД - зрачок; - ТФН - бровь; - общие липиды - 1-ый волос; - ТАГ - 2-ой волос; - холестерин - нос; - глюкоза - рот; Возьмем уже имеющиеся данные для пациентов, которые хранятся в файле Excel, загрузим в программу и выберем нужного для нас пациента (рисунок). Ввод данных в программу Рассмотрим полученные результаты. Отображение состояния пациента с заболеванием щитовидной железы до и после лечения в виде «лиц Чернова» Рассматривая полученное «лицо», характеризующее состояние пациента с заболеванием щитовидной железы (рисунок) отметим, что после лечения наблюдается уменьшение показателя ДАД, ТФН и глюкозы. Это видно из того, что бровь, рот и зрачок отображается так же, как и на лице, соответствующему нормам. Интегральная оценка пациента с заболеванием щитовидной железы до и после лечения Рассматривая интегральную оценку состояние пациента с заболеванием щитовидной железы (рисунок) отметим, что пациент идет на поправку, т.к. до лечения интегральный показатель попадает в область «утомление», а после лечения в область «норма». ЗаключениеВ результате выполнения данной работы изучены существующие методы и подходы для интегральной оценки и отображения состояния организма человека. Сделан вывод о том, что использование существующих на сегодняшний день интегральных показателей оценки уровня физического здоровья в качестве оценки и прогнозирования качества здоровья детей не представляется возможным. Поэтому актуальным стоит задача в разработке нового алгоритма с использованием нечетких множеств для работы с качественными параметрами. Рассмотрены доступные пакеты прикладных программ и на основании имеющихся недостатков неприемлемых с поставленной задачей были отвергнуты. Выбраны и программно реализованы 2 подхода формирования графических образов состояния биосистем: 1) на основе интегральных оценок состояния биосистемы; 2) с помощью пиктографиков «Лица Чернова». |