цйккцйк. ПроизвПракт_Сопов. Федеральное государственное бюджетное образовательное учреждение высшего образования Алтайский государственный университет Институт математики и информационных
Скачать 214.99 Kb.
|
|
№ | Содержание индивидуальных заданий | Рабочий график (план) выполнения |
1. | Анализ литературы по применению методов глубокого машинного обучения в сегментации изображений компьютерной томографии легких | 07.02.2022 – 28.02.2022 |
2. | Изучение и анализ методов сегментации медицинских изображений | 01.03.2022 – 23.03.2022 |
3. | Применение методов кластеризации и машинного обучения в сегментации изображений медицинского характера, для подготовки данных к дальнейшей обработке | 24.03.2022 – 16.04.2022 |
Руководитель практики от кафедры ____Козлов Д. Ю., к.ф.-м.н., доцент__________
(ФИО науч. рук-ля, должность)
_____________ /_______________/ «______»_______________ 2022 г.
(подпись)
СОГЛАСОВАНО:
Заведующий кафедрой
_____Козлов Д. Ю., к.ф.-м.н., доцент________________________________________________
(ФИО, должность)
_____________ /_______________/ «______»_______________ 2022 г.
(подпись)
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное бюджетное образовательное учреждение
высшего образования «Алтайский государственный университет»
Кафедра информатики
ОТЧЕТ ПО ИТОГАМ ПРОИЗВОДСТВЕННОЙ ПРАКТИКИ
Научно-исследовательская работа
Исполнитель:
студент гр. № 485
____________/ Сопов В.Е. /
« » ____________ 2022 г.
Руководитель практики
_______________/ Козлов Д.Ю. /
« » ____________ 2022 г.
Зав. кафедрой информатики
к.ф.-м.н., доцент Козлов Д.Ю.
______________________
« » ____________ 2022 г.
2022
ОТЧЕТ ПО ИТОГАМ ПРОИЗВОДСТВЕННОЙ ПРАКТИКИ
НАУЧНО-ИССЛЕДОВАТЕЛЬСКАЯ РАБОТА
студента(-ки) _4_ курса
института математики и информационных технологий АлтГУ,
направление подготовки 02.03.02 Фундаментальная информатика и информационные технологии
_________________Сопова Вадима Евгеньевича ____________
(фамилия, имя, отчество)
Место и сроки прохождения практики.
Место прохождения практики: Базовая кафедра информационных систем и технологий ИМИТ (на базе КАУО АИЦТиОКО).
Сроки практики: 07.02.2022 г. – 16.04.2022 г.
Руководитель практики: Козлов Д.Ю., доцент, Зав. каф информатики к.ф.-м.н.
(Фамилия И.О. науч. рук-ля, уч. степень, должность)
Общие сведения о проделанной работе
В ходе производственной практики была проделана следующая работа:
1) Проведен анализ литературы по применению методов глубокого МО в обработке изображений компьютерной томографии (Приложение 1).
2) Изучены алгоритмы сегментации медицинских изображений (Приложение 2).
3) Реализованы методы кластеризации и машинного обучения в задаче сегментации (Приложение 3).
Самоанализ проделанной работы
В результате прохождения производственной практики достигнуты все ожидаемые результаты. Предложений по совершенствованию практики нет.
Приложение 1
Сейчас, как никогда присутствует потребность в регулярном мониторинге состояний легких для предупреждения или обнаружения заболеваний. Рентгенография — технически простой и наиболее доступный для населения метод предварительной диагностики заболевания, в том числе отслеживания заболевания на ранней стадии. Данный тип исследования широко распространен по всему миру и вопреки наличию других, более сложных и эффективных способов диагностики, он остается приоритетным в медицинской практике даже в хорошо оснащенных клиниках и медицинских центрах. Несмотря на все преимущества данного метода, анализ и выявление признаков заболевания по флюорографическим снимкам является весьма сложной задачей, требующей участия нескольких высококвалифицированных специалистов. В работе [1] отлично описаны методы ручной обработки изображений, основанные на контрастировании.
Процесс определения болезни по снимку труден и затратен по времени и даже у достаточно опытного врача может быть неточен, поэтому существует необходимость проверки снимков на автоматическом уровне нейросетью.
Однако, для решения подобной задачи с помощью компьютерного зрения необходимо предварительно обработать данные, так-как помимо необходимых легких на изображении имеются «мусорные» данные. Например, это могут быть костные или мягкие ткани, патологии в которых нет, однако таких данных может быть достаточно немалое количество, что существенно снизит точность работы модели. Поэтому возникает задача выделить лишь необходимую для обучения нейросети часть изображения, на которой присутствует некая патология. К решению такой задачи можно подойти с разных сторон. Например, в исследовании [2] разрабатываются математические методы сегментации изображений стандарта Dicom для задач распознавания медицинских изображений. В исследовании [3] эта описано решение этой задачи с помощью нейросети U-net.
[1] Горюнова В.В., Горюнова Т.И., Кухтевич И.И., Полякова Т.Т. ОБРАБОТКА МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ В ГРАФИЧЕСКОЙ БАЗЕ ДАННЫХ И ИДЕНТИФИКАЦИЯ ПАЦИЕНТОВ // Международный студенческий научный вестник. - 2017. - №4 (часть 9). - С. 1390-1393.
[2] Дороничева А.В., Савин С.З. Метод сегментации медицинских изображений // Фундаментальные исследования. - 2015. - №5(часть 2). - С. 294-298.
[3] Li X, et al. H-DenseUNet: hybrid densely connected UNet for liver and tumor segmentation from CT volumes. IEEE Trans Med Imaging. – 2018. -37(12). – С. 74.
Приложение 2
Для выявления подходящего метода сегментации медицинских изображений были изучены теоретические основы различных алгоритмов сегментации[4]. Из основных методов выделяют:
Основанные на кластеризации.
С использованием гистограмм
Выделение границ
Методы, основанные на нейросетевом подходе
Методы, основанные на кластеризации, опираются на соответствующие алгоритмы и могут включать дальнейшую обработку изображений.
Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. Из-за Быстроты этого метода его часто применяют для обработки видео [5].
Выделение краёв — это хорошо изученная область в обработке изображений. Границы и края областей сильно связаны, так как часто существует сильный перепад яркости на границах областей. Поэтому методы выделения краёв используются как основа для другого метода сегментации. Обнаруженные края часто бывают разорванными. Но чтобы выделить объект на изображении, нужны замкнутые границы области [6].
С учётом прогресса глубоких нейронных сетей за последние несколько лет в различных областях, лучшие результаты для семантической сегментации чаще всего достигаются при помощи свёрточных нейронных сетей, в том числе, когда данные слабо размечены. Действительно, проблема низкого уровня размеченности данных в семантической сегментации довольно важна, поскольку для каждого пикселя определить его принадлежность с высокой точностью — задача, требующая высоких затрат времени и не всегда высокую точность. Однако, сочетание хорошо размеченных данных со слабо размеченными данными (например, с точностью до ограничивающих рамок) улучшает производительность модели. Для задачи сегментации хорошо себя показали FCN (англ. fully-convolutional networks) — полносвёрточные сети, позволяющие работать с изображениями произвольного размера, а на выходе выдавать тепловую карту нахождения классов на изображении через серию свёрток. Поскольку свёртка над матрицей большой размерности с большим числом каналом является затратной, как правило, первая половина слоёв в таких свёрточных сетях обеспечивает сабсэмплинг (англ. subsampling - уменьшение размерности), а вторая часть слоёв - апсэмплинг (англ. upsampling - увеличение размерности). Таким образом, размерность изображений в пикселях на входе и на выходе сети является одинаковой, а большинство операций свёртки применяется к матрицам небольшой размерности. Конечная классификация достигается за счёт выбора максимума по классам из значений тензора размерности C×W×HC×W×H, где CC — множество классов, заранее заданных перед обучением и к которым могут принадлежать пиксели изображения, W×HW×H — размер изображения. Такую модель можно обучить при помощи обратного распространения ошибок, а в качестве функции потерь для пикселей использовать кросс-энтропию [7].
Модель U-Net, разработанная для сегментации биомедицинских изображений, улучшает архитектуру FCN путём использования сужающихся блоков свёртки для захвата контекста, расширяющихся блоков свёртки для локализации, а также прямых связей между блоками свёртки на одинаковых уровнях. Прямая связь слоёв обеспечивает улучшенное обучение за счёт отсутствия так называемого "артефакта шахматной доски" — негативного явления, вызванного апсэмплингом при помощи транспонированной свёртки. Развитием U-Net, в свою очередь модель DenseNet, в которой используются полностью связанные свёрточные сети. В основе идеи лежит использование "плотных блоков" — совокупности нескольких свёрточных слоёв с подключением каждого слоя к каждому слою. Однако, существенным недостатком такой модели является низкая эффективность работы с памятью [8].
Приложение 3
В результате обзора методов сегментации, было принято решение использовать алгоритм, основанный на кластеризации с последующим применением морфологических операций для выделения нужной маски.
Применялся алгоритм К-средних [9], разделение пикселей изображений велось на два кластера: фон, к которому относится воздух, а также легкие, и передний план с мягкими и костными тканями, пример снимка приведен на рисунке 1.
Рисунок 1
Далее после разбиения на кластеры были выделены маски, наложенные на исходные изображения, результат приведен на рисунке 2.
Рисунок 2
В результате с изображения были удалены лишние данные, не представляющие ценности для дальнейшего обучения модели машинного обучения, так-как заведомо известно, что патологии в них нет. Эффективность данного метода можно оценить, сравнив графики площадей описывающих прямоугольников исследуемой области на срезах, принадлежащих одному пациенту. На рисунке 3 представлен график до обработки алгоритмом, на рисунке 4 после.
Рисунок 3
Рисунок 4
Заметно что максимальная площадь сократилась с 500 пикселей до 350, а также уменьшилось количество снимков, это произошло потому что на некоторых снимках нет даже части исследуемой области, то есть легких.
Перечень литературы и интернет ресурсов, использованных при прохождении практики
Linda G. Shapiro and George C. Stockman (2001): «Computer Vision», pp 279—325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3
Ron Ohlander, Keith Price, and D. Raj Reddy (1978): «Picture Segmentation Using a Recursive Region Splitting Method», Computer Graphics and Image Processing, volume 8, pp 313—333
R. Kimmel and A.M. Bruckstein.
https://www.cs.technion.ac.il/ron/PAPERS/Paragios_chapter2003.pdf, International Journal of Computer Vision 2003; 53(3):225–243.
George Seif, https://towardsdatascience.com/semantic-segmentation-with-deep-learning-a-guide-and-code-e52fc8958823, Semantic Segmentation with Deep Learning.
Kerem Turgutlu, https://medium.com/@keremturgutlu/semantic-segmentation-u-net-part-1-d8d6f6005066, Semantic Segmentation — U-Net
Dr. Michael J. Garbade, https://towardsdatascience.com/understanding-k-means-clustering-in-machine-learning-6a6e67336aa1, Understanding K-means Clustering in Machine Learning