Магистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios
Скачать 1.55 Mb.
|
Компьютерное зрение можно рассматривать как дополнение к биологическому зрению. Зрительное восприятие человека и различных животных рассматриваются с биологической точки зрения, в результате этого создаются модели для разработки таких систем, которые имитируют данный процесс[2]. Разделы компьютерного зрения состоят из нескольких частей: • воспроизведение действий; • обнаружение событий; • детектирование и распознавание образов; • восстановление изображений. Задачи компьютерного зрения Основная задача в компьютерном зрении и обработки изображений – это анализ изображения или видеозаписи на наличие некоторого объекта или особенности. Данная задача может быть корректно и просто решена человеком, однако в компьютерном зрении данная задача до сих пор не решена удовлетворительно [3]. Методы, которые существуют на данный момент, эффективны только при определенных условиях, когда объекты представлены отдельно и легко выделяются на окружающем фоне: • простые геометрические объекты; • человеческие лица; • печатные или рукописные символы; • автомобили. При этом должно быть определенное освещение и достаточно высокое качество изображения. Существует ряд задач, основанных на распознавании. • Задача идентификации. Данная задача заключается в выделении определенного объекта среди множества ему подобных (например, определить лицо определенного человека). • Классификация объектов – процесс отнесения объекта к тому или иному классу. Примеры таких задач: распознавания букв, символов, поиск дефекта в какой-либо детали. • Кластеризация. Подразумевает под собой разделение определенного набора объектов на классы или группы, в которых объекты должны быть схожи между собой согласно некоторым критериям. • Оптическое распознавание символов. В данную задачу входят такие подзадачи, как распознавание символов на изображениях или видеозаписях, содержащих печатный или рукописный текст. Полученный данные зачастую представляются в текстовом формате, который более удобен для редактирования. Структура системы компьютерного зрения То, как будет реализована система компьютерного зрения очень сильно зависит от той области, где будет применена данная система, от аппаратной части и требований к производительности. Данные системы могут быть автономными и решать довольно специфические проблемы по детектированию и распознаванию, кроме того эти системы могут быть частью более крупных систем, в которых необходимо компьютерное зрение[4]. 1) Получение изображений Изображения могут быть получены от одного или нескольких источников, данные источники могут включать, помимо различных типов светочувствительных камер, датчики расстояния, радары, ультразвуковые камеры и пр. В зависимости от того, какой датчик используется, полученные данные могут быть двумерными изображением, трехмерными изображением, а также последовательностью изображений. Интенсивность света в одной или нескольких спектральных полосах (цветные изображения или в оттенках серого) определяет значения пикселей, однако это не всегда так. Зачастую это значение связано с различными физическими измерениями, такими как глубина, поглощение или отражение звуковых или электромагнитных волн, или ядерным магнитным резонансом. 2) Предварительная обработка Для того, чтобы эффективно применить методы компьютерного зрения, необходимо применить методы предобработки видео и изображений. Обработка данных позволяет добиться результата, который будет удовлетворять определенным условиям, которые необходимы в рамках определенного метода. [5] • Удаление шума с видео и изображений; • улучшение контрастности и повышения качества видео и изображений; • масштабирование изображений для получения конкретной области; • сглаживание; • бинаризация; • морфологические операции; • сегментация изображений; Данные методы позволяют улучшить исходное изображение, что может повысить качество детектирования и распознавания. 3) Выделение деталей Детализация элементов в изображении различного типа сложности. Примеры: • Линии; • границы; • локализация; • точек интереса: углы, капли, точки. |