Главная страница

Разработка системы автоматического доступа в помещение с использованием метода распознавания лиц


Скачать 1.87 Mb.
НазваниеРазработка системы автоматического доступа в помещение с использованием метода распознавания лиц
Анкорhfcgjpyfdfybt
Дата16.10.2022
Размер1.87 Mb.
Формат файлаpdf
Имя файлаTPU942353.pdf
ТипДокументы
#736918
страница2 из 7
1   2   3   4   5   6   7
Специальная оценка условий труда в Томском политехническом университете, 2019.
В данной работе применены следующие термины с соответствующими определениями:
Python – высокоуровневый язык программирования общего назначения.
Модуль (в Python) – любой файл с программой.
Raspberry Pi – одноплатный компьютер.
Машинное зрение – это научное направление в области искусственного интеллекта, в частности робототехники, и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.
Двигатель постоянного тока – электрическая машина постоянного тока, преобразующая электрическую энергию постоянного тока в механическую энергию.
Н-мост – электронная схема, которая дает возможность приложить напряжение к нагрузке в разных направлениях.
Логический ноль – принимаемое значение низкого уровня сигнала.
Логическая единица – принимаемое значение высокого уровня сигнала.
Прерывание программы (в Python) – сигнал от аппаратного или
программного обеспечения, сообщающий процессору о наступлении какого-либо события, требующего немедленного прекращения работы программы.
Директория – каталог файловой системы.
В данной работе применены следующие обозначения и сокращения:
LBP – local binary patterns (локальные бинарные шаблоны).
OLED – organic light-emitting diode (органический светодиод).
BCM – тип нумерации выводов микропроцессора Broadcom.
SPI – serial peripheral interface (последовательный периферийный интерфейс).

Оглавление
Введение
19 1 Cистемы распознавания лиц
21 1.1 Apple Face ID
21 1.2 Сканер радужной оболочки глаза компании Samsung
24 1.3 Алгоритм FindFace
26 1.4 NeoFace от NEC
30 2 Методы распознавания лиц
32 2.1 Метод Виолы-Джонса
34 2.2 Алгоритм Local Binary Patterns
38 3 Система автоматического доступа в помещение
40 3.1 Программное обеспечение
42 3.2 Схемотехническая часть
58 3.3 Экспериментальное исследование системы
65 4 Финансовый менеджмент, ресурсоэффективность и ресурсосбережение
69 4.1 Оценка коммерческого потенциала и перспективности проведения научных исследований с позиции ресурсоэффективности и ресурсосбережения
69 4.1.1 Потенциальные потребители результатов исследования
69 4.1.2 Анализ конкурентных технических решений
70 4.1.3 Технология QuaD
72 4.1.4 SWOT-анализ
75 4.2 Планирование научно-исследовательских работ
77 4.2.1 Структура работ в рамках научного исследования
77 4.2.2 Определение трудоемкости выполнения работ
79 4.2.3 Разработка графика проведения научного исследования
80 4.2.4 Бюджет научно-технического исследования (НТИ)
81 4.2.4.1 Расчет материальных затрат НТИ
82

4.2.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ
84 4.2.4.3 Основная заработная плата исполнителей темы
85 4.2.4.4 Дополнительная заработная плата исполнителей темы
87 4.2.4.5 Отчисления во внебюджетные фонды (страховые отчисления)
88 4.2.4.6 Расчет затрат на научные и производственные командировки 89 4.2.4.7 Контрагентные расходы
89 4.2.4.8 Накладные расходы
89 4.2.4.9 Формирование бюджета затрат научно-исследовательского проекта
90 4.3 Определение ресурсной (ресурсосберегающей), финансовой, бюджетной, социальной и экономической эффективности исследования
91 5 Социальная ответственность
96 5.1 Правовые и организационные вопросы обеспечения безопасности
96 5.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые нормы трудового законодательства
96 5.1.2 Организационные мероприятия при компоновке рабочей зоны
97 5.2 Производственная безопасность
98 5.2.1 Анализ потенциально возможных и опасных факторов, которые могут возникнуть на рабочем месте при проведении исследований
98 5.2.2 Разработка мероприятий по снижению воздействия вредных и опасных факторов
99 5.3 Экологическая безопасность
106 5.3.1 Анализ влияния объекта исследования на окружающую среду
106 5.3.2 Анализ влияния процесса исследования на окружающую среду
107 5.4 Безопасность в чрезвычайных ситуациях
107

5.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований и обоснование мероприятий по предотвращению ЧС
107 5.4.2 Анализ вероятных ЧС, которые могут возникнуть при проведении исследований и обоснование мероприятий по предотвращению ЧС
109
Заключение
112
Список используемых источников
113
Приложение А
117
Приложение Б
128
Приложение В
133
Приложение Г
134
Приложение Д
135

19
Введение
Потребность в идентификации личности человека с каждым годом вызывает всё больший интерес. В современном информационном мире вопрос безопасности как цифровых данных, так и физических вещей, как никогда актуален. Решения проблемы сохранности личной информации и личных вещей с начала 21 века стремительно развиваются: от паролей на сайтах и кодовых замков на дверях, до распознавания по отпечатку пальца и сканировании сетчатки глаза на телефонах.
Однако, самым совершенным способом идентификации личности является распознавание лица человека, так как лицо человека является одним из наиболее различимых критериев личности [1].
Распознавание лиц включает в себя поиск и идентификацию человеческого лица. Поиск и идентификация не являются простыми задачами как на программных уровнях, так и на уровнях вычислительной мощности используемой платформы.
Для человеческого глаза найти и идентифицировать человеческое лицо на кадре – задача тривиальная, в то же время для компьютерной системы это: работа со слабоконтрастными изображениями, применение различных фильтров для уменьшения влияния шумов и помех, преобразование изображения из слабоконтрастного в контрастное, создание различных векторов и массивов признаков, создание различных критериев лица и т. д. Каждая система, идентифицирующая личность человека по лицу – это точно настроенный комплексный набор алгоритмов по нахождению и распознаванию человеческого лица[1].
Рассматривая распознавание лиц как одну из задач по решению проблемы безопасности, то можно сказать, что распознавание лиц имеет большую актуальность в современном мире. Учитывая развитие интеллектуальных систем и постоянное совершенствование систем безопасности, можно прийти к выводу, что

20 такие системы получают не только применение в особо охраняемых объектах, но и в объектах гражданской инфраструктуры. Например, система распознавания лиц, разработанная в Пекинском университете Циньхуа (Tsinghua University), была сертифицирована китайским Министерством общественной безопасности для использования в общественных местах [2]. Японское отделение компании Omron, специализирующееся на технологиях распознавания, автоматизации и управления, разработало систему распознавания лица человека для мобильных телефонов [3].
Компания Riya, основанная группой специалистов в области алгоритмов распознавания черт лица из Стэнфордского университета, открыто тестировала
Web-сервис контекстного поиска изображений лиц в цифровых фотоальбомах [4].
Компания A4Vision заявляет о том, что Федеральная служба охраны при
Департаменте внутренней безопасности США внедрила её биометрическую технологию трехмерного распознавания лиц в своем 10-м Окружном центре [2].
Целью работы является разработка автоматической системы доступа в помещение с использованием метода распознавания лиц.
Для практической реализации системы поставлены следующие задачи: а) разработка схемотехнической части управления двигателем электромеханического замка; б) разработка меню программы, которое позволит вносить изменения в программное обеспечение (вносить данные людей) системы без демонтажа конструкции; в) разработка и реализация программного обеспечения для идентификации лиц людей в режиме реального времени на видеопотоке с модуля камеры.

21 1 Cистемы распознавания лиц
В данной главе рассматриваются системы распознавания лиц от различных производителей, алгоритмы и методы, разработанные для таких систем.
1.1 Apple Face ID
Главным фаворитом среди всех систем распознавания лиц на данный момент является разработка Apple – Face ID. По заявлениям Apple, Face ID ошибается в 1 случае из 1000000 [5]. В настоящий момент, большинство систем распознавания лиц, доступные рядовому пользователю техники, используют только одну камеру, Face ID использует TrueDepth, как приводят информацию авторы в работе [6], – комплекс датчиков: 7-мегапиксельной фронтальной камеры, инфракрасной камеры, и двух инфракрасных осветителей – проектора точек и заполняющего излучателя (рисунок 1.1).
Рисунок 1.1 – Комплекс датчиков TrueDepth

22
Принцип работы Face ID основан на нейронных сетях, как и большинство современных систем распознавания лиц.
При работе с Face ID необходимо провести регистрацию пользователя: пользователь смотрит под прямым углом на телефон, и, по требованию системы, поворачивает голову по окружности, тем самым регистрируя лицо в различных положениях. На этом регистрация заканчивается и телефон готов к разблокировке.
По скорости выполнения, такая процедура регистрации невероятно быстрая и показывает преимущество используемых алгоритмов обучения.
Необходимо отметить, что нейронные сети, на которых основана технология
Face ID, выполняют классификацию, с точки зрения пользователя, достаточно просто и быстро, но на самом деле эта процедура достаточна трудоемкая. Так как выполнение классификации для нейронной сети означает умение предсказывать ситуацию, когда лицо, изображение которого она «видит» в данный момент, является лицом пользователя, то она должна использовать заранее созданные данные для прогнозирования истинного или ложного ответа. В отличие от других случаев применения обучения нейронных сетей, эта процедура работать не будет, так как нейронная сеть должна тренироваться с нуля, используя только что полученные данные с лица пользователя.
Обучение нейронных сетей требует большого количества данных пользователя (фотографий), а также не менее большее количество фотографий других людей для создания отрицательных примеров. Отрицательные примеры – это данные, которые нейронная сеть должна понимать, как ложные, и, соответственно, на выходе сети выдавать отрицательный ответ. Однако для подобного обучения сети требуется большая вычислительная мощность аппарата, что не дает возможности обучать нейронную сеть непосредственно на устройстве пользователя [6].
Авторы в работе [6] указывают, что Face ID основан на сиамской свёрточной

23 нейронной сети, которая обучается, отображая лица в низкоразмерном скрытом пространстве, сформированном для максимизации различия между лицами разных людей, используя контрастную потерю. Пример контрастной потери представлен на рисунке 1.2 [5]. При этом алгоритме пользователь получает архитектуру, способную делать однократное обучение.
Рисунок 1.2 – Пример контрастной потери
Сиамская нейронная сеть состоит из двух идентичных нейронных сетей, у которых идентичны все весовые характеристики. Основная идея алгоритма состоит в том, что во время передачи двух массивов данных через сиамские сети, сети отображают массивы данных в низкоразмерных характеристиках пространства, или как n-мерные массивы, а затем в процессе обучения, создается сопоставление, что

24 данные точек из разных классов были как можно дальше, а данные точек из одного и того же класса находились как можно ближе. В конечном итоге сеть научится различать и извлекать наиболее значимые функции из массивов данных и сжимать их в изображение [6].
Одним из преимуществ такого подхода в том является тот факт, что у пользователя на выходе получается готовая система, которая может распознавать различных пользователей без каких-либо дополнительных действий и настроек.
Как указывают разработчики [6], Face ID способен подстраиваться как к внезапным изменениям внешности, например, очки, шапка, макияж так и к «постепенным», например, растущие волосы.
1.2 Сканер радужной оболочки глаза компании Samsung
Технология сканирования радужной оболочки глаза была впервые предложена в 1936 году офтальмологом Франком Буршем [7]. Он заявил, что радужная оболочка глаза каждого человека является уникальной. Вероятность ее совпадения составляет примерно 10
, что значительно выше, чем вероятность совпадения отпечатков пальцев.
В начале 90-х Джон Дафман из компании Iridian Technologies запатентовал алгоритм для обнаружения различий радужной оболочки глаза. Пример изображения из патента [7] представлен на рисунке 1.3. Данный способ биометрической идентификации личности человека выполняется при помощи иридосканера. Идентификация по радужной оболочке глаза с использованием иридосканера описана в работе [7].

25
Рисунок 1.3 – Схема разделения радужной оболочки глаза на характерные сегменты
Радужная оболочка глаза – это тонкая подвижная оптическая диафрагма со зрачком в центре. По текстуре радужная оболочка напоминает сеть из тонких нитей с большим количеством ответвлений и соединений. Рисунок радужной оболочки глаза сложен, потому алгоритмы распознавания по радужной оболочке глаза выделяют в среднем 300 характерных опорных точек, с помощью которых возможно обеспечить высокую надежность идентификации [8].
В основе иридосканера современного смартфона используется высококонтрастная камера, подобная обычной камере. Однако роль сканера радужной оболочки глаза с небольшими допущениями может выполнять и стандартная фронтальная камера. Для идентификации в первую очередь делается высококачественная фотография глаза. Фотографируется глаз на монохромную камеры с несильной подсветкой, что позволяет использовать метод распознавания в темное время суток или в темных помещениях. Для более качественного захвата изображения глаза делается серия фотографий, для того чтобы выбрать лучший по

26 детализации кадр. Далее изображение обрабатывается, определяются границы радужки, и контрольная область по которой происходит распознавание. К каждой точке выбранной области применяют специальные фильтры, чтобы извлечь фазовую информацию и преобразовать рисунок оболочки в цифровой формат.
Подробно схема работы алгоритма распознавания по радужной оболочке глаза от компании Samsung рассматривается в работе [8] и представлена на рисунке 1.4.
Рисунок 1.4 – Схема работы распознавания по радужной оболочке от Samsung
1.3 Алгоритм FindFace
Российская компания NtechLab предложила свою разработку в этой области: алгоритм FindFace [9]. Эта российская компания специализируется на решениях в области нейронных сетей, поэтому предложенный ее алгоритм работы основан также на нейронной сети. Сеть обучена определять уникальные характеристики лица, чтобы затем находить похожие лица в общей базе лиц глобального масштаба, выполняя поиск за доли секунды. Весь алгоритм распознавания делится на 4 этапа: а) детектирование лица и силуэта на изображении;

27 б) исправление визуальных искажений; в) извлечение характеристик лица; г) верификация или идентификация лица.
Программа анализирует кадры из видеоряда, используя стоп-кадр, который состоит из массива пикселей [9]. Каждый пиксель имеет уникальный цветовой
RGB-код, который представлен в виде трех числовых значений. На вход нейронной сети приходит матрица из RGB-значений пикселей, на основе которой и происходит детектирование лица. Пример матрицы из RGB-значений пикселей, представленный в работе [9], демонстрируется на рисунке 1.5.
Рисунок 1.5 – Матрица из RGB-значений пикселей
Алгоритм
FindFace, как утверждают разработчики, способен задетектировать неограниченное количество лиц в кадре, что делает его идеальным решением для обеспечения безопасности в местах массового скопления людей.

28
Основное преимущество данной разработки – скорость работы детектора не зависит от количества лиц в кадре. Пример обработки кадра с использованием
FindFace, рассматриваемый в работе [9], представлен на рисунке 1.6.
Рисунок 1.6 – Обнаруженные лица в кадре с соответствующими координатами
После получения изображения происходит исправление визуальных искажений. Для этого используется специализированный алгоритм, который определяет и исправляет визуальные искажения: например, положение и наклон головы. Разработчики компании NtechLab утверждают, что их технология распознавания лиц работает в сложных условиях и эффективно отображает лица на изображении или видео даже при значительном недостатке освещенности, а также при изменении позы, поворотах и наклоне головы. На рисунке 1.7 представлена

29 работа алгоритма по устранению визуальных искажений [9].
Рисунок 1.7 – Работа алгоритма исправления визуальных искажений
На следующем этапе алгоритм извлекает характеристики лица, то есть находит и присваивает каждому лицу вектор признаков или биометрический шаблон лица. Компания NtechLab присваивает понятию «биометрический шаблон» следующее определение: биометрический шаблон лица – это определённая последовательность чисел, сформированная нейронной сетью в результате преобразования исходного изображения, и применяемая для сравнения с другими шаблонами [9]. Разработчики не дают уточнение насчет того, как называется алгоритм, по которому происходит обработка изображения с последующим созданием векторов признаков, однако. по описанию работы этого алгоритма можно сделать вывод, что они используют в своей разработке Local Binary Patterns.
После выполнения всех этапов, происходит идентификация или

30 сопоставление признаков с другими признаками, которые есть в базе данных. В качестве базы данных алгоритм FindFace использует обработанные фотографии из социальных сетей. Как утверждает NtechLab [9], точность распознавания составляет 99,2%.
1.4 NeoFace от NEC
Еще одно интересное решение предлагает компания NEC – японская компания, производитель электронной, компьютерной техники, телекоммуникационного оборудования, одна из крупнейших мировых телекоммуникационных компаний [10].
1   2   3   4   5   6   7


написать администратору сайта