Главная страница

Разработка системы автоматического доступа в помещение с использованием метода распознавания лиц


Скачать 1.87 Mb.
НазваниеРазработка системы автоматического доступа в помещение с использованием метода распознавания лиц
Анкорhfcgjpyfdfybt
Дата16.10.2022
Размер1.87 Mb.
Формат файлаpdf
Имя файлаTPU942353.pdf
ТипДокументы
#736918
страница3 из 7
1   2   3   4   5   6   7
Разработка этой кампании «NeoFace» позволяет с высокой точностью идентифицировать личность человека, распознает возрастные изменения, и применятся в системах доступа национальных систем идентификации людей [11].
Примеры использования данной разработки в различных проектах: а) оснащение пунктов пропуска на границе, в аэропортах, железнодорожных и морских вокзалах; б) системы доступа в помещения и зоны с ограниченным доступом; в) динамичное распознавание человека в движущейся толпе; г) ограничение доступа на стадионы болельщиков, занесенных в “черные” списки.
В рассматриваемом решении, как указано в работе [11], применяется технология Adaptive Region Mixed Matching (адаптивное динамическое сравнение участков). Принцип работы данной технологии основан на фокусировке внимания на сегментах с высокой степенью схожести для сопоставления.
Отличительной особенностью NeoFace является работа с изображениями: в ходе работы программа делит вводимое изображение и зарегистрированное

31 изображение на маленькие сегменты и фокусируется только на сегментах с большей степенью схожести [10]. Такой подход дает системе возможность достичь более высокой точности идентификации, даже если часть лица субъекта скрыта, например, маской или очками.
Авторы этой технологии распознавания лиц утверждают, что она может быть реализована как функционально независимое приложение или интегрировано в новые или существующие биометрические решения безопасности [10].
Технология NeoFace основана на математическом алгоритме, который путем построения нелинейной GLVQ (Generalized Learning Vector Quantization – обобщенное векторное обучение квантованию) пространственной модели вначале определяет, точно ли перед камерой находится лицо человека, а затем создает двухмерную модель лица интересующего нас объекта. На следующем этапе при помощи другого алгоритма двухмерная модель превращается в трехмерную, после чего на основе базового фото создаются вариации подсветки лица и варианты углов наклона лица. На последнем этапе происходит выделение индивидуальных и повторяемых черт лица в общем объеме информации, после чего можно с уверенностью сказать, является ли данное лицо искомым. Более подробно работа технологии представлена в работе [11].

32 2 Методы распознавания лиц
В этой главе приводятся методы и математический аппарат, используемый в технологиях для распознавания лиц.
В основу всех методов распознавания по геометрии лица заложен то факт, что набор черт лица, соотношение размеров и формы черепа каждого человека уникально. Соответственно можно выделить основные этапы распознавания лица, которые представлены на рисунке 2.1.
Рисунок 2.1 – Этапы работы системы распознавания лиц
На этапе обработки изображений (рисунок 2.1) прилагаются различные действия по обработке изображений для того, чтобы далее стало возможно без каких-либо условностей работать с изображениями с целью «обучения» системы распознаванию лиц. Такая обработка производится с целью подготовки изображения с следующему этапу, который заключается в анализе изображений.

33
Стандартные действия, которые применяются на этапе обработки изображений: а) очистка от шумов; б) улучшение контрастности; в) улучшение резкости изображения; г) поворот и искажение перспективы изображения.
В процессе анализа изображений (блок «Анализ изображений» на рисунке
8) происходит извлечение информации из изображений, а точнее вектор признаков с их значениями. Анализировать можно изображения, полученные различными видами камер как черно-белыми, так и цветными и даже ИК-камер. Стоит отметить, что большинство используемых повсеместно алгоритмов оперируют изображениями, предварительно переведенными в оттенки серого. Делается это для того, чтобы рациональнее использовать производительную мощность платформы, на которой работает алгоритм распознавания лиц, так как обработка монохромного изображения и цветного изображения разительно отличается по времени [12].
Этап распознавания образов (блок «Распознавание образов» на рисунке 2.1) представляет собой сравнение классификаций векторов признаков полученных от анализа изображений и признаков, полученных в данный момент, например изображения, полученные с видеопотока видеокамеры, либо изображения, внесенные в систему другим способом. Вне зависимости от того каким образом получены в данный момент изображения, им всем характерно отсутствие предварительной обработки, как это происходит с изображениями, прошедшими этап анализа изображений. Информация на выходе данного этапа может быть различной, всё зависит от примененного метода распознавания образов (подробнее описано в работе [12]). В этом подходе необходимо указать на факторы, возникающие при распознании лиц, и мешающие провести распознавание: а) частичное закрытое лицо; б) движение и вращение головы в различные стороны;

34 в) вариативность интенсивности и углов освещения; г) лицевая мимика.
2.1 Метод Виолы-Джонса
Метод Виолы-Джонса впервые был описан в 2001 году Полом Виолой и
Майклом Джонсоном в работе [13]. Этот метод позволяет распознавать лица в полностью автоматическом режиме. По сравнению с другими методами, метод
Виолы-Джонса имеет такие преимущества, как низкая сложность алгоритма и низкие требования к производительной мощности платформы, благодаря чему, появляется возможность применять данный метод в режиме реального времени.
Основной метода является использование признаков Хаара, т.е. проведение анализа изображения по характерным чертам лица человека, присущим каждому. Таким образом, цвет кожи или раса человека, а также освещение не влияют на результат метода.
Авторы метода предложили использовать интегральное представление изображения – матрица, которая совпадает по размерам с исходной и в каждом ее элементе хранится сумма всех элементов, находящихся левее и выше данного [13].
Элементы представлены в матричном виде и рассчитываются по следующей формуле 2.1:
𝐼(𝑥, 𝑦) = ∑
𝑖(𝑥`, 𝑦`)
`
`
,
(2.1) где i(x`,y`) – яркость пикселя исходного изображения.
Таким образом, каждый элемент I(x,y) интегрального изображения содержит в себе сумму интенсивности пикселей в прямоугольнике от (0,0) до (x`,y`).
Формирование интегрального изображения занимает линейное время, пропорциональное числу пикселей исходного изображения, и осуществляется за один проход. Расчет интегрального изображения I, как указывают авторы в работе

35
[13], можно производить по формуле 2.2:
𝐼(𝑥, 𝑦) = 𝑖(𝑥, 𝑦) + 𝐼(𝑥 − 1, 𝑦) + 𝐼(𝑥, 𝑦 − 1) − 𝐼(𝑥 − 1, 𝑦 − 1).
(2.2)
Важнейшим достоинством интегрального представления изображения является возможность быстрого вычисления суммы пикселей произвольного прямоугольника, а также любой другой фигуры, которую можно аппроксимировать несколькими прямоугольниками. Вычисление суммы пикселей произвольного прямоугольника проводится по следующей формуле:
𝑆 = ∑
𝑖(𝑥, 𝑦) = 𝐼(𝐴) + 𝐼(𝐶) − 𝐼(𝐵) − 𝐼(𝐷).
(2.3)
Для описания искомых объектов используются каскады из признаков или
«Каскад Хаара» – это набор примитивов (рисунок 2.2), для которых считается их свертка с изображением. В этом случае используются самые простые примитивы, состоящие из прямоугольников и имеющие всего два уровня: +1 и -1. При этом каждый прямоугольник используется несколько раз, но разного размера. Под сверткой «s» подразумевается формула, которая предложена авторами в [13]:
𝑠 = 𝑋 − 𝑌 ,
(4) где X – сумма элементов изображения в светлой области;
Y – сумма элементов изображения в темной области.

36
Рисунок 2.2 – Признаки Хаара
Признаки Хаара были представлены Виолой и Джонсом, и названы так из- за своего сходства с вейвлетами Хаара. Вейвлет Хаара представляет собой свертку одномерного сигнала, в виде разности двух ближайших отсчетов [13]. Функция свертки, рассматриваемая в работе [13], изображена на рисунке 2.3.
Рисунок 2.3 – Вейвлет Хаара
Признак Хаара представляет собой прямоугольную область, разделенную на две смежные области. Признаки накладываются на изображение на различных позициях и в различных масштабах. Значение признака определяется как разность

37 сумм пикселей из областей. Примеры признаков Хаара, приведенные в работе [13], показаны на рисунке 2.2.
Каждый признак отвечает за конкретную характеристику изображения и отражает ее наличие или отсутствие. Например, признак из двух смежных прямоугольных областей может показать, где находится граница между темным и светлым участками изображения. Пространство признаков можно значительно расширить, используя наклонные признаки. При помощи наклонных признаков можно определить наличие края под определенным углом [13]. Однако, при получении изображения в режиме реального времени, как правило, пользуются изображениями низкого разрешения, из-за чего могут возникнуть проблемы с округлением при использовании наклонных признаков несмотря на то, что сама идея данных признаков является верной с математической стороны.
В общем случае, применение примитивов Хаара с целью найти лицо на изображении выглядит как показано на рисунке 2.4. Более подробно описание приведено авторами в работах [14, 15].
Рисунок 2.4 – Работа примитивов Хаара

38 2.2 Алгоритм Local Binary Patterns
В 1996 году Тимо Ояла и Матти Пиетикяйнен впервые описали алгоритм
LBP [16]. Алгоритм LBP (Local Binary Patterns – алгоритм локальных бинарных шаблонов) – представляет собой описание окрестности пикселя изображения в двоичной форме. Считая, что центральный пиксель является порогом, алгоритм использует восемь пикселей, находящийся в окрестности центрального. Значение
«1» присваивается тем пикселям, которые имеют значение больше (или равное), чем центральный пиксель. Значение «0» присваивается тем пикселям, которые меньше центрального. Таким образом окрестность пикселя описывается при помощи восьмиразрядного бинарного кода. В работе [16] приводится пример работы алгоритма LBP, изображенный на рисунке 2.5.
Рисунок 2.5 – Пример работы алгоритма LBP
На основе полученных чисел для всех частей, на которые была разбита фотография, считается гистограмма. Объединение всех частей формирует вектор, позволяющий предоставить информацию и характеристику изображения. При определении схожести двух лиц, вычисление вектора проводится для каждого изображения и сравнивается.

39
Рисунок 2.6 – Пример создания гистограммы для всего изображения
Из всех вышеперечисленных методов только метод Виола-Джонса способен работать в реальном времени, то есть напрямую обрабатывать изображение с видеокамеры. Остальным методам необходимо длительное время обрабатывать изображение. В разрабатываемой системе используются два метода обработки изображения с целью распознавания: вышеописанный метод Виолы-Джонса и алгоритм Local Binary Patterns или алгоритм локальных бинарных шаблонов.

69 4
Финансовый менеджмент, ресурсоэффективность и ресурсосбережение
4.1 Оценка коммерческого потенциала и перспективности проведения научных исследований с позиции ресурсоэффективности и ресурсосбережения
4.1.1 Потенциальные потребители результатов исследования
Темой выпускной квалификационной работы является разработка системы автоматического доступа в помещение с использованием метода распознавания лиц. Данная система может применятся в любой сфере производства, так как универсальна, проста в эксплуатации и имеет высокую степень защиты. Исходя из особенностей принципа работы, систему можно использовать в качестве элемента системы контроля посещаемости помещений.
Таблица 4.1 – Карта сегментирования использования системы автоматического доступа в помещение с использованием метода распознавания лиц
Область применения
Доступ в помещение
Контроль посещаемости помещения
Ра зм ер к
ом па ни и
Крупные
Низкий уровень конкуренции
Средний уровень конкуренции
Средние
Низкий уровень конкуренции
Средний уровень конкуренции
Мелкие
Низкий уровень конкуренции
Средний уровень конкуренции
Как видно из таблицы 4.1 низкий уровень конкуренции наблюдается при использовании системы по назначению, то есть в качестве доступа в помещение.

70
Однако при использовании системы в качестве контроля посещаемости наблюдается средний уровень конкуренции, так как данная область рынка освоена компаниями, занимающимися программными и цифровыми разработками.
4.1.2 Анализ конкурентных технических решений
Анализ конкурентных технических решений с позиции ресурсоэффективности и ресурсосбережения позволяет провести оценку сравнительной эффективности научной разработки и определить направления для ее будущего повышения. Так как прямых аналогов данной системы нет, то сравнение проведено для систем контроля посещаемости. Для сравнения были выбраны такие решения, как NeoFace от компании NEC (К1) и FindFace от компании NtechLab (К2). Сравнение проведено в форме таблицы и отражено в таблице 4.2.
Таблица 4.2 – Оценочная карта для сравнения конкурентных технических разработок
Критерии оценки
Вес крите- рия
Баллы
Конкуренто- способность
Б
ф
Б
к1
Б
к2
К
ф
К
к1
К
к2 1
2 3
4 5
6 7
8
Технические критерии оценки ресурсоэффективности
1. Повышение производительности труда пользователя
0,03 5
4 5
0,15 0,12 0,15
Продолжение таблицы 4.2

71
Критерии оценки
Вес крите- рия
Баллы
Конкуренто- способность
Б
ф
Б
к1
Б
к2
К
ф
К
к1
К
к2 2.
Удобство в эксплуатации
(соответствует требованиям потребителей)
0,09 4
5 5
0,36 0,45 0,45 3. Помехоусточивость
0,1 3
4 5
0,3 0,4 0,5 4. Надежность
0,1 3
5 4
0,3 0,5 0,4 5. Безопасность
0,15 5
5 5
0,75 0,75 0,75 6. Потребность в ресурсах памяти
0,1 5
3 2
0,5 0,3 0,2 7.
Качество интеллектуального интерфейса
0,08 5
5 5
0,4 0,4 0,4
Экономические критерии эффективности
1. Конкурентоспособность продукта
0,07 4
5 4
0,28 0,35 0,28 2. Уровень проникновения на рынок 0,07 1
5 2
0,07 0,35 0,14 3. Цена
0,08 5
3 2
0,4 0,24 0,16 4. Послепродажное обслуживание
0,06 4
4 4
0,24 0,24 0,24 5.
Финансирование научной разработки
0,07 2
4 4
0,14 0,28 0,28
Итого
1 3,89 4,38 3,95
Анализ конкурентных технических решений определяется по формуле:
К = ∑ В ∙ Б ,
(4.1) где К – конкурентоспособность научной разработки или конкурента;
В
i
– вес показателя (в долях единицы);
Б
i
– балл i-го показателя.

72
Собственные преимущества заключаются в более простом исполнении и меньшем потреблении мощностей компьютеров, тогда как конкурентам необходимы серверные мощности для качественного функционирования.
Преимущества конкурентов заключаются в более глубоком проникновении на рынок, лучшем финансировании проекта, а также лучшей помехоустойчивостью.
4.1.3 Технология QuaD
Технология QuaD (Quality Advisor) представляет собой гибкий инструмент измерения характеристик, описывающий качество новой разработки и ее перспективность на рынке и позволяющие принимать решение целесообразности вложения денежных средств в научно-исследовательский проект.
Показатели оценки качества и перспективности новой разработки подбираются исходя из выбранного объекта исследования с учетом его технических и экономических особенностей разработки, создания и коммерциализации.
Таблица 4.3 – Оценочная карта для сравнения конкурентных технических разработок
Критерии оценки
Вес крите- рия
Баллы
Макси- мальный балл
Относи- тельное значение
Средне- взвешенное значение
1 2
3 4
5
Показатели оценки качества разработки
1. Энергоэффективность
0,02 80 100 0,8 0,016 2. Помехоустойчивость
0,02 60 100 0,6 0,012
Продолжение таблицы 4.3

73
Критерии оценки
Вес крите- рия
Бал- лы
Макси- мальный балл
Относи- тельное значение
Средне- взвешенное значение
4. Унифицированность
0,04 90 100 0,9 0,036 5. Уровень материалоем- кости разработки
0,05 80 100 0,8 0,04 6. Уровень шума
0,02 100 100 1
0,02 7. Безопасность
0,03 100 100 1
0,03 8. Потребность в ресур- сах памяти
0,01 95 100 0,95 0,0095 9. Функциональная мощ- ность (предоставляемые возможности)
0,08 90 100 0,9 0,072 10.
Простота эксплуатации
0,07 90 100 0,9 0,063 11. Качество интеллек- туального интерфейса
0,08 95 100 0,95 0,076 12. Ремонтопригодность
0,06 90 100 0,9 0,054
Показатели оценки коммерческого потенциала разработки
13. Конкурентоспособ- ность продукта
0,07 55 100 0,55 0,0385 14. Уровень проникнове- ния на рынок
0,06 40 100 0,4 0,024 15.
Перспективность рынка
0,08 100 100 1
0,08
Продолжение таблицы 4.3

74
Критерии оценки
Вес крите- рия
Бал- лы
Макси- мальный балл
Относи- тельное значение
Средне- взвешенное значение
16. Цена
0,07 100 100 1
0,07 17.
Послепродажное обслуживание
0,05 80 100 0,8 0,04 18.
Финансовая эффективность научной разработки
0,07 80 100 0,8 0,056 19. Срок выхода на рынок
0,04 85 100 0,85 0,034 20.
Наличие сертификации разработки
0,04 10 100 0,1 0,004
Итого
1 0,811
Оценка качества и перспективности по технологии QuaD определяется по формуле:
П
ср
= ∑ В ∙ Б ,
(4.2) где П
ср
– средневзвешенное значение показателя качества и перспективности научной разработки;
В
i
– вес показателя (в долях единицы);
Б
i
– средневзвешенное значение i-го показателя.
Значение П
ср позволяет говорить о перспективах разработки и качестве проведенного исследования. Если значение показателя П
ср получилось от 100 до 80, то такая разработка считается перспективной. Если от 79 до 60 – то перспективность выше среднего. Если от 69 до 40 – то перспективность средняя. Если от 39 до 20 –

75 то перспективность ниже среднего. Если 19 и ниже – то перспективность крайне низкая.
По результатам оценки качества и перспективности делается вывод об объемах инвестирования в текущую разработку и направлениях ее дальнейшего улучшения.
1   2   3   4   5   6   7


написать администратору сайта