Главная страница
Навигация по странице:

  • «МИРЭА  Российский технологический университет» РТУ МИРЭА

  • «Технологическая (проектно-технологическая) практика» Тема практики

  • Технологическая (проектно-технологическая) практика Студенту 4 курса учебной группы БСБО-06-19 Сморчков Михаил Максимович Место и время практики

  • Должность на практике

  • 3. ДОПОЛНИТЕЛЬНОЕ ЗАДАНИЕ

  • СОГЛАСОВАНО

  • Проведенные инструктажи

  • «МИРЭА  Российский технологический университет» РТУ МИРЭА РАБОЧИЙ ГРАФИК ПРОВЕДЕНИЯПРОИЗВОДСТВЕННОЙ ПРАКТИКИ

  • Неделя Сроки выполнения Этап

  • ОТЧЁТ по производственной практике студента 4 курса учебной группы БСБО-06-19 ИКБ Сморчков Михаил Максимович

  • Отчет проверил: Руководитель практики от Университета __________________(Горелик С.С.) (подпись) Содержание

  • 2.2 Метод главных компонент

  • Отчет. мирэа Российский технологический университет рту мирэа


    Скачать 1.48 Mb.
    Названиемирэа Российский технологический университет рту мирэа
    АнкорОтчет
    Дата17.05.2023
    Размер1.48 Mb.
    Формат файлаdocx
    Имя файлаotchyot_po_proizvodstvennoy_praktike_smorchkov_m_m-bsbo-06-19-1 .docx
    ТипОтчет
    #1138061





    МИНОБРНАУКИ РОССИИ

    Федеральное государственное бюджетное образовательное учреждение
    высшего образования
    «МИРЭА Российский технологический университет»

    РТУ МИРЭА

    Институт кибербезопасности и цифровых технологий

    Кафедра КБ-14 «Цифровые технологии обработки данных»


    ОТЧЁТ ПО ПРОИЗВОДСТВЕННОЙ ПРАКТИКЕ

    «Технологическая (проектно-технологическая) практика»
    Тема практики: «Исследование методов анализа специализированных баз данных, содержащих фотоизображения, для решения задачи распознавания лиц»

    приказ Университета о направлении на практику от «31» августа 2022 г. № 1693-У


    Отчет представлен к

    рассмотрению:
    Студент группы: БСБО-06-19




    «21» декабря 2022 г.



    ___________

    (Подпись)



    Сморчков М.М.

    Отчет утвержден.

    Допущен к защите:











    Руководитель практики от кафедры


    «___» декабря 2022 г.


    ___________

    (Подпись)



    Горелик С.С.



    Москва 2022 г.



    МИНОБРНАУКИ РОССИИ

    Федеральное государственное бюджетное образовательное учреждение
    высшего образования
    «МИРЭА Российский технологический университет»

    РТУ МИРЭА

    Институт кибербезопасности и цифровых технологий

    Кафедра КБ-14 «Цифровые технологии обработки данных»
    ИНДИВИДУАЛЬНОЕ ЗАДАНИЕ НА ПРОИЗВОДСТВЕННУЮ ПРАКТИКУ

    Технологическая (проектно-технологическая) практика
    Студенту 4 курса учебной группы БСБО-06-19

    Сморчков Михаил Максимович

    Место и время практики: РТУ МИРЭА, кафедра КБ-14 «Цифровые технологии обработки данных», с «01» сентября 2022 г. по «21» декабря 2022 г.

    Должность на практике: студент

    1. ЦЕЛЕВАЯ УСТАНОВКА: развитие способностей в области проектной деятельности путем применения современных методов и инструментальных средств прикладной информатики, в том числе путем анализа и моделирования прикладных процессов с учетом выбранной темы исследования

    2. СОДЕРЖАНИЕ ПРАКТИКИ:

    2.1. Изучить: исследовать информационные и прикладные процессы

    2.2. Практически выполнить: применить современные инструментальные средства для моделирования информационных и прикладных процессов

    2.3. Ознакомиться: с уровнем развития информационных и прикладных процессов с учетом темы исследования

    3. ДОПОЛНИТЕЛЬНОЕ ЗАДАНИЕ: оформить презентационный материал

    4. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЕ УКАЗАНИЯ: в процессе практики рекомендуется использовать периодические издания и отраслевую литературу годом издания не старше 5 лет


    Заведующий кафедрой:


    «01» сентября 2022 г.



    (подпись)


    (Иванова И.А.)






    СОГЛАСОВАНО:










    Руководитель практики от кафедры

    «01» сентября 2022 г.



    (подпись)


    (Горелик С.С.)

    Задание получил










    «01» сентября 2022 г.





    (подпись)

    (Сморчков М.М.)

    Проведенные инструктажи:







    Охрана труда:




    «01» сентября 2022 г.

    Инструктирующий


    (подпись)

    Горелик С.С., ст. преподаватель кафедры КБ-14

    Инструктируемый


    (подпись)

    Сморчков М.М.










    Техника безопасности:




    «01» сентября 2022 г.

    Инструктирующий


    (подпись)

    Горелик С.С., ст. преподаватель кафедры КБ-14

    Инструктируемый


    (подпись)

    Сморчков М.М.










    Пожарная безопасность:




    «01» сентября 2022 г.

    Инструктирующий


    (подпись)

    Горелик С.С., ст. преподаватель кафедры КБ-14

    Инструктируемый


    (подпись)

    Сморчков М.М.







    С правилами внутреннего распорядка ознакомлен:

    «01» сентября 2022 г.





    (подпись)

    Сморчков М.М.





    МИНОБРНАУКИ РОССИИ

    Федеральное государственное бюджетное образовательное учреждение
    высшего образования
    «МИРЭА Российский технологический университет»

    РТУ МИРЭА

    РАБОЧИЙ ГРАФИК ПРОВЕДЕНИЯ
    ПРОИЗВОДСТВЕННОЙ ПРАКТИКИ


    студента Сморчкова М.М. 4 курса группы БСБО-06-19 очной формы обучения, обучающегося по направлению подготовки 09.03.02 Информационные системы и технологии

    профиль «Технологии искусственного интеллекта в безопасности»

    Неделя

    Сроки

    выполнения

    Этап

    Отметка о выполнении

    1

    «01» сентября 2022 г.- «20» сентября 2022 г.

    Подготовительный этап, включающий в себя организационное собрание (Вводная лекция о порядке организации и прохождения производственной практики, инструктаж по технике безопасности)




    2

    «21» сентября 2022 г.- «30» ноября 2022 г.

    Выполнение задания по практике в соответствии с выданным заданием студента. (Мероприятия по сбору, обработке и структурированию материала, выполнение поставленной задачи)




    3

    «01» декабря 2022 г.- «21» декабря 2022 г.

    Подготовка отчета и презентационного материала по практике (Оформление материалов отчета и презентации в полном соответствии с требованиями на оформление учебных работ студентов)




    4

    «___» декабря 2022 г.

    Защита отчета по производственной практике у руководителя практики. (Представление отчета по практике к защите)




    Согласовано:

    Заведующий кафедрой _________________/Иванова И.А., к.т.н, доцент/

    Руководитель практики от
    кафедры _______________/Горелик С.С., ст. преподаватель КБ-14/

    Обучающийся _________________/ Сморчков М.М./

    ОТЧЁТ

    по производственной практике
    студента 4 курса учебной группы БСБО-06-19 ИКБ

    Сморчков Михаил Максимович

    1. Практику проходил с 01.09.2022 г. по 21.12.2022 г. в__ФГБОУ ВО «МИРЭА – Российский технологический университет», на кафедре КБ-14 «Цифровые технологии обработки данных», студент

    (место прохождения практики и должность)

    1. Задание на практику выполнил

    в полном объеме/частично________________________________________________________

    (нужное подчеркнуть)

    Не выполнены следующие задания:

    _---------------

    (указать также причины невыполнения)

    Подробное содержание выполненной на практике работы и достигнутые результаты: проведено исследование прикладной области в части изучения _______________________________________________________________________________

    _______________________________________________________________________________

    Предложения по совершенствованию организации и прохождения практики:

    предложений нет
    Студент _______________ (Сморчков М.М.)

    (подпись)

    «__» __________ 2022 г

    Заключение руководителя практики

    Приобрел следующие профессиональные навыки: студент продемонстрировал профессиональные умения и навыки, знание и понимание прикладной области, задач, требующих решения в прикладной области, современные подходы и средства решения прикладных задач разных классов, умение находить и работать с различными источниками информации по профессиональной деятельности, структурировать отчет с учетом тематики исследования

    Проявил себя как: студент соблюдал/не соблюдал сроки календарного графика практики.

    (нужное подчеркнуть)

    «__» __________ 2022 г

    Отчет проверил:

    Руководитель практики от Университета
    __________________(Горелик С.С.)

    (подпись)

    Содержание

    Введение 7

    1.Базы данных 8

    2. Методы распознавания лиц 15

    Заключение 19

    Список источников 20



    Введение


    Современный мир охватывает огромное количество цифровых фотоизображений, содержащих информацию о людях. Эти изображения хранятся в специализированных базах данных и используются для различных целей, в том числе для решения задачи распознавания лиц. Технология распознавания лиц имеет широкий спектр применения, от обеспечения безопасности до создания удобных и инновационных услуг для пользователей. Однако, для эффективного решения задачи распознавания лиц требуются специализированные методы анализа баз данных, содержащих фотоизображения, так как выбор правильный базы данных (способа хранения фотоизображений) может упростить задачу распознавания лиц и оптимизировать занимаемое данными место.
    1. Базы данных


    База данных — это Cовокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ[1].


      1. 1.1 Реляционные базы данных

    Реляционная база данных (далее SQL БД) — это база данных, реализованная в соответствии с реляционной моделью данных, Другими словами, база данных в которой для структуризации базы данных используются отношения между таблицами[1][2].

    В SQL БД данные хранятся в виде таблиц, которые состоят из строк и столбцов. Реляционные базы данных используются для хранения и управления большими объемами структурированных данных. SQL БД предоставляют язык SQL (Structured Query Language) для обработки данных.

    Р исунок 1.1 — Основные понятия реляционных баз данных

    Одним из преимуществ SQL БД является их способность обеспечивать консистентность и целостность данных. SQL БД поддерживают связи между таблицами, которые обеспечивают целостность данных. В SQL БД можно создавать ограничения (constraints) на таблицы и столбцы, чтобы обеспечить консистентность данных. Кроме того, SQL БД поддерживают транзакции, что позволяет обеспечить целостность данных в случае сбоев в системе[2].

    SQL БД имеют ряд преимуществ перед другими типами баз данных:

    • SQL БД обладают высокой производительностью и эффективностью при работе с большими объемами структурированных данных

    • SQL БД позволяют хранить данные в структурированном формате, что облегчает их анализ и поиск.

    Использование SQL БД для распознавания лиц предоставляет возможность легко хранить и обрабатывать большое количество данных. SQL БД позволяют легко создавать таблицы, индексы и ограничения, что упрощает процесс хранения и поиска изображений лиц. Более того, при использовании SQL БД для хранения и обработки данных, разработчикам не нужно заботиться о том, как хранить, индексировать и поисковые функции для каждого изображения лица, так как все это уже реализовано в SQL БД.

    Тем не менее, использование SQL БД для распознавания лиц также имеет свои ограничения. Один из главных недостатков SQL БД заключается в том, что они не всегда подходят для хранения неструктурированных данных, таких как изображения. Изображения могут занимать большой объем памяти, что может привести к трудностям при обработке и хранении в SQL БД. Кроме того, при использовании SQL БД для распознавания лиц может возникнуть проблема с точностью распознавания. Если данные в базе данных не соответствуют реальным данным (например, изображения в базе данных не являются достаточно разнообразными), то точность распознавания может значительно снизиться.

      1. 1.2 Нереляционные базы данных

    Нереляционная база данных (далее NoSQL БД) — это база данных, которая не использует традиционную реляционную модель хранения данных и вместо этого использует другие структуры данных для хранения данных[1]. Нереляционные базы данных являются альтернативой реляционным базам данных, которые были разработаны для работы с неструктурированными и полуструктурированными данными, такими как тексты, изображения и видео. Они предлагают более гибкие модели данных и могут быть использованы для о бработки больших объемов данных.

    Рисунок 1.2 — Сравнение структуры реляционных и нереляционных СУБД

    Нереляционные базы данных бывают :

    • Документоориентированные базы данных.

    В таких базах данных данные хранятся в документах, которые могут быть в формате JSON, XML, BSON и других. Примерами документоориентированных баз данных являются MongoDB, Couchbase и Amazon DocumentDB.

    • Колоночные базы данных.

    В таких базах данных данные хранятся в таблицах, где каждый столбец соответствует отдельному атрибуту, а каждая строка - отдельной записи. Примерами колоночных баз данных являются Apache Cassandra и HBase.

    • Ключ-значение базы данных.

    В таких базах данных данные хранятся в виде пар ключ-значение, где ключ - уникальный идентификатор, а значение - произвольные данные. Примерами ключ-значение баз данных являются Redis и Riak.

    • Графовые базы данных.

    В таких базах данных данные хранятся в виде вершин и ребер графа, что позволяет эффективно хранить и обрабатывать связанные данные. Примерами графовых баз данных являются Neo4j и Amazon Neptune.

    При использовании нереляционных баз данных для распознавания лиц, разработчики могут использовать документную модель данных для хранения изображений лиц в формате JSON или BSON. В документной модели данные хранятся в виде документов, которые могут содержать различные поля и структуры данных, включая изображения лиц. Это позволяет легко хранить и обрабатывать изображения лиц в нереляционных базах данных.

    Плюсы нереляционных баз данных:

    • Масштабируемость.

    Большинство систем NoSQL легко масштабируются горизонтально, что позволяет обрабатывать большие объемы данных.

    • Гибкость.

    NoSQL базы данных не требуют строгой схемы данных, что позволяет быстро изменять структуру данных.

    • Высокая производительность.

    NoSQL базы данных обычно показывают лучшие результаты в работе с большими объемами данных.

    • Надежность.

    Некоторые системы NoSQL обеспечивают высокую отказоустойчивость и достижимость данных.

    Однако, NoSQL БД также имеют свои ограничения. Они не всегда подходят для хранения структурированных данных, и могут не обеспечивать транзакционную целостность данных. Кроме того, при использовании нереляционных баз данных для распознавания лиц может возникнуть проблема с точностью распознавания, так как нереляционные базы данных не всегда могут обеспечивать точный поиск и сопоставление данных[4].

    Также, при использовании нереляционных баз данных для распознавания лиц следует учитывать некоторые ограничения и недостатки. Например, некоторые типы нереляционных баз данных могут иметь ограничения по производительности при обработке определенных типов данных, включая фотоизображения.




      1. 1.3 Распределенные базы данных

    Распределенная база данных (от англ. distributed database) — это база данных, которая физически распределяется на две или более компьютерные системы[1]. Иначе говоря, распределенные базы данных представляют собой системы хранения и управления данными, в которых данные разбиваются на несколько частей и хранятся на нескольких физических устройствах, которые могут находиться в разных местах. Каждое устройство хранит только часть данных, что позволяет обеспечивать более высокую доступность и производительность, а также более надежную защиту данных.



    Рисунок 1.3 — Распределенные базы данных

    Распределенные базы данных могут быть полезны для распознавания лиц, так как они могут обеспечивать более быстрый доступ к большим объемам данных, которые могут возникать при обработке фотоизображений. Кроме того, распределенные базы данных могут быть легко масштабированы по мере необходимости, что позволяет расширять систему при необходимости увеличения ее производительности. Они могут обеспечивать более быстрый доступ к большим объемам данных, высокую доступность и надежность системы. Кроме того, они могут быть легко масштабируемы по мере необходимости. Тем не менее, использование распределенных баз данных также требует дополнительных усилий на управление данными и обеспечение согласованности, что может увеличить сложность проекта и его стоимость.

    Однако, использование распределенных баз данных также имеет свои ограничения и недостатки. Например, управление распределенными данными может быть сложным, и требует разработки специальных алгоритмов, которые позволяют обеспечивать целостность и согласованность данных. Кроме того, распределенные базы данных могут иметь более высокую стоимость, чем локальные базы данных, так как они требуют больших ресурсов на хранение и обработку данных.

    Выбор между локальными и распределенными базами данных зависит от конкретных требований проекта и доступности ресурсов. Распределенные базы данных могут быть полезны для распознавания лиц, если данные распределены на нескольких устройствах и требуется быстрый доступ к большим объемам данных. Кроме того, распределенные базы данных могут быть полезны для обеспечения высокой доступности и надежности системы.


    2. Методы распознавания лиц


    Распознавание лиц - это задача компьютерного зрения, которая заключается в идентификации и классификации лиц на изображениях или в реальном времени с помощью алгоритмов машинного обучения [3][5].

    Технология распознавания лиц может быть использована для различных целей, таких как:

    • Безопасность: распознавание лиц может быть использовано для идентификации людей на местах работы, в аэропортах, на стадионах и других общественных местах для обеспечения безопасности и предотвращения преступлений.

    • Аутентификация: распознавание лиц может быть использовано для аутентификации пользователей в системах безопасности, банковских приложениях и других приложениях, где требуется высокий уровень безопасности.

    • Управление ресурсами: распознавание лиц может быть использовано для управления ресурсами, такими как доступ к зданиям, мероприятиям и т.д.

      1. 2.1 Метод на основе геометрических признаков.

    Метод на основе геометрических признаков — это один из методов распознавания лиц, который использует геометрические признаки лица, такие как расстояние между глазами, длина носа и т. д., для идентификации личности[5].

    Основная идея метода заключается в том, что каждый человек имеет уникальные геометрические черты в лице, и эти черты могут быть использованы для идентификации личности. В этом методе выделяются точки на лице, называемые ключевыми точками (landmarks), которые затем используются для извлечения геометрических признаков.

    Существует несколько различных подходов к выделению ключевых точек. Некоторые методы используют заранее заданные точки, такие как углы глаз, носа и рта, в то время как другие методы используют алгоритмы для автоматического выделения ключевых точек. После выделения ключевых точек метод на основе геометрических признаков применяет алгоритмы для извлечения признаков, которые затем используются для идентификации личности. Например, признаки могут быть основаны на расстояниях между ключевыми точками, углах между линиями, соединяющими ключевые точки, и т. д.

    Преимущества метода на основе геометрических признаков:

    • Не требует большого объема данных для обучения, так как геометрические признаки являются универсальными и применимы для большинства людей

    • Не зависит от освещения или других факторов, таких как растительность на лице, которые могут затруднить распознавание с помощью других методов

    • Может быть применен в реальном времени на мобильных устройствах и других устройствах с ограниченными вычислительными мощностями благодаря своей скорости.

    Недостатками метода на основе геометрических признаков являются:

    • Требует выделения и подготовки изображения лица для правильного извлечения признаков.

    Это может быть сложно, если изображение содержит шум или находится в условиях с недостаточным освещением. Более того, метод требует того, чтобы лицо было заранее зарегистрировано в базе данных, что не всегда возможно или желательно.

    Например, если анализируемые изображения были сделаны в разных условиях освещения, позы или пространственном положении.

    • Не учитывает информацию о текстуре и цвете лица

      1. 2.2 Метод главных компонент

    Метод главных компонент (PCA) - это один из наиболее распространенных подходов к распознаванию лиц. Этот метод использует линейную алгебру для сжатия изображений лиц в пространство меньшей размерности, что позволяет увеличить скорость распознавания и уменьшить количество данных, необходимых для хранения[6].

    Принцип работы метода главных компонент заключается в том, что он осуществляет проекцию исходных данных на новое пространство меньшей размерности, при этом максимально сохраняется дисперсия исходных данных. Это достигается путем нахождения главных компонент – новых признаков, которые наиболее точно описывают распределение исходных данных.

    Для применения метода главных компонент к задаче распознавания лиц необходимо выполнить следующие шаги:

    1. Подготовить обучающую выборку, состоящую из изображений лиц.

    2. Нормализовать каждое изображение, чтобы оно имело одинаковый размер и было расположено в одном и том же положении.

    3. Применить метод главных компонент к обучающей выборке, чтобы найти главные компоненты, описывающие распределение изображений лиц.

    4. С использованием полученных главных компонент построить новые признаки, которые будут использоваться для распознавания лиц.

    5. Обучить классификатор на основе новых признаков.

    6. Проверить работу классификатора на тестовой выборке.

    Одним из главных преимуществ метода главных компонент является возможность работать с большим количеством изображений за счёт уменьшения объёма данных. Также, метод позволяет учитывать различные условия освещения и искажения, такие как изменение масштаба и повороты изображений, что делает его более универсальным.

    Основной недостаток заключается в том, что при использовании метода для больших наборов изображений, требуется большой объем вычислительных ресурсов и времени для обработки данных. Метод может быть неработоспособным в случае, если изображения содержат большое количество шума или изображения с низким разрешением.

    Заключение


    Выбор конкретного типа базы данных и метода распознавания зависит от многих факторов: от количества данных, качества данных, структуры данных, предметной области, условий обработки и вычислительной мощности.

    Реляционные базы данных наиболее удобны для хранения структурированных данных, таких как идентификаторы и атрибуты лиц, а нереляционные базы данных могут обеспечивать более высокую скорость доступа и обработки данных, особенно в случае с большим объемом неструктурированных данных, таких как изображения. Распределенные базы данных могут предоставлять увеличенную масштабируемость и отказоустойчивость.

    Методы на основе геометрических признаков позволяют быстро и эффективно идентифицировать лица, но могут столкнуться с проблемами, такими как низкая точность в случае с изменением освещения и угла обзора. Метод главных компонент является одним из наиболее эффективных алгоритмов для распознавания лиц, обеспечивая высокую точность при использовании относительно небольшого объема данных, но при этом требует много вычислительных ресурсов и большее время на обработку.

    Список источников


    1. ГОСТ 34.321-96. Информационные технологии. Система стандартов по базам данных. Эталонная модель управления данными, 2001-07-01.

    2. Ярослав Дашкевич. Реляционные базы данных. – Москва: Бином, 2007.

    3. А.И. Панов, М.О. Стромов, А.А. Леонтьев. Обзор нейросетевых методов распознавания лиц. Информатика и ее применения, 2015. – Т. 9. – № 1.

    4. К.В. Корябкин, В.С. Черноруцкий. Нереляционные базы данных. – Москва: Наука, 2019.

    5. Н.В. Николенко, И.К. Азаренкова, А.Ю. Скопин. Методы глубинного обучения. – Москва: ДМК Пресс, 2019.

    6. Г.Ф. Бендерская, В.А. Буданцев. Распознавание лиц. – Москва: Издательство Московского университета, 2017..


    написать администратору сайта