Требования к данным для систем ИИ по верификации людей

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Содержание:

  1. Введение

  2. Системы верификации

  3. Общие требования к данным

  4. Требования к эталонному набору данных

  5. Требования к сравниваемым объектам

  6. Результаты тестирования

1. Введение

В современном мире все чаще внедряются системы искусственного интеллекта (ИИ) в жизнедеятельность человека. Одним из самых интересных и актуальных направлений является разработка сервисов верификации людей на изображении.

Верификация – это подтверждение личности человека путем сравнения полученного лица на изображении с эталонным образцом, заранее загруженным в систему [1].

Такие системы должны показывать хорошее качество, так как ошибка может привести к серьезным сбоям в рабочем процессе компании или организации.

Работу таких систем мы уже можем наблюдать в реальном мире. Например, при оплате на кассе в магазине клиенты Сбербанка могут рассчитаться за покупки своим лицом или при входе в подъезд дома с технологией умный домофон.

2. Системы верификации

Модели ИИ по верификации лиц в основном имеют общие принципы работы:

Основные этапы работы модели [2]
Основные этапы работы модели [2]

1. Обнаружение лица (Face Detection):

Сначала система находит на изображение лицо, выделяет его и передает интересующую область изображения на следующий этап.

2. Выравнивание лица (Face Alignment):

Для лучшей обобщаемости модели, система должна стандартизировать изображение, выравнивая его по ключевым точкам лица, таким как глаза, нос и рот. Это уменьшает вариативность, связанную с позой, выражением лица и освещением.

3. Извлечение признаков (Feature Extraction):

Следующий шаг – формирование векторного представления (эмбеддинга) лица и/или его внешних признаков, ключевых точек. В последнее время для решения этой задачи используют нейронные сети, которые могут автоматически выучивать признаки из больших наборов данных с лицами.

4. Сравнение и классификация (Matching and Classification):

На этом этапе система сравнивает извлечённые признаки с известным набором лиц, заранее загруженным в систему для верификации. Это может быть сделано с использованием различных метрик или алгоритмов классификации.

5. Решение (Decision Making):

На основе степени совпадения система принимает решение о том, кто представлен на изображении, или отвергает совпадение, если уровень уверенности ниже определённого порога.

3. Общие требования к данным

При построении модели ИИ важно обратить внимание на качество данных, так как, если мы подаем на вход модели мусор, то и на выходе мы получим мусор.

В нашем случае формируются наборы данных с эталонной выборкой и выборкой сравниваемых объектов. Мы обозначили общие требования к таким выборкам:

  • отсутствие окклюзии,

  • изображения разного разрешения,

  • разные положения человека в кадре,

  • разная освещенность и обстановка,

  • четкость изображения для выделения параметров лица и ключевых точек.

Окклюзия – это ситуация, в которой два объекта расположены приблизительно на одной линии и один объект, расположенный ближе к виртуальной камере или порту просмотра, частично или полностью закрывает видимость другого объекта [3].

4. Требования к эталонному набору данных

Для формирования эталонного набора данных мы определили следующие требования:

  • спокойное выражение (без экспрессии в выражении эмоций),

  • фон на изображении должен иметь однородную цветовую палитру или быть одноцветным,

  • хорошая освещенность лица – отсутствие наложения тени, которая бы скрывала ключевые характеристики лица,

  • если есть очки, то они должны иметь чистые и прозрачные стекла, чтобы зрачки глаз и радужные оболочки были видны.

Данные требования позволят сформировать эмбеддинг лица человека, который будет полностью характеризовать параметры лица и выделит все его ключевые признаки.

5. Требования к сравниваемым объектам

При формировании выборки данных сравниваемых объектов необходимо учитывать следующие требования:

  • обеспечить поддержку актуальной внешности людей,

  • учесть внешние параметры камеры, такие как различные углы обзора, различные положения камеры,

  • включить в набор динамические параметры, такие как движение сотрудников, изменения выражений лица.

Стоит отметить, что данный набор данных в нашем исследовании мы используем как набор тестовых данных для оценивания качества работы разрабатываемой системы.

6. Результаты тестирования

Мы провели тестирования работы разрабатываемой системы верификации сотрудников на данных Labeled Faces in the Wild [4] для эталонной выборки из 10 человек с 5 и 15 разными изображениями лица для каждого. Количество тестовых данных было примерно 3000 изображений, где около 50% изображений – это известные люди, а остальные 50% изображений – это неизвестные люди.

Мы получили следующие результаты:

  • 5 изображений с учетом требований – accuracy 94.42%, precision 100%,

  • 5 изображений без учета требований – accuracy 86.32%, precision 100%,

  • 15 изображений с учетом требований – accuracy 98.1%, precision 100%,

  • 15 изображений без учета требований – accuracy 94,92%, precision 100%.

В заключение можно сделать вывод, что тщательно выстроенные параметры данных повышают точность верификации лиц и создают основу для надежной и стабильной работы системы. При этом при построении системы можно сократить объем эталонных данных где-то в три раза за счет соблюдения приведенных выше требований. Причем качество останется тем же.

Список источников:

  1. Федорова Е.В. Методы распознавания лиц // EurasiaScience XXVI Международная научно-практическая конференция. – 2019. – С. 136.

  2. Рюмина Е.В., Карпов А.А. Аналитический обзор методов распознавания эмоций по выражениям лица человека // Научно-технический вестник информационных технологий, механики и оптики. – 2020. – С. 2.

  3. Окклюзия [Электронный ресурс] // Википедия – URL: https://ru.wikipedia.org/wiki/Окклюзия (дата обращения 10.12.2023).

  4. Labeled Faces in the Wild [Электронный ресурс] // University of Massachusetts Amherst – URL: https://vis-www.cs.umass.edu/lfw/#deepfunnel-anchor (дата обращения 10.12.2023).

Источник: https://habr.com/ru/articles/791644/


Интересные статьи

Интересные статьи

Вьетнам стал привлекательным направлением для международных инвесторов и предпринимателей, стремящихся расширить свои бизнес-операции в Юго-Восточной Азии. Стабильный экономический рост, благоприятные...
Я технический писатель и я недавно сменил место работы. И так получилось сменил не просто место работы, но и отрасль. Атомная энергетика, сменилась радиоэлектронной промышленностью, а именно волоконно...
У нас на производстве уже несколько лет работает "самодельная" система контроля за простоями на производстве, реализованная на базе MS SQL, SQL Server Reporting Services и IIS. Поскольку эта система д...
В течение длительного времени познание окружающего мира носило бессистемный характер и характеризовалось накоплением отрывочных знаний в разных областях естествознания. Этому способствовал эмпирически...
Самое большое заблуждение начинающих data scientist'ов, или что лучше стоит делать вместо изучения машинного обучения. Читать далее