О чем идет речь? Малоизвестные ошибки систем распознавания лиц требуют такой же проработки и учета, как и любые другие. Ложные данные – нередкое явление этой системы.
На что обратить внимание? Снизить риски поможет правильная организация сбора датасета и работы с нейросетью. Качественные фото, правильное изображение лиц и ряд других методов решают проблемы и повышают эффективность работы.
Оглавление:
Устройство системы распознавания лиц
Распознавание лиц – это возможность систем видеонаблюдения, которая позволяет в автоматическом режиме сопоставлять изображение лица человека, запечатленное на видео или фото, с сохраненными в памяти данными и определять, кто именно находится в кадре. Для работы этой функции используются нейросети. Применяются две разные нейросети. Первая – сеть-выравниватель. Она обрабатывает сохраненный кадр, определяет наличие на ней лиц одного или нескольких человек, вырезает их из кадра и сопоставляет с базой данных.
Алгоритм работы следующий.
- Действие № 1. Нейросеть обрезает изображения лиц, находящихся на снимке, выравнивает их и распознает глаза, нос, иные признаки. При этом могут возникать ошибки, если лица расположены вплотную друг к другу, имеют малый масштаб, повернуты в профиль относительно объектива.
- Действие № 2. Программа идентифицирует отдельные детали лица, поворачивает их в соответствии с заданным алгоритмом.
- Действие № 3. Нейросеть придает фотоизображению требуемый вид. Существуют алгоритмы, составляющие изображение более чем по семи ключевым точкам, то есть обводят овал лица. Эта функция может быть полезна при создании дипфейков.
Вторая используемая нейросеть – это сеть-распознаватель. Она работает с изображением, предварительно подготовленным предыдущим алгоритмом. После обработки эта программа формирует вектор лица, представляющий собой набор чисел фиксированной длины. В разных программах векторы свои, обычно они выражаются определенной степенью двойки, например 512. Если в базе данных сохранены изображения с похожими векторами, то они выдаются пользователю в результатах совпадения.
Для примера используем фото Владимира Машкова и два фото Сергея Безрукова, которые пропустим через нейросеть. По каждому из них будет составлен вектор. Если сравнить расстояние между векторами Машкова и Безрукова и между двумя Безруковыми, то в первом случае разница будет значительная, поскольку используются фото двух разных людей. Во втором случае расстояние будет минимально, так как обработаны два фото одного человека.
Чтобы научить нейросеть распознавать лица, требуются миллионы фотографий. Изначально в систему вводятся данные, кому принадлежит то или иное изображение. В процессе обучения нейросеть обретает способность генерировать все более точные результаты. После тестирования на миллионах изображений сеть может определять даже те лица, которых изначально не было в базе.
Программа FaceID, используемая в смартфонах, работает по иному алгоритму. Она использует ряд ключевых инфракрасных точек лица, которые проецируются через камеру. Созданная таким образом трехмерная модель сопоставляется с той, что сохранна в памяти устройства.
Стандарты работы систем распознавания лиц
Совместный технический комитет (ISO/IEC JTC 1) Международной организации по стандартизации и Международная электротехническая комиссия, разрабатывающая усовершенствованный стандарт ISO/IEC 24358, отмечают отдельные ошибки, которые могут влиять на точность автоматического распознавания лиц.
Скачивайте и используйте уже сегодня:
10 шагов, которые помогут выбрать добросовестного подрядчика
Поможет сохранить бюджет и уложиться в сроки проекта
Новый стандарт ляжет в основу биометрических программ следующего поколения и позволит повысить качество распознавания лиц, минимизировать вносимые программой изменения в исходные фото, поможет исключить подделку и неправомерное изменение изображений.
Малоизвестные ошибки систем распознавания лиц
Эксперты обращают внимание на следующие малоизвестные ошибки систем распознавания лиц.
- Основная масса изображений лиц формируются с помощью видеокамер, которые сами не выполняют функцию распознавания. В этом их уязвимость по сравнению, например, с дактилоскопической идентификацией, позволяющей точно определить тип изображения, которое необходимо собрать. Если лица двух людей расположены непосредственно рядом друг с другом или лицо изображено на одежде человека, попавшего в объектив, то ошибки идентификации могут быть достаточно серьезными.
- Важно, чтобы эталонное изображение, которое загружается в базу, было корректным: без эмоций, мимики, хорошо равномерно освещено, без грима, очков и т. п. Чем дальше от «идеала» эталон, тем ниже вероятность распознавания.
- Определение качества и пригодности для идентификации выполняется отдельно от момента съемки. Обычно изображение собирается и передается программе, выполняющей непосредственное распознавание. При недостаточном качестве изображений получение новых происходит по прошествии некоторого периода и влечет дополнительные издержки.
- Важно , чтобы камера сформировала изображение максимально приближенное к эталону. Помимо очков, маски и пр., играет важную роль выбор правильного расположения камеры, т. к. в том числе и ракурс влияет на точность распознавания.
- Доверие к уровню точности распознавания. Технологии идентификации лиц изучены достаточно подробно, их эффективность подтверждена экспериментальным путем. Однако аналогичных исследований в части улучшения качества исходных изображений не проводилось.
- Для автоматической и ручной идентификации требуются фото разного качества. Если ручное распознавание осуществляется по фото с высокой детализацией, то нейросети используют стандартные фронтальные проекции с пониженным разрешением.
Решение этих проблем – вовсе не теоретическая задача. Рассмотрим, как они влияют на процесс распознавания лиц.
Проблема?1.?Определение?рисков неточной идентификации
В биометрическом программном обеспечении используется стандарт оценки эталонного качества, разработанный Национальным институтом стандартов и технологий (NIST) при Министерстве торговли США. Он включает в себя несколько тестов, в создании которых задействованы почти все ведущие разработчики ПО в данной отрасли. Алгоритмы этого стандарта тестируются на быстроту и качество обработки на основе нескольких отдельных фотобанков, имеющих разное состояние исходных изображений и широкий диапазон ошибок.
Так, неточности типа FNMR (false non-match rate) одного теста на базе VISA Photos и WILD Photos при неизменном FMR (false match rate) могут показывать разительно отличающиеся результаты. Возникает проблема: какая степень ошибок может считаться допустимой при определении рисков неточной идентификации?
Проблема?2.?Оценка?точности распознавания на своем?датасете
Может быть, эта проблема не столь актуальна, если в распоряжении имеются многомиллионные датасеты. Если же пользователь располагает своей базой данных, то оценить качество работы алгоритма в определенной ситуации становится сложнее. Непросто выявить долю ошибок здесь и сейчас. Также нужно принимать во внимание, что на результат работы алгоритма влияет раса, демографическая группа изображенных людей.
Решить проблему может формирование собственной тестовой базы данных, ее разметка и составление ROC-кривых. Однако выполнение этой задачи может растянуться на несколько месяцев, и нет гарантий, что объем фотобанка даст возможность оперировать оценкой ошибок десять в минус шестой степени.
Рекомендации по использованию систем распознавания лиц
Во избежание ошибок пользователям систем идентификации лиц следует придерживаться нескольких правил.
- Правильное определение точки установки камеры для выполнения задачи. Именно отсюда начинается причина снижения вероятности корректного распознавания. В реальности часто в той точке, откуда было бы идеально решать задачу наблюдения, камеру установить просто невозможно физически, начинается поиск компромисса.
- Используйте быстродействующие и кроссплатформенные сервисы определения качества изображений. Желательно, чтобы они могли сразу оценить возможную долю ошибок при распознавании.
- Отдавайте предпочтение разработчикам, предоставляющим собственный алгоритм тестирования на датасетах клиента, а также готовым предоставить фрагмент датасета для добавления к своему фотобанку.
- Не жалейте средств на оптику. Если используется одно фото человека, то на формирование качественного фотобанка рассчитывать не приходится.
Программы идентификации все еще содержат малоизвестные ошибки систем распознавания лиц. Однако технологии не стоят на месте. Кроме того, долю ошибок вполне можно просчитать и оптимизировать.