Оглавление:
- Суть системы распознавания лиц
- Устройство системы распознавания лиц
- Мифы про систему распознавания лиц
- Технологии систем распознавания лиц
- Сферы применения систем распознавания лиц
- Реализация системы распознавания лиц в рамках СКУД
- Требования к системе распознавания лиц для СКУД
- Технические параметры и места установок камер для распознавания лиц
- Проблемы применения системы распознавания лиц
Системы распознавания лиц – это уже не экзотика из фантастических романов, а реальность, окружающая практически каждого из нас. И речь не только о массовом видеонаблюдении и верификации, как в Китае, но и о знакомых всем программах распознавания в смартфонах. Однако, несмотря на схожесть задач, принципы работы у этих решений разные.
Будет заблуждением считать, что внедрение системы распознавания лиц в рамках СКУД (системы контроля и управления доступом) – панацея и гарантия безопасности. Несмотря на распространенность и постоянные улучшения, они все еще часто ошибаются. В нашей статье мы расскажем, как работает софт по распознаванию лиц, какие задачи оно может решать и разберемся с техническими требованиями к данным системам.
Суть системы распознавания лиц
Что представляет собой система распознавания лиц? Это специализированная программа, с помощью которой лицо на каком-либо изображении выделяется автоматически, а затем происходит сопоставление и анализ его биометрических данных. Это необходимо для того, чтобы идентифицировать персону.
Лицо каждого из нас уникально. Именно поэтому качественная программа для распознавания легко обнаружит его на фотографии или в видеоряде, проанализирует, прогонит по имеющейся базе биометрических данных и предоставит информацию по конкретному человеку.
Устройство системы распознавания лиц
Как работает система распознавания лиц? Программа базируется на двух нейросетях.
Первая из них носит название сети-«выравнивателя» (от англ. aligner). Она определённым образом обрабатывает изображение, поступающее с камеры наблюдения: обнаруживает все имеющиеся в видеоряде человеческие лица, «вырезает» и «выравнивает» их.
Процесс осуществляется в несколько этапов:
- Программа вырезает лица, которые смогла распознать. Человеческие лица, расположенные слишком близко друг к другу, повёрнутые в профиль либо просто маленькие и размытые, не всегда обнаруживаются детектором.
- Лица выравниваются посредством обозначения на них точек глаз, носа и рта.
- На последнем этапе изображение поворачивается и подгоняется по размеру определённым образом — так, чтобы точки глаз, носа и рта заняли соответствующее положение.
Существуют продвинутые алгоритмы, использующие больше семи точек, что позволяет полностью обвести контуры лица. Это может потребоваться, например, для создания дипфейков.
Вторая нейросеть носит название «распознавателя». Она принимает изображение, выравненное на первых этапах, обрабатывает его и выдаёт вектор человеческого лица — набор чисел, имеющих фиксированную длину. У разных нейросетей показатели могут быть различны, но в большинстве случаев вектор составляет ту или иную степень числа 2. Для человеческих лиц, похожих друг на друга, и векторы будут вычисляться сходные.
Чтобы лучше понять, как работает система распознавания лиц, разберём это на конкретном примере.
Возьмём одну фотографию Моники Беллуччи и две фотографии Хью Джекмана, обработаем все три изображения с помощью нейросетей, описанных выше. Получим три разных вектора. Измерим расстояние: между векторами Моники и Хью, а также между двумя векторами Хью. В первом случае разница будет велика, поскольку речь идёт о разных людях, во втором же расстояние будет совсем небольшим.
Для обучения нейросетей требуются крупнейшие базы данных с человеческими лицами. На первом этапе нейросеть сообщает, какой персоне принадлежит то или иное лицо, а уже впоследствии, в процессе обучения, совершенствует свой алгоритм для выдачи максимально точных результатов. Только после «тренировки» на миллионах людей нейросети начинают распознавать новые лица, не занесённые в базу.
У технологии Face ID, встроенной в смартфоны, несколько иной принцип действия. Её алгоритм идентифицирует человека не по фотографии, а посредством множества инфракрасных сигналов, проецируемых на лицо владельца устройства через объектив камеры. Затем строится трёхмерная модель и сравнивается с изначальной (т.е. внесённой ранее).
Мифы про систему распознавания лиц
С момента своего появления система распознавания лица человека успела обрасти множеством мифов. Разберём самые распространённые.
- Информация, полученная в результате идентификации биометрических признаков, может быть украдена.
Это ошибочное мнение. Дело в том, что биометрические данные любого человека не хранятся в базах данных в чистом виде: современные системы контроля и управления доступом (СКУД) преобразуют их в специальный цифровой код, с использованием которого невозможно восстановить индивидуальные параметры человека. Все сведения, включая отпечатки пальцев и прочие личные характеристики, остаются закрытыми.
- В устройствах, сканирующих радужную оболочку глаз, применяются лазерные технологии.
На деле ситуация обстоит иначе. Специальная камера, распознающая данные с сетчатки, делает серию снимков на расстоянии шестидесяти сантиметров от глаза, применяя при этом инфракрасное освещение. Оно практически незаметно и не наносит никакого вреда нашим глазам.
- Биометрические параметры уязвимы для фальсификации.
Даже несмотря на колоссальный технический прогресс, совершенных программ не существует. Да, если поставить конкретную цель, возможно, удастся подделать геометрию лица или радужную оболочку. Вопрос в другом: есть ли в этом смысл?
Современные системы распознавания лиц оснащены довольно надёжными защитными механизмами. Если же речь идёт о бюджетных программах, то проблема не в том, что их можно подделать: они неидеальны сами по себе. Кроме того, стоит помнить, что на практике действует ряд решений, направленных на защиту систем биометрического распознавания от фальсификации как на программном, так и на аппаратном уровнях.
- Системы распознавания лица человека стоят баснословных денег.
Это неоднозначный вопрос: всё зависит от устройства. Если клиент хочет добиться комфортного использования, а вопрос безопасности для него не в приоритете, вполне можно обойтись стандартными системами идентификации, стоимость которых не выше, чем СКУД на базе smart-карт. Если же необходимо гарантировать не только удобство, но и абсолютную безопасность применения технологии, то и цена будет на порядок больше.
Скачивайте и используйте уже сегодня:
10 шагов, которые помогут выбрать добросовестного подрядчика
Поможет сохранить бюджет и уложиться в сроки проекта
Технологии систем распознавания лиц
2D-распознавание лиц
Технология двумерного распознавания лица человека основывается на плоских изображениях. Её алгоритмы применяют антропометрические параметры, графы (т. е. обычные или эластичные 2D-модели лиц), а кроме того — изображения человеческих лиц, представленные определённым набором физических или математических признаков.
Данная технология является одной из самых востребованных в мире, поскольку в подавляющем большинстве имеющихся в настоящее время баз данных распознанных человеческих лиц хранятся именно двумерные изображения.
Основное преимущество 2D-распознавания лиц заключается в наличии не только готовых баз данных, но и уже отлаженной инфраструктуры. Именно по этой причине максимальный спрос приходится на данный сегмент, что, в свою очередь, стимулирует разработчиков и дальше совершенствовать свой продукт.
Однако у двумерной технологии идентификации имеется и весомый недостаток: она допускает более высокие коэффициенты ошибок FAR и FRR в сравнении с 3D-распознаванием лиц.
3D-распознавание лиц
В 3D-системе распознавания лица человека используются реконструированные трёхмерные модели. Эта технология может похвастаться более высокими качественными характеристиками в сравнении с двумерной, но всё равно остаётся несовершенной.
В настоящее время на мировом рынке представлены несколько различных устройств для 3D-идентификации: это лазерные сканеры, в которых оценивается расстояние от сканера до человеческого лица; специальные сканеры, оснащённые структурированной подсветкой поверхности лица и производящие математическую обработку изгибов полос; сканеры, в основе функционирования которых заложен фотограмметрический метод обработки синхронных стереопар изображений лиц.
К несомненным достоинствам трёхмерного распознавания можно отнести высокую точность и небольшое количество ошибок, которого пока не получается достигнуть в 2D. Однако у 3D-сканирования есть и ряд минусов:
- Специалист может без особых трудностей подделать результаты. Если перед вами стоит задача защитить свой ПК, ноутбук, телефон или помещение от незаконного проникновения, использовать 3D не рекомендуется: такую систему легко взломать.
- Системы трёхмерной идентификации должны оснащаться специальными камерами для сканирования, чья стоимость гораздо выше обычных камер, применяемых в двумерном распознавании.
- Нет готовых баз данных с распознанными человеческими лицами.
Не стоит забывать и о таком нюансе, как идентификация лиц близнецов — она всё ещё остаётся довольно нетривиальной задачей. В данный момент в мире на тысячу родившихся детей приходится порядка тринадцати близняшек (данные сильно колеблются в зависимости от региона).
Идентификация лица по текстуре кожи
Высокое разрешение изображений — ещё один плюс современных технологий, благодаря которому стало возможным серьёзное усовершенствование систем распознавания лиц. В данном случае речь идёт о детальном анализе текстуры человеческой кожи.
В процессе этого анализа конкретная часть лица захватывается как изображение, а потом разбивается на несколько маленьких блоков, трансформируемых в математически измеримые пространства, в которых записываются линии, поры, морщинки — словом, фактическая кожная текстура.
Именно эта технология делает возможным распознавание различий между близнецами, что пока невозможно для обычных систем идентификации.
Распознавание лица по тепловизионному изображению
В настоящее время применение тепловизионных камер для идентификации человеческих лиц является весьма перспективным направлением для разработки, однако готовых для внедрения технических решений ещё не появилось.
Тепловизионные технологии, как ожидается, должны нивелировать множество болевых точек двумерного сканирования, таких как:
- идентификация лиц в полной темноте либо в условиях плохой освещённости;
- макияж, причёска с длинными волосами, густая борода, шляпа, тёмные очки — всё это перестанет быть помехой;
- появится возможность распознавания лиц близнецов.
Разработка тепловизионных систем распознавания лица человека ведётся в двух основных направлениях:
- Идентификация по предварительно сформированным термограммам распознанных лиц. Основные проблемы те же, что и в 3D-технологиях: отсутствуют готовые базы данных, оборудование стоит дорого.
- Идентификация по изображениям, полученным с помощью тепловизионной камеры. В качестве лиц для эталона применяются базы данных стандартных плоских изображений. Вопрос совместимости решается с помощью глубоких нейронных сетей.
Как становится понятно, можно долго говорить о перспективах этих направлений, но в текущий момент тепловизионное сканирование работает только в экспериментальных лабораториях, причём результаты далеки от совершенства.
Сферы применения систем распознавания лиц
- Соблюдение правоохранительных норм.
Системы идентификации человеческих лиц активно внедряются органами защиты правопорядка. Особенно распространена технология в Штатах. Полицейские собирают фотографии задержанных граждан, прогоняют их по местным, государственным и федеральным базам данных сканирования лиц. Затем изображения нарушителей правопорядка добавляются в базы данных, по которым полиция в будущем сможет без труда найти преступника.
- Аэропорты и пограничный контроль.
Идентификация лица — процедура, которая уже довольно долгое время является привычной в аэропортах большинства стран. Многие авиапутешественники успели обзавестись специальными биометрическими паспортами. Благодаря им людям не приходится стоять в длинных очередях: контроль осуществляется автоматически. Такие паспорта не только заметно сокращают время ожидания, но и выводят показатели безопасности на качественно новый уровень.
- Поиск пропавших без вести.
Системы распознавания лица человека успешно применяются в ситуациях, когда требуется найти пропавшего человека или жертв работорговли. Допустим, пропавшие люди числятся в базе данных распознавания лиц. В таком случае в органы защиты правопорядка может быть направлено соответствующее уведомление — сразу после того, как эти люди будут опознаны системой в любом общественном месте.
- Снижение уровня преступности в розничной торговле.
Сканирование человеческих лиц может пригодиться в случае, когда требуется обнаружить недобросовестных покупателей, ворующих товары в супермаркете. Это весьма эффективно: преступников-рецидивистов удастся распознать ещё на входе в торговый зал. Изображения посетителей прогоняются по уже сформированным базам данных, и в тот самый момент, когда покупатель, представляющий потенциальную угрозу, зайдёт в супермаркет, охрана получит уведомление, а значит, сможет предотвратить возможную угрозу.
- Банки.
Ещё один несомненный плюс в пользу технологии распознавания лиц заключается в том, что она делает возможным биометрический онлайн-банкинг. Вместо того чтобы тратить время на ввод сложных паролей, вы можете просто посмотреть в камеру своего смартфона или ПК, и система распознает вас.
Ни один злоумышленник не сможет взломать такую защиту. Даже если база данных будет украдена, то «оценка витальности» — метод, применяемый для определения, является ли носитель биометрических данных живым человеком, или это всего лишь изображение — в теории должна помешать хакерам использовать фотографии из базы для имитации реального пользователя.
- Маркетинг и реклама.
В этой области идентификация применяется для повышения качества обслуживания клиентов. Так, популярный бренд замороженной пиццы DiGiorno использовал сканирование в своей маркетинговой кампании в 2017 году. Как работала система распознавания лиц в этом случае? Проводился специальный анализ выражения лиц посетителей на мероприятиях, посвящённых бренду — это было нужно для того, чтобы определить эмоциональные реакции клиентов на пиццу.
- Здравоохранение.
Сканирование лиц также может применяться в больницах с целью оказания помощи пациентам. Уже в наши дни некоторые медицинские учреждения проводят испытания систем распознавания лица человека для доступа к медкартам, упрощения процесса регистрации посетителей, определения боли и эмоционального состояния у тяжёлых больных. Кроме того, технология помогает обнаружить некоторые генетические заболевания.
- Мониторинг посещаемости студентов или работников.
Ряд китайских учебных заведений успешно применяет технологию сканирования для контроля пропусков занятий. Используются специальные планшетные компьютеры, которые распознают лица студентов и прогоняют их по базе данных для подтверждения личности. В широкой перспективе сканирование можно применять и для регистрации сотрудников на их рабочих местах — так начальство сможет без труда определять прогульщиков и опаздывающих.
- Распознавание водителей.
Как утверждают потребительские отчёты, уже сейчас многие автомобильные компании проводят эксперименты с системами распознавания лиц, чтобы внедрить их на место привычных ключей от машины. Ко всему прочему, технология способна запоминать личные предпочтения владельцев авто: в каком положении они держат кресла и зеркала, какую радиостанцию слушают во время поездки.
Реализация системы распознавания лиц в рамках СКУД
В настоящее время выделяют три основополагающих принципа, согласно которым создаются системы распознавания лица человека.
- Локальный контроль и обработка информации, поступающей с камеры видеонаблюдения, на ПК. Такие устройства незаменимы на контрольно-пропускных пунктах и терминалах, к примеру, на проходной какого-либо промышленного комплекса. Это очень удобно, поскольку полученные сведения отправляются прямиком в табель учёта рабочего времени. Такая реализация носит локальный характер и используется только для местного контроля.
- Удалённая обработка информации, поступающей с IP-видеокамер. В данном случае видеоряд обрабатывается на удалённом сервере, оснащённом необходимым ПО.
-
Обработка данных непосредственно в видеокамере. При таком способе реализации обработанная информация поступает на сервер практически в чистом виде. В большинстве случаев связка «камера — сервер» оснащена соответствующим ПО, которое разработано специально для конкретной видеокамеры с функцией сканирования.
Однако у этой технологии имеется весомый недостаток: видеокамеры стоят очень дорого. Впрочем, сэкономить можно на сервере взаимодействия, поскольку часть работы по распознаванию осуществляется встроенным в камеру ПО (оно представляет собой гибрид аппаратно-программной реализации).
Требования к системе распознавания лиц для СКУД
Существует перечень определённых требований, предъявляемых к системам распознавания лиц. Далее мы рассмотрим основные из них.
Время прохождения через турникет
Это ключевая характеристика. Она особенно важна в ситуациях, когда какое-либо учреждение насчитывает большое количество персонала или посетителей. Если на сканирование каждого лица потребуется много времени, это приведёт к большой очереди на пропускном пункте. Время прохождения через турникет суммируется из следующих алгоритмов, которые должна выполнить система: сканирование и оцифровка, передача изображения на сервер, формирование шаблона, его сопоставление с полученным изображением и, наконец, открытие турникета.
Чтобы добиться приемлемого времени прохождения (не больше полутора секунд), требуется обеспечить слаженное и быстрое совершение всех перечисленных операций. Быстродействие не представляется возможным без использования Ethernet-технологий: именно они облегчают подключение устройств, масштабируют систему и гарантируют хорошую скорость передачи данных. Применение протокола RS-485 для связи контроллеров СКУД, увы, не позволит добиться желаемого быстродействия общей системы.
Процент распознавания лица
Чтобы система сканирования лиц в СКУД использовалась легитимно, она должна иметь высокие показатели распознавания. Большинство клиентов требуют, чтобы они составляли не менее 99 %.
Разумеется, без должного технического оснащения, подбираемого индивидуально для каждого случая, такого процента добиться не выйдет: места расположения видеокамер отличаются друг от друга, разнится также и уровень освещённости точек прохождения посетителей. С другой стороны, если изображение человека получено при помощи конкретной камеры, то и вероятность идентификации ею же достигает необходимых 99 %.
Стоит учитывать, что с годами человеческие лица претерпевают естественные возрастные изменения. Меняются причёски, люди используют яркий макияж, надевают головные уборы и очки ? всё это добавляет трудностей при идентификации.
В данном контексте перспективным представляется использование адаптивных шаблонов лица Fine Pattern: они автоматически подстраиваются под минимальные изменения во внешности. Шаблоном служит не одно изображение лица, а сразу несколько. Затем изображения сравниваются между собой, и худшее заменяется лучшим.
Важной характеристикой также является удобство внесения распознанных лиц в базы данных. Так, самым эффективным считается режим обучения системы, благодаря которому лицо попадает в базу автоматически, при первом поднесении карты к считывателю на проходной, и уже затем готовый шаблон применяется для сканирования посетителя и распознавания его лица на других проходных.
Это оптимальный вариант: не потребуется участие оператора бюро пропусков и инженеров обслуживающих организаций, достаточно всего лишь выдать именные карты.
Идентификация по нескольким признакам
Как работает система распознавания лиц? Она идентифицирует человека сразу по нескольким параметрам. В большинстве случаев заказчики, желающие установить систему сканирования, предъявляют высокие требования к СКУД и ожидают от монтажной бригады, что она обеспечит многофакторную идентификацию.
Для этого необходимо заблаговременно удостовериться в том, что выбранная система осуществляет распознавание по лицу, отпечаткам пальцев, Proximity-карте, наборному коду, номеру автомобиля, а результаты сканирования подтверждаются оператором — и всё это комплексно, в рамках процесса аутентификации одного посетителя.
Расширение базы данных
Ещё один немаловажный момент. Чем больше распознанных лиц хранится в базе, тем эффективнее работает система сканирования. При этом прирост числа распознанных пользователей не должен увеличивать время поиска и, как следствие, время прохода через турникет. Чтобы добиться оптимального функционирования, используемые в системе распознавания по лицу СУБД должны быть реализованы на основе Oracle или MS SQL Server.
Технические параметры и места установок камер для распознавания лиц
- Угол установки
Камера видеонаблюдения монтируется с отклонением центральной оси, не превышающим 15 градусов к плоскости лица человека. Эта цифра должна соблюдаться в любой точке области распознавания.
- Плотность пикселей
Для эффективного сканирования человеческих лиц необходима плотность пикселей не меньше 500 pix/м во всей потенциальной области распознавания. Именно от этого показателя зависят разрешение и угол обзора видеокамеры.
- Глубина резкости
Это обязательное требование: глубина резкости должна покрывать всю зону контроля. Данный показатель непосредственно определяется фокусным объективом и значением диафрагмы. Отсюда следует, что необходимо заблаговременно рассчитывать глубину резкости для каждого отдельно взятого случая, отдавать предпочтение видеокамерам, которые позволяют управлять диафрагмой.
- Значение времени накопления заряда
Чтобы полученное изображение было чётким, время накопления заряда (выдержка) должно составлять не больше 1/100 секунды.
- Источник изображения для распознавания лиц
Желательно отдать предпочтение камере с хорошей светочувствительностью (матрица от 1/3 и больше) и оснащённой светосильным объективом (от F1,4 и лучше).
- Требования к освещению
Освещение в контрольно-пропускной зоне должно быть хорошим и ровным (от 150 люкс). Обеспечить такие параметры довольно трудно: потребуется подходить к каждому объекту индивидуально. Допустим, нередко случается так, что контроль посетителей осложняется из-за засветки видеокамеры уличным освещением.
- Нейтральный задний фон
Как и для любой фотографии в БД, для видеокамеры нужно обеспечить изображение с нейтральным однотонным задним планом. Соблюсти это условие сложнее всего, особенно если речь идёт о распознавании лиц в толпе.
Проблемы применения системы распознавания лиц
Поскольку система распознавания лица человека всё ещё остаётся технологией, далёкой от совершенства, её использование сопряжено с рядом трудностей. Вот основные из них.
- Ошибки в распознавании
2018 год отметился курьёзом для США: технология распознавания лиц от Amazon ошибочно идентифицировала 28 членов Конгресса как преступников. Сравнительно недавно подобный инцидент произошёл и в России — москвича Сергея Межуева задержали как преступника в розыске, собрали все данные о нём и не отпускали до тех пор, пока настоящий подозреваемый не был найден. А виной всему — ошибка системы сканирования лиц в метрополитене.
- Использование лиц без согласия
До некоторых пор в Америке для обучения нейросетей аутентификации применяли датасеты с человеческими лицами из открытых источников, причём датасеты тоже находились в свободном доступе. В настоящее время их убрали, поскольку это прямое нарушение закона о персональных данных. Теперь получить доступ к датасетам можно только по запросу и для некоммерческой деятельности.
The New York Times опубликовала расследование, согласно которому система распознавания лиц Clear View использует фото из Twitter, чтобы помогать полиции находить людей. Аналогичные претензии были и к NtechLab: у компании был доступ к фото пользователей в «ВКонтакте».
- Дискриминация и расизм
Нетрудно догадаться, что для обучения нейросетей применяются в большинстве своём подборки фотографий людей «титульной» нации и расы. В конечном счёте системы распознавания лиц плохо справляются (или не справляются совсем) с идентификацией азиатов, латиноамериканцев и афроамериканцев. Как показывает статистика, применяемые в криминалистике системы сканирования гораздо чаще опознают чернокожих людей как потенциальных преступников.
Кроме того, исследование MIT от 2018 года показало, что алгоритмы Microsoft, IBM и китайского Megvii (FACE ++) очень часто ошибаются при идентификации темнокожих женщин по сравнению со светлокожими мужчинами.
- Использование системы для манипулирования людьми
Попав в руки властей, системы для аутентификации человека открывают им доступ к практически неограниченному контролю. Наглядный пример — Китай.
В Китае действует так называемый социальный рейтинг, или кредит. Каждому человеку присваиваются баллы за какую-либо общественно полезную работу, отсутствие правонарушений, своевременную уплату налогов. За каждое нарушение баллы списываются — рейтинг может не просто упасть до нуля, но даже уйти в минус. Это, в свою очередь, влечёт за собой отказ в выдаче кредитов или социальных выплат, запрет на вылет из страны, невозможность устройства на работу в определённые организации и пр.
Подводя итог, можно сказать следующее: да, система распознавания лиц работает, и работает достаточно эффективно, но для её усовершенствования требуются ещё годы разработок и экспериментальных исследований. В настоящее время система функционирует без огрехов только в идеальных условиях, достичь которых на практике (за пределами лаборатории) не представляется возможным.
Очень важно предварительно определить стоимость ошибки. Если она не повлечёт за собой никаких серьёзных последствий — смело вызывайте монтажников и внедряйте систему идентификации. Если же вы не готовы к просчётам системы, которые ставят под сомнение целесообразность её эксплуатации, следует заранее обсудить со специалистами все возможные тонкости и проблемы. Нелишним будет проведение тестирования технологии прямо на объекте.