Как различают лица человек и компьютер и чего ждать в скором будущем

Новости Приватность Спецпроекты Технологии

В 2010 году владельцы самой большой базы лиц в мире — Facebook — научились отличать портрет от пейзажа и выделять область лица на фотографии. Иногда у них это получалось плохо. Спустя четыре года Facebook может с точностью до 97% определить, кто изображен на фотографиях — один человек или разные люди.

Прогресс очень значительный, но алгоритм крупнейшей соцсети до сих пор проигрывает людям в 3% случаев. Если нас попросят опознать хорошо знакомого человека в необычном ракурсе на снимке плохого качества, то мы все равно справимся с задачей лучше машины.

И это довольно необычно, ведь чаще всего компьютер гораздо точнее человека. Так почему мы лучше решаем такие задачи и как это пытаются делать машины?

Тренированный мозг

Оказывается, за распознавание лиц у нас отвечает целая зона мозга на границе затылочной и височной долей — ее называют веретеновидной извилиной. Человек учится узнавать лица буквально с рождения. Новорожденные младенцы развивают этот навык с первых дней жизни и уже в четыре месяца могут четко отличить одного дядю от другого — и тетю, конечно, тоже.

Глаза, скулы, нос, рот и брови являются ключевыми чертами лица, помогающими нам узнавать друг друга. Немалую роль играет также кожа — ее текстура и пигментация. Кроме того, наш мозг обрабатывает лицо как единое целое. Поэтому если мы прикроем половину портрета листом бумаги, то все равно узнаем изображенного человека. А вот если сделать несложный коллаж, совместив лица двух разных людей, мы далеко не сразу поймем, кто есть кто на картинке.

Как различают лица человек и компьютер, и чего ждать в скором будущем

Вот что получится, если совместить портреты Брэда Питта и Анджелины Джоли

С рождения наш мозг коллекционирует лица. Постепенно мы неосознанно формируем усредненный шаблон, от которого и отталкиваемся, когда пытаемся отличить одно лицо от другого. Если бы этот шаблон можно было визуализировать, он выглядел бы примерно так:

Распознавание лиц происходит в тот момент, когда мозг сравнивает полученную картинку с внутренним шаблоном и находит характерные отличия: нос шире, губы уже, кожа розоватая или золотистая. Поэтому редко путешествующим людям иногда кажется, что представители другой расы «все на одно лицо»: наши внутренние шаблоны настроены на черты лица, характерные для нашего окружения.

Кстати, некоторые животные тоже умеют распознавать мимику и лица — например, обезьяны и собаки. Хотя чаще всего в идентификации другого живого существа им помогает нюх, визуальная картинка также позволяет им больше понять о людях и других животных. Что интересно, друг человека — собака не только понимает смысл нашей улыбки или плача, но и сама со временем учится улыбаться.

Как распознает лица компьютер

Как улыбки связаны с умением распознавать лица? На самом деле они практически неразделимы, ведь любое мимическое изменение преображает наше лицо до неузнаваемости и вызывает сбой в работе компьютерных алгоритмов распознавания лиц.

Уже давно существуют программы, которые могут взглянуть на два фронтальных портрета и определить, что на них изображен один и тот же человек. Такой софт ищет то же, что и портретист: так называемые опорные точки на лице человека, из которых складываются индивидуальные черты. В различных методиках число отличается: кто-то выделяет 80, а кто-то 150 таких точек.

Самыми важными измерениями для художников и программ распознавания лиц являются расстояние между глазами, ширина ноздрей и длина носа, высота и форма скул, ширина подбородка, высота лба и так далее.

Стоит повернуть голову в сторону и сменить ракурс, как эти параметры изменятся, и программа не сможет определить, что перед ней тот же человек. Хотите остаться инкогнито? Наденьте очки, чтобы скрыть глаза и скулы, или натяните шарф на рот и подбородок — так вы сможете сохранить анонимность. Когда мы тестировали скандально известный сервис FindFace, он узнал модель только на портретах анфас.

Так работают системы распознавания лиц, анализирующие изображения в двухмерном пространстве. Вот только ничто не вечно под луной, и разработка более совершенных алгоритмов уже ведется вовсю.

Что будет дальше?

Наш мозг обучается узнавать людей по мере взросления. Способность отличить «своего» от «чужого» — это один из ключевых навыков, необходимых ребенку для выживания. Современные компьютеры тоже способны учиться. Чтобы повысить качество распознавания лиц, разработчики используют самообучающиеся алгоритмы, а учебником для них служат наши с вами фотографии, выложенные в соцсетях, на сайтах для обмена фотографиями, опубликованные в онлайн-журналах и на других ресурсах.

Идентификация человека по лицу стала гораздо проще, когда алгоритмы начали плотно работать с 3D-моделями. Составив на базе нескольких фотографий трехмерный слепок головы человека, программа сможет представить его лицо в любом ракурсе. Кстати, шаблоны в мозгу человека тоже трехмерные. Хотя эта технология еще только развивается, уже сейчас на рынке можно найти несколько коммерческих решений.

Изучение мимики также приносит свои плоды. Реалистичная отрисовка эмоций — это клад для индустрии видеоигр, за которым давно открылась большая охота. В этом направлении уже сделано немало — вы можете в этом убедиться, посмотрев трейлеры к выпускаемым играм. Но эта же технология пригодится и системам распознавания лиц — освоив человеческую мимику, они научатся понимать, что эту рожицу на снимке, скорее всего, скорчила вот та девочка, идущая по улице.

Помимо 3D-моделей разработчики исследуют и другие направления. Например, компания Identix создала биометрическую технологию распознавания лиц FaceIt Argus, которая анализирует текстуру кожи — линии, поры, шрамы и тому подобное. Создатели FaceIt Argus заявляют, что их программа может различать даже идентичных друг другу близнецов. По словам производителя, технологию не собьют с толку ни очки, ни рожицы. Используя FaceIt Argus вместе с традиционной системой распознавания лиц, можно увеличить точность работы программы на 20-25%.

С другой стороны, эта технология не работает, если предложить ей фотографии низкого качества, сделанные при плохом освещении.

Но для этого случая создаются другие технологии. Разработка специалистов из института технологий города Карлсруэ, Германия, позволяет узнать человека, сфотографированного в полной темноте или при плохом освещении на инфракрасную камеру.

Данная технология может сопоставить портрет человека, снятый в среднем или дальнем инфракрасном диапазоне, со снимком при нормальном освещении с точностью 80%. Достигается это с помощью анализа тепловой сигнатуры человека.

И это не так просто, как может показаться: дело в том, что прямого соответствия между тем, как лицо выглядит при дневном и инфракрасном освещении, нет. Картинка, которая возникает при отражении света нашей кожей, сильно отличается от изображения, сформированного при измерении излучаемого телом тепла. Интенсивность теплового излучения сильно зависит от температуры кожи, окружающей среды и настроения человека. Кроме того, инфракрасные снимки обычно отличаются более низким разрешением, чем обычные фотографии, что еще больше усложняет задачу.

Чтобы решить эту проблему, ученые обратились к алгоритму машинного обучения и «скормили» компьютеру 1586 фотографий, принадлежащих 82 людям.

Далее — везде

Сегодня технологии распознавания лиц используются практически повсеместно. Китайский Uber недавно внедрил такое решение, чтобы держать под контролем собственных таксистов. NEC и Microsoft работают над технологией, которая позволит маркетологам узнать своих клиентов еще ближе. А тролли с «Двача» используют сервис распознавания лиц для травли российских порноактрис.

Развитие технологии распознавания лиц заставит человечество пересмотреть все, что ему известно о конфиденциальности и праве личности на частную жизнь. Произойдет это не сегодня и даже не через год, но готовиться надо уже сейчас. Если вам интересно, до какого абсурда может довести вторжение технологий в реальности, рекомендуем сериал «Черное зеркало», особенно фильм второй — «15 миллионов призов».