Книга: Hello World. Как быть человеком в эпоху машин
Назад: Кто ты, по-твоему?
Дальше: Подводим баланс

Один на миллион?

Сами алгоритмы используют один из двух подходов. В первом строится объемная модель лица – либо наложением множества плоских изображений, либо с помощью сканирования лица специальной инфракрасной камерой. Так работают идентификаторы лица в айфонах. Такие алгоритмы научились уходить от трудностей, связанных с изменением выражения лица и старением, – для них важнее всего те зоны лица, где есть твердые ткани и кости, например, изгибы орбиты глаза и валика носа.

По заверениям Apple, шансы на то, что кто-нибудь взломает ваш айфон с помощью идентификатора лица, составляют один на миллион, однако алгоритм небезупречен. Его могут обмануть близнецы, родные братья и сестры, дети, стащившие родительский телефон. Так, вскоре после внедрения этой технологии появилось видео о десятилетнем мальчике, который легко справился с фейс-контролем маминого айфона. С тех пор его мама стирает не предназначенные для детских глаз сообщения. Был случай, когда алгоритм ввела в заблуждение специально отпечатанная на 3D-принтере маска с инфракрасными наклейками вместо глаз. Из всего этого следует, что алгоритм можно использовать для разблокирования телефона, однако это не самый надежный инструмент для доступа к банковскому счету.

При сканировании фотографий в паспорте и видеозаписей с камер наблюдения толку от 3D-алгоритмов не намного больше. Для этого понадобятся алгоритмы другого типа, которые проводят статистический анализ плоского изображения. Они не пытаются, как мы с вами, найти особые приметы, отличающие одно лицо от другого, а формируют статистическое описание распределения на картинке освещенных и затененных участков. Как в случае с алгоритмами распознавания собак из главы “Медицина”, ученые недавно пришли к выводу, что эффективнее предоставить алгоритму достаточно обширную подборку лиц и позволить ему самостоятельно, методом проб и ошибок, выбирать наиболее подходящие комбинации, а не надеяться на то, что люди найдут правильные варианты. Как обычно, это сделали с помощью нейросетей. Именно такие алгоритмы работают там, где в последнее время произошел качественный рывок в производительности и точности. Впрочем, производительность эта сопряжена с издержками. Не всегда можно точно понять, как именно алгоритм приходит к выводу, похожи два лица или нет.

Это означает, что даже такие ультрасовременные алгоритмы легко сбить с толку. Поскольку они составляют статистическое описание распределения света и тени на лице, достаточно надеть очки с оригинальной оправой и декором на стеклах, и алгоритм запутается. Более того, если разрисовать очки так, чтобы декор дал сигналы, схожие с чужим лицом, можно заставить алгоритм выдать решение, что вы и есть тот самый человек – парень на фото ниже воспользовался этим приемом, нацепив очки, в которых он выглядит в точности как Мила Йовович. Очки для маскировки? Похоже, Кларк Кент что-то знал.





Оставим выходки с экстравагантными очками – возможности статистических алгоритмов в распознавании лиц были отмечены во множестве восторженных публикаций, и, в частности, на все лады расхваливали гугловский FaceNet. Чтобы проверить зоркость этого алгоритма, ему велели опознать 5000 лиц известных людей. Предварительно то же задание выполнили на отлично живые эксперты, которые угадали в 97,5 % случаев – что неудивительно, потому что известные всему миру лица участникам эксперимента тоже были известны. Но FaceNet выступил еще лучше, добившись феноменальной точности 99,6 %.

Вроде бы выходит так, что в распознавании лиц машины превзошли человека. Казалось бы, при столь блестящих результатах мы с полным правом можем применять алгоритмы для опознания преступников. Однако тут кроется один подвох. На самом деле для тестирования алгоритма пять тысяч лиц – это очень мало. Когда его задействуют в борьбе с преступностью, ему придется выловить одно-единственное лицо не из нескольких тысяч, а из нескольких миллионов.

Ибо в базе данных британской полиции насчитывается девятнадцать миллионов лиц – изображений, созданных по фотографиям тех, кого арестовали по подозрению в совершении преступления. А вот ФБР располагает коллекцией в 411 миллионов изображений, и, по некоторым источникам, в нее входят лица половины взрослого населения Америки. В Китае же, где база данных об удостоверяющих личность документах позволяет без труда получить сведения о миллиардах лиц, программы распознавания лиц уже получили мощную поддержку государства. На улицах, в метро и аэропортах – повсюду установлены камеры видеонаблюдения, от объективов которых не уйдет ни объявленный в розыск преступник, ни беспечный пешеход, гуляющий по городским улицам. (Говорят даже, что всякие незначительные провинности вроде брошенного на улице мусора учитываются в рейтинге граждан, в системе Sesame Credit, – со всеми вытекающими последствиями для нарушителей порядка, о которых рассказывалось в главе “Персональные данные”.)

Возникает проблема: с ростом числа лиц в базе данных многократно увеличивается вероятность ошибочной идентификации. Чем больше лиц просматривает алгоритм, тем больше у него шансов отыскать два похожих. Поэтому, когда те же алгоритмы работают с более обширной подборкой изображений, их точность резко падает.

Допустим, мне дали десять удостоверений личности незнакомых людей и предложили сказать, которое из них чье; допустим, я прошла тест на отлично – стало быть, сумею узнать любого человека по изображению его лица, поэтому меня отправили в центр Нью-Йорка высматривать в толпе преступников, на которых имеется ориентировка. Очевидно, я не смогу продемонстрировать тот же высокий уровень точности.

То же самое происходит с алгоритмами. В 2015 году Вашингтонский университет провел конкурс MegaFace – специалистам со всего мира предложили протестировать свои алгоритмы распознавания лиц на базе данных объемом в миллион изображений. Хоть и ближе к реальности, но существенно меньше, чем содержится в каталогах госорганов. И все равно алгоритмы выдержали экзамен не слишком успешно.

FaceNet компании Google, почти безупречно выполнивший задание со знаменитостями, показал неожиданно невысокий результат – идентифицировал верно всего лишь 75 % изображений. Другие алгоритмы дали всего лишь 10 % верных ответов. На то время, когда писалась эта книга, чемпионом был китайский продукт Tencent YouTu Lab, точность которого в распознавании лиц составила 83,29 %.

Иными словами, если бы вы искали конкретных преступников в веренице миллионов цифровых изображений, то, судя по приведенным результатам, вы упустили бы каждого шестого – и это при самом благоприятном исходе.

Однако следует помнить, что эта область знаний стремительно развивается. Точность ответов неуклонно повышается, и как будут обстоять дела через годы или через несколько месяцев, никто не знает. Могу сказать лишь, что различные позы и внешний вид объектов, освещенность и качество изображения – все эти детали страшно усложняют создание надежного и точного инструмента для распознавания лиц. До идеальной точности поиска нужного лица среди четырехсот миллионов нам еще довольно далеко, и мы пока не можем найти того самого единственного на триллион, полностью идентичного двойника.

Назад: Кто ты, по-твоему?
Дальше: Подводим баланс