Очень может быть, что программа PredPol вам где-нибудь встречалась. С тех пор как ее начали применять в 2011 году, ей посвятили тысячи публикаций в СМИ – обычно под заголовками, отсылающими к фильму “Особое мнение” с Томом Крузом в главной роли. PredPol среди прочих программ уже как Ким Кардашьян – знаменита на весь мир, журналисты без конца перемывают ей косточки, но никто толком не знает, чем она занимается.
Поэтому я хотела бы несколько умерить ваши ожидания, прежде чем вы подумаете о провидицах, которые плавают в бассейне и выкрикивают предсказания. PredPol никого не выслеживает, пока преступление не совершено. Эту программу вообще интересуют не люди, а географические данные. Да, я вольно употребила слово “предсказание”, но вообще-то алгоритм не может предвидеть будущее. Это не магический кристалл. Он не дает прогноз для происшествий, а только оценивает их потенциальный риск – вроде небольшая разница, но очень существенная.
Представьте себе алгоритм в роли букмекера. Если полицейские встанут перед картой города и сделают ставки на то, где ночью будут совершены преступления, PredPol рассчитает их шансы на выигрыш. Он действует, как типстер на скачках, профессиональный прогнозист, – высвечивает на карте города красными квадратиками “фаворитов” нынешнего вечера среди улиц и районов.
Вопрос в том, оправдает ли “надежды” фаворит нашего советчика. Чтобы проверить проницательность алгоритма, ученые провели два независимых эксперимента – состязания программы с лучшими аналитиками из криминальной полиции на юге Англии, в графстве Кент, и в Юго-западном дивизионе полиции Лос-Анджелеса. Это был честный поединок. Алгоритму и человеку было предложено разместить на карте двадцать квадратиков, соответствующих ста пятидесяти квадратным метрам, и таким образом указать места, где, по их мнению, в ближайшие двенадцать часов с наибольшей вероятностью будут совершены преступления.
Прежде чем перейти к подведению итогов, надо отметить, что задача была поставлена довольно каверзная. Мы с вами, не зная почти ничего о криминальном ландшафте Кента и Калифорнии, скорее всего, не придумали бы ничего лучше, кроме как расставить квадратики наобум. Учтите, что они покроют ничтожно малую часть карты – для Кента всего одну тысячную всей территории – и придется каждые двенадцать часов менять расстановку, начиная все сначала. При столь хаотичной игре можно надеяться, что наши с вами “прогнозы” сбудутся менее чем в одном случае из ста.
Специалисты справились гораздо лучше. Аналитик из Лос-Анджелеса сумел верно указать места совершения преступлений в 2,1 % случаев, а в Кенте его коллега выступил даже лучше, со средним результатом 5,4 % – выдающееся достижение, если вспомнить, что территория Кента раз в десять больше Лос-Анджелеса.
Но алгоритм обошел их обоих. В Лос-Анджелесе он дал вдвое больше верных прогнозов для правонарушений по сравнению со своим живым соперником, а в Англии на одном из этапов эксперимента чуть ли не каждое пятое преступление происходило в зоне красных квадратиков, распределенных по карте математическими методами. PredPol – не магический кристалл, но еще никто и никогда не мог так ясно предвидеть будущее в мире криминала.
Есть одна загвоздка. Компьютер более или менее хорошо предсказывает, где в ближайшие двенадцать часов кто-то нарушит закон, но полиция преследует несколько иную цель – сократить число правонарушений, которые могли бы произойти в ближайшие двенадцать часов. Допустим, алгоритм выдал свой прогноз – каковы ваши дальнейшие действия?
Вариантов несколько. В случае ограбления дома можно установить камеры видеонаблюдения или поставить живых детективов под прикрытием и поймать воров с поличным. Но, наверно, будет лучше для всех, если направить усилия на профилактику преступления. Что бы вы выбрали, если подумать? Заманить злодея в ловушку, став его жертвой? Или не стать жертвой ни при каких обстоятельствах?
Можно предупредить жителей данного района, что их дома под угрозой, посоветовать им сменить замки, установить охранную сигнализацию или выключатели с таймером, чтобы перехитрить жуликов – те решат, что дома кто-то есть, и пойдут дальше. В одном эксперименте, который провели в Манчестере в 2012 году, так и сделали, и количество ограблений уменьшилось более чем на четверть. Впрочем, есть один отрицательный момент: по расчетам исследователей, профилактика каждого взлома методом “защиты цели” обходится примерно в 3925 фунтов. Попробуйте продать эту технологию Полицейскому управлению Лос-Анджелеса, которое ежегодно разбирается с пятнадцатью тысячами домовых краж.
Другой вариант, так называемая тактика “участковых полицейских”, или “полицейских на точках”, практически ничем не отличается от традиционного патрулирования.
“Раньше, – рассказывал мне бывший сотрудник лондонской полиции Стив Колган, – патрульные делили карту на куски, распределяли участки меж собой и обходили их. Тебе этот участок, тебе тот. Все просто”. Но, как подсчитали в одном британском исследовании, если полицейский обходит случайно выбранный на карте города участок пешком, можно надеяться, что один раз за восемь лет он окажется в радиусе ста метров от места грабежа.
По методу “полицейских на точках” патрульные отправляются в те “горячие точки”, которые выделил алгоритм. По-моему, этот метод без всякого преувеличения можно было бы назвать “полицейские на горячих точках”. Суть в том, что если полиция всегда на виду, в нужном месте и в нужное время, то шансы не допустить правонарушения существенно возрастают – уж по крайней мере, когда что-то случится, полицейские отреагируют незамедлительно.
В Кенте именно так и получилось. На втором этапе эксперимента в начале вечерней смены сержант печатал карту, на которой красными квадратами были размечены зоны риска на текущий день. Если все было тихо, полицейский патруль должен был приехать в ближайший такой квадрат, выйти из машины и обойти участок пешком.
В один из таких вечеров на той улице, где при других обстоятельствах патруля не оказалось бы, полицейские заметили женщину с ребенком, иммигрантку из Восточной Европы. Выяснилось, что с ней жестоко обращались дома, а ее ребенок буквально несколько минут назад подвергся сексуальным домогательствам. Дежуривший тогда сержант подтвердил, что “их нашли только потому, что PredPol отметил это место”. Позднее той же ночью в том же районе арестовали подозреваемого.
В ходе испытаний методики “полицейских на точках” алгоритм спас не только эту мать с ребенком – в целом по Кенту преступность снизилась на 4 %. В США, где такой же эксперимент проводила сама компания PredPol, сообщалось о еще более значительном снижении преступности. В лос-анджелесском районе Футхилл за первые четыре месяца применения алгоритма было совершено на 13 % меньше преступлений, в то время как во всех других районах города, где полиция работала по привычной схеме, закон нарушался на 0,4 % чаще. В Алхамбре, пригороде Лос-Анджелеса, с января 2013 года, когда там внедрили эту программу, были достигнуты фантастические результаты: краж со взломом стало меньше на 32 %, а угонов – на 20 %.
Цифры эффектные, но на самом деле еще неизвестно, так ли велика заслуга программы PredPol. Тоби Дейвис, математик и криминолог из Университетского колледжа Лондона, сказал мне: “Возможно, [преступность] упала просто потому, что полицейских направили в какие-то районы, неважно, куда именно, и велели им вылезти из машин и прогуляться”.
Надо отметить еще один момент. Раз вероятность засечь правонарушение тем выше, чем усерднее вы его ищете, то журнал учета преступлений обновляется хотя бы потому, что полицейские выехали из участка. “Если полиция на месте, – объяснил Дейвис, – правонарушений регистрируется больше, чем могло бы при других условиях. Даже когда в двух разных местах совершается одинаковое количество преступлений, больше материалов полицейские соберут там, где они сами были, чем там, где их не было”.
Следовательно, тактика расстановки полицейских по точкам таит в себе одну большую потенциальную опасность. Выбирая районы для патрулирования на основании компьютерного прогноза, вы рискуете попасть в петлю обратной связи.
Предположим, в относительно бедном квартале изначально сложилась криминогенная обстановка – тогда алгоритм, наверное, предскажет рост преступности в этом районе. Туда направят больше полицейских, а стало быть, они зафиксируют больше правонарушений. Алгоритм даст еще более печальный прогноз, подтянут дополнительные силы полиции – и так далее. Этот замкнутый круг характерен скорее для попрошайничества, бродяжничества, мелкой наркоторговли и прочих правонарушений, типичных для бедных районов.
В Великобритании разные группы населения то и дело жалуются на недостаточный полицейский контроль на улицах, и, казалось бы, нечестно стягивать все силы полиции в определенные районы. Однако не все питают теплые чувства к полиции. “Можно понять тех, кого раздражает вид полицейского, расхаживающего у них под окнами, даже когда все спокойно, пусть он просто ходит взад-вперед, – говорит Дейвис. – По-хорошему, вы же имеете право на жизнь без неусыпного полицейского надзора, так чтобы полиция не давила на вас”.
Мне кажется, он прав.
Так вот, хороший алгоритм должен быть разработан с учетом привычных для полиции тактики и методик. По крайней мере, теоретически возможно сделать так, чтобы программу не влекло так неудержимо в какой-то один квартал, – скажем, чтобы она высылала наряды полиции как в районы высокого риска, так и туда, где риск поменьше. Однако PredPol – это частная собственность, людям со стороны программа недоступна, и никто не знает, как она работает, поэтому, к сожалению, нет никакой возможности узнать, предусматривает ли она уход от петли обратной связи – или, в более широком смысле, достаточно ли она объективна.
На рынке представлены и другие алгоритмы, кроме PredPol. Один из конкурентов – HunchLab, который собирает самую пеструю статистическую информацию: сведения о зарегистрированных преступлениях, звонки в полицию, данные переписи, а также совсем уж неожиданные параметры вроде фаз луны. В основе алгоритма HunchLab нет конкретной теории. Он не пытается дать ответ на вопрос, почему в одном районе преступления совершаются чаще, чем в других, – он просто отмечает найденные в данных закономерности. Благодаря этому он дает более достоверный прогноз для более разнообразных правонарушений, чем PredPol, который опирается на идею о создании преступниками географических паттернов; но, поскольку эта программа тоже защищена авторскими правами на интеллектуальную собственность, мы, как люди посторонние, не можем поручиться, что она ненароком не ущемит интересы какой-нибудь части общества.
Еще один закрытый алгоритм прогнозирования – Strategic Subject List (Стратегический список объектов наблюдения), который взяли на вооружение в Полицейском управлении Чикаго. В этой программе используется принципиально другой подход. Ее задача – определить потенциальных участников перестрелок без учета географических данных. Исходя из различных условий, программа формирует “тревожный список” людей, которые, по ее версии, с наибольшей вероятностью в ближайшем будущем окажутся вовлечены в события с применением огнестрельного оружия, неважно, они будут стрелять или их подстрелят. Идея вполне здравая, ибо сегодняшняя жертва завтра легко может сама стать виновником преступления. И у этого алгоритма благородная цель – тем, кого он отметил, полицейские предлагают записаться на коррекционные программы, чтобы попытаться как-то изменить свою жизнь.
Впрочем, есть основания опасаться, что этот алгоритм не дает ожидаемого эффекта. Как показало недавнее исследование, проведенное некоммерческой организацией RAND Corporation, наличие фамилии в списке ничего не говорит о вероятности участия человека в перестрелке. Однако повышает его шансы попасть за решетку. Исследователи предположили, что в любом инциденте со стрельбой те, кто оказался в поле зрения алгоритма, для полиции становятся подозреваемыми.
Алгоритмы прогнозирования полицейского контроля, несомненно, перспективны, и те, кто их разрабатывает, безусловно, честно делают свое дело с самыми лучшими намерениями. Но и беспокойство из-за возможной необъективности алгоритмов тоже оправдано. На мой взгляд, это слишком важные для справедливого общества вопросы, чтобы мы вот так просто поверили в добросовестное использование таких алгоритмов правоохранительными органами. На этом примере, одном из многих, видно, до какой степени нам необходимы независимые эксперты и контролирующие органы, которые гарантируют нам, что от алгоритма будет больше пользы, чем вреда.
При этом потенциальный вред кроется не только в прогнозах. Как мы уже не раз видели на других примерах, существует реальная опасность того, что под влиянием авторитета алгоритма некорректные результаты приобретут дополнительную весомость. А это может привести к самым неприятным последствиям. Слово компьютера – еще не истина в последней инстанции.