Поручая принятие решений алгоритмам, мы должны точнее сформулировать понятие честности. Компьютеры невероятно исполнительны, когда дело касается соблюдения инструкций, – иногда даже слишком. Так что если мы хотим заставить их поступать честно, мы должны точно сформулировать для них это понятие.
Вернемся к программе COMPAS, однако чтобы не касаться в обсуждении острой расовой темы, зададимся вопросом, что означает честное поведение программы в отношении мужчин и женщин. Правосудие должно быть слепым, а любая программа должна быть слепа к полу. Но что это означает на самом деле?
Есть разные понимания справедливости, которые можно запрограммировать. Одна из самых простых мер – уравнять процент мужчин и женщин, среди которых программа спрогнозирует совершение повторного правонарушения. Однако это очень грубый способ. Женщины могут совершать меньше преступлений, чем мужчины, и такой метод приведет нас к тому, что в тюрьму попадет дополнительное количество женщин, а опасные мужчины окажутся на свободе.
Более удачная мера справедливости заключается в одинаковой погрешности для мужчин и женщин. Это значит, что процент ошибочной классификации должен быть равным для женщин и мужчин. Женщины совершенно справедливо могли бы возмутиться, если бы неправильно был классифицирован больший процент правонарушителей женского пола, особенно если бы их занесли в категорию вероятных рецидивистов.
Проблема с погрешностью как мерой справедливости заключается в том, что правильное определение потенциальных рецидивистов может оказаться важнее, чем правильное определение тех, кто не совершит преступление повторно. Отпустить рецидивиста выйдет «дороже», чем не отпустить того, кто больше не совершит правонарушение. Смешивая эти две группы, мы предполагаем, что они одинаково важны. Правительственные и судебные ошибки также противоречат пропорции Блэкстона. Сэр Уильям Блэкстон в своем трактате XVII века под названием «Комментарии к английским законам» писал: «Лучше, чтобы от правосудия скрылись десять виновных, чем пострадал один невиновный».
Третья мера честности разбивает эти две группы. Мы можем задать равные ложные положительные и ложные отрицательные показатели для мужчин и женщин. Ложные негативные показатели – это доля людей, которые совершают рецидив, хотя программа прогнозировала, что этого не произойдет. Ложные позитивные показатели – процент тех, кто не совершит преступление повторно, хотя согласно утверждению программы, должен был. Женщины совершенно справедливо возмутились бы, если бы ложные позитивные показатели для них были бы выше, чем для мужчин, и если бы в результате этого больше женщин были несправедливо заключены под стражу. И снова ложные негативные показатели могут быть гораздо опаснее для общества. Потому мы можем поставить во главу угла снижение именно этих показателей.
Четвертая мера справедливости по-другому подходит к вопросу прогнозирования. Мы можем задать одинаковые показатели ошибок при неудачном и успешном прогнозировании для мужчин и женщин. Показатель ошибок при неудачном прогнозировании – это доля людей, которые не должны были совершить рецидив, но совершили. Показатель ошибок при неудачном прогнозировании делит количество человек, которые не должны были повторить правонарушение, но сделали это, на количество тех, кто не повторил. Разница с ложным негативным показателем в том, что он делит количество тех, кто не должен был совершить рецидив, но совершил, на общее количество совершающих преступление повторно.
Точно так же показатель ошибок при успешном прогнозировании – это доля тех, кто должен был снова совершить правонарушение, но не сделал этого. Показатель ошибок при успешном прогнозировании делит количество человек, которые должны были совершить рецидив, но не совершили, на количество тех, кого программа заподозрила в потенциальном повторении правонарушения. Отличие от ложного позитивного показателя заключается в том, что там количество человек, которые должны были совершить рецидив, но не совершили, делится на общее количество тех, кто не совершил повторного преступления. И вновь женщины могли бы справедливо возмутиться, если бы показатель ошибок при успешном прогнозировании для них оказался выше, чем для мужчин, и в результате больше женщин было бы несправедливо заключено под стражу. Так же и показатель ошибок при неудачном прогнозировании может быть важнее для общества, чем показатель ошибок при успешном прогнозировании – отпускать рецидивистов опаснее, чем держать в тюрьме тех, кто не совершит правонарушение повторно. Те, кто несправедливо остается под стражей, могут поспорить, однако необходимо найти компромисс между их свободой и общей безопасностью. Поэтому мы, возможно, должны относиться к этим двум показателям по-разному.
Мы можем использовать и другие меры честности, такие как соотношение ложных позитивных и ложных негативных показателей или равное отношение к «похожим» индивидам. Однако это не так важно в контексте нашего разговора. Мораль заключается в том, что честность может означать совершенно разные вещи. Нет ни одного простого определения этого понятия. Наоборот, в обществе постоянно происходит дискуссия на тему того, какое именно понимание необходимо в этом конкретном случае. А там, где такая дискуссия не происходит, она часто должна была бы происходить. Поручая машинам принятие таких решений, нужно очень четко понимать, какого рода честность нам нужна в конкретных обстоятельствах.