Книга: Математика жизни и смерти. 7 математических принципов, формирующих нашу жизнь
Назад: Ошибка прокурора
Дальше: Ослепленные математикой

Нокс и нож

Еще одним делом, в котором трактовка результатов анализа ДНК вместе с вычислением вероятностей сыграли ключевую роль, был случай убийства британской студентки Мередит Керчер. В 2007 году в итальянском городе Перуджа Керчер зарезали ножом в квартире, где она жила вместе со своей подругой – студенткой по обмену Амандой Нокс. Два года спустя, в 2009 году, Нокс и ее итальянский экс-бойфренд Рафаэле Соллесито были единогласным решением присяжных осуждены за убийство Керчер. Решающим доказательством обвинения стал нож, размер и форма которого соответствовали некоторым ранам, нанесенным Керчер. Нож был найден на кухне Соллесито, а на его рукоятке обнаружена ДНК Нокс, связывающая и Соллесито, и Нокс с орудием убийства. На лезвии ножа был обнаружен образец другой ДНК – совсем небольшой, всего лишь несколько клеток. Выделенный из этих клеток профиль ДНК совпал с профилем жертвы.
В 2011 году Нокс и Соллесито подали апелляцию на свои длительные тюремные приговоры. Адвокаты защиты сосредоточились в первую очередь на дискредитации единственного доказательства, которое физически связывало Нокс и Соллесито с убийством, – следы ДНК на ноже.
Почти у каждого (за исключением однояйцовых близнецов) есть собственный уникальный геном – последовательность азотистых оснований аденина (А), гуанина (G), тимина (Т) и цитозина (С), характерных для длинных цепочек ДНК в каждой клетке. Если сосчитать и сохранить каждую из примерно трех миллиардов пар оснований в геноме человека, то полученная последовательность стала бы поистине уникальным идентификационным кодом. Однако в суде (и в базах данных ДНК) используется (и хранится) отнюдь не полный профиль генома. Когда речь об использовании профилей ДНК зашла впервые, создание полного профиля генома требовало обработки слишком большого объема данных, занимало слишком много времени и стоило баснословно дорого. Для сравнения двух профилей также требовалось чересчур много времени, так что оно было нецелесообразно.
Вместо этого профиль ДНК формируется путем анализа 13 конкретных участков ДНК человека. Эти участки называются локусами. Поскольку мы наследуем по одной хромосоме в каждой паре от каждого из наших родителей, с каждым локусом связано по две области ДНК. Каждая из этих областей частично состоит из короткого тандемного повтора – небольшого, многократно повторяющегося сегмента ДНК. У каждого человека количество повторений в конкретном локусе специфично. Фактически эти 13 локусов выбраны именно из-за такого разнообразия числа повторяющихся сегментов – количество различных комбинаций таких повторов по 13 локусам астрономически велико. Таким образом профиль ДНК – это всего лишь перечень повторов в каждом локусе, который можно считать по диаграмме, известной как электрофореграмма. Электрофореграмма представляет собой необработанную последовательность ДНК и немного похожа на показания сейсмометра (прибора, используемого для измерения силы землетрясений), где на фоне низкоуровневого шума в определенных позициях, соответствующих каждому из локусов профиля ДНК, выделяются характерные пики. Электрофореграмма для образца с лезвия ножа показана на рис. 12.
Создание индивидуальной электрофореграммы можно сравнить с записью результатов двух последовательных серий бросков тринадцати 18-гранных кубиков. Идеальное совпадение двух случайно выбранных профилей ДНК можно сравнить с выпадением одной и той же последовательности значений на гранях кубиков. В идеальных условиях вероятность совпадения профилей двух случайно выбранных, не связанных между собой человек составляет менее одного на сто триллионов, что, по сути, делает профиль ДНК уникальным идентификатором. Точное совпадение пиков на двух электрофореграммах дает основание заключить, что они принадлежат одному и тому же человеку.

 

Рис. 12. Электрофореграмма из образца ДНК (предположительно принадлежавшего Мередит Керчер) с лезвия ножа. Маркированы пики, соответствующие 13 локусам, используемым в стандартном профиле ДНК. В некоторых случаях виден только один пик, что указывает на то, что владелец образца унаследовал от родителей одинаковое количество повторов для этого локуса. Верхнее число в каждой графе дает количество повторений сегмента ДНК. Нижнее число показывает силу сигнала, отображенную высотой пика. Сила сигнала большинства пиков ниже требуемого минимума в 50

 

Иногда совпадения ДНК могут быть неоднозначными, так как в силу возраста или качества образца ДНК профиль удается восстановить лишь частично, так что сигнал удается получить не в каждом локусе. Частичные профили, разумеется, надежного совпадения профиля ДНК не дают. Бывает также, что фоновый шум, возникающий во время анализа образца, заглушает сигнал, поступающий на электрофореграмму – особенно часто такая ситуация происходит с небольшими образцами. Поэтому анализ должен опираться на общепринятые стандарты уровня сигнала в профиле ДНК. Это и была единственная надежда адвокатов Нокс.
Во время первоначального судебного разбирательства доктор Патриция Стефанони, главный технический директор отдела судебно-генетической экспертизы полиции Рима, решила, что из-за крошечного размера образца ДНК, оставшегося на лезвии ножа, этот образец не надо разделять на две части – чтобы получить достаточно сильный сигнал профиль, ей был необходим весь имеющийся в распоряжении материал. Это прямо противоречило принятым нормам проведения экспертизы: второй образец нужен для того, чтобы перепроверить профиль, если тот получится слабым или сомнительным. Но ее решение оставило экспертизу без контрольного образца. Как было отмечено во время предварительного разбирательства, электрофореграмма имела четкие пики во всех нужных местах и невероятно близко соответствовала профилю Керчер. Однако, как видно из пронумерованных граф на рис. 12, большинство пиков в профиле значительно ниже даже самых либеральных стандартов. Пренебрежение нормативными процедурами при создании профиля, которое продемонстрировала Стефанони, позволило команде защиты на апелляции дискредитировать доказательства, построенные на основе следов ДНК с лезвия ножа.
В ответ обвинение попросило провести повторное тестирование небольшого количества клеток, пропущенных при первоначальном сборе мазка, но обнаруженных независимыми судебно-медицинскими экспертами, чтобы подтвердить результаты первого теста. Однако председательствующий судья Клаудио Хеллман отклонил это ходатайство.
3 октября 2011 года присяжные, среди которых были и эксперты, и простые судебные заседатели , удалились на совещание, чтобы вынести свой вердикт. Они совещались необычно долго, атмосфера в зале суда постепенно накалялась, и к выходу присяжных присутствующие уже едва сдерживали эмоции. Несмотря на подробный разбор доказательств, никто не знал, куда качнется маятник. Когда вердикт был зачитан, Нокс рухнула на стул и разрыдалась от радости и облегчения. Присяжные сняли с нее обвинение в убийстве. В мотивационной части вердикта, объясняя отказ от тестирования второго образца ДНК, судья Хеллман заявил, что «сумма двух результатов, оба из которых ненадежны вследствие нарушения научных принципов проведения экспертизы, не может дать достоверного результата». Но Лейла Шнепс и Корали Колмез, авторы вышедшей в 2013 году книги «Процесс над математикой: как в зале суда используют цифры и злоупотребляют ими», предполагают, что судья Хеллман ошибался: иногда два ненадежных теста лучше, чем один .
Чтобы понять их аргументы, давайте снова представим себе, что вместо анализа ДНК мы бросаем игральный кубик, желая определить, стандартный он или шулерский, со смещенным центром тяжести. В первом случае шестерка должна выпадать один раз из шести, а на кости, у которой одна сторона тяжелее, в 50 % случаев, как нам заранее известно. Мы хотим подойти к ситуации непредвзято, поэтому еще до начала тестов допускаем, что каждый из этих сценариев одинаково вероятен.
Начнем наш тест, бросив кубик 60 раз подряд. Если кубик стандартный, то шестерка должна в среднем выпасть шесть раз. Если кубик со смещенным центром тяжести, то шестерка выпадет в среднем 30 раз. Выпадение 30 и более шестерок в ходе бросков дает нам веские основания полагать, что кубик утяжелен, поскольку такой результат в случае бросков стандартного кубика крайне маловероятен. Аналогичным образом, если шестерка выпадет 10 или меньше раз, мы будем уверены, что имеем дело со стандартной костью. Если шестерка выпадает в диапазоне от 10 до 30 раз, то мы сможем вычислить вероятность того, что этот кубик утяжелен, сравнив шанс получить такой результат с кубиком со смещенным центром тяжести с шансом получить аналогичный результат со стандартным кубиком.

 

Рис. 13. Результаты двух независимых серий бросков. В первом тесте шестерка выпала 21 раз из 60, а во втором – только 20 раз. Кажется, что второй тест подрывает результат первого

 

Во время теста мы фиксируем результаты бросков – итог показан в верхней половине рисунка 13: шестерка выпала всего 21 раз. Вероятность такого результата при бросках стандартного кубика невелика – всего 0,000297. С кубиком со смещенным центром тяжести вероятность получить 21 шестерку тоже довольно мала – 0,00693, но она все же в 20 с лишним раз выше, чем со стандартным кубиком. 21 шестерка скорее выпадет при бросках утяжеленного, чем стандартного кубика. Мы можем найти общую вероятность выпадения 21 шестерки в обоих сценариях, сложив соответствующие вероятности и получив 0,00722. Доля этой вероятности, которую обеспечивает утяжеленная игральная кость, составляет 0,00693/0,00722, что дает 0,96. Таким образом, вероятность, что мы бросали утяжеленный кубик, равна 96 %. Достаточно убедительно, но, возможно, этого не хватит для того, чтобы осудить убийцу.

 

Табл. 9. Вероятность выпадения разного количества шестерок в каждом из тестов со стандартными костями (столбец 1) и костями со смещенным центром тяжести (столбец 2). Общая вероятность для обоих сценариев (столбец 3) и вероятность того, что у кубика смещен центр тяжести (столбец 4)

 

Для верности проведем второй тест, бросив кубик еще 60 раз. На этот раз, как показано в нижней половине рисунка 13, выпало только 20 шестерок. Как видно из таблицы 9, вероятность получить такой результат со стандартным кубиком составляет 0,000780, а со смещенным центром тяжести – 0,00364, что примерно в пять раз выше. Хотя это и не сильно отличается от результатов первого теста, но тот же расчет дает чуть менее убедительные 82-процентные шансы на то, что кубик утяжелен. Похоже, второй тест поставил под сомнение результаты первого. Во всяком случае, второй тест никоим образом не позволяет нам без сомнений убедиться, что мы имеем дело с шулерским кубиком.
Однако при объединении результатов, как показано на рис. 14, мы сможем проанализировать уже 120 бросков кубика. Если кубик стандартный, то при 120 бросках шестерка в среднем должна выпадать 20 раз. Но она выпала 41 раз. Вероятность такого результата в серии из 120 бросков для стандартного кубика составляет всего 0,00000155; а вот вероятность получить такой результат с кубиком со смещенным центром тяжести в 100 с лишним раз выше. Она составляет 0,000168. Итого, с учетом количества выпавших шестерок вероятность, что мы имеем дело с шулерским кубиком, превышает 99 %.

 

Рис. 14. При объединении результатов тестов мы получаем 41 шестерку при 120 бросках. Это говорит о высочайшей вероятности того, что кубик шулерский

 

Как ни странно, сочетание двух не самых убедительных проверок дает гораздо более надежный результат, чем любой из этих тестов по отдельности. Аналогичный метод часто используется в научной практике систематических обзоров. Систематические обзоры в медицине, например, анализируют несколько клинических тестов, каждый из которых сам по себе не содержит исчерпывающей оценки эффективности того или иного вида лечения из-за немногочисленности тестируемых. Однако при объединении результатов нескольких независимых исследований часто можно сделать статистически значимые выводы о степени эффективности медицинского вмешательства. Пожалуй, наиболее известным применением систематических обзоров является анализ альтернативных лекарственных средств (в следующей главе мы покажем, что мнимые положительные эффекты от их применения зачастую вызваны математическими артефактами ), крупномасштабные клинические испытания которых финансируются скудно. Объединив результаты нескольких, казалось бы, неоднозначных тестов, систематические обзоры опровергали такие альтернативные методы лечения, как клюквенная терапия инфекций мочевыводящих путей или использование витамина С для предотвращения простуды .
Утверждая, что сочетание пары потенциально неоднозначных ДНК-тестов могло бы дать более убедительные доказательства связи между ДНК Керчер и ножом на кухне Соллесито, Шнепс и Колмез исходят из той же логики. Решение судьи Хеллмана лишило суд возможности рассмотреть эти свидетельства, отняв таким образом у мира возможность понять, какое влияние они могли бы оказать на исход судебного разбирательства.
Назад: Ошибка прокурора
Дальше: Ослепленные математикой