ДНК-фотороботы: уже сегодня?
В мае 2016 г. в городке Браунвуд, штат Техас, была изнасилована и жестоко убита 25-летняя Ронда Шантэй Бланкиншип. Тело было найдено милях в пяти от дома, за городом – вряд ли она пошла бы туда одна, скорее с кем-то знакомым. Девушка была с отставанием в развитии, при этом очень милая и добрая, пела в церковном хоре, все ее любили. У кого рука поднялась? Самым удручающим для родных было то, что городок маленький, все всех знают и, вероятно, они видят убийцу каждую неделю, здороваются с ним…
Свидетелей не нашлось, и детективы решили испробовать новый метод – фоторобот, составленный по ДНК. На смену генотипированию преступников пришло фенотипирование – реконструкция внешности! Такие услуги оказывает (наряду с традиционными генеалогическими исследованиями) компания Parabon NanoLabs. Заказчиков сразу предупреждают, что за ненаследственные признаки вроде массы тела программа не отвечает, возраст реконструирует условно (как можно установить возраст по геному, потом расскажем подробнее), а цвет кожи, глаз и волос, наличие веснушек и форму лица – с вероятностью плюс-минус. Тем не менее ДНК-фотороботами уже пользовалась полиция более 20 штатов США.
Портрет подозреваемого послали матери убитой: не похож ли на кого-то из знакомых? И вдруг младший брат Шантэй сказал: “Мама, я, кажется, знаю этого мальчика. Он все время обижал меня в школе”. Все оказалось именно так ужасно, как они себе представляли. “Он сидел позади нее в церкви. Его мама забирала ее каждую неделю и отвозила в церковь (…) Он очень дружил с моей племянницей и ее друзьями. И мы бы никогда не узнали”. Он делился в своем “Фейсбуке” ссылками на сообщения о похоронах девушки и на сообщество “Правосудия для Шантэй”, “Он сам еще ребенок”, – добавила мама Шантэй в видеообращении.
Как рассказал на пресс-конференции шериф округа Вэнс Хилл, подозреваемый Райан Риггс, 21 год, увидев портрет, сбежал и скрывался несколько дней, а потом признался в убийстве перед прихожанами церкви, которую посещали и он, и Шантэй. Это произошло в ноябре 2017 г., всего через неделю после того, как портрет был распространен. Пастор немедленно связался с офисом шерифа, и родители Райана сами отвезли его в полицию, где он повторил признание,. Судебное разбирательство должно состояться в сентябре 2019 г., а пока защита подсудимого, к ужасу родных жертвы, собирает доказательства того, что она в детстве подвергалась сексуальным домогательствам, каковые стали причиной и умственной отсталости, и, возможно, легкого согласия на секс. Хотя непонятно, как это извиняет или объясняет убийство с помощью тупых предметов и лезвия от газонокосилки.
Конечно, после этого случая все заговорили о Parabon NanoLabs и ее ДНК-фотороботах. Стив Арментраут, директор компании, который сам создавал портрет подозреваемого в деле Шантэй Бланкиншип, отметил, что фенотипирование ни в коем случае не станет заменой традиционным следственным методам (ненаследуемые изменения внешности, от чрезмерной полноты до переломов носа и окрашенных волос, по геному не восстановишь). Тем не менее у полиции появился новый мощный инструмент.
Как работает ДНК-фенотипирование? Тут мы не обойдемся молекулярной биологией, тут уже начинается информатика. Сначала собирают массив данных – геномы людей и их фенотипические признаки. Поскольку не очень просто, да и непрактично анализировать все 3 млрд нуклеотидов (точнее, 6 млрд, ведь геномы у нас диплоидные), анализируют однонуклеотидные полиморфизмы, снипы. Некоторым образом, на новом витке технологии мы вернулись к тому, с чего начинал Алек Джеффрис, когда пытался выявить индивидуальные нуклеотидные замены с помощью рестриктаз! Затем создаются наборы данных генотипов и фенотипов (genotype-and-phenotype, GaP) для тысяч людей. С этим уже могут работать биоинформатики. Статистический анализ GaP (Parabon сообщает, что анализирует сотни тысяч отдельных SNP и миллиардов SNP-комбинаций) выявляет генетические маркеры, связанные с тем или иным признаком. Это серьезная вычислительная задача. Те SNP, которые с наибольшей вероятностью вносят биологический вклад в проявления признака, используют в прогнозирующих моделях. Сначала применяют алгоритмы машинного обучения, чтобы выстроить математический “мостик” между SNP и признаком. Потом предлагают программе наборы SNP неизвестного лица, чтобы она реконструировала его внешность. На основании окончательной модели, откалиброванной всеми доступными способами, создают изображение.
Пока даже для такого простого, казалось бы, признака, как цвет глаз, дается доверительный интервал, а не точное значение. Но информация вроде “у преступника точно не карие глаза” также может оказать помощь следствию.
А что касается точных значений признаков – никто не обещал, что будет легко. Человек – доминирующий на планете вид, его разнообразие столь же огромно, как численность и ареал расселения. Это для простых людей глаза бывают черные, карие, серые, голубые и зеленые, а специалисты по нашему биоразнообразию различают гораздо больше цветов – для антропологов их 12 или 16, не считая градаций яркости.
В апреле 2018 г. была опубликована статья международной группы ученых – результаты масштабного полногеномного поиска ассоциаций, целью которого было найти новые локусы, влияющие на цвет волос. Изучили геномы почти 300 000 человек европейского происхождения; удалось идентифицировать 123 аутосомных локуса и один локус в Х-хромосоме, существенно связанные с цветом волос; из них ранее были известны только 13. (Интересно, что у женщин рыжие и светлые волосы встречались чаще, чем у мужчин.) Значимые для цвета волос SNP в этих локусах, вместе взятые, объясняют 34,6 % случаев наследуемости рыжих волос, 24,8 % – светлых волос и 26,1 % – черных волос в исследованных популяциях. Еще 10 000 ведер, и золотой ключик наш…
Совместная работа лаборатории Сьюзен Уолш Университета Индианы – Университета Пердью в Индианаполисе (штат Индиана, США) и Медицинского центра Университета Эразма (Роттердам, Нидерланды) – система HIrisPlex-S для предсказания цвета глаз, волос и кожи по ДНК-данным. Новая версия, анонсированная весной 2018 г., обещает криминалистам, антропологам и археологам высокую точность реконструкции внешности. Обновлен и общедоступный сайт для этих инструментов – неспециалистам тоже можно зайти, получить общее представление о том, как это делается; после всего, о чем мы поговорили, по крайней мере часть слов будет понятна.
“И опять все это в Европе и Америке, мимо нас?” Опять нет. Мы уже говорили о программе Союзного государства “ДНК-идентификация”, которая стартовала в 2017 г. На сайте программы говорится, что в рамках проекта будут созданы технологии определения по ДНК вероятной внешности и этногеографического происхождения неизвестного индивида. Планируется также определение вероятного возраста: с возрастом изменяется длина теломер, характер метилирования нуклеотидов, есть и другие признаки.
И – подчеркиваю по просьбе участников проекта, это поисковое направление! – определение психоэмоционального статуса и предрасположенности к социально значимым заболеваниям. Естественно, в этих областях многое определяется средой, но кое-что – бесспорно, генами, и с научной точки зрения это очень интересно, но сногсшибательный результат гарантировать заранее нельзя.
Метилирование ДНК – обратимая модификация молекулы ДНК без изменения нуклеотидной последовательности. Метильная группа СН3 присоединяется к азотистому основанию – цитозиновому кольцу (кто забыл, что это, может заглянуть в первую главу), обычно там, где встречается сочетание “букв” CG, но есть и другие варианты. Этот процесс важен для нормального развития, он участвует в геномном импринтинге, инактивации второй Х-хромосомы в клетках женщин, подавлении активности мобильных элементов, старении, канцерогенезе. Картина метилирования генома называется с модным окончанием “ом” – метилом, вслед за геномом, протеомом и транскриптомом. Теломеры – концевые участки хромосом, которые укорачиваются в стареющих клетках, о них все слышали.
Так вот, что касается внешности: почему в 2010-е гг. XXI в. это разрабатывается заново? Наши разработки не копируют зарубежные?
– Копирование тут невозможно, – объясняет Светлана Боринская. – В чем состоит задача программы? Найти конкретные локусы, по которым мы можем эффективно дифференцировать российские популяции и тем самым указывать родство индивида с определенной группой. Эти локусы не такие, как в Америке, какие-то могут совпадать, но в целом они другие. Поэтому программа и запущена, иначе бы мы пользовались мировыми данными и искали преступников в Минске по французским частотам аллелей. Но это не получается. Даже с внешностью не совсем получается. Например, голландцы разработали систему определения внешности по ДНК IrisPlex, а при ее использовании на российских популяциях – там были русские, коми, какие-то азиатские популяции, – вообще ничего не совпало с реальностью. Карий цвет глаз неверно определялся.
Почему так происходит? Гены, определяющие фенотипические признаки, в разных популяциях людей наверняка одни и те же. Но вот снипы в одном и том же гене, отвечающем за синтез пигмента в глазу, могут быть разными у француза и бурята. Мы ищем “французские” снипы, не находим их и делаем неверный вывод о фенотипе. Поэтому необходимо, во-первых, определить, как коррелируют наши фенотипы с нашими генотипами, во-вторых, создать реактивы для выявления именно наших снипов. (Реактивы для выявления нуклеотидных последовательностей – это тоже нуклеотидные последовательности, а не только растворы солей и ферменты, так что задача не совсем тривиальная.)
Чем хороша (или плоха) популяционная генетика: разработки в этой области невозможно позаимствовать у соседей, как чертеж механизма или схему синтеза вещества. Корреляции между снипами и внешними признаками, найденные при исследовании населения других стран, могут быть неприменимы к нашим гражданам, с нашим особым путем развития. А могут быть применимы – но мы не узнаем наверняка, не проведя собственных исследований. Хорошо, что у нас есть люди для таких задач.