Книга: ДНК и её человек [litres]
Назад: ДНК-фотороботы: уже сегодня?
Дальше: Не так быстро

“Нарисую портрет по геному”

Крейг Вентер умеет привлечь внимание прессы, чем бы он ни занимался. Нелегко превзойти его главное достижение – когда в 1990-е гг. основанная Вентером компания Celera Genomics отважно вступила в конкуренцию с Human Genome Project и показала, что частная инициатива может помериться силой с международным научным проектом. Но, когда он в 2010 г. анонсировал появление живой делящейся бактерии с полностью синтетическим геномом, шуму тоже было много. И вот в сентябре 2017 г. Крейг Вентер в очередной раз создал новостной повод – внес свой вклад в суету вокруг информационной безопасности геномов. Вместе с соавторами из Института Крейга Вентера и основанной им же компании Human Longevity он опубликовал статью об идентификации личностей людей, чьи анонимные геномы находятся в свободном доступе. При этом основным инструментом идентификации была названа реконструкция внешности по ДНК.
“Эта работа бросает вызов современным концепциям неприкосновенности частной жизни и может иметь далеко идущие этические и юридические последствия”, – пишут авторы статьи. И в самом деле, ведь нехорошо говорить людям, что их данные защищены, когда можно просто взять геном и нарисовать по нему похожий портрет человека?
Конечно, авторы статьи упомянули о том, что геномные данные уже несколько десятилетий используют для идентификации личности и поисков родственных связей, и уже поэтому странно говорить об анонимности геномов. Ну а если предположить, что генеалогические базы завтра закроются для всех, кроме лиц со спецдопуском, тогда наши геномы будут в безопасности? Да вряд ли. Имея информацию о геноме, можно определить пол, цвет кожи и глаз, сделать предположения о росте и склонности к полноте, о чертах лица, даже о возрасте. И конечно, о генетических заболеваниях. Иными словами, анонимный геном примерно так же “не указывает на конкретного человека”, как следующий текст: “Мы не будем называть по имени этого героя «Игры престолов», но он мужчина, европеоид, глаза светлые, вероятно, средних лет, может носить фамилию Ланнистер и, ах да, у него ахондроплазия”.
Статья Вентера с коллегами вышла за несколько месяцев до признания убийцы Шантэй Бланкиншип, но реконструкция внешности по ДНК к тому моменту имела длинную предысторию. Выходили публикации о реконструкции по геномным детерминантам цвета кожи (в том числе оттенков смуглого у европеоидов, что непросто), цвета глаз и волос, в основном с использованием снипов. За три года до того вышла работа под руководством Марка Шрайвера из Пенсильванского университета (того самого, соавтора статьи об определении цвета кожи по AIM) – подход к трехмерной реконструкции лица по геномам. Об этой работе стоит рассказать подробнее (хотя с тех пор были и более новые) – на нее часто ссылаются, и станет понятнее, как это вообще делается.
Участвовать в исследовании пригласили людей из США, Бразилии и Кабо-Верде в возрасте от 18 до 40 лет. (Сильные возрастные изменения – это следующий шаг, это потом.) Всего почти 600 человек, преимущественно африканского и европейского происхождения – для участников определили этнические маркеры, AIM, те самые, что помогли поймать луизианского убийцу, и постарались исключить людей со значительной монголоидной примесью. Для каждого участника сделали 3D-изображения лица, покрашенные в серый (чтобы цвет кожи не был подсказкой), и пригласили других людей, студентов Пенсильванского университета, посмотреть на эти изображения, и сказать, как им кажется, мужчина это или женщина, сколько в этом человеке африканской крови и т. п. Результаты опроса помогали анализировать собранные данные: особенности человеческого лица лучше всего видят другие люди, так устроен наш мозг.
Авторы учли, как влияют на внешность пол человека и его расовая принадлежность. Антропологи задолго до всех этих наших ДНК хорошо умели “отличать череп негра от черепа эскимоса”, как говорится в “Собаке Баскервилей”, и установили, какие значения может принимать тот или иной признак у представителя определенной этнической группы. И в большинстве случаев (хотя и не во всех), когда мы видим человеческое лицо, то угадываем, женское оно или мужское, без подсказок в виде усов или косметики, – по таким неочевидным признакам, как форма скул и подбородка. Пол можно установить по ДНК, как и расовую принадлежность предков, так что жульничества тут нет – никаких дополнительных данных, кроме образца ДНК, не понадобится. И самое интересное – авторы определили однонуклеотидные полиморфизмы в 20 генах, предположительно отвечающих за строение черепа и лица, и сопоставили их с 3D-изображениями. Программе, “переварившей” все эти данные, было предложено реконструировать лица по генотипам, но авторы подчеркивали, что о полном успехе говорить рано.
Вентер с коллегами подошли к задаче несколько по-иному. Они собрали образцы ДНК у 1061 жителя окрестностей Сан-Диего возрастом от 18 до 82 лет. Среди участников исследования оказались 569 представителей африканских этнических групп, 273 латиноамериканских, 63 европейских, 63 восточноазиатских и 18 южноазиатских, а также 75, не принадлежащих ни к одной из этих групп. Для каждого человека получили 3D-изображения, записали образцы голоса (есть данные о связи между голосом и чертами лица – звучит странно, но, в конце концов, то и другое формируется под действием гормонов), количественно измерили цвет глаз и кожи, отметили возраст, рост и вес, а также сделали полногеномное секвенирование. Реконструировать внешние признаки по геномным данным предполагалось с помощью алгоритмов машинного обучения. Программа должна была выдать черты лица, голос, возраст, рост и вес, индекс массы тела, цвет глаз и кожи. (Возраст определяли по длине теломер и мозаичным потерям одной из Х-хромосом у женщин и Y-хромосомы у мужчин.)
Что же в итоге? Цвет глаз, кожи и, разумеется, пол предсказывали точно, “однако для комплексных признаков наша модель объясняла лишь малую часть наблюдаемых фенотипических вариаций”, как деликатно выразились авторы. Не получилось предсказать по геному цвет волос и вероятность облысения.
Фактически людям из Human Longevity удалось сделать следующее. Они выбирали из своей тысячи участников небольшие подгруппы – скажем, 10 человек, затем брали один из десяти геномов и пытались угадать, кому из десятки он принадлежит, сопоставляя результат реконструкции с реальными портретами. Угадывали для десятки с вероятностью около 74 %, причем результаты предсказуемо ухудшались, если подгруппа была этнически однородной – состояла, например, только из африканцев или только из европейцев. Результат гораздо лучше, чем при случайном выборе, но до “опознания по фото” отсюда еще далеко.

 

 

Со временем, считают авторы, точность предсказаний будет расти, когда мы узнаем больше о признаках, определяющих черты лица и в том числе о низкочастотных вариантах, связанных с редкими фенотипами. Возраст можно будет предсказать точнее по метилированию генома. Правда, есть еще одна проблема: для полногеномного секвенирования пока что требуется порядка 100 нг ДНК, а на месте преступления обычно находят гораздо меньше, если нет следов крови или спермы. Так что старый добрый PCR-анализ на STR еще не скоро сдаст позиции.
Назад: ДНК-фотороботы: уже сегодня?
Дальше: Не так быстро