Часть 5
Новые времена: все мы родственники
2010 год
Генетическая генеалогия рассказывает о вашем прошлом
Человек по имени Лоран может быть, например, вашим братом, отцом или другом. Он увлекается генеалогией и уже который год терпеливо выстраивает свою родословную. С недавних пор все его знакомые из США рассказывают ему о генетике: с помощью своей ДНК Лоран сможет найти дальних родственников. А если они тоже восстановили часть своей родословной, то ему удастся соединить свое генеалогическое древо с тем, что получилось у них.
Такой метод уже применялся в генеалогических базах данных: как только два пользователя находили общего предка, они могли соединить два генеалогических древа. Но теперь, благодаря развитию генетики, можно не ждать, пока кто-то другой сообщит о родстве. Лорану достаточно сравнить свою ДНК с ДНК других пользователей, чтобы обнаружить родство и выявить возможных общих предков. Революция в области генеалогии! Благодаря этой новой возможности Лоран осознал, что все мы родственники.
В каждом из нас есть что-то от… Карла Великого
Поначалу, занявшись изучением родословной своей семьи классическим методом, Лоран быстро разочаровался. Он добрался до начала XVIII века и не мог углубиться дальше в прошлое: многие метрические книги были уничтожены, в частности во время Французской революции. И тут его приятельница, также увлекавшаяся генеалогией, рассказала, что ей повезло больше: среди своих французских предков она смогла обнаружить… самого Карла Великого! У него было пять законных жен и не меньше 19 детей. В то время, в 810 году, население Франции составляло около 9 миллионов человек. По словам приятельницы Лорана, он почти наверняка мог бы отыскать Карла Великого и в своей родословной. Как она рассуждала?
Я уже вкратце упоминала об этом. У каждого из нас по два родителя, по два дедушки и две бабушки (итого четыре), восемь прадедушек и прабабушек, и в каждом следующем поколении это число умножается на два. От нас до времен Карла Великого — 40 поколений, а значит, у каждого из нас 240 — примерно триллион! — потенциальных предков. Если экстраполировать результат на все население Франции, это число надо умножить на 70 миллионов. Это астрономические цифры — особенно учитывая тот факт, что во Франции в эпоху Карла Великого жило меньше 10 миллионов человек (а на всей планете — около 200 миллионов).
Что это означает? На самом деле все очень просто: в наших родословных огромное количество общих предков. Нравится вам это или нет, но все мы родственники! Те же подсчеты можно произвести и в масштабах планеты. Сегодня нас, людей, 7 миллиардов. Сто лет назад жило по восемь предков каждого из нас. Значит, будь у нас у всех разные предки, век назад их насчитывалось бы 8 × 7 миллиардов, то есть 56 миллиардов человек. Но на самом деле в начале ХХ века на планете жило всего 1–2 миллиарда человек!
Углубимся еще немного в эту тему, прежде чем вернуться к генетическим родословным. Даже в традиционной генеалогии много такого, от чего голова идет кругом! В действительности все мы приходимся друг другу еще более близкими родственниками, чем кажется Лорану. И вот почему: из тех 10 миллионов человек, которые жили во Франции во времена Карла Великого, далеко не все оставили потомство, дошедшее до наших дней. Оба родителя моей подруги Софи — единственные дети своих родителей. У сестры Софи детей нет, но у самой Софи есть сын. Если у него не будет детей, то оба деда и обе бабки Софи окажутся в числе людей своего поколения, не передавших гены будущим поколениям.
В квебекском регионе Сагеней — Озеро Сен-Жан только у 50% женщин, живших в начале XIX века, есть потомки среди населения, рожденного в 1950-х, то есть шесть-восемь поколений спустя. Наряду с квебекцами, не оставившими потомства, были и другие, ставшие предками для многих людей. Есть от чего потерять голову: взяв достаточно простую модель популяции, можно убедиться, что любой человек, живший определенное количество поколений назад и имеющий хотя бы одного потомка, который дожил до наших дней, стал предком почти 100% современного населения. Так, в Европе все наши общие предки жили 1200–2000 лет назад: всякий, кто дышал воздухом того времени и у кого ныне жив хотя бы один из потомков, — предок всех наших современников. Дорогой читатель, если кто-то из ваших бабушек и дедушек, как у Лорана, родился во Франции, могу с уверенностью предположить, что Карл Великий — и ваш предок тоже!
Дедушке всего человечества 3000 лет
В модели, о которой я только что упомянула, не учитываются внешние миграции и внутреннее деление на субпопуляции. Используя аналогичные расчеты, исследователи определили, когда жили общие для всего человечества предки. Чтобы сделать поправку на географию, они добавили в модель деление на части света, которые обмениваются определенным количеством мигрантов в каждом поколении. Им удалось вычислить, что все наши общие предки жили всего 5000 лет назад! Более того: самому близкому к нам по времени общему для всего человечества генеалогическому предку всего-навсего 3000 лет. Модель выглядит надежной, даже если учитывать более или менее высокий уровень миграций между частями света.
Итак, наш общий генеалогический предок жил 3000 лет назад. А 5000 лет назад жили вообще все наши предки. Поясню: не у всех людей, живших 5000 лет назад, остались живущие в наши дни потомки, но те, кто оставил таких потомков, стали предками всего человечества. Доля людей, чьи потомки дожили до наших дней, в зависимости от модели колеблется от 60 до 80%. Иначе говоря, если бы 5000 лет назад вы вошли в какую-нибудь деревню или город, то большинство встреченных вами людей оказались бы общими предками всего человечества.
Конечно, место этих предков в вашей родословной будет зависеть от того, где вы живете. В родословной шведа чаще будут встречаться общие европейские предки, тогда как в родословной габонца стоит ожидать скорее африканских. Тем не менее у каждого из нас среди древних предков найдется хотя бы один земледелец, выращивавший рис на берегах Янцзы, сибирский охотник на медведей, африканский охотник на слонов, вавилонский ученый, папуас — любитель свинины… Полученная с помощью модели дата (5000 лет) рассчитана с учетом прежних способов миграции; в частности, предполагается, что произошло несколько миграций на достаточно далекие расстояния. В модели, где миграции происходят постепенно, короткими переходами, нашим общим предкам скорее было бы несколько десятков тысяч лет. Истина, несомненно, где-то посередине: локальные миграции дополнялись несколькими миграциями на большие расстояния.
Итак, все мы родственники, и, если углубиться в генеалогию популяции, у всех быстро отыщутся общие предки. Дональд Трамп, пусть это его и смутит, состоит в родстве с Бараком Обамой, а тот, если верить Историческому генеалогическому обществу Новой Англии, — родственник Брэда Питта. Кроме того, в любом поколении не у всех есть потомки в будущих поколениях: мы все происходим от ограниченного числа людей — общих предков. Предок одного — предок всех!
Но это вовсе не значит, что до нас дошли переданные всеми этими предками части генома. Каждый из родителей передает детям только половину своего генома, бабушки и дедушки — по четверти. Значит, чем дальше, тем меньше генов достается нам от предков. До шестого поколения часть генома передается всегда, но для более старших поколений эта доля стремительно уменьшается. У вашего предка в десятом поколении один шанс из двух ничего вам не передать. Из 4096 ваших предков 12 поколений назад каждый с вероятностью 82% не передал вам никаких своих генов! Генеалогический предок — не обязательно предок генетический.
Потомки Марии-Антуанетты
Поначалу, услышав о генетической генеалогии, Лоран засомневался. Он знал сайты, которые предлагают сравнить вас со знаменитостями и рассказать, в родстве ли вы с Марией-Антуанеттой, Людовиком XVI и т. д. Впрочем, многие его знакомые, обратившиеся за этой услугой, и правда были объявлены родственниками Марии-Антуанетты! Надо сказать, что эти анализы поначалу основывались лишь на митохондриальной ДНК, позволяющей установить родство только по материнской линии, а главное — не сильно различающейся у разных людей. Тип митохондриальной ДНК, которым обладала Мария-Антуанетта, часто встречается в популяции, по меньшей мере у каждого пятого, и, несомненно, в ту эпоху он был не только у знаменитой «австриячки». Так что результат теста указывал лишь на очень отдаленное родство с королевой французов.
Новые методы генетической генеалогии отличаются тем, что позволяют анализировать не только митохондриальную ДНК (или Y-хромосому, чтобы узнать родословную по отцовской линии), но и геном в целом. Если точнее, речь идет о приблизительно 700 тысячах маркеров, которые покрывают весь геном. Эти маркеры, выбранные в тех местах генома, где существует вариабельность среди индивидов, выявляют сходство и различия между ними. Применительно к генеалогии такие маркеры позволяют узнать, есть ли у вас общие предки с другим человеком, который уже прошел тестирование, и определить, когда жили эти предки. Достаточно сравнить фрагменты ДНК двух индивидов, следуя простому правилу: чем длиннее общий фрагмент ДНК, тем ближе общий предок.
Объединение ДНК
Даже если суть этого правила кажется очевидной, рассмотрим его чуть более подробно, чтобы узнать о его ограничениях. Попробуем представить нашу ДНК в виде длинных бус, состоящих из бусин четырех цветов, из четырех нуклеотидов — A, C, T, G. Все мы получили по две нитки бус: одну от отца, другую от матери. Каждая нитка бус уникальна в том смысле, что в ней есть мелкие особенности, свойственные конкретному индивиду: кое-где бусина отличается — к примеру, А вместо Т. Чтобы создать следующее поколение, мы производим гаметы, половые клетки: женщины — яйцеклетки, мужчины — сперматозоиды. В каждой гамете находится только одна нитка бус, и лишь при оплодотворении две нитки, одна от мужской гаметы, другая от женской, соединятся, чтобы появился новый индивид.
При образовании гамет первые бусины поступают из нитки, полученной от матери, следующие — из нитки отца, потом еще один фрагмент от матери, и т. д. Это как если бы мы аккуратно выложили рядом обе нитки, разрезали их на части и складывали кусочки по порядку, беря их случайным образом из материнской и отцовской ниток. Я уже говорила об этом явлении, называемом рекомбинацией. Длина фрагментов ДНК измеряется в сантиморганах, они обозначаются аббревиатурой сМ (один сантиморган равен отрезку, на котором вероятность рекомбинации составляет 1%; это приблизительно миллион нуклеотидов).
Длина полного генома, полученного от одного из родителей, то есть одной из двух ниток бус, 3400 сМ. Нитка обрезается в случайных местах, и они меняются при образовании каждой новой гаметы: подсчитано, что цепочка ДНК «разрезается» каждый раз в 34 местах, а значит, длина каждого отрезка в среднем составляет 100 сМ (3400 сМ ÷ 34). Но сами эти фрагменты происходят от ДНК наших бабушек и дедушек: в среднем мы получаем от каждого из них 1700 сМ фрагментами приблизительно по 50 сМ.
Из-за рекомбинации длина доставшегося от предка фрагмента ДНК будет тем меньше, чем более древний этот предок. Эта информация полезна в теории: она помогает узнать, давно ли жил общий предок двух индивидов. На практике же нужно учесть некоторые оговорки. Рекомбинация — процесс случайный. Таким образом, один далекий предок мог случайно передать мало фрагментов ДНК, но большой длины, тогда как другой — только короткие фрагменты. На деле, чтобы определить, в родстве ли между собой два индивида и есть ли у них общий предок, надо изучить все фрагменты генома. Количество идентичных фрагментов и их длина позволяют вычислить родственные связи.
Нераскрытые преступления
Эти расчеты часто используют на сайтах, посвященных генетической генеалогии. Изучив вашу ДНК и сравнив ее с уже имеющимися в базе данными, можно найти ваших генетических родственников. Но при отдаленном родстве, начиная с третьей-четвертой степени, вполне может оказаться, что с одним из родственников у вас нет общей ДНК, поскольку, как я уже говорила, ваши генеалогические предки не обязательно стали предками генетическими (у вас вполне может быть общий прапрапрадед, который не передал вам свою ДНК).
Как решить эту проблему? Таким вопросом задались несколько американских исследователей. Взяв за основу базу, где собраны генетические профили более чем миллиона людей, они заметили, что у 60% индивидов есть по крайней мере один генетический родственник третьей или четвертой степени. В целом это исследование показало, что если бы 2% американцев европейского происхождения внесли свои генетические данные в базу, то каждый американец европейского происхождения нашел бы в этой базе родственника третьей или четвертой степени. Иными словами, располагая базой данных от 3 миллионов человек, можно соотнести любую ДНК как минимум с одним родственником третьей степени.
Между тем в США появляется все больше баз данных, с которыми люди делятся своей ДНК. Об этих базах очень много говорилось в СМИ, поскольку они позволили разгадать некоторые давние полицейские загадки. Самая известная из них — дело убийцы из Золотого штата, преступника, совершившего с 1976 по 1986 год 13 убийств и изнасилований. По его ДНК, найденной на месте преступления, удалось отыскать в базе данных одного из его дальних родственников. Затем «следователи по родословным» восстановили генеалогическое древо этого родственника и, выбрав тех, чей возраст и пол примерно соответствовали профилю, сумели вычислить подозреваемого. Порывшись в его мусорном ведре, нашли соломинку, проанализировали оставшуюся на ней ДНК и выявили убийцу. Позже таким образом было раскрыто еще несколько десятков старых «висяков».
Эти новые возможности уже вызывают за океаном вопросы, связанные с защитой частной собственности. Представьте себе пользователя, который ради изучения своей родословной или из желания найти родственника помещает свою ДНК в базу данных: тем самым он подвергает всех своих близких и дальних родственников риску быть втянутыми в полицейские расследования. Использование таких инструментов оправдано, когда это нужно для поиска пропавших людей или преступников; но базы генетико-генеалогических данных открывают путь к самым разным видам персональной идентификации. Например, как выяснили исследователи, по ним можно идентифицировать американцев, анонимно сдавших ДНК для общественно значимых исследовательских проектов в области генетики.
Хуже того: в каких-то семьях подобные тесты могут без ведома заинтересованных лиц выявить подложное отцовство. Допустим, брат и сестра узнают, что они лишь наполовину родные, и тайное становится явным. Пережить такие неожиданные открытия бывает непросто. Американские пользователи фейсбука даже создали группу под названием DNA NPE friends для помощи not parent expected — тем, кто получил нежеланную информацию и не знает, как с этим справиться. В интернете полно историй со счастливым концом, историй неожиданно обнаруженного родства, а рядом с ними — множество семейных драм. Ваша ДНК уникальна (если, конечно, у вас нет однояйцевых близнецов), это и есть ваша генетическая идентичность. Но она вам не принадлежит, поскольку в то же время является собственностью ваших родственников: ведь вы отчасти делите ее с ними. Эти новые способы использования ДНК порождают и сложную проблему хранения генетических данных, контроля за ними и права доступа к ним, не говоря уже о возможном коммерческом использовании.
Определение происхождения
Существует и другая категория тестов из области генетической генеалогии, менее точных, чем те, о которых говорилось выше: это тесты на происхождение. Кстати, в 2015 году Лоран получил такой тест в подарок на Рождество. Следуя инструкции, он взял у себя образец слюны и отправил пробирку по почте, а через несколько недель получил результаты. Ему сообщили, что он на 25% итальянец. Между тем, изучая свою родословную, он не обнаружил ни одного предка по ту сторону Альп. Четыре года спустя он повторно прошел тот же тест, и вот неожиданность: на этот раз у него нашли 2% итальянской крови! Кроме того, оказалось, что он француз только на 23%. Но что означает быть итальянцем на 2% или французом на 23% и почему изменились результаты?
Чтобы ответить на эти вопросы, надо понимать, как проводится такое тестирование. В вашей слюне содержатся клетки, по которым определяют ДНК. Когда компания, проводящая тестирование, получает вашу ДНК, она прочитывает в ней некоторые участки, которые варьируются между разными популяциями, и сравнивает их с участками ДНК референтной популяции. Эта процедура проводится на тысячах фрагментов ДНК, что позволяет подсчитать проценты. Вердикт «ваша ДНК на 25% итальянская» означает, что в четверти случаев обнаружилось совпадение с этой популяцией.
Первое важное обстоятельство, объясняющее, почему результаты тестов разнятся: в ходе тестов ваша ДНК сравнивается с теми образцами, которые смогла собрать данная компания. Но если в научных статьях четко задаются критерии определения той или иной популяции, то принципы выбора референтных популяций компаниями, проводящими тестирование, остаются тайной.
Как правило, при проведении исследований для формирования референтной популяции выбирают индивидов, у которых все бабушки и дедушки принадлежали к данной группе. Это позволяет исключить миграции ХХ века, как если бы мы вернулись в 1900-е годы. Хотелось бы верить, что компании, проводящие тестирование, поступают именно так, но доказательств у нас нет.
Еще одна оговорка связана с используемыми наименованиями популяций. Что, например, означает «француз»? Позабудем про административное деление, про заморские департаменты и территории и т. д. и предположим, что этим словом называют человека, рожденного в метрополии. Но исследования, посвященные генетическому разнообразию, показывают, что в масштабах Европы генетическая близость между двумя индивидами соответствует близости географической только тогда, когда мы рассматриваем популяции, в которых у людей все бабушки и дедушки происходят из одной местности, то есть рождены в радиусе от 50 до 100 километров друг от друга. Словом, между эльзасцем и немцем из Франкфурта генетическое сходство будет явно больше, чем между уроженцами Марселя и Лилля, хотя последние оба французы.
Если, к примеру, ваши предки родом с севера Франции, а референтная популяция набрана из южан, то тесты могут идентифицировать вас как бельгийца. Если же у вас предки с севера Италии, но тестирующая компания включает в референтную итальянскую популяцию только южных итальянцев, а во французскую — французов с юго-востока страны, то вас, несомненно, причислят к французам, а не к итальянцам.
Возьмем более широкую географическую шкалу и представим, что у вас есть предки-сибиряки, а вашу ДНК сравнивают с референтной популяцией Северной Америки, куда, в частности, входят индейцы, но не сибиряки. Ваше происхождение определят как индейское, поскольку 15 тысяч лет назад предки индейцев вышли именно из Сибири (и не важно, что никто из ваших предков никогда не ступал на американскую землю).
Парадокс сестер-близнецов
Проблема в том, что каждая из тестирующих компаний по-разному формирует референтные популяции, в большей или меньшей степени покрывая те или иные регионы. Поэтому, проводя тесты в разных компаниях, вы наверняка получите разные заключения. И результаты могут вас удивить…
Приведу пример из жизни. Две сестры, однояйцевые близнецы, развлекались тем, что посылали свои образцы ДНК в разные компании. Одни находили у них североафриканские и ближневосточные корни, а другие ничего такого не выявляли. Более того, в одной компании результаты у сестер оказались разными — хотя геном у них, разумеется, один и тот же. Одну определили как «европейку в широком смысле» на 13%, тогда как у другой якобы преобладала «восточноевропейская» составляющая. В данном случае сомнения вызывает алгоритм подсчета, который выдает слегка различающиеся результаты на основе одинаковых данных. Этот пример напоминает о том, что в данном случае проценты следует воспринимать с учетом статистической погрешности.
Как правило, в масштабах части света результаты тестов в разных компаниях сходятся: проценты европейского, индейского, африканского, азиатского происхождения совпадают. Но при укрупнении масштаба в какой-то одной части света результаты оказываются менее надежными. В тех регионах, где между популяциями мало генетических различий, можно говорить скорее о градиенте генетической близости, а распределение по «популяциям происхождения» более произвольно и во многом зависит от референтной выборки. Кроме того, регионы с большим этническим и генетическим разнообразием представлены слабо. Например, в том регионе Центральной Азии, где мы работали, в границах одной страны отмечаются заметные генетические различия между этническими группами, и все эти особенности не учитываются при формировании референтных популяций. Если потребитель рассчитывает узнать по таким генетическим тестам свое происхождение, он, вероятно, будет разочарован. Результат вроде «китаец на 50%» мало что даст усыновленному человеку, который хотел бы узнать, где именно в Азии его корни.
Мораль: если вам подарили такой тест, помните, что это всего лишь развлечение! Его результаты не стоит воспринимать буквально — много из них не узнаешь.