Геном денисовского человека: от “черновика” к “чистовику”
В 2010 году первое прочтение ядерного генома денисовского человека было сделано на скорую руку, вчерне, с небольшой плотностью покрытия. Означает это вот что. Когда читают геном, его приходится складывать из тысяч и тысяч небольших кусочков, которые друг с другом перекрываются. За счет перекрытия последовательности удлиняются все больше и больше, и в результате получаются относительно длинные фрагменты или даже полная последовательность генома. Если кусочков в пробе мало, то и перекрываются они неплотно, а в каких-то участках генома и вовсе не сходятся концы с концами. Если данный кусочек генома удалось прочесть лишь один раз, то возможные ошибки секвенирования никак не выловишь.
Но если в ископаемом образце сохранилось много древней ДНК или ее удалось экстрагировать в полной мере, то каждый прочтенный кусочек генома будет перекрываться с несколькими другими фрагментами и на концах, и в средней части. Можно подсчитать, сколько перекрывающихся отрезков приходится в среднем на каждый нуклеотид, и это число будет служить показателем качества прочтения генома, или, по-другому, плотностью покрытия. Для денисовского генома, основанного на ДНК из фаланги мизинца девочки (Denisova 3), сначала удалось получить покрытие, равное 1,9, то есть каждый участок генома был прочтен в среднем 1,9 раза. Первый опубликованный неандертальский геном имел плотность покрытия около 1,3 и был составлен из фрагментов ДНК трех индивидов. Этого хватило, чтобы охарактеризовать геномы в самых общих чертах, а также понять, что предки внеафриканских сапиенсов скрещивались с неандертальцами, а предки австралийцев и новогвинейцев – еще и с денисовцами. Но вероятность ошибок при такой невысокой степени покрытия оставалась слишком большой для решения многих интересных задач. В частности, по такому “черновому” геному невозможно судить о генетическом разнообразии денисовцев и об их популяционной истории.
В августе 2012 года в журнале Science появилась долгожданная статья, в которой коллектив палеогенетиков, возглавляемый Сванте Пэабо, сообщил, что удалось радикально повысить качество прочтения денисовского генома (Meyer et al., 2012). Теперь он отсеквенирован со средним покрытием 31 (99,4 % нуклеотидов прочтено не менее 10 раз, 92,9 % – не менее 20) и не уступает по качеству отсеквенированным геномам ныне живущих людей. Правда, это относится лишь к наиболее “осмысленной” части генома, где преобладают уникальные последовательности (а не повторы). Эту часть составляют 1,86 миллиарда пар нуклеотидов из примерно трех миллиардов. Дело в том, что в древних костях ДНК сохраняется в виде коротеньких обрывков длиной в несколько десятков нуклеотидов (а если длина фрагмента больше, то это, скорее всего, современное загрязнение – и для верности такой фрагмент лучше выкинуть из рассмотрения). Если последовательность нуклеотидов в крохотном древнем обрывке не уникальна, то есть встречается в геноме много раз, ее нельзя “картировать” – привязать к какому-то конкретному месту в геноме.
Тем не менее содержательная часть денисовского генома, к которой принадлежат практически все белок-кодирующие гены и важнейшие регуляторные участки, теперь реконструирована с поразительной точностью. Этого удалось добиться благодаря новой методике работы с древней ДНК, которую изобрел первый автор статьи Маттиас Майер. По его словам, “никто не ожидал, что удастся получить такой высококачественный геном древнего человека. Все, включая и меня самого, были поражены результатом”.
Ископаемые кости обычно сильно загрязнены современной ДНК, в основном бактериальной, так что доля подлинной человеческой древней ДНК составляет всего несколько процентов. В фаланге из Денисовой пещеры содержание древней ДНК исключительно высокое (70 %), однако в распоряжении исследователей был лишь крошечный фрагмент этой косточки, поэтому очень важно было ничего не потерять при экстракции.
Изначально палеогенетики пользовались технологиями секвенирования, разработанными для современных организмов. Эти методы ориентированы на работу с молекулами ДНК в их “стандартной” конфигурации, то есть в форме двойной спирали. Однако многие фрагменты древней ДНК, выделенные из ископаемых костей, частично или полностью распадаются на одиночные нити или же одна из нитей двойной спирали оказывается повреждена. До 2012 года в ходе палеогенетических исследований такие фрагменты терялись. Разработанная Майером методика позволяет их поймать и отсеквенировать наряду с обычными, двухнитевыми фрагментами. Для этого к концам одноцепочечных фрагментов древней ДНК присоединяют особые молекулы – “адаптеры”. Адаптер затем служит праймером (затравкой) для синтеза недостающей комплементарной цепи ДНК на матрице исходного одноцепочечного фрагмента, который в итоге становится двухцепочечным, после чего его можно секвенировать стандартными методами. Новая методика позволила на порядок увеличить количество древней ДНК, доступной для секвенирования, что и обеспечило успех предприятия.
Имея настолько качественно прочитанный геном, можно было, не боясь ошибок, сравнивать его с другими. Для сравнения выбрали геномы 11 современных людей (с покрытием от 24 до 33): пяти африканцев, двух европейцев, трех азиатов и южноамериканского индейца. Сравнение всех этих геномов между собой и с геномом денисовской девочки позволило исследователям заключить, что предки сапиенсов и денисовцев отделились друг от друга в промежутке от 700 до 170 тыс. лет назад. Столь низкая точность была связана с тем, что на тот момент имелись очень разные оценки скорости мутирования у людей, а не зная скорость мутирования, нельзя откалибровать “молекулярные часы”, используемые для вычисления времени расхождения популяций. Полной ясности нет и сегодня, хотя понятно, что дата 700 тыс. лет назад гораздо ближе к реальности, чем 170 тыс. лет назад.
Денисовский геном чуть больше похож на геном шимпанзе, чем геномы современных людей: между геномами денисовца и шимпанзе на 1,16 % меньше различий. Это объясняется тем, что у современных людей было больше времени для накопления нейтральных отличий от шимпанзе, чем у денисовской девочки, жившей десятки тысячелетий назад (по последним данным, она жила 76–52 тыс. лет назад, см. раздел “Уточнены датировки археологических находок в Денисовой пещере” выше).
Если скорость накопления изменений в ДНК принять примерно постоянной (допущение, лежащее в основе принципа “молекулярных часов”), то данную величину, 1,16 %, можно использовать для датирования денисовской фаланги. Если предки людей и шимпанзе разделились 6,5 млн лет назад и от этого момента до рождения денисовской девочки прошло на 1,16 % меньше времени, чем до современности, то получается, что возраст находки – примерно 75 тыс. лет. Это была, пожалуй, первая серьезная попытка использовать палеогенетические данные для датировки ископаемых остатков, и на тот момент еще ничего нельзя было сказать о надежности такого метода. Дальнейшие исследования показали, что он работает неплохо.
Анализ подтвердил, что некоторые популяции древних сапиенсов, а именно предки современных папуасов, скрещивались с денисовцами и унаследовали от них до 6 % своей ДНК. В геномах других азиатских народов денисовских примесей тогда не обнаружили (позже выяснилось, что менее значительная, но все же существенная примесь денисовской ДНК есть в геномах жителей Восточной Азии, в том числе китайцев и японцев, а также коренных американцев).
А вот еще один факт, важный с эволюционной точки зрения. Выяснилось, что в геноме папуаса участки денисовского происхождения на Х-хромосоме встречаются реже, чем на остальных хромосомах (аутосомах). Этот факт можно объяснить по-разному. Он может означать, что в гибридизации принимали участие со стороны сапиенсов в основном женщины, а со стороны денисовцев – мужчины. Или же что между двумя популяциями в то время уже существовала частичная генетическая несовместимость и поэтому естественный отбор впоследствии удалил из папуасского генофонда значительную часть денисовских фрагментов Х-хромосомы (известно, что внутригеномные конфликты сильнее проявляются и потому “заметнее” для отбора, если конфликтующие гены сидят на Х-хромосоме, которая у мужчин присутствует в единственном экземпляре – и поэтому все проблемы, какие в ней есть, немедленно проявляются в фенотипе). Последующие исследования подтвердили именно вторую версию.
Итак, в 2012 году стал известен геном одного представителя странной популяции, о которой не было практически никаких дополнительных сведений. Что можно узнать о неведомых людях по одному тщательно прочтенному геному? Как выяснилось, не так уж мало.
Например, удалось оценить численность популяции, родной для той девочки. Для этого нужно было понять, насколько близки по геномам были ее родители. Если родители генетически мало отличались друг от друга, то у их дочери аллели большинства генов окажутся одинаковыми, а если они различались сильно, то их родительский генетический вклад был более разнообразным – и тогда многие аллели в парных хромосомах девочки должны различаться (это называют высоким уровнем гетерозиготности).
Уровень гетерозиготности денисовской девочки оказался впятеро ниже, чем у современных африканцев, вчетверо ниже, чем у современных европейцев и азиатов, и почти втрое ниже, чем у южноамериканских индейцев каритиана, которые отличаются крайне низким уровнем гетерозиготности. Иными словами, родители денисовской девочки генетически мало отличались друг от друга.
Теоретически это может означать одно из двух. Либо родители девочки приходились друг другу очень близкими кровными родственниками, чуть ли не братом и сестрой, и унаследовали большие идентичные участки генома от недавних общих предков. Второй вариант – они происходили из разных семей и не имели недавних общих предков, но вся популяция, к которой они принадлежали, была такой маленькой, что ее члены волей-неволей должны были в течение многих поколений скрещиваться с не очень дальними родственниками. Общий уровень генетического разнообразия в такой популяции должен быть низким.
Как различить эти две ситуации? Имея качественный геном, это сделать нетрудно. В первом случае в геномах родителей девочки должны были присутствовать очень длинные абсолютно идентичные участки, а у самой девочки – длинные участки полной гомозиготности. Во втором случае идентичные участки в родительских геномах должны были быть многочисленными, но короткими (потому что они были получены от довольно давних общих предков и успели искрошиться из-за кроссинговера). Соответственно, у девочки во втором случае не должно быть очень длинных непрерывных участков полной гомозиготности, а немногочисленные гетерозиготные сайты должны быть рассеяны по геному более или менее хаотично.
В геноме денисовской девочки нет длинных гомозиготных фрагментов. Следовательно, дело тут не в браке между членами одной семьи (как в случае “алтайского неандертальца” Denisova 5, см. раздел “Геном алтайского неандертальца” в главе 3), а в крайне низком уровне генетического разнообразия популяции денисовцев. Отсюда следует, что популяция была малочисленной.
Но это еще далеко не все, на что способна современная сравнительная геномика. Существуют статистические методы, позволяющие на основе анализа одного-единственного генома оценить изменения численности популяции в прошлом (Li, Durbin, 2011). Идея состоит в следующем. Взяв геном любого человека, состоящий из материнской и отцовской половин, можно подсчитать число отличающих их мутаций. Так мы поймем, насколько геном матери отличался от генома отца. Ту же операцию можно проделать по отдельности для каждого небольшого фрагмента генома. Потом для каждого фрагмента по числу различий в двух половинах можно оценить время существования общего предка. Не предка “вообще”, а предка именно для данного фрагмента генома. То есть человека, от которого мать и отец обладателя изучаемого генома унаследовали именно этот фрагмент. Получится множество предковых фрагментов и у каждого свое время существования, так что в результате будет диапазон датировок плюс количество предков для каждого временного интервала. Чем больше общих предков в том или ином временном интервале, тем меньше в то время была популяция, и наоборот: чем меньше предковых фрагментов пришлось на какое-то время, тем больше была популяция в тот период. Ведь в маленькой популяции будет увеличена вероятность того, что два случайно выбранных генома являются близкими потомками одного и того же прародителя. Поэтому если на частотном распределении числа общих предков появляется пик, то есть наблюдается “сгущение” предков в какой-то период времени, то можно смело утверждать, что численность популяции тогда была совсем небольшой, популяция проходила через бутылочное горлышко. Например, у современных внеафриканских сапиенсов такой пик приходится на период 90–50 тыс. лет назад – в это время небольшая группа мигрантов из Африки выбралась на просторы Евразии, чтобы дать начало современному населению Евразии, Австралии и Америки.
Применив этот подход к геному денисовской девочки, ученые пришли к выводу, что численность предков современных людей и предков денисовцев в глубокой древности (более 500 тыс. лет назад) менялась синхронно. Очевидно, это была одна и та же, еще не разделившаяся популяция. Позже, примерно 250–125 тыс. лет назад, численность сапиенсов (наших непосредственных предков, которые тогда еще жили только в Африке) стала быстро расти, а предков денисовцев – напротив, сократилась и оставалась небольшой вплоть до эпохи, когда жила денисовская девочка.
Есть и другой подход, позволяющий оценить численность популяции денисовцев. Если денисовцы действительно были малочисленнее древних сапиенсов, это должно было отразиться на эффективности действовавшего на них отбора. Известно, что в маленьких популяциях естественный отбор хуже справляется с отбраковкой слабовредных мутаций (об этом рассказано в нашей книге “Эволюция. Классические идеи в свете новых открытий”). Слабовредных мутаций много среди значимых (несинонимичных) нуклеотидных замен в белок-кодирующих генах. Синонимичные замены, как правило, нейтральны. Поэтому эффективность очищающего отбора можно оценить по соотношению значимых и незначимых нуклеотидных замен. Слабый очищающий отбор должен приводить к ускоренному накоплению значимых замен. Следовательно, если денисовцы были малочисленнее сапиенсов, то у первых доля значимых замен (имеются в виду значимые отличия, например, от шимпанзе) должна быть выше, чем у вторых. Так и оказалось: у денисовцев отношение значимых замен к незначимым в белок-кодирующих последовательностях в 1,5–2,5 раза выше, чем у сапиенсов. Этот результат служит дополнительным свидетельством в пользу низкой численности популяции денисовцев.
Неандертальцы, судя по всему, тоже не были многочисленной расой, по крайней мере на поздних этапах своего существования. Похоже, предки неандертальцев и денисовцев, выйдя из Африки и расселившись по Старому Свету, не очень-то процветали. Их было мало, они жили мелкими разрозненными группами, женились на близких родственниках (как родители Denisova 5) и практиковали каннибализм (книга 1, глава 5, раздел “Людоеды”). Уже только за счет своей малочисленности неандертальцы и денисовцы проигрывали сапиенсам заочную эволюционную гонку. Ведь в маленьких популяциях отбор работает не так эффективно, как в больших: в маленьком генофонде полезные мутации накапливаются медленнее, а вредные – быстрее. Хуже того, в маленьких обществах нет условий для быстрой культурной эволюции. Полезные знания в них медленнее накапливаются и чаще теряются (об этом мы поговорим подробнее в заключительной главе).
Тем временем предки сапиенсов в Африке плодились, набирались ума и культуры, развивали мозг. И когда они вышли оттуда и устремились на просторы Евразии, то и тут продолжали процветать. Быть может, они едва замечали жалкие группки “выродков”, попадавшихся им кое-где на новых территориях и вскоре исчезавших бесследно. Однако эпизодическая гибридизация все же случалась. Пожалуй, удивительно здесь не то, что она случалась, а то, что случалась столь редко. Это указывает на существование каких-то серьезных репродуктивных барьеров.