Глава 6. Воссоздадим геном
В 2010 году Джон Крейг Вентер создал жизнь с нуля. Он и его группа синтезировали полный геном крошечной свободноживущей бактерии, которую они назвали Mycoplasma mycoides JCVI-syn1.0, и перенесли его в клетку-реципиент, из которой предварительно удалили ее собственный геном. Ученые не только соединили вместе все фрагменты, необходимые, чтобы геном функционировал (что он и делал), а клетка размножалась (что она и делала), но и внесли в него своеобразный «водяной знак» – переведенные в генетический код имена исследователей, участвовавших в проекте, чтобы этот синтетический геном можно было отличить от настоящего, на котором он был основан.
Процесс создания жизни Вентер и его группа начали с изучения полной геномной последовательности бактерии Mycoplasma mycoides. Этот оцифрованный геном, представляющий собой не более чем строчки текста, хранящиеся в файле на жестком диске компьютера, стал макетом созданной ими жизни. Они выбрали именно этот бактериальный геном из-за его небольшой длины – немногим более миллиона пар оснований, а также из-за быстрого роста бактерий, которое ускорило эксперимент.
Миллион спаренных оснований – это очень короткий геном, даже для бактерии. Однако недостаточно короткий, чтобы его можно было синтезировать целиком за один раз. При создании цепочек ДНК в лаборатории машины делают это, соединяя в определенном порядке отдельные азотистые основания – А, Г, Ц и Т, из которых образуются целые геномы. Чем длиннее фрагмент, тем больше ошибок будет сделано в процессе синтеза. Если ученые хотят, чтобы бактерия могла выживать и размножаться, искусственный геном должен соответствовать своему макету максимально близко.
Чтобы обойти проблему синтеза длинных фрагментов, группа Вентера разработала четырехэтапный процесс создания полного генома. Вначале они синтезировали, по одному спаренному основанию за раз, 1078 фрагментов ДНК, каждый из которых насчитывал 1080 пар оснований. Это достаточно короткие фрагменты, чтобы их гарантированно можно было синтезировать в лаборатории, но также достаточно длинные, чтобы каждый из них содержал уникальную идентифицирующую его информацию, – это позволяло собрать конечную версию генома в правильном порядке. Затем ученые стали брать по 10 фрагментов, расположенных рядом в шаблонном геноме, за раз и помещать эти небольшие участки в дрожжевые клетки, позволяя внутренним механизмам клеток сшить фрагменты вместе. В результате у них получилось 100 фрагментов бактериальной ДНК, каждый из которых имел около 10 тысяч пар оснований в длину. Затем они склеили эти куски по 10 штук, получив 11 фрагментов, около 100 тысяч пар оснований в длину каждый. Наконец, они сшили вместе и эти 11 фрагментов и получили в результате один бактериальный геном длиной в миллион спаренных оснований. Они изъяли этот геном из дрожжевой клетки и перенесли в бактериальную, где он начал вырабатывать все белки, необходимые ей для жизни. Весь процесс занял 15 лет и обошелся более чем в 40 миллионов долларов.
Создание первой искусственной жизни – поразительное достижение. Однако оно ничуть не приближает нас к возможности создания мамонтов или странствующих голубей. Во-первых, бактерии – прокариоты, то есть у них нет ядра. Поэтому Вентер и его группа смогли пропустить важный этап создания жизни, который никому пока не удалось преодолеть, – им не пришлось собирать геном, состоящий из множества различных хромосом, внутри ядерной мембраны, что пришлось бы сделать при создании эукариотической клетки. Пока кто-нибудь не справится с этой задачей (пристальный взгляд в сторону Института Крейга Вентера), нам не увидеть резвящихся в округе мамонтов или странствующих голубей с полностью синтезированными геномами. Во-вторых, бактериальные геномы имеют небольшую длину. Геном мамонта содержит более 4 миллиардов спаренных оснований. Геномы птиц, как правило, короче, чем у млекопитающих, но все равно обычно включают в себя не меньше миллиарда пар оснований. Не все эти пары содержат гены, отвечающие за синтез белков, но мы до сих пор по-настоящему не знаем, какая часть остального содержимого генома имеет жизненную важность. Еще важнее то, что мы не знаем и, вероятно, так и не сможем узнать полную геномную последовательность какого-либо вымершего вида. Даже если ученые откроют способ синтезировать полную геномную последовательность эукариотического генома внутри клеточного ядра, вполне возможно, что нам никогда не найти шаблон для синтеза.
Давайте поближе присмотримся к мамонту. За прошедшие годы ученые, работающие с древней ДНК, секвенировали миллиарды пар оснований мамонтовой ДНК, выделенной из тысяч костей и других останков этого животного. Фрагменты ДНК, полученные из этих источников, как правило, повреждены и имеют небольшую длину (примерно от 30 до 90 пар оснований), чего и следует ожидать от очень старой ДНК. Возвращаясь к аналогии с пазлом из главы 2, представим, что фрагменты ДНК мамонта – это кусочки пазла, а на крышке коробки нарисован африканский слон. Хотя благодаря сравнению последовательностей митохондриальной ДНК мы знаем, что индийский слон приходится мамонту более близким родственником, чем африканский (рис. 9), на сегодня мы имеем реконструкцию ядерного генома только африканского слона, так что в качестве шаблона можно использовать только его. Кроме того, геном африканского слона известен нам лишь на 80 % или около того, так что картинка на крышке коробки не совсем верна. В сущности, у нас есть миллиарды микроскопических, слегка деформированных кусочков пазла и немного смазанная фотография-подсказка от другой головоломки.
Рис. 9. Эволюционные связи между мамонтами, мастодонтами, а также индийскими и африканскими слонами, основанные на изучении ископаемых останков и последовательностей митохондриальной ДНК этих животных
Проще всего будет соединить те кусочки пазла, которые относятся к наиболее сохранившимся участкам генома. Это части генома, общие или почти общие для мамонтов и современных слонов, да и всех видов млекопитающих. Мы наверняка справимся и с кусочками, относящимися к тем частям генома, в которых мамонты и африканские слоны похожи, хотя и не полностью идентичны. Сложнее всего будет собрать фрагменты, принадлежащие областям генома, в которых различия между мамонтами и африканскими слонами очень велики. Такие расхождения могут быть следствием перестановки или даже удвоения или исчезновения генов.
В книге «Парк юрского периода» ученые заполнили пробелы в геноме динозавра – на месте фрагментов, которые они не смогли секвенировать, – с помощью ДНК лягушки. Точно так же мы можем решить эту проблему, просто заполнив недостающие участки при помощи ДНК слона. Но вряд ли это хорошая идея. Общий предок мамонтов, индийских слонов и африканских слонов жил на Земле около 4 миллионов лет назад. Это значит, что мамонта отделяет от индийского и африканского слонов более 8 миллионов лет эволюционных изменений – достаточно длинный промежуток, чтобы успели накопиться эволюционные различия. Одними из самых трудных в сборке будут те области генома мамонта, которые подверглись изменениям после точки расхождения мамонтов и других видов слонов. Вероятно, эти участки будут относиться к наиболее важным областям генома, которые потребуется изменить, чтобы получить слона, выглядящего и ведущего себя как мамонт, а не как слон. С точки зрения возрождения вымершего вида узнать правильную последовательность нуклеотидов в этих областях генома будет важнее всего.
В случае геномов живых видов лучший способ собрать эти наиболее каверзные участки заключается в том, чтобы секвенировать очень длинные фрагменты ДНК. Под «длинными» я имею в виду участки длиной в тысячи и сотни тысяч спаренных оснований. Сделать это сложно, и на попытки каждый год уходят огромные деньги. К сожалению, длинные цепочки древней ДНК не сохраняются: большинство наших фрагментов содержат менее сотни спаренных оснований, а зачастую и намного меньше. Так что даже если в ближайшие несколько лет у нас произойдет технологический прорыв, позволяющий секвенировать очень длинные участки ДНК, это не принесет особой пользы для возрождения вымерших видов.
Хорошая новость заключается в том, что стоимость секвенирования ДНК продолжает снижаться, а значит, мы можем создавать все больше и больше цепочек ДНК каждого нашего древнего образца, не разоряясь при этом до основания. Кроме того, мы совершенствуем способы выделения ДНК из окаменелостей. Несмотря на то что эти фрагменты будут короткими, их количество может увеличиться. Кроме того, если нам повезет, мы найдем древние образцы (к примеру, сохранившиеся в замерзшей арктической почве), содержащие много сотен спаренных оснований, – хотя крайне маловероятно, чтобы нам удалось обнаружить фрагменты длиной в тысячи или сотни тысяч спаренных оснований. Наконец, совершенствуются вычислительные методы, используемые для соединения фрагментов ДНК при отсутствии близкородственного шаблонного генома, что позволит нам получить более качественные сборки древних геномов все более разнообразных видов.
Правда, однако, заключается в том, что ни один геном млекопитающего еще не был секвенирован полностью. Это касается и человеческого генома, хотя появившиеся более 10 лет назад восторженные заявления определенно указывают на обратное. Правда заключается в том, что отдельные участки человеческого генома до сих пор не были секвенированы, и их нельзя секвенировать ни одним из существующих способов.
Геном состоит из двух компонентов: эухроматина – компонента, содержащего гены, и гетерохроматина – очень плотного компонента, состоящего из повторяющихся фрагментов. В эухроматической части человеческого генома все еще присутствует несколько очень маленьких несеквенированных промежутков, но на них приходится менее 1 % генома. Вторая, более крупная недостающая часть относится к гетерохроматическим участкам. Гетерохроматин составляет около 20 % человеческого генома, и поскольку он содержит множество повторяющихся фрагментов, это наиболее сложная для секвенирования часть человеческого (и вообще любого) генома. Гетерохроматин, вероятно, играет важную роль в регуляции экспрессии генов, направляя сегрегацию хромосом во время деления клетки и определяя, где разные хромосомы должны находиться в ядре. Но поскольку с помощью существующих технологий секвенировать его очень трудно, мы знаем о гетерохроматине намного меньше, чем о эухроматической части генома.
Секвенировать гетерохроматин из древнего образца будет не легче, чем в случае живого человека. На самом деле секвенировать гетерохроматин из образца, находящегося в плохом состоянии, скорее всего, окажется намного сложнее, чем из образцов тканей живых организмов, вследствие фрагментации древней ДНК. Станет ли это серьезным препятствием на пути к возрождению вымерших видов, еще предстоит выяснить.
Поскольку нам не удастся узнать полную геномную последовательность вымершего вида, синтезировать геном целиком с нуля при возрождении вымершего вида не получится, даже если у нас появится возможность воссоздать искусственную эукариотическую жизнь. Но я совершенно уверена, что синтетическая биология – это действительно способ возродить вымершие виды и исчезнувшие признаки. Пусть нам не удастся создать целый геном, но ведь мы можем синтезировать фрагменты ДНК. Что, если мы используем эти фрагменты, чтобы вернуть вымершие виды к жизни путем редактирования генома?