Вселенная древних белков продолжает расширяться
В 2010 году журнал Natureопубликовал интересную статью об эволюционном движении белков по ландшафтам приспособленности ( Povolotskaya, Kondrashov, 2010). Авторы работы решили сравнить аминокислотные последовательности 572 древних белков, которые имелись уже у последнего общего предка всего живого и были унаследованы его потомками, а также нуклеотидные последовательности соответствующих генов 836 прокариот (бактерий и архей). Эти белки называют древними, потому что после более чем 3,5 млрд лет эволюции в телах разнообразных потомков LUCA они до сих пор сохранили сходство своих аминокислотных последовательностей (вплоть до поразительного 40-процентного сходства рибосомных белков L14 у бактерий и архей) и продолжают выполнять те же функции, что и у Луки.
Расширение физической и белковой Вселенной. Стрела времени направлена сверху вниз. Слева: в ходе расширения физической Вселенной увеличиваются расстояния от произвольно выбранного объекта (например, Земли) до других объектов, причем скорость удаления пропорциональна расстоянию. Справа: в ходе расширения «белковой вселенной» дочерние молекулы удаляются в пространстве последовательностей от исходной точки, которая соответствует одному из белков LUCA. При этом дистанции между произвольно выбранным объектом (например, белком, принадлежащим эволюционной линии, которая привела к кишечной палочкеE. coli ) и другими объектами (родственными белками других эволюционных линий) постепенно растут. Однако белки с данной функцией не могут выйти за пределы «своей» подобласти в пространстве последовательностей — иначе это будет уже другой белок, выполняющий другую функцию (эволюционные события, связанные со сменой функции белка, в обсуждаемой работе не рассматриваются). Границы этой функциональной области показаны внутренним кругом. Рано или поздно расходящиеся белки достигнут этой границы, и дальнейшее расхождение станет невозможным. Стрелочками показано направление движения белков в пространстве последовательностей. По рисунку изPovolotskaya, Kondrashov, 2010 .
Для начала Поволоцкая и Кондрашов решили выяснить, достигли уже эти белки максимального расхождения в пространстве последовательностей или их расхождение (накопление различий) все еще продолжается. Сохранение сходства после 3,5 млрд лет независимой эволюции, казалось бы, говорит о том, что возможности изменения этих белков ограниченны. Можно предположить, что области в пространстве последовательностей, соответствующие их функциям, невелики и предел расхождения давно достигнут. Но возможно и другое объяснение. Эти области могут быть велики, но труднопроходимы. Например, они могут представлять собой лабиринт из узких хребтов, разделенных пропастями, и поэтому на «освоение» всего доступного пространства не хватило миллиардов лет, прошедших со времен LUCA.
Исследователи проводят аналогию между эволюцией белков и расширением Вселенной. Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка — исходного белка с данной функцией, который был закодирован в геноме LUCA.
Принцип анализа белковых последовательностей, примененный Поволоцкой и Кондрашовым. Использовались четверки гомологичных белков, родственные отношения между которыми изображены в виде дерева. Анализ такой четверки позволяет понять, растет или снижается сходство между первыми двумя белками и четвертым. В данном случае считается, что у первого белка «предковая» (имеющаяся у белков 2 и 3) аминокислота R в 11-й позиции (выделена жирным шрифтом ) заменилась на E, что привело к росту сходства первого белка с четвертым, т. е. к их сближению в пространстве последовательностей. У второго белка «предковая» аминокислота K в 3-й позиции (выделена полужирным шрифтом ) заменилась на Y, что привело к снижению сходства второго белка с четвертым, т. е. к их расхождениюв пространстве последовательностей. По рисунку изPovolotskaya, Kondrashov, 2010 .
Чтобы выяснить, закончилось ли уже расширение «вселенной древних белков» или оно продолжается до сих пор, авторы применили оригинальные методы анализа белковых последовательностей. Нам будет полезно с ними ознакомиться — хотя бы для того, чтобы понять логику биоинформатики, молодой науки, занимающейся сравнением и осмыслением генетических текстов.
Использовались четверки гомологичных (происходящих от одного предка) и выполняющих одну функцию белков. Первые два белка в каждой четверке — это близкородственные молекулы с похожими аминокислотными последовательностями. Эти два белка назывались «сестринскими», и именно их эволюция анализировалась в рамках данной четверки.
Третий белок отличался от сестринских белков сильнее, чем они друг от друга. Он выполнял роль «внешней группы», позволяя понять, какие аминокислотные замены произошли в первом, а какие во втором сестринском белке. Например, если у внешнего белка в данной позиции стоит аминокислота K (лизин) и такая же аминокислота стоит здесь у первого из двух сестринских белков, а у второго в этом месте находится другая аминокислота (например, Y — тирозин), то считалось, что K в данной позиции — это «предковое», исходное состояние, а у второго сестринского белка произошла замена K на Y.
К этим трем белкам добавлялся четвертый, еще более далекий от сестринских, чем третий. Если у четвертого белка в данной позиции стоит аминокислота K (как на рисунке), то делался вывод, что у второго сестринского белка произошло эволюционное изменение, увеличившее дистанцию между белками 2 и 4: белки разошлись. Если бы у четвертого белка здесь стояла аминокислота Y, то был бы сделан вывод, что в результате изменения, затронувшего белок 2, белки 2 и 4 сблизились.
В общей сложности было обработано 13,6 млн таких четверок. Для каждой четверки определялось число замен, ведущих к сближению последовательностей и к их расхождению. По соотношению этих двух величин можно понять общую тенденцию: расходятся ли белки, сближаются или балансируют вокруг некого постоянного уровня сходства последовательностей.
Оказалось, что даже у наиболее удаленных друг от друга гомологичных белков тенденция к расхождению значительно преобладает над тенденцией к сближению. Следовательно, «вселенная древних белков» продолжает расширяться и пределы областей, соответствующих их функциям, за 3,5 млрд лет так и не были достигнуты. Эволюция этих белков была крайне медленной. Что же ее сдерживало? Решению этой проблемы посвящена вторая часть статьи, приводящая на память другой рассказ Борхеса — «Сад расходящихся тропок».