Новые гены?
Активность генов может меняться в ходе эволюции не только путем изменений сайтов связывания ТФ, работы самих ТФ или регуляторных РНК, но и в результате дупликации генов. При прочих равных два одинаковых гена произведут больше продукта (то есть информационной РНК, которая затем «транслируется» в белок), чем один.
Дупликация генов, так же как и их потеря, — весьма обычное явление в эволюции. В человеческой эволюционной линии (после ее обособления) произошло как минимум 134 генных дупликации. Удваивались не только гены, но и все то, что находится между ними — всевозможные некодирующие участки ДНК, функция которых в большинстве случаев неизвестна. Иногда происходило удвоение отдельных фрагментов генов. Некоторые гены дуплицируются многократно. Например, ген MGC8902 у человека присутствует в 49 копиях (у шимпанзе десять, у макак четыре). Ген к тому же несет следы действия положительного отбора и активно работает в клетках мозга.
Удвоение генов часто становится первым шагом к возникновению принципиально новых генов. Одна из двух копий гена, оказавшись в ином генетическом «контексте» (окружении), может начать по-другому регулироваться, работать в других тканях или на иных этапах развития организма и в конце концов может приобрести новую функцию и структуру. Но это долгий путь. В какой степени он был реализован в эволюции человека, пока неясно, да и определить, в какой момент ген перестает быть просто дубликатом старого гена и начинает быть новым геном, не легче, чем провести грань между нечеловеческими гоминидами и людьми.
Новые гены могут возникать и быстрее — путем перетасовки частей имеющихся генов. Один такой случай зарегистрирован у человека. Ген SIGLEC-11 дуплицировался примерно 15 млн лет назад, еще до расхождения линий человека и шимпанзе. Его вторая копия в какой-то момент выключилась, перестала работать, и в ней накопились мутации. У шимпанзе эта отключенная копия так и осталась невостребованной, а у человека ее фрагмент заместил собой часть исходного гена SIGLEC-11. В результате получился почти совсем новый, чисто человеческий ген. Он кодирует рецепторный белок, относящийся к надсемейству иммуноглобулинов и присутствующий на мембранах лимфоцитов и некоторых клеток мозга. По-видимому, он выполняет нейропротекторную функцию — защищает нервные клетки от каких-то токсинов.
Рассмотрим один хорошо изученный пример появления нового гена путем дупликации и смены функции. Правда, на этот раз речь пойдет о гене, который появился не в гоминидной линии, а раньше — у общего предка человекообразных обезьян. Этот случай детально исследован бельгийскими и швейцарскими биологами в 2008 году (Rosso et al., 2008).
Для начала необходимо напомнить, что существует два основных механизма удвоения генов: «обычная» дупликация фрагментов ДНК и ретродупликация. Последнее означает дупликацию в результате деятельности ферментов — обратных транскриптаз. Гены обратных транскриптаз входят в состав мобильных генетических элементов — ретротранспозонов, которых в геноме любого млекопитающего насчитываются тысячи. Ретротранспозоны размножаются так: сначала клетка осуществляет транскрипцию (прямую, а не обратную) ретротранспозона, то есть синтезирует на матрице ДНК молекулу РНК. Затем эта РНК используется для синтеза закодированного в ней белка — обратной транскриптазы. Последняя в свою очередь может синтезировать на матрице РНК комплементарный ей фрагмент ДНК и встроить его в хозяйскую хромосому (подробнее об этом рассказано в книге «Рождение сложности»).
Время от времени обратные транскриптазы переписывают в ДНК хозяина информацию не только со «своих» молекул РНК, создавая новые копии ретротранспозонов, но и с «хозяйских» РНК, создавая тем самым «лишние» копии хозяйских генов. Отличить такие ретродуплицированные гены от обычных можно по отсутствию в них некодирующих вставок — интронов. Дело в том, что после транскрипции интроны из молекулы РНК вырезаются (это называется сплайсингом). В результате получаются «зрелые матричные РНК», которые используются, с одной стороны, клеткой для синтеза белка, с другой — обратными транкриптазами для создания ретрокопий. В зависимости от того, в какой генетический контекст попадет ретрокопия, она может оказаться либо работающей (тогда ее называют ретрогеном), либо, чаще, она работать не будет, и тогда ее называют ретропсевдогеном.
В эволюции приматов, в том числе человекообразных, ретрогены появлялись довольно часто. Ген CDC14Bretro появился 18–25 млн лет назад у общих предков человекообразных обезьян (гиббонов, орангутанов, горилл, шимпанзе и людей) в результате ретродупликации. Его «родителем» был очень древний ген CDC14B, первые варианты которого появились еще у одноклеточных. Функция этого гена (точнее, кодируемого им белка) состоит в регуляции некоторых стадий клеточного деления. Ген весьма консервативен, то есть мало меняется в ходе эволюции, что говорит о важности выполняемой им функции. Варианты CDC14B настолько похожи у разных организмов, что если у дрожжей удалить этот жизненно необходимый ген и вместо него вставить человеческий аналог, то дрожжевые клетки совершенно нормально живут и делятся.
Как же сложилась судьба ретрокопии этого гена, которая появилась у древних человекообразных?
Здесь необходимо еще одно пояснение. Исходный ген CDC14B у приматов подвергается альтернативному сплайсингу, то есть из незрелой матричной РНК, считанной с этого гена, может быть «нарезана» не одна, а несколько — в данном случае четыре — разных зрелых матричных РНК (которые используются затем для синтеза четырех различающихся вариантов белка). Подробнее о явлении альтернативного сплайсинга рассказано в книге «Рождение сложности». Предком CDC14Bretro является один из четырех сплайс-вариантов, который исследователи обозначили как CDC14Bpar (от parent — «родитель»). Остальные варианты получили названия CDC14B1, CDC14B2 и CDC14B3.
Затем авторы проверили, в каких тканях производятся соответствующие молекулы РНК. Картина получилась любопытная. Оказалось, что все четыре сплайс-варианта исходного гена CDC14B производятся во всех тканях человеческого организма, однако его ретрокопия CDC14Bretro работает (экспрессируется) только в мозге и семенниках. Особенно интересно, что ретроген активно работает во время раннего эмбрионального развития в переднем мозге эмбриона, в той области, из которой впоследствии развивается кора больших полушарий.
Похоже на то, что пока «родительский» ген продолжал заниматься своей старинной работой — регуляцией клеточных делений во всех тканях, — его ретрокопия занялась чем-то более специфическим в мозге и в семенниках. Эта смена тканевой локализации, по-видимому, произошла еще до отделения предков гиббонов от предков остальных человекообразных, то есть вскоре после дупликации, 18–25 млн лет назад. Это подтверждается тем, что у гиббонов, шимпанзе и людей ретроген экспрессируется в одних и тех же тканях — в семенниках и в мозге (горилл и орангутанов пока не проверяли).
Интересные результаты дал также анализ изменений нуклеотидной последовательности ретрогена в ходе эволюции. Сопоставив последовательности гена CDC14Bretro разных человекообразных обезьян с эволюционным деревом этой группы, авторы реконструировали «ископаемые» варианты этого гена, которые имелись у вымерших предков, а также установили, какие нуклеотидные замены и в каком количестве произошли в каждой отдельной веточке. Как известно, нуклеотидные замены делятся на синонимичные, не ведущие к изменению структуры кодируемого белка, и несинонимичные, или значимые. Первые находятся вне сферы внимания естественного отбора и могут накапливаться свободно. Вторые влияют на фенотип и поэтому либо отсеиваются отбором (если они вредны), либо, наоборот, распространяются в популяции и в конце концов фиксируются (если они полезны). Поэтому по соотношению синонимичных и значимых замен можно судить о том, находился ли данный ген под действием одного из двух вариантов отбора. Если синонимичных замен много, а значимых мало, то ген находился под действием отрицательного (очищающего) отбора, который отбраковывал большинство значимых замен. Если доля значимых замен повышена, то ген находился под действием положительного отбора, который способствовал фиксации полезных изменений.
Так вот, оказалось, что ген CDC14Bretro в ходе эволюции гоминоидов почти всегда находился под действием очищающего отбора, и только однажды он подвергся кратковременному, но сильному действию положительного отбора. Этот период соответствует веточке дерева, которая соединяет общего предка орангутанов и африканских человекообразных обезьян (= горилла + шимпанзе + человек) с общим предком последних. Движущий отбор действовал на данный ген только в промежутке от 14 до 7 млн лет назад и только в одной эволюционной линии, которая соответствует общим предкам африканских человекообразных обезьян (после отделения от этой линии предков орангутанов и до разделения ее на линии, ведущие к горилле и к предку шимпанзе и человека). За этот период в гене зафиксировалось 12 значимых замен и ни одной синонимичной.
Большинство значимых замен, зафиксировавшихся у предков африканских человекообразных, расположены в концевых участках гена, от которых зависит, в какие части клетки будет доставляться белок. Поэтому авторы решили проверить, в каких частях клетки работают белки, кодируемые четырьмя сплайс-вариантами CDC14B и ретрогеном CDC14Bretro. Оказалось, что два из четырех сплайс-вариантов скапливаются в клеточном ядре, а два другие, в том числе «предковый» вариант CDC14Bpar, локализуются в цитоплазме и прикрепляются к микротрубочкам — особым внутриклеточным структурам, играющим важную роль в клеточном делении.
Белки, кодируемые ретрогеном CDC14Bretro, у гиббона и орангутана ведут себя так же, как их молекулярный предок — сплайс-вариант CDC14Bpar, то есть прикрепляются к микротрубочкам. Однако белки, кодируемые тем же ретрогеном у гориллы, шимпанзе и человека, ведут себя иначе: они игнорируют микротрубочки и вместо этого прикрепляются к мембранам эндоплазматической сети (системы внутриклеточных каналов, служащей для синтеза и транспорта различных веществ).
Авторы не поленились изготовить «ископаемые» белки по реконструированным последовательностям генов, которые имелись у (1) общего предка орангутана и африканских человекообразных и (2) общего предка африканских человекообразных. Таким образом, были воссозданы белки, существовавшие до и после периода интенсивного положительного отбора. Эти белки затем внедрили в живые клетки. Оказалось, что первый (более древний) воскрешенный белок липнет к микротрубочкам, как у орангутана и гиббона, а второй — к эндоплазматической сети, как у гориллы, шимпанзе и человека.
Дополнительные эксперименты подтвердили, что основной «смысл» тех двенадцати значимых замен, которые зафиксировались в период действия положительного отбора, состоял именно в том, чтобы изменить внутриклеточную локализацию белка — направить его от микротрубочек к эндоплазматической сети. Кроме того, три из этих замен должны были немного изменить свойства активного центра белка — так называемого фосфатазного домена. К сожалению, конкретная биохимическая функция всех этих родственных белков неизвестна, но определенно можно сказать следующее. «Изначальный» вариант белка, кодируемый сплайс-вариантом CDC14Bpar; занимался отрезанием фосфатных групп у какого-то вещества в окрестностях микротрубочек и тем самым управлял клеточным делением. Примерно то же самое поначалу делал и белок, кодируемый вновь образовавшимся ретрогеном CDC14Bretro, но уже не во всех тканях, а только в мозге и семенниках (почему произошло изменение тканевой специфичности, пока неясно). У гиббонов и орангутанов он продолжает этим заниматься до сих пор.
Затем 14–7 млн лет назад у предков африканских человекообразных обезьян ретроген попал под действие положительного отбора и быстро накопил 12 значимых замен, которые привели к смене внутриклеточной локализации и функции белка. Теперь белок стал присоединяться к мембранам эндоплазматической сети и отрезать фосфатные группы у какого-то другого вещества (об этом свидетельствует изменение активного центра). Скорее всего, все началось с какой-то одной случайной замены, которая чуть-чуть изменила свойства белка, так что это изменение оказалось полезным и создало «зацепку» для отбора — возникло слабое полезное отклонение в «удачном» направлении. После этого отбор быстро оптимизировал структуру гена для выполнения новой функции, закрепив еще и мутаций.
Разобранный пример показывает, как в результате дупликации генов и последующей игры случайности (мутаций) и необходимости (отбора) может возникнуть — а может и не возникнуть! — белок с новыми свойствами и функциями.