Днк – инструкция по сборке белков
ДНК представляет собой еще один класс органических веществ, но если аминокислот в белках 20, то для построения ДНК предусмотрены лишь четыре «буквы» (они называются нуклеотидами). Последовательность из трех нуклеотидов (это т. н. кодон) кодирует одну аминокислоту. И если есть 4 типа нуклеотидов, то из них можно составить 64 кодона (4 нуклеотида на первой позиции × 4 на второй позиции × 4 на третьей = 64). Некоторые из этих 64 зарезервированы для обозначения конца гена; за вычетом этих «стоп-кодонов» для 20 аминокислот остается 61 кодон. Поэтому кодирование аминокислот характеризуется избыточностью нуклеотидного кода – на каждую аминокислоту приходится более одного кодона (в среднем 3, т. е. 61/20). Как правило, различные кодоны для конкретной аминокислоты различаются одним нуклеотидом. Например, для аминокислоты аланина отведены кодоны ГЦА, ГЦЦ, ГЦГ и ГЦТ,. Избыточность кода важна для понимания эволюции на уровне генов.
Полная последовательность нуклеотидов, кодирующая определенный белок, называется «ген». Совокупная ДНК организма называется «геном», в геноме содержатся десятки тысяч генов организма. Секвенировать геном означает определить уникальную последовательность миллиардов нуклеотидов, слагающих геном организма. И эта цепочка нуклеотидов настолько гигантская (у человека около 20 000 генов), что ее приходится разбивать на несколько томов, называемых хромосомами.
Отсюда рождается проблема размещения. Библиотека ДНК располагается в центре клетки, в ядре. А белки находятся повсюду в клетке и синтезируются тоже повсюду в клетке (кстати, подумайте о белках в аксонных окончаниях нейронов спинного мозга синего кита, ведь им до ядра нейрона сотни световых лет). И как же доставить информацию из ядра к месту сборки белка? Для этого есть посредник, который довершает картину. Это РНК, близкая к ДНК молекула, которая теми же нуклеотидными буквами копирует нуклеотидную последовательность гена. Любая хромосома содержит невероятно длинную цепочку ДНК, кодирующую ген за геном. А в цепочке РНК, напротив, закодирован один-единственный ген. Иными словами, РНК имеет более практичную длину. И эта РНК может отправляться к месту назначения в клетке, где она распорядится, в каком порядке прицеплять друг к дружке аминокислоты (а аминокислоты в изобилии имеются повсюду в клетке, вдруг понадобятся для какого-нибудь белкового проекта). РНК можно представлять себе как ксерокопии одной страницы гигантской двадцатитысячестраничной энциклопедии ДНК. (В свою очередь, на основе единственной страницы РНК-инструкции можно построить множество копий белка. Это, безусловно, облегчает задачу синтеза одного и того же белка в любом из аксонных окончаний.)
В этой схеме заключена т. н. центральная догма молекулярной биологии, которую в начале 1960-х гг. сформулировал Фрэнсис Крик, второй участник знаменитой пары Уотсон и Крик, открывшей структуру двойной спирали ДНК (к ним должна быть причислена и Розалинд Франклин, но это уже другая история). Центральная догма Крика утверждает, что нуклеотидная последовательность ДНК, составляющая ген, предопределяет уникальную последовательность РНК, а она, в свою очередь, однозначно определяет последовательность аминокислот, а та, в свою очередь, жестко задает форму/формы белка, а от нее, в свою очередь, зависит функция этого белка. В этой концепции негласным образом подразумевается еще одно важнейшее утверждение: каждый ген кодирует один белок.
Чтобы не создавать лишних сложностей, я дальше не буду упоминать РНК, потому что нам сейчас интересны гены, стартовая точка синтеза. Как гены соотносятся с белками и, соответственно, с их функциями?