Генетический код – это словарик, дающий перевод с четырехбуквенного языка нуклеиновых кислот (А, Г, Т и Ц для ДНК; РНК вместо Т содержит У) на двадцатибуквенный язык белков. Группа из трех расположенных подряд букв называется кодоном и кодирует аминокислоту. (Всего кодонов 4 × 4 × 4 = 64.) Большинство аминокислот кодируется более чем одним кодоном. Помимо этого, три кодона обозначают конец цепочки.
Генетический код обычно изображают так, как он показан в таблице В-1. На первый взгляд таблица может показаться запутанной, но по сути она очень проста. Точная химическая формула каждой аминокислоты известна. Возьмем, например, аминокислоту валин. Для простоты чтения валин в таблице обозначен сокращенно Val. Аналогичным образом гистидин, другая аминокислота, обозначается His. Для каждой аминокислоты в таблице можно прочесть три основания соответствующего триплета. Первое основание указано слева, второе – сверху, а третье – справа. Так, можно видеть, что валин (Val) кодируется сочетаниями ГУУ, ГУЦ, ГУА и ГУГ, тогда как гистидину (His) соответствуют кодоны ЦАУ и ЦАЦ. Три кодона, отмечающие окончание полипептидной цепочки (STOP), – это УАА, УАГ и УГА. Левый конец цепочки РНК или ДНК в общепринятой записи называется 5’-концом, а правый – 3’-концом (по химическим причинам).
Таблица B-1
Код, по-видимому, совершенно одинаков у всех высших растений и животных, изученных на данный момент. Впрочем, известны небольшие вариации, особенно у ДНК некоторых митохондрий (крошечных органелл, живущих в цитоплазме высших организмов) и, несомненно, у грибов.
У урацил (для ДНК следует читать T [= тимин] на месте У)
Ц цитозин
A аденин
Г гуанин
Ala аланин Lys лизин
Arg аргинин Met метионин
Asn аспарагин Phe фенилаланин
Asp аспарагиновая кислота Pro пролин
Cys цистеин Ser серин
Gln глутамин Thr треонин
Glu глутаминовая кислота Trp триптофан
Gly глицин Tyr тирозин
His гистидин Val валин
Ile изолейцин Leu лейцин
STOP – «конец цепочки»