Когда очертания двойной спирали прояснились, встала следующая проблема: как она работает, как воздействует на остальные части клетки? В общих чертах ответ был уже известен. Гены определяли аминокислотную последовательность белков. Поскольку остов нуклеиновой кислоты выглядел упорядоченным, мы предположили – и это оказалось верным, – что именно последовательность оснований в нем и несет эту информацию. Так как ДНК находилась в ядре, а синтез белков, похоже, происходил вне ядра, в цитоплазме, мы подумали, что копия каждого активного гена должна как-то отправляться в цитоплазму. Поскольку цитоплазма изобиловала РНК, а явных следов ДНК в ней не было, мы решили, что «почтальоном» служит РНК. Было несложно объяснить, как отрезок ДНК создает РНК-копию – простейший механизм связывания пар оснований это позволял. Труднее было понять, как получившаяся матричная РНК (так ее называют сейчас) может управлять синтезом белков, тем более что этот процесс тогда был изучен крайне слабо.
Кроме того, существовала проблема информации. Нам было известно, что существует десятка два различных типов аминокислот – мелких единиц, из которых состоят белковые цепочки, – однако в ДНК и РНК присутствовали всего четыре различных основания. Одно из возможных решений состояло в том, что с нуклеиновой кислоты считываются по два основания за один прием. Это давало лишь 16 возможных комбинаций (4х4), что представлялось явно недостаточным. Другой возможный вариант – считывание по три основания одновременно. Это дало бы 64 (4х4х4) возможных сочетания четырех оснований A, T, Г, Ц. Но это как будто слишком много.
Возможно, вам будет легче понять дальнейшие рассуждения, если я обрисую современное состояние знания о генетическом коде. К сожалению, словосочетание «генетический код» ныне используется в двух совершенно разных значениях. Непрофессионалы обозначают им всю генетическую информацию в организме. Молекулярные биологи, как правило, подразумевают под ним своего рода словарик, необходимый, чтобы соотнести четырехбуквенный язык нуклеиновых кислот с двадцатибуквенным языком белков, как азбука Морзе соотносит язык точек и тире с 26 буквами латинского алфавита. Я буду употреблять этот термин во втором смысле. Подробности см. в приложении В, где «словарик» представлен в форме таблицы. Рядовому читателю не обязательно вникать в тонкости этой таблицы. Все, что вам нужно знать, – что генетическая информация считывается с неперекрывающихся групп по три основания одномоментно (у РНК набор оснований A, У, Г, Ц). Одна такая группа называется кодоном – этот термин ввел Сидни Бреннер. Оказывается, кодируются таким образом всего двадцать аминокислот. В стандартном коде на две аминокислоты приходится всего по одному кодону, многие кодируются двумя, одна – тремя, некоторые – четырьмя, а у двух аминокислот аж по шесть кодонов. Кроме того, имеются три кодона, обозначающие «конец цепочки» (с началом цепочки все несколько сложнее). В сумме получается как раз 64 кодона. Ни один кодон не остается неиспользованным.
С технической точки зрения такой способ трансляции правильнее, строго говоря, называть не «кодом», а «шифром» – так же, как азбука Морзе на самом деле не азбука, а шифр. В ту пору я этого не знал – к счастью, поскольку «генетический код» звучит куда заманчивее, чем «генетический шифр».
Важный пункт, который следует отметить: хотя в генетическом коде имеются определенные закономерности – в некоторых случаях аминокислоту кодируют два первых основания, третье же не задействовано, – в остальных отношениях его структура не имеет явного смысла. Вполне возможно, что она сложилась в ходе исторических случайностей отдаленного прошлого. Разумеется, все это было неизвестно на 1953 г., когда была открыта двойная спираль.
Мы с Джимом бегло касались проблемы синтеза белков в то лето, но куда больше нас волновала сама ДНК. Правильно ли мы определили структуру? Как именно она реплицируется? Так что серьезно мы к вопросу о белках не подступались.
Однажды нам пришло письмо из Америки, написанное крупным, круглым, незнакомым почерком. Оказалось, что его автор – физик и космолог Георгий Гамов – уже известен нам понаслышке, но содержание письма было для нас в новинку. Гамова заинтересовали наши публикации в Nature. (По правде говоря, у нас порой бывало ощущение, что на них больше обращают внимание физики, чем биологи.) Он сделал скоропалительный вывод, что матрицей синтеза белков служит сама структура ДНК. Он обратил внимание, что, если рассматривать ее с определенной точки зрения, в ней можно обнаружить двадцать различных видов выемок, заданных локальными последовательностями оснований. Так как цепочки белков образуются из двадцати видов аминокислот, он смело предположил, что каждой аминокислоте соответствует лишь один тип выемки.
Сидя в «Орле» и читая письмо Гамова, мы с Джимом сообразили, что так и не сосчитали точное количество типов аминокислот, присутствующих в белках. Оценить его напрямую было затруднительно, поскольку возможных аминокислот много, но в живых организмах встречаются лишь немногие из них, и то не все в белках. Специалисты по химии белков открыли свыше двадцати аминокислот в различных белках, но некоторые среди них, например, гидроксипролин, присутствовали лишь в одном-двух белках, а не в большинстве.
Гамов предложил собственную «волшебную двадцатку», но мы тут же заметили, что некоторые из его кандидатур неубедительны и что он, напротив, упустил кое-какие очевидные – например, аспарагин и глутамин. Прямо на месте мы составили собственный список. Не помню, разбирался ли Джим в тонкостях, но, к счастью, у меня на тот момент уже были обстоятельные познания во многом, что касалось структуры белков. Основная наша идея состояла в том, что аминокислоты, из которых предположительно состоят белки, следовало отнести либо к «стандартным», либо к «нестандартным». Всякая аминокислота, о которой было известно, что она встречается в широком спектре белков, включалась в набор стандартных. Аминокислоты, встречавшиеся в немногих и нетипичных белках, например, бромотирозин, мы зачисляли в нестандартные. Кроме того, мы исключали любые аминокислоты, которые, даже если встречались в составе полимеров клетки, до сих пор не были обнаружены в настоящих белках. К ним, например, относилась диаминопимелиновая кислота, присутствующая в клеточных стенках некоторых бактерий.
Мы не утверждали, что всякий белок должен включать все аминокислоты стандартного списка, поскольку в небольшой молекуле белка какая-либо из более редких аминокислот может отсутствовать просто по случайности – в силу того, что ее полипептидная цепочка состоит из малого числа аминокислот (например, в молекуле инсулина нет триптофана и метионина). К нашему удивлению, у нас получилось точно двадцать. Что замечательно, впоследствии наш список по существу подтвердился. Независимо от нас Дик Синг, один из изобретателей современной хроматографии, составил похожий список, но у него была одна лишняя «кандидатура» – цистин наравне с цистеином, что было явно неубедительно.
Стоит заметить, что все авторы учебников по биохимии предлагали списки гораздо длиннее. В начале столетия открытие каждой новой аминокислоты, встречающейся в белках, становилось событием. Те времена прошли, но романтика поиска все еще витала. Новая аминокислота, если ее присутствие в белках удавалось подтвердить экспериментально, все еще считалась важным открытием и заносилась в учебники. Мысль, что может существовать стандартный набор аминокислот, а все остальные – в некотором роде отклонения, была чужда большинству биохимиков, хотя некоторые специалисты по белкам, несомненно, ее допускали, пусть и не выражали вслух. Ныне известно, что механизм синтеза белков весьма специфичен и может работать лишь с ограниченным набором аминокислот. Прочие, «нестандартные», получаются главным образом из стандартных путем модификации в ходе дополнительных процессов после того, как полипептидная цепь уже синтезирована.
Это красивый пример природной сложности, порожденной естественным отбором. Он показывает, как легко впасть в заблуждение, если избрать чересчур прямолинейный подход к биологическому вопросу. Конечно, нам повезло, что мы угадали верный стандартный набор с первой попытки. Это была удачная догадка, которая нуждалась в подтверждении множеством дополнительных экспериментов. Хотя биохимикам потребовалось несколько лет для того, чтобы ее подтвердить, никто не усомнился по-настоящему, что наш список верен. Несмотря на то что некоторые данные получались противоречивыми, наш список выдержал испытание временем. Из него исключили только формилметионин, используемый для начала синтеза цепочки ДНК у прокариот, а этого предвидеть мы попросту не могли.
Не помню, приложил ли Гамов к первому письму рукопись статьи (наверное, он прислал ее позже), но когда мы получили экземпляр – он у меня где-то валяется до сих пор, – мы с удивлением обнаружили, что Гамов вписал своим соавтором Томкинса. Гамов был знаменит в качестве популяризатора науки, с немного чудаковатым уклоном. Мистер Томкинс, гамовский «маленький человек», – персонаж ряда его книг, обычно фигурирующий в заглавии (например, «Мистер Томкинс познает атом»). Увы, к моменту публикации статьи мифического мистера Томкинса изгнал суровый редактор.
«Код» Гамова был причудлив в нескольких отношениях. Каждая аминокислота кодировалась тройкой оснований (а точнее, несколькими тройками, связанными симметрией), но тройки, кодирующие последовательные аминокислоты, перекрывались. Например, если отрезок последовательности выглядел как …ГГAЦ…, то комбинация ГГA кодировала одну аминокислоту, а ГAЦ – следующую. Естественно, это накладывало ограничения на аминокислотную последовательность. Некоторые последовательности не могли быть закодированы таким способом. Это не было очевидно, поскольку Гамов не знал, какой из его триплетов какую аминокислоту кодирует. Вопрос оставался открытым и требовал экспериментального выяснения. В то время, хотя аминокислотный состав многих белков был уже установлен, по крайней мере приблизительно, последовательности были известны лишь фрагментарно (Фред Сэнгер еще не закончил работу над расшифровкой последовательности двух цепочек инсулина), так что данных для проверки теории Гамова было не слишком много.
У нас с Джимом имелся ряд возражений против идей Гамова. Мы сомневались, что выемки в молекуле ДНК годятся для осуществления подобной задачи. Нас смущали его постулаты о симметрии, и мы не одобряли идею, что ДНК напрямую кодирует белки. РНК казалась более вероятной кандидатурой, но, может быть, РНК была способна укладываться в структуру, образующую нужные впадины. Гамов неявно ввел одно ограничение, которое представлялось вполне естественным. Связанные в цепочку аминокислоты оказываются друг от друга на близком расстоянии – всего около 3,7 ангстрем (длина сильной связи между атомами обычно колеблется между 1 и 1,5 ангстремами). Однако комбинация из трех оснований намного длиннее. По этой причине перекрывающийся код, позволяющий сократить это расстояние, выглядел более правдоподобным, несмотря на ограничения, которые он накладывал на возможные аминокислотные последовательности.
Гамов внес и другой вклад. Мы осознали, что расшифровка кода может рассматриваться как абстрактная проблема, отвлеченная от реальных биохимических тонкостей. Возможно, изучая ограничения аминокислотных последовательностей по мере того, как они становятся известны, и наблюдая, как мутации влияют на ту или иную последовательность, можно взломать код без знания всех промежуточных биохимических ступеней. Такой подход представляется естественным физику, столкнувшемуся со сложностями химии и биохимии, хотя ради справедливости по отношению к Гамову нужно признать, что его идеи изначально основывались на нашей модели двойной спирали, а не на одних абстракциях.
Зимой 1953–1954 гг., когда я работал в Бруклинском политехническом институте – это была моя первая поездка в Штаты, – я сумел опровергнуть все возможные варианты гамовского кода, опираясь на те немногие данные о последовательностях, которыми тогда располагала наука, и исходя из допущений (по сути, необоснованного), что код «универсален» – то есть одинаков для всех живых организмов.
Следующим летом мы с Джимом провели три недели в Вудс-хоул. Там были Гамов с женой – они жили у Альберта Сент-Дьердьи, во флигеле у моря. (Сент-Дьердьи, венгр по происхождению, получил Нобелевскую премию в 1937 г., главным образом как первооткрыватель витамина С). К тому времени Гамов познакомился со многими исследователями, интересовавшимися проблемой кода, и в первую очередь с Мартинасом Ичасом и Алексом Ричем. По вечерами мы с Джимом часто приходили к флигелю – посидеть с Гамовым на берегу, обсудить всевозможные аспекты проблемы кода, просто потрепаться или посмотреть, как Гамов показывает карточные фокусы любой подвернувшейся симпатичной девушке. Темп научной жизни в те времена был далеко не столь лихорадочным, как в наши дни.
К тому времени мы достаточно тесно сошлись с Гамовым и стали звать его Джо. Его звали Георгий, но в письмах он подписывался Geo. Он почему-то считал, что это произносится «Джо», и его стали так называть в кругу друзей. Мы привыкли к его детскому почерку, его типично русской привычке пропускать артикли a и the, его орфографическим ошибкам. Мы думали, что причина ошибок – то, что ему приходится писать на иностранном языке, но позже узнали, что на родном русском у него такие же проблемы с правописанием. Кроме того, нас поразила его машина – большой белый кабриолет с красными сиденьями. Он сказал мне, что треть его дохода составляет зарплата научного работника, треть приносят книги и еще треть – консультирование; таким образом, чрезмерно дорогая машина отчасти получила объяснение. Он был приятным и дружелюбным, несмотря на то что его возраст и положение были солиднее нашего. Он отстаивал теорию происхождения Вселенной в результате Большого взрыва – среди прочего, он предсказал существование реликтового излучения, которое тогда еще не открыли. Католическая церковь предпочитала его теорию конкурирующей теории «непрерывного творения», выдвинутой Голдом, Бонди и Хойлом. И все же я слегка удивился, когда он сказал мне, что обменивается репринтами с папой римским через канцелярию Святого престола.
Гамов любил пропустить стаканчик виски. Хотя тогда я этого не замечал, он, вероятно, уже ступил на скользкую дорожку к алкоголизму. Я ничуть не удивился, получив по почте письмо, написанное его узнаваемым почерком и приглашавшее на «праздник РНК с виски и твистом», который должен был состояться у него дома через несколько дней. Зайдя к нему в следующий раз, я поблагодарил его за приглашение, но оказалось, что он знать не знает ни о каком празднике. К его недоумению, письма от принявших приглашение продолжали поступать. Их передавал из большого дома Альберт Сент-Дьердьи. Естественно, Джо заподозрил, что виновником был сам Сент-Дьердьи, но тот все отрицал. «Ей-богу, это не я», – ответил он. Джо был сконфужен, и я понял: надо что-то делать. Мне потребовалось не так много времени, чтобы обнаружить, что одним из авторов розыгрыша был Джим. Обычно он не был склонен к розыгрышам, но его учитель Макс Дельбрюк пользовался скандальной славой по этой части. Вторым шутником оказался племянник Альберта, Эндрю Сент-Дьердьи. Я заключил дипломатическое соглашение. Джим и Чули (домашнее прозвище племянника) обязались выставить пиво, с Джо причиталось виски. Вечеринка прошла чрезвычайно успешно, и почти все приглашенные явились.
Тем временем Джо в присущей ему манере основал странную организацию – Галстучный клуб РНК. Это было весьма элитарное общество: кого туда принимать, решал Гамов. Клуб состоял всего из двадцати членов, по числу аминокислот, и каждый из них получал не только галстук, изготовленный по рисунку Гамова галантерейной фирмой в Лос-Анджелесе (это организовали Джим Уотсон и Лесли Орджел), но и булавку к нему, на которой было написано сокращенное название соответствующей аминокислоты. Мне, кажется, достался «Тир» – тирозин, но не помню, дошла ли до меня сама булавка. Клуб никогда не собирался очно, но у него существовал список должностей. Джо Гамов был назначен Синтезатором, Джим Уотсон – Оптимистом, а я – Пессимистом. Мартинаса Ичаса назначили Архивариусом, а Алекса Рича – Лордом-хранителем печати. Как выяснилось, клуб служил механизмом письменного обмена спекулятивными идеями между заинтересованным меньшинством. После возвращения в Англию осенью 1956 г. я написал для клуба статью, в которой анализировал соображения Гамова, обобщал их и выдвигал идею, которая впоследствии оказалась важной, – адапторную гипотезу.
Статья называлась «О вырожденных матрицах и адапторной гипотезе» (On Degenerate Templates and the Adaptor Hypothesis). Основная мысль ее состояла в том, что чрезвычайно трудно представить себе, как ДНК или РНК в любой мыслимой форме может обеспечить прямые инструкции к синтезу боковых цепочек двадцати стандартных аминокислот. Однако любая структура, по-видимому, имела определенные закономерности расположения групп атомов, которые могли образовывать водородные связи. Поэтому я предложил теорию, согласно которой существовало двадцать адапторов (по одному на каждую аминокислоту) наряду с двадцатью особыми ферментами. Каждый фермент присоединял определенную аминокислоту к соответствующему адаптору. Эта комбинация затем отражается на матрице РНК. Молекула-адаптор может вписаться только в те места на матрице нуклеиновой кислоты, где она способна образовать водородные связи, необходимые, чтобы она прикрепилась. Вписавшись, она поднесет аминокислоту как раз к нужному месту.
Из этой мысли следовало несколько выводов. Здесь я подчеркну один из них – что генетический код может иметь практически любую структуру, поскольку конкретные детали зависят от того, какая аминокислота каким адаптором переносится. Это соответствие, скорее всего, установилось на очень раннем этапе эволюции и, возможно, случайным образом. По причине этого пессимистического вывода статья открывалась цитатой из малоизвестного персидского автора XI века: «Ибо сильнее всего сбивается с пути тот, кто ищет пути там, где его нет», – а завершалась замечанием: «В достаточно изолированных условиях Кембриджа мне, надо признаться, часто не хватает духу, чтобы взяться за проблему кода».
Статья была разослана членам Галстучного клуба РНК, но так и не вышла в настоящем журнале. Это самая резонансная из моих напечатанных статей. Позже я опубликовал краткую заметку с изложением этой идеи, где условно допускал, что адаптором может быть маленький отрезок нуклеиновой кислоты. Вскоре выяснилось, что Малон Хогланд, биохимик из Гарвардской медицинской школы, независимо получил экспериментальные свидетельства в поддержку моей гипотезы. В наши дни каждому молекулярному биологу известно, что данную функцию выполняет семейство молекул, которые теперь называют транспортными РНК. По иронии судьбы, я не сумел с ходу распознать в этих молекулах транспортной РНК искомый адаптор, потому что они были значительно крупнее, чем я ожидал, но вскоре я убедился, что мой скепсис безоснователен. Вскоре после этого Малон приехал на год в Кембридж, и мы вместе занялись опытами с транспортной РНК. Мы работали в маленькой комнатке на верхнем этаже в Мольтеновском институте, которую директор любезно уступил нам в пользование, пока она временно пустовала.
В этот период теоретики усиленно бились над попытками разрешить проблему кода – в первую очередь Гамов, Ичас и Рич. Гамов и Ичас выдвинули идею «комбинаторного кода», где порядок оснований в триплете не имел значения, а важна была только их комбинация. Хотя эта гипотеза была неправдоподобна со структурной точки зрения, в ней что-то было, поскольку возможных комбинаций из четырех элементов, взятых по три, получается как раз двадцать. Но по-прежнему оставалось совершенно неясным, как соотнести каждую аминокислоту с комбинацией оснований.
Ученые всё еще думали, что код должен быть перекрывающимся, поэтому поиск ограничений на аминокислотную последовательность продолжался. По мере того как открывали новые последовательности, их добавляли к уже известным, но не находилось ни малейших признаков того, что какие-либо последовательности запрещены, пусть поначалу данные и были чересчур скудными, чтобы мы могли быть уверены в том, что ничего не упустили. Внимание было сосредоточено в основном на соседних аминокислотах. Комбинаций из двух аминокислот возможно общим счетом 400 (20х20). Любая перекрывающаяся тройка могла бы кодировать лишь 256 (64 возможных тройки, помноженных на 4), так что код подобного рода должен был иметь ограничения. Сидни Бреннер сообразил, что этот довод можно усилить. С любым триплетом могли соседствовать по одну сторону лишь четыре других триплета. Например, если речь идет о триплете AAT, то предшествовать ему могли только TAA, ЦAA, AAA и ГAA, тогда как следовать после него – только ATT, ATЦ, ATA и ATГ, если принять, что код перекрывается. Следовательно, если в известных последовательностях у определенной аминокислоты окажется девять и более «соседей», следующих после нее, значит, ее кодирует не менее трех триплетов, поскольку два триплета дают лишь восемь. Сидни сумел показать, что необходимое количество триплетов существенно превышает 64 и что, следовательно, все перекрывающиеся варианты триплетного кода невозможны. Это рассуждение исходило из посылки, что код «универсален» – то есть одинаков для всех организмов, для которых получены экспериментальные данные, – но оно было достаточно убедительно, чтобы мы практически уверились в ошибочности идеи перекрывающегося кода.
Это не отменяло геометрического затруднения. Как могла в процессе синтеза белков одна аминокислота оказаться достаточно близко к другой для соединения в цепочку, если кодирующие их триплеты не перекрывались и, следовательно, были разделены некоторым расстоянием? Сидни предположил, что у постулируемых адапторов имеется гибкий хвостик, к концу которого присоединяется нужная аминокислота. В ту пору мы с Сидни не рассматривали эту идею слишком серьезно и называли ее «авось-теорией», подразумевая, что можно представить себе по крайней мере один способ, которым природа могла бы разрешить эту проблему, так что незачем на данном этапе переживать, каков в действительности правильный ответ, тем более что перед нами стояли более важные задачи. В данном случае, как оказалось, Сидни был прав. У каждой транспортной РНК в самом деле есть гибкий хвостик, к которому присоединяется аминокислота.
В скобках позволю себе заметить, что английская школа молекулярной биологии, когда ей нужно как-то назвать новое понятие, обычно использует общеизвестное английское слово, такое как «бессмысленный» (nonsense) или «перекрывающийся» (overlapping), тогда как парижане любят сочинять слова с латинскими корнями, например, «капсомер» (capsomere) или «аллостерическая регуляция» (allosterie). Бывшие физики, например, Сеймур Бензер, обожают придумывать слова, оканчивающиеся на «-он»: «мутон», «рекон», «цистрон». Новые слова зачастую быстро входили в обиход. Однажды молекулярный биолог Франсуа Жакоб уговорил меня выступить с докладом в парижском клубе физиологов. По тогдашним правилам все доклады следовало делать на французском. Меня не обрадовало это предложение, ибо с французским у меня совсем плохо, но Франсуа дал понять Одилии (одинаково хорошо говорившей на английском и французском), что, если я соглашусь, она тоже получит возможность съездить в Париж, так что вскоре мне пришлось сдаться. Я решил выступить по вопросу генетического кода, пребывая в убеждении – как оказалось, ложном, – что осилю доклад, написав основные положения мелом на доске. Но вскоре стало ясно, что говорить по-французски мне придется, чтобы объяснить суть идей, так что я начал с того, что надиктовал весь доклад секретарше (обычно я использую для докладов заметки). Затем я выкинул оттуда все шутки, потому что даже при выступлении перед секретаршей обнаружил, что мои импровизированные анекдоты неуместны, и понял, что вряд ли смогу прочесть их бесстрастно. Затем Одилия перевела доклад на французский, рукопись ее была перепечатана на машинке и повсюду расставлены ударения, чтобы мне было легче читать. Однако возникла проблема, как перевести термин «перекрывающиеся». Как это будет по-французски? В конце концов Одилия вспомнила подходящее слово, и мы выехали в Париж. Я настолько сомневался в этом странном слове, что по прибытии спросил у Франсуа, какое слово у них используется в значении «перекрывающиеся». «А, – ответил он, – мы просто говорим пере-кри-ваю-штиеса».
Я был бы рад похвастаться, что доклад прошел успешно, но не могу. Начал я достаточно гладко, старательно зачитывая, но по мере того как входил в раж, мое произношение становилось все более диким. Обсуждение – в основном на французском – далось мне крайне тяжело. После доклада я спросил Франсуа, как я выступил. «Не так уж плохо, – тактично отозвался он, – только непохоже на себя». Я понял, что он имеет в виду: ни спонтанности, ни юмора. С тех пор я ни разу не пытался делать доклады на иностранных языках, хотя мое французское произношение со временем и улучшилось.
Стало ясно, что код не перекрывается, но из-за этого тут же встала новая проблема. Если код читался как последовательность неперекрывающихся триплетов, как узнать, где границы между триплетами? Иначе говоря, если мы представим себе, что нужные тройки разделены запятыми (например, ATЦ, ЦГA, TТЦ), откуда клетка знает, где ставить «запятые»? Очевидная мысль, что считывание начинается с начала (где бы оно ни находилось) и продвигается шагами по одной тройке за раз, казалась слишком простой, и я решил (ошибочно), что должно быть какое-то другое решение. Мне пришло в голову попытаться смоделировать код со следующими характеристиками. При наличии определенной рамки считывания все триплеты будут «осмысленными» (то есть кодирующими ту или иную аминокислоту), тогда как все триплеты, считывающиеся вне рамки (расположенные в местах воображаемых «запятых»), будут «бессмысленными» – то есть у них не будет адаптора и потому они не смогут кодировать никакую аминокислоту. Я рассказал об этой идее Лесли Орджелу, который тут же отметил, что в таком коде максимальное количество кодирующих триплетов будет равняться 20. Комбинация типа ААА должна быть бессмысленной, поскольку последовательность ААА может читаться с любым сдвигом. (К тому времени мы уже приняли по умолчанию, что любая аминокислота может следовать за каждой.) Это исключало 4 из 64 триплетов. Если триплет XYZ кодирующий, то круговые перестановки YZX и ZXY должны быть некодирующими, так что максимальное число кодирующих триплетов равняется 60 : 3 = 20. Вопрос был в том, существует ли набор из 20 триплетов с подобными свойствами. Я валялся в постели с тяжелой простудой, но обнаружил, что по крайней мере 17 насчитать могу легко. Лесли указал на эту проблему Джону Гриффиту, который насчитал 20 с подходящими свойствами. Мы вскоре обнаружили несколько других решений (плюс множество перестановок), так что сомнения отпали: такой код возможен. Мы даже изобрели убедительный довод, объясняющий, чем он полезен.
Проблема, как получить искомые двадцать кодирующих триплетов, в действительности не самая трудная. Чуть позже я купил билет на ночной рейс из Штатов в Англию. В ожидании посадки я встретил космолога Фреда Хойла и разговорился с ним. Он спросил меня, чем я занимаюсь, и я объяснил ему идею кода «без запятых». На следующее утро, когда самолет приближался к английскому побережью, Хойл подошел к моему креслу с решением – он обдумал его за ночь.
Естественно, идея «кода без запятых» привела нас с Орджелом и Гриффитом в восторг. Она выглядела так красиво, можно сказать, элегантно. На входе – волшебные числа 4 (количество оснований) и 3 (триплет), на выходе – волшебное число 20, число аминокислот. Без дальнейших хлопот мы записали свои соображения для Галстучного клуба РНК. И все же меня одолевали сомнения. Я понимал, что у нас нет иных свидетельств в пользу кода, кроме эффектного совпадения числа 20. Но если объявится какое-то другое число, то нам придется отбросить эту идею и искать другой вариант кода, который давал бы 20 аминокислот, так что само по себе число 20 не было доказательством.
Несмотря на мои тревоги, новая гипотеза кода привлекла внимание. После того как четверо исследователей поинтересовались, можно ли сослаться на нашу работу (записка для Галстучного клуба РНК не приравнивалась к публикации), мы решили написать статью для «Трудов Национальной академии наук США», где она и вышла в 1957 г. Пересказ ее даже появился в популярной книге «Виток жизни» (The Coil of Life), написанной Рут Мур, хотя эта книга вышла лишь в 1961 г., когда мы уже разочаровались в этой идее.
Так как модель «кода без запятых» отводила на каждую аминокислоту только по одному триплету, то предполагалось, что можно, зная, какой аминокислоте какой триплет соответствует, определить, из каких оснований состоит ДНК – исходя из того, что все они кодируют белки, – опираясь на среднестатистический аминокислотный состав белков. Так как состав белков у всех организмов весьма похож (хотя мы уже знали о существовании небольших различий), это подразумевало, что молекулы ДНК у всех видов по составу близки. По мере накопления данных, в особенности о разнообразных типах бактерий, становилось ясно, что это вовсе не так. Разумеется, количество аденина всегда равнялось количеству тимина (А = Т), поскольку этого требовал закон комплементарности, и по этой же причине гуанина было столько же, сколько цитозина (Г = Ц), но сама по себе структура ДНК не накладывала никаких ограничений на соотношение (А + Т): (Г + Ц), и это соотношение, как оказалось, значительно варьирует от организма к организму. Следовательно, «код без запятых» был ошибочным решением.
Удары, окончательно похоронившие его, пришли с двух сторон. Наши собственные исследования мутаций с фазовыми сдвигами, о которых будет рассказано в гл. 12, поставили его под сомнение, но более решительный удар нанес Маршалл Ниренберг, показавший, что полимер из одного урацила (простейшая форма РНК) кодирует полифенилаланин (см. с. 222) – ведь в рамках «кода без запятых» триплет УУУ должен был быть некодирующим. Итоговая расшифровка генетического кода, подтвержденная неоднократно различными методами, решительно доказала, что вся идея была ошибочной. Правда, можно допустить, что такой принцип мог сыграть некоторую роль на заре возникновения жизни, когда код только начал эволюционировать, – но это чистой воды домыслы.
Идея «кода без запятых» привлекла внимание специалистов по комбинаторике, в особенности Сола Голомба. Нам так и не удалось разрешить проблему исчисления всех возможных вариантов четырехбуквенного кода с перекрывающимися триплетами, хотя мы нашли не одно решение. Решение было разработано Голомбом и Уэлчем с помощью очень простого соображения (до которого нам самим стоило бы додуматься), послужившего ключевым звеном доказательства. Примерно в то же время проблему независимо решил голландский математик Х. Фрейденталь.
В конце концов код (см. приложение Б) был расшифрован экспериментальными, а не теоретическими, методами. Основной вклад внесли команды Маршалла Ниренберга и Гобинда Хораны. Существенную роль сыграла также команда под руководством Северо Очоа, уже нобелевского лауреата на тот момент. По мере выяснения кода делались попытки угадать целое по кусочку, но большей частью неудачные. В некоторых отношениях код воплощает основу молекулярной биологии, как таблица Менделеева воплощает основу химии. Но между ними есть глубокое различие. Периодическая таблица, вероятно, верна для любой точки во Вселенной и тем более работает в тех местах, где температура и давление близки земным. Если же в других мирах есть жизнь и даже если эта жизнь состоит из нуклеиновых кислот и белков (что вовсе не обязательно), ее код, скорее всего, будет значительно отличаться. Даже здесь, на Земле, некоторые организмы демонстрируют мелкие различия. Генетический код, как и сама жизнь, не свойство вечной природы вещей, а – по крайней мере отчасти – продукт случайности.