KnigaRead.com/

Ник Лейн - Лестница жизни

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Ник Лейн, "Лестница жизни" бесплатно, без регистрации.
Перейти на страницу:

Теперь задача сразу стала ясна. Все свелось к математической головоломке, варианты решения которой не ограничивались никакими фактами из тех, что пришлось зубрить следующим поколениям студентов, изучавших молекулярную биологию. Четыре буквы в молекулах ДНК должны были кодировать двадцать аминокислот. Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте. Дублетный код тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот (4 x 4 = 16). Минимальное число букв было три, то есть код мог быть триплетным (впоследствии Фрэнсис Крик и Сидней Бреннер доказали, что это именно так). Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (4 x 4 x 4 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же их было только двадцать? Секрет этого фокуса должен был объяснить смысл четырехбуквенного «алфавита», организованного в шестьдесят четыре трехбуквенных «слова», кодирующие двадцать аминокислот.

Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий (Джордж) Гамов, больше известный своими теориями, касающимися Большого взрыва. Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали. Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной. Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации. Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее. Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц. Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее. И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.

Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом. Но Фред Сэнгер, скромный гений, впоследствии получивший две Нобелевских премии (одну за метод прочтения последовательностей аминокислот в белках, другую — за метод прочтения букв в ДНК), занимался в то время выяснением последовательности аминокислот в молекуле инсулина. Вскоре он выяснил, что аминокислоты в белке могут располагаться в любом порядке и ограничений на их последовательности в белках в природе нет. Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота. Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.

Следующую попытку разгадать загадку кода предпринял Крик. Он высказал идею настолько красивую, что ее немедленно все приняли, хотя самого автора и смущала нехватка доказательств. Крик воспользовался новыми открытиями, сделанными в нескольких молекулярно-биологических лабораториях, в первую очередь в новой лаборатории Уотсона в Гарварде. Уотсон глубоко увлекся исследованиями РНК — более короткой одноцепочечной молекулы, близкой к ДНК и находимой как в цитоплазме клеток, так и в ядре. Кроме того, он обратил внимание на то, что РНК составляет неотъемлемую часть крошечных структур, теперь называемых рибосомами, на которых, судя по всему, и синтезировались белки. Итак, неактивная ДНК сидит в ядре. Когда нужно синтезировать какой-либо белок, соответствующий участок ДНК используется в качестве матрицы, чтобы синтезировать его РНК-копию. Она физически выходит из ядра и достигает ожидающих ее снаружи рибосом, синтезирующих этот белок, используя в качестве матрицы уже молекулу РНК. Эта разновидность РНК впоследствии получила название матричной РНК (мРНК). Уотсон еще в 1952 году писал Крику: «ДНК делает РНК делает белок». Крика теперь интересовало вот что: как точная последовательность букв молекулы матричной РНК переводится (транслируется) в последовательность аминокислот в белке?

Крик крепко задумался. Он предположил, что матричная РНК транслируется с помощью набора особых молекул — адаптеров, по одной на каждую аминокислоту. Адаптеры тоже должны состоять из РНК, у каждого из них должен быть антикодон, способный узнавать соответствующий кодон матричной РНК и связываться с ним. Принцип этого связывания, как считал Крик, должен быть точно таким же, как в ДНК: Ц образует пару с Г, А — с Т, и так далее[10]. Существование адаптеров предполагалось тогда чисто гипотетически, но они действительно были открыты несколько лет спустя, и оказалось, что они действительно состоят из РНК, как и предсказывал Крик. Теперь их называют транспортными РНК (тРНК). Вырисовывалась система, напоминающая детский конструктор, детали которого соединялись друг с другом и вновь разделялись, образуя изумительные, хотя и недолговечные структуры.

Но здесь Крик пошел по ложному пути. Я пишу об этом довольно подробно потому, что хотя действительность и оказалась несколько богаче, чем он предполагал, его идеи могут по-прежнему быть актуальны для решения вопроса о том, как все это возникло. Крик представлял себе, что матричная РНК просто сидит в цитоплазме, а ее кодоны торчат, как соски свиноматки, и к каждому из них может «присосаться» транспортная РНК. Рано или поздно молекулы тРНК свяжутся с мРНК по всей длине, расположившись одна за другой, и с каждой из них будет связана, как хвост поросенка, соответствующая аминокислота, готовая соединиться с соседними аминокислотами и образовать белковую цепочку.

Проблема, по мнению Крика, состояла в том, что тРНК будут прибывать в случайном порядке, по мере их появления рядом с мРНК, и связываться с ближайшим соответствующим кодоном. Но если не начинать с начала и не заканчивать в конце, как они узнают, где начинается и где заканчивается один кодон? Как они смогут найти правильную рамку считывания? Если последовательность содержит фрагмент АТЦГТЦ, то одна тРНК может связаться с кодоном АТЦ, а другая — с кодоном ГТЦ, но что помешает соответствующей тРНК узнать кодон ЦГТ в середине этого фрагмента и тем самым транслировать совсем не то, что нужно? Предложенный Криком ответ на этот вопрос предполагал категорический запрет подобных вещей. Раз матрица в целом должна читаться однозначно, значит, не все кодоны должны иметь смысл. Какие же из них требовалось запретить? Ясно, что последовательности, состоящие только из А, только из Ц, только из Т или только из Г, должны были оказаться под запретом: в цепочке АААААА нельзя найти правильную рамку считывания. Затем Крик проверил все другие трехбуквенные комбинации. Он рассуждал примерно так: если АТЦ имеет смысл, то все циклические перестановки этих трех букв (ТЦА и ТАЦ) должны быть под запретом. Сколько возможностей это нам оставляет? Снова двадцать! (Из шестидесяти четырех возможных кодонов AAA, ТТТ, ЦЦЦ и ГГГ исключаются. Остается шестьдесят. Из каждых трех вариантов циклических перестановок допустим только один, значит, делим шестьдесят на три.)

В отличие от перекрывающихся кодов, код Крика не накладывал никаких ограничений на порядок аминокислот в белке и не предполагал, что точечная мутация будет непременно менять две или три аминокислоты. Когда была выдвинута эта гипотеза, казалось, она дает прекрасное решение проблемы рамки считывания и при этом сокращает число кодонов с шестидесяти четырех до двадцати, что соответствует числу аминокислот в белках. Эта гипотеза ничуть не противоречила всем имеющимся на тот момент данным. И все же она ошибочна. Спустя несколько лет выяснилось, что искусственно полученная РНК, состоящая из кодонов ААА (запрещенных Криком), все же кодирует аминокислоту лизин и может транслироваться в белковую цепочку, состоящую исключительно из лизина.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*