Простое начало. Как четыре закона физики формируют живой мир - Партасарати Рагувир
Как мы выяснили, белок – это последовательность аминокислот, соединенных химическими связями. Порядок аминокислот в цепи задается нуклеотидной последовательностью ДНК клетки. Одну аминокислоту кодирует группа из трех нуклеотидов (триплет). Так, в ДНК-последовательности TГГ закодированы инструкции для включения в цепь одной гидрофобной аминокислоты триптофана. Триплеты ЦГT и ЦГЦ соответствуют положительно заряженной аминокислоте аргинину. Таким образом, последовательность TГГЦГT указывает на триптофан, связанный с аргинином. Не существует, однако, механизма, напрямую переводящего инструкции ДНК в аминокислотные последовательности. Всегда необходим посредник – молекула РНК (рибонуклеиновой кислоты).
РНК, как следует из названия, похожа на ДНК. Это тоже цепочка из нуклеотидов четырех типов, три из которых (A, Ц и Г) аналогичны нуклеотидам ДНК, а четвертый (У, урацил) заменяет в РНК тимин (T). Белковая машина, называемая РНК-полимеразой, связывается с промо́торной последовательностью ДНК и перемещается по двойной спирали, как язычок замка-молнии, разделяя две нити и выстраивая по нуклеотидной последовательности одной из них, матричной, комплементарную цепочку РНК (см. рисунок) [21]. Процесс копирования информации из формы ДНК в форму РНК называется транскрипцией – по аналогии с транскрипцией произносимых слов в текст или переводом рукописного текста в печатный.
РНК комплементарна матричной цепи ДНК и, следовательно, идентична ее партнерше, кодирующей цепи, за исключением урацилов, занявших в РНК места всех тиминов. Например, кодирующая цепь ДНК ATЦГTT, которой соответствует зеркально отраженная матричная цепь TAГЦAA, будет транскрибирована в РНК-последовательность AУЦГУУ. Другая клеточная машина, рибосома, транслирует РНК в белок. Рибосома движется вдоль РНК [22], взаимодействуя с каждым триплетом (кодоном) и прикрепляя соответствующую аминокислоту к растущему белку (см. рисунок). Например, РНК-триплет УГГ кодирует триптофан, а последовательности ЦГУ и ЦГЦ – аргинин. Некоторые триплеты (УАГ, УГA, УAA) кодируют команду «стоп», которая сообщает рибосоме, что нужно прервать синтез белка и отсоединиться от РНК. Триплет AУГ, напротив, значит «старт».
Следовательно, тот или иной сегмент ДНК определяет, какой белок будет создан в ходе транскрипции, а затем трансляции. Поскольку ДНК передается от родителей детям через яйцеклетку и сперматозоид, каждый из таких сегментов обеспечивает наследственную передачу черт – показателей активности и иных свойств соответствующих белков. Так, ваша способность видеть цвет обеспечивается тремя разными белками, каждый из которых реагирует на свет определенной длины волны и производится в одном из трех типов колбочек в вашей сетчатке. Возникновение отличий хотя бы в одном триплете, кодирующем одну аминокислоту из приблизительно 350 в составе каждого из этих белков, может привести к небольшим, но ощутимым отклонениям в цветовосприятии. В более радикальных случаях, когда полностью теряется участок ДНК, кодирующий тот или иной светочувствительный белок, развивается одна из форм дальтонизма1.
Можно подумать, что сегменты ДНК, кодирующие белки, мы и называем генами. Это почти, но не совсем так.
Клетки должны не только определять, какой репертуар белков им нужно создавать, но и контролировать, когда и в каком количестве их производить. Некоторые участки ДНК не кодируют белковые последовательности, а влияют на считывание других сегментов механизмами транскрипции и трансляции. Например, белки из класса факторов транскрипции могут прикрепляться к промотору возле начальной точки работы РНК-полимеразы, уменьшая или увеличивая вероятность того, что полимераза займет нужное место и начнет транскрипцию. Мы уже видели такой пример, когда рассматривали рецептор глюкокортикоидных гормонов. Другой вариант: участок ДНК может транскрибироваться в РНК без последующей трансляции в белок, и сама эта РНК способна взаимодействовать с ДНК или с другими РНК, оказывая влияние на синтез белков. РНК участвует в регуляции жизнедеятельности клетки множеством способов, в которых мы начали разбираться совсем недавно и повысили в итоге статус РНК с простого посредника между ДНК и белком до критически важного участника этих молекулярных «переговоров». Так, чувствуя голодание, клетки производят РНК под названием GAS5 (транскрипт 5, специфичный для остановки роста), которая прикрепляется к ДНК-связывающей области глюкокортикоидного рецептора и таким образом препятствует его взаимодействию с мишенью: структурное сходство с ДНК позволяет РНК служить обманкой2.
Регуляция процессов, в ходе которых генетическая информация трансформируется в те или иные молекулы, важна не менее, чем сама эта информация, и тоже попадает в определение гена: ген – это отрезок ДНК (за редким вирусным исключением), кодирующий какую-либо наследственную характеристику, обычно соответствующую одному белку или молекуле РНК, и включающий в себя некодирующие регуляторные последовательности. Это громоздкое определение, к тому же постоянно меняющееся, но жизнь и не обязана соответствовать нашему стремлению к простой терминологии. Ситуацию осложняет и то, что термин «ген» по старинке часто трактуют только как белок-кодирующий сегмент ДНК. В этой книге я постараюсь быть максимально точным и понятным. К счастью, вопрос, к которому мы подошли, достаточно прост.
Теперь мы научились читать геномы любых организмов, то есть устанавливать их полные нуклеотидные последовательности. Поскольку мы умеем выявлять промоторные последовательности, которые велят транскрипционной машине начинать работу, и последовательности-терминаторы, приказывающие ее заканчивать, мы можем посчитать число генов в геноме того или иного организма. В бактериальной клетке их несколько тысяч, и каждая бактерия способна конструировать тысячи разных белков. В геноме бактерий, вызывающих туберкулез и холеру, примерно по 4 тысячи генов, около 98 % из которых кодируют белки3. Геном болгарской палочки – подвида Lactobacillus delbrueckii, часто применяемого для превращения молока в йогурт, – содержит менее 2 тысяч белок-кодирующих генов4.
В человеческом геноме около 20 тысяч генов, кодирующих белки. Точно установить число так называемых некодирующих генов, производящих нетранслируемые РНК, сложнее, но предполагают, что их примерно столько же5. Не спешите, впрочем, задирать перед бактериями нос: наше превосходство нельзя назвать сногсшибательным, если учесть, что при кажущейся колоссальной разнице в сложности организмов разница в фактическом числе наших генов менее чем десятикратная. Более того, нас нельзя назвать особенными даже среди эукариот (организмов, клетки которых хранят свой наследственный материал в окруженном мембраной ядре). Около 20 тысяч белок-кодирующих генов насчитали в геноме домашней лошади, обычной домовой мыши и даже шпорцевой лягушки Xenopus tropicalis. У некоторых организмов генов меньше. Плодовая мушка Drosophila melanogaster и гриб Schizophyllum commune имеют примерно по 13 тысяч белок-кодирующих генов, а сапсан – около 16 тысяч. У хлебной плесени Neurospora crassa их около 10 тысяч, а у почвенной амебы Dictyostelium discoideum – около 13 тысяч. Однако есть и организмы с гораздо большим числом генов, чем у нас. ДНК крошечной дафнии Daphnia pulex, почти прозрачного ракообразного длиной не более миллиметра, кодирует 31 тысячу белков, и это пока рекорд среди животных с прочитанным геномом. Рис имеет около 30 тысяч белок-кодирующих генов, а кукуруза вообще обошла нас вдвое с почти 40 тысячами генов белков и десятками тысяч некодирующих генов6. Иными словами, число генов очень мало говорит нам о сложности организмов и их способностях.