Несса Кэри - Мусорная ДНК. Путешествие в темную материю генома
Сегодня мы относим Xist- и Tsix-РНК к обширному классу длинных некодирующих РНК. Этот термин не очень точен: конечно же, имеются в виду РНК, которые не кодируют белки. Как мы увидим, длинные некодирующие РНК преспокойно кодируют другие функциональные молекулы. И эти функциональные молекулы сами представляют собой длинные некодирующие РНК.
Длинные некодирующие РНК определяются как молекулы, длина которых превышает 200 нуклеотидных оснований (цифра взята довольно-таки произвольно) и которые не кодируют белки, что отличает их от информационной РНК. Двести оснований — нижний предел размера. Самые крупные из таких некодирующих РНК могут насчитывать по сотне тысяч оснований. Подобных РНК множество, хотя ученые расходятся во мнении относительно их общего числа. По различным оценкам, в геноме человека их содержится от 10 тысяч до 32 тысяч1,2,3,4. Но хотя длинных некодирующих РНК существует много, уровень их экспрессии обычно не так высок, как у классических информационных РНК, кодирующих белки — как правило, менее 10% от уровня экспрессии средней информационной РНК5.
Такая сравнительно низкая экспрессия любой из длинных некодирующих РНК — одна из причин, по которым на них до недавних пор не обращали особого внимания. В сущности, при анализе экспрессии молекул клеточной РНК длинные некодирующие РНК раньше просто не удавалось надежно детектировать, поскольку методы анализа не отличались достаточной чувствительностью. Но теперь ученые знают о существовании таких РНК, а следовательно, могли бы полагать, что сумеют полностью проанализировать геном любого организма (в том числе и человеческого) и предсказать существование таких РНК, просто исходя из вида ДНК-последовательности. В конце концов, генетики отлично научились делать такие предсказания для генов, кодирующих белки.
Однако для длинных некодирующих РНК это не так-то просто по целому ряду причин. Известно, как идентифицировать предполагаемые гены, кодирующие белки, поскольку такие гены обладают некоторыми удобными свойствами. Возле начала и конца таких генов есть определенные последовательности, которые помогают нам их искать. Кроме того, они кодируют предсказанные нами аминокислотные звенья, что еще больше укрепляет нас в уверенности: мы имеем дело с геном, кодирующим белок. Наконец, большинство генов, кодирующих белки, окажутся похожими, если рассматривать определенный ген у разных видов. А значит, выявив «классический» ген у животного вроде иглобрюха, легко будет в дальнейшем использовать найденную последовательность как основу для анализа человеческого генома с целью выяснения, имеется ли похожий ген у нас самих.
Но длинные некодирующие РНК не имеют таких ярко выраженных нуклеотидных индикаторов (в отличие от генов, кодирующих белки). Кроме того, у разных видов они сильно отличаются. Таким образом, знание нуклеотидной последовательности длинной некодирующей РНК какого-то другого вида едва ли поможет нам идентифицировать функционально схожую с ней последовательность в геноме человека. Менее 6% из представителей одного специфического класса длинных некодирующих РНК рыбы данио-рерио, популярного модельного животного, явно имеют аналогичные последовательности у мышей и человека6. Лишь примерно 12% представителей того же класса длинных некодирующих РНК, обнаруживаемых у человека и мышей, можно найти у каких-то других животных7,8. Такое сравнительно слабое сохранение длинных некодирующих РНК в разных видах подтвердилось в ходе недавнего исследования, где сравнивалась экспрессия длинных некодирующих РНК из различных тканей разных видов четвероногих. Четвероногие (тетраподы) — все сухопутные позвоночные, в том числе и те, что «вернулись в море» (скажем, киты или дельфины). Исследователи сообщают, что 11 тысяч длинных некодирующих РНК обнаруживаются лишь у приматов. Лишь 2500 таких РНК являются общими для всех тетрапод, и только 400 из них можно отнести к древним, то есть (по определению авторов исследования) к таким, которые возникли свыше 300 миллионов лет назад, примерно в ту эпоху, когда разошлись эволюционные пути амфибий и других тетрапод. Авторы полагают, что эти древние длинные некодирующие РНК — как раз те, которые во всех организмах регулируются наиболее активно, и что они, вероятно, играют роль главным образом на ранних стадиях развития организма9. На самых ранних стадиях эмбриогенеза большинство позвоночных выглядят очень похоже. Так что логично предположить: в самом начале нашей жизни мы и все наши близкие и дальние эволюционные родичи используем схожие пути и механизмы развития.
Несходство длинных некодирующих РНК у разных видов (наблюдающееся почти повсеместно) заставило некоторых авторов счесть, что такие РНК вообще не играют важной роли. Ведь если бы они имели большое значение, то меньше бы менялись в ходе эволюции и развития видов. На самом же деле последовательности, которые содержат код для этих «мусорных» РНК, эволюционируют гораздо стремительнее, чем последовательности, кодирующие белки.
Что ж, логично. Однако здесь все-таки есть чрезмерное упрощение. Возможно, длинные некодирующие РНК и длинны по количеству содержащихся в них нуклеотидных оснований, но это не обязательно значит, что они представляют собой какие-то вытянутые волокна, плавающие в клетке. Дело в том, что длинные молекулы РНК способны складываться, образуя трехмерные структуры. Нуклеотидные основания РНК образуют пары, почти по тем же правилам, которым следуют две соединяющиеся нити ДНК. Но РНК — молекула однонитевая, поэтому ее нуклеотидные основания спариваются лишь на сравнительно коротких отрезках. В итоге молекула изгибается, принимая сложные, но стабильные формы. Эти трехмерные структуры могут играть очень важную роль в функционировании длинной некодирующей РНК. Вполне возможно, что сама такая трехмерная структура во многом схожа у разных видов, даже если ее нуклеотидная последовательность у них сильно отличается10. Это показано на рис. 8.1. К сожалению, трудно строить предсказания насчет схожести таких структур, основываясь на данных о нуклеотидной последовательности. Но такая методика все же полезна для нахождения функционально устойчивых длинных некодирующих РНК.
Рис. 8.1. Схема показывает, как две однонитевые молекулы длинной некодирующей РНК с различными нуклеотидными последовательностями могут образовывать структуру одной и той же формы. Структура определяется правилами образования пар. Нуклеотид А связывается только с У, а нуклеотид Ц — только с Г (они показаны квадратиками с различной окраской или узором). Перед вами упрощенная схема. На самом деле длинные некодирующие РНК могут обладать множеством участков, способных формировать сложные структуры. Кроме того, эти структуры трехмерны (здесь они для простоты изображены как плоские).
Бревна или щепки?
Из-за трудностей, которые возникают при выявлении длинных некодирующих РНК в нуклеотидной последовательности человеческого генома, большинство исследователей сейчас склоняются к более прагматичному подходу их идентификации — детектируют сами эти молекулы непосредственно в клетках. Однако в научном сообществе нет единого мнения насчет интерпретации результатов таких изысканий. Ярые сторонники мусорных последовательностей могли бы заявить: если какая-то последовательность экспрессируется как длинная некодирующая молекула РНК, эта молекула экспрессируется так по какой-то причине. Другие ученые настроены более скептически. Они утверждают, что такая экспрессия длинных некодирующих РНК — просто «сопутствующее событие». Иными словами, они считают, что экспрессия длинных некодирующих РНК — просто своего рода побочный эффект, возникающий при включении «настоящего» гена.
Что же имеется в виду под «сопутствующим событием»? Допустим, мы отпиливаем сучья бензопилой. Основная цель нашей деятельности — получить бревна, чтобы построить дом или приготовить дрова для печки. Мы не стараемся получить щепки или опилки, но они все равно возникают в результате работы бензопилы. Незачем тратить силы, пытаясь избежать щепок. Они, в общем-то, не мешают выполнению нашей основной задачи. А если мы все-таки найдем способ от них избавиться, это может снизить эффективность производства бревен. А кроме того, ведь мы можем случайно натолкнуться на метод использования щепок и опилок (побочного продукта нашего производства). К примеру, для мульчирования почвы в цветочном горшке или при устройстве логова для ручной змеи.
Вот и «мусорные скептики» заявляют: экспрессия длинных некодирующих РНК попросту означает, что при экспрессии генов, происходящей на каком-то участке, уменьшается подавление экспрессии другого генетического материала. В рамках этой модели производство длинных некодирующих РНК — всего лишь неизбежное следствие важного процесса. Неизбежное, но, в общем-то, несущественное и безвредное. Между тем «мусорные энтузиасты» возражают: такая модель не объясняет некоторых особенностей экспрессии длинной некодирующей РНК. Например, различные типы таких РНК экспрессируются при анализе образцов тканей различных областей мозга11. Сторонники важной роли длинных некодирующих РНК заявляют: это свидетельствует о существенном значении таких молекул, иначе зачем бы разным зонам мозга включать разные длинные некодирующие РНК? Скептики возражают: различные длинные некодирующие РНК обнаруживаются лишь из-за того, что разные области мозга включают разные «классические» гены, кодирующие белки. Иными словами, опилки при разделывании дуба и сосны получаются разные, ничего удивительного.