Несса Кэри - Мусорная ДНК. Путешествие в темную материю генома
Эти данные позволили нам приписать биохимические функции 80% генома. Особенно это касается зон, лежащих за пределами хорошо изученных участков, то есть за пределами областей, которые кодируют белки5.
Иными словами, участники проекта ENCODE как бы заявляли: перед нами не темное небо, лишь менее чем на 2% занятое звездами. Они утверждали: небосвод нашего генома на четыре пятых заполнен всевозможными объектами. Причем большинство объектов — отнюдь не звезды (если считать, что звезды в этом сравнении — гены, кодирующие белки). Вероятно, это астероиды, планеты, естественные спутники планет, метеоры, кометы и прочие межзвездные тела, какие только можно себе представить.
Как мы видели, многие исследовательские группы уже и до этого приписали определенные функции каким-то из этих темных областей: вспомним промоторы, энхансеры, теломеры, центромеры, длинные некодирующие РНК (это лишь несколько примеров). Так что большинство ученых вполне устраивала идея, согласно которой в нашем геноме содержится не только эта небольшая доля генетического материала, кодирующая белки. Но 80% генома, обладающие функциями? Это казалось чересчур смелым заявлением.
Данные ENCODE многих поразили. Тем не менее их предвестием стали результаты многочисленных косвенных исследований, на протяжении предыдущего десятилетия проводившихся учеными, которые все пытались понять, отчего человек так сложно устроен. Над этой проблемой ломало голову немало специалистов и неспециалистов с тех самых пор, как выяснилось: полная расшифровка человеческого генома не выявила у человека большего числа генов, кодирующих белки, по сравнению с куда более простыми организмами. Исследователи проанализировали размеры части генома, кодирующей белки, у различных представителей царства животных, и процентную долю, которую составлял мусор в общем объеме генома. Результаты этого анализа (мы уже бегло коснулись их в главе 3) сжато показаны на рис. 14.1.
Как мы уже знаем, количество генетического материала, кодирующего белки, не очень-то соотносится со сложностью организма. Куда более убедительная зависимость существует между процентной долей мусора в геноме и тем, насколько сложно устроен носитель этого генома. Пытаясь интерпретировать этот факт, исследователи предположили, что различия между простыми и сложными существами порождаются главным образом именно мусорной ДНК. Возможно, это означает, что существенная доля мусорной ДНК все-таки обладает какими-то функциями6.
Рис. 14.1. График показывает, что по мерю увеличения сложности организма доля мусорной ДНК в геноме нарастает быстрее и отчетливее, чем размер части, кодирующей белки.
Множественные параметры
ENCODE рассчитывал долю функционирующих участков в нашем геноме, объединив всевозможные данные. В число этих данных вошла и информация о молекулах РНК, которые удалось обнаружить участникам проекта. Среди этих РНК оказались представлены как кодирующие белки, так и не кодирующие их, то есть мусорные РНК. Все они имели самую разную длину — от молекул протяженностью в тысячи нуклеотидных оснований до молекул в сотню раз меньше. Кроме того, ENCODE считал геномные области имеющими функции, если такие зоны несли на себе определенные комбинации эпигенетических модификаций, обычно связываемые с функциональными областями. Другие подходы предполагали, в частности, анализ участков, которые образуют петли и благодаря этому сближаются. Еще одна методика подразумевала характеризацию генома по специфическим физическим свойствам, связываемым с той или иной функцией[43].
Свойства эти отличались у разных типов человеческих клеток, что подтвердило гипотезу, согласно которой клетки могут использовать одну и ту же геномную информацию весьма гибко. К примеру, изучение образования петель показало, что одна разновидность взаимодействий между различными участками генома наблюдается лишь у каждого третьего из исследованных типов клеток7. Это позволяет предположить, что сложная трехмерная укладка нашего генетического материала — явление комплексное и зависящее от типа клетки.
Изучая физические характеристики, обычно связываемые с регуляторными областями, ученые пришли к выводу, что регуляторные участки ДНК также активируются в зависимости от типа клетки — и что, в свою очередь, характер клетки (то, какой она станет) формируется под действием этой мусорной ДНК8. К этому выводу исследователи пришли после того, как выявили около 3 миллионов таких мест (сайтов) путем анализа клеток 125 различных типов. Это не означает, что у клеток каждого типа 3 миллиона сайтов. Это лишь означает, что, проанализировав все эти клеточные типы, ученые обнаружили 3 миллиона сайтов. Опять-таки, это наводит на мысль, что регуляторный потенциал генома может использоваться по-разному — в зависимости от нужд той или иной клетки. Распределение сайтов по клеточным типам упрощенно показано на рис. 14.2.
Рис. 14.2. Анализируя наборы данных проекта ENCODE, ученые выявили свыше трех миллионов сайтов с характеристиками регуляторных областей (исследуя множество клеточных линий человека). Площади кругов отражают распределение таких сайтов. Большинство их обнаруживали в клетках двух и более типов, хотя значительная их доля оказалась специфической для отдельных типов клеток. И лишь очень малую часть сайтов удалось найти в каждой из проанализированных клеточных линий.
Свыше 90% регуляторных участков, выявленных благодаря этому методу, находились более чем за 2500 пар нуклеотидных оснований от начала ближайшего гена. Иногда они располагались вдали от всех генов, а иногда — в мусорной области, входящей в состав гена, но все равно они размещались далеко от его начала.
Большинство промоторов генов ассоциированы более чем с одним таким участком, а каждый такой участок обычно ассоциирован более чем с одним промотором. Однако, опять-таки, наши клетки, судя по всему, контролируют генетическую экспрессию отнюдь не прямолинейно. Они используют сложные сети взаимодействующих узлов.
Среди наиболее поразительных данных — информация, позволяющая предположить, что более 75% нашего генома хоть когда-нибудь, хоть в каких-нибудь клетках копируется в РНК9. Любопытное предположение. Никто не мог ожидать, что три четверти мусорной ДНК наших клеток может реально использоваться для производства РНК. При сравнении информационных РНК, кодирующих белки, с длинными некодирующими РНК ученые выявили существенную разницу в картине экспрессии. В 15 изученных клеточных линиях информационные РНК, кодирующие белки, гораздо охотнее экспрессировались во всех клеточных линиях, чем длинные некодирующие РНК (см. рис. 14.3). Исследователи пришли к выводу: длинные некодирующие РНК играют определяющую роль в управлении судьбой клеток.
Взятые в совокупности, данные из статей, опубликованных в рамках проекта ENCODE, рисуют картину весьма активного человеческого генома с чрезвычайно сложными схемами взаимодействия и «общения». В сущности, мусорная ДНК набита информацией и инструкциями. Нелишне повторить здесь указания гипотетического режиссера из Введения: «Если вы ставите „Гамлета“ в Ванкувере и „Бурю“ в Перте, в такой-то строке „Макбета“ ударение должно падать на четвертый слог. Если только при этом любительская труппа не ставит „Ричарда III“ в Момбасе, в Кито не идет дождь»10.
Рис. 14.3. Экспрессию генов, кодирующих белки, и генов, не кодирующих белки, проанализировали на примере пятнадцати различных типов клеток. Выяснилось, что гены, кодирующие белки, гораздо чаще экспрессируются во всех типах клеток, чем области, которые вырабатывают молекулы РНК. не кодирующие белки.
Всё это звучит очень вдохновляюще. Почему же тогда многие относятся к значимости этих данных с таким скептицизмом? Отчасти из-за того, что статьи, вышедшие в рамках проекта ENCODE, явили миру очень уж громкие заявления. Самым громким стало утверждение, что целых 80% генома обладают функциями. Проблема в том, что в основе некоторых таких утверждений лежали косвенные измерения самих функций. Особенно это касается исследований, где заключение о наличии функции выводили либо из присутствия эпигенетических модификаций, либо из других физических характеристик ДНК и ассоциированных с ней белков.
Потенциальное против реального
Скептики возражают: эти данные в лучшем случае указывают на то, что исследуемая область потенциально может обладать какой-то функцией. А это слишком туманный признак, и пользы от него ждать не приходится. Представьте себе огромный особняк, владельцы которого впали в нищету, поэтому им отключили электричество за неуплату. Допустим, в здании двести комнат, а в каждой из них — по пять выключателей. Потенциально каждый выключатель может зажечь лампочку, но вполне возможно, что некоторые выключатели вообще никогда не соединялись ни с какими проводами (аристократы не славятся электротехническими талантами), а некоторые лампочки давным-давно перегорели. Сам факт, что на стенах торчат выключатели, которыми можно щелкать туда-сюда, из положения ВКЛ в положение ВЫКЛ и обратно, еще не означает, что при помощи этих устройств действительно удастся изменить уровень освещенности в комнатах.