Несса Кэри - Мусорная ДНК. Путешествие в темную материю генома
Руководителем Wellcome Trust, международной благотворительной организации, вложившей колоссальные суммы в проект «Геном человека», был тогда Майкл Декстер. Он высказался не менее пафосно, хотя и чуть менее теологично, объявив завершение черновой расшифровки генома «выдающимся достижением не только в масштабах нашей жизни, но и в масштабах всей человеческой истории»4.
Возможно, другие открытия по своему значению не менее важны, чем результаты проекта «Геном человека». На ум сразу же приходят огонь, колесо, число 0, алфавит. Не исключено, что у вас есть на примете и другие открытия. Кое-кто может также заметить, что расшифровка человеческого генома пока еще не выполнила всех своих обещаний, особенно касающихся борьбы с заболеваниями. (К примеру, Дэвид Сейнсбери, тогдашний министр науки Великобритании, заявлял: «Теперь мы обрели возможность достигнуть в медицине всего, на что мы только могли надеяться»5.)
Впрочем, большинство ученых уже тогда понимали, что подобные заявления следует воспринимать с изрядной долей скептицизма. Этому их научила история генетики. Возьмем, к примеру, два сравнительно хорошо известных генетических заболевания. Мышечная дистрофия Дюшенна — очень опасный недуг. Страдающие им мальчики постепенно теряют мышечную массу, физически деградируют, утрачивают подвижность и обычно умирают еще в подростковые годы. Муковисцидоз — генетическое заболевание, при котором легкие утрачивают способность очищаться от слизи. Страдающие этим недугом подвергаются большому риску заразиться острыми формами инфекций, угрожающих жизни. Хотя некоторые из больных муковисцидозом в наши дни все-таки доживают примерно до 40 лет, это происходит лишь благодаря интенсивной физиотерапии, ежедневно очищающей их легкие, и колоссальным дозам антибиотиков.
Ген, мутирующий при мышечной дистрофии Дюшенна, выявили в 1987 году, а ген, мутирующий при муковисцидозе, обнаружили в 1989-м. То, что мутации в этих генах являются причиной болезней, установили более чем за 10 лет до завершения расшифровки человеческого генома. Но даже сейчас, после более чем 20 лет усилий специалистов, эффективных методов лечения этих болезней по-прежнему не существует. Понятно, что неизбежен значительный временной разрыв между знанием генетической последовательности человека и созданием методик лечения, позволяющих спасать жизни больных. Особенно велик этот разрыв, когда причиной заболевания становится не один ген, а два и более, или же когда какие-то гены взаимодействуют со средой (а ведь для большинства недугов дело обстоит именно так).
Впрочем, не следует чересчур строго судить политиков за их громкие заявления. Ученые и сами подняли немалую шумиху вокруг своих открытий. Если вы требуете от спонсоров почти 3 миллиарда долларов, вам нужно придумать амбициозный план и разработать убедительную рекламную кампанию. Расшифровка человеческого генома — не самоцель. Однако тем не менее она является важным научным достижением. В сущности, это был инфраструктурный проект, предоставивший человечеству данные, без которых попросту не удалось бы поставить великое множество других вопросов.
Разумеется, геномная последовательность человека — не одна на всех. У разных людей она разная. В 2001 году секвенирование миллиона пар нуклеотидных оснований ДНК обходилось в неполных 5300 долларов. К апрелю 2013-го стоимость такой же процедуры упала до 6 центов. Иными словами, пожелай вы проделать секвенирование вашего собственного генома, в 2001 году вам обошлось бы это в 95 с лишним миллионов долларов, а сегодня с вас потребуют чуть меньше 6 тысяч долларов6. Более того, одна компания заявляет, что пришла эпоха тысячедолларовых геномов7. Поскольку стоимость секвенирования так резко упала, ученым теперь гораздо легче исследовать степень вариативности генома между различными людьми. Это дает целый ряд преимуществ. В наши дни специалисты получили возможность выявлять редкие мутации, которые вызывают опасные заболевания, но встречаются лишь у небольшого количества пациентов, зачастую — в генетически изолированных популяциях (например, в общинах амишей (аманитов)[5], проживающих в США8). Есть возможность секвенировать опухолевые клетки пациентов, чтобы выявить мутации, которые приводят к развитию раковых процессов. В некоторых случаях это позволяет создать специфические методики лечения для борьбы с конкретной формой онкологического заболевания конкретного пациента9. Исследования в области эволюции человека и миграции людей удалось значительно усовершенствовать именно благодаря анализу ДНК-последовательностей10.
Дорогой, я куда-то задевала гены
Но тогда, в 2001 году, все это оставалось делом будущего. Пытаясь абстрагироваться от поднявшейся шумихи, ученые размышляли над расшифрованным человеческим геномом и задались простым вопросом: что же делает нас особенными, непохожими на других живых существ? Человек — наиболее сложно устроенный вид из всех обитателей Земли. Никакой другой вид не строит города, не создает произведения искусства, не выращивает злаки, не играет в настольный теннис. Философы могут спорить, делают ли нас такие занятия «лучше» других видов. Но уже сам факт того, что мы способны вести такие споры, указывает на то, что мы устроены значительно сложнее других видов. В этом не может быть никаких сомнений.
В чем же состоит молекулярное объяснение нашей изощренности как организмов? Ученые уже довольно давно более или менее сошлись во мнении, что объяснение таится где-то в наших генах. Ожидалось, что у человека попросту больше генов, кодирующих белки, нежели у более простых организмов — скажем, у червей, мух или кроликов.
К тому времени, когда опубликовали черновую расшифровку человеческого генома, генетики уже завершили секвенирование для целого ряда других организмов. Разумеется, поначалу они сосредоточились на более простых (и меньших по размеру) геномах по сравнению с человеческим. К 2001 году удалось секвенировать геномы сотен вирусов, десятков бактерий, двух простых видов животных, одного гриба и одного растения. Ученые использовали эти данные, чтобы оценить, сколько генов содержится в человеческом геноме. (Для этой оценки применялся и целый ряд других экспериментальных методик и подходов.) Оценки варьировались от «30 тысяч» до «120 тысяч» — среди специалистов царила известная неуверенность касательно данного вопроса. В прессе часто циркулировала цифра «100 тысяч», хотя и эта оценка изначально не считалась определенной. Похоже, большинство исследователей считали разумной величину примерно в 40 тысяч.
Но когда в феврале 2001 года обнародовали черновую расшифровку генома человека, ученые не смогли найти в ней и 40 тысяч генов, кодирующих белки, не говоря уж о 100 тысячах. Исследователи из Celera Genomics идентифицировали 26 тысяч генов, кодирующих белки, и с меньшей уверенностью выявили еще 12 тысяч. Участники международного консорциума идентифицировали 22 тысячи таких генов и предсказали, что в общей сложности их окажется 31 тысяча. В годы после публикации черновика это количество неуклонно сокращалось. Сейчас считается общепринятым фактом, что человеческий геном содержит около 20 тысяч генов, кодирующих белки11.
Может показаться странным, что ученые не пришли к единому мнению насчет количества генов, едва была опубликована черновая расшифровка генома. Причина — в том, что для идентификации генов необходимо анализировать данные о генетической последовательности, а это не так просто, как кажется. Гены не помечены разными цветами, они не используют особые наборы генетических букв, отличающие их от прочих частей генома. Чтобы выявить ген, кодирующий белок, нужно проанализировать определенные характеристики и объекты: скажем, те последовательности, которые могут кодировать цепочку аминокислот.
Как мы уже видели в главе 2, гены, кодирующие белки, не создаются из одной непрерывной ДНК-последовательности. Они конструируются модульным образом, причем области, кодирующие белки, перемежаются отрезками генетического мусора. Человеческие гены обычно гораздо длиннее генов фруктовых мушек-дрозофил или микроскопического червя C.elegans (эти существа являются весьма распространенными модельными системами в генетических исследованиях). Однако белки человека обычно примерно того же размера, что и аналогичные белки дрозофилы или червя. В человеческих генах велика именно мусорная составляющая, а не те фрагменты, которые кодируют белки. У людей эти мусорные участки зачастую вдесятеро длиннее, чем у более простых организмов. Некоторые из таких участков могут достигать длины в несколько десятков тысяч пар нуклеотидных оснований.
Отсюда возникает серьезная проблема: как отличить сигнал от шума, анализируя гены в генетических последовательностях человека? Даже в пределах одного-единственного гена лишь небольшой участок отвечает за кодирование белка. Этот участок окружен гигантской областью генетического мусора.