Простое начало. Как четыре закона физики формируют живой мир - Партасарати Рагувир
Пример с ростом гораздо более типичен, чем с муковисцидозом, – по крайней мере в категории сложных признаков и заболеваний, к которым сегодня приковано наше внимание. Нет единственного гена, наделяющего вас предрасположенностью к раку толстой кишки, и даже гена, задающего цвет волос: это определяется перекличкой множества участков генома. И удивляться тут нечему. В геноме человека всего лишь 20 тысяч белок-кодирующих генов, а сложнейшее устройство нашего организма невозможно описать в 20 тысячах белковых инструкций. Поэтому было бы странно ожидать, что каждой характеристике досталось по собственному гену. Белок, кодируемый тем или иным геном, может участвовать в формировании множества разных признаков, равно как и отдельный признак может определяться согласованной активностью множества разных генов. Но, как мы узнали из глав 3 и 4, важнее всего то, что 99 % генома, которые и не гены вовсе, влияют на работу генов даже мощнее, регулируя их включение и выключение.
Давайте подробнее разберем рост, поскольку эта характеристика всем нам знакома и прекрасно иллюстрирует, что может и чего не может сообщить нам генетика. На рост влияют гены и среда, в которой развивается человек, причем факторы эти – предрешенное и условное – не исключают друг друга.
В среднем люди раньше были ниже. Средний рост француза, родившегося в 1800 году, составлял 164 сантиметра, а родившегося в 1980-м – почти 176,5. Средний рост японки, появившейся на свет в 1900 году, составлял 143 сантиметра, а ее правнучка, рожденная в 1980-м, могла быть на 15 сантиметров выше. Такая динамика наблюдалась по всему миру, особенно после перехода стран на современную экономику. В этот вековой или двухвековой промежуток загадочные эпидемии не выкашивали только невысоких и не мутировал так резко наш геном. Мы подросли в первую очередь благодаря изменению питания. Современный француз ежедневно получает вдвое больше калорий, чем мог себе позволить его предок в начале XIX века1. К калориям все не сводится, однако обилие энергии, получаемой из рациона, сопряжено с изобилием питательных веществ, и вместе они позволяют человеческому телу полностью раскрыть заложенный в нем потенциал2. На рост влияют и другие негенетические факторы вроде детских болезней и загрязнителей окружающей среды, воздействие которых на огромную часть человечества за последние столетия заметно уменьшилось.
Теперь рассмотрим современное население типичной промышленно развитой страны. Даже если разделить взрослых по половому признаку, в каждой группе окажутся люди разного роста. Более того, мы прекрасно знаем, что у высоких родителей дети чаще тоже бывают высокими. Конечный рост детей обычно схож с ростом их биологических родителей, а не случайно выбранных взрослых или приемных родителей. Иными словами, генетика важна. Но насколько? И какие области генома ответственны за рост?
В прошлой главе мы познакомились с превосходными инструментами для чтения ДНК. Для изучения редких черт и малозаметных вариаций, как и для всеобъемлющего описания, полезно секвенировать полный геном. Рост и многие другие признаки, однако, достаточно выразительны и устойчивы, а потому к ним можно применять и методы попроще. Ваш геном больше чем на 99 % совпадает с моим, поэтому можно сосредоточиться лишь на тех областях, где есть расхождения. Рассмотрим одно из немногих различий – точку, где у большинства людей стоит, скажем, нуклеотид A, но у немалой доли популяции его заменяет Ц. Геномные позиции, где относительно часто встречается такая неоднозначность, называют однонуклеотидными полиморфизмами (ОНП или SNP – «спипы» в лабораторном жаргоне). В геноме человека несколько миллионов типичных ОНП, и слово «типичный» здесь означает, что по меньшей мере у 1 % населения это место занимает более редкий нуклеотид. Несколько миллионов – это много, но все же не слишком в сравнении с 3 миллиардами нуклеотидов полного генома человека, поэтому мы умеем находить такие ОНП без особого труда.
Например, мы можем закрепить на микроскопических шариках короткие однонитевые фрагменты ДНК, комплементарные доминирующей форме ОНП, и использовать их как зонды, наблюдая, свяжется ли с шариками измельченная и амплифицированная ДНК исследуемого человека. Если да, мы поймем, что у этого человека типичный вариант нуклеотида в интересующей точке генома, если же нет – будем знать, что у него вариант более редкий [59]. Я не вдаюсь в детали, да и технологии на рынке доступны разные, важнее здесь другое: в каждой из них нашли отражение изящные методы, описанные в прошлой главе. В них используются уникальные преимущества флуоресцентных нуклеотидов, ДНК-полимераз, серийных заготовок в виде стеклянных подложек, усеянных миллионами шариков с миллионами клонов ДНК на каждом, и многого другого. Мы получаем результат стоимостью до 100 долларов в пересчете на один тест – меньше, чем многие тратят на пару обуви, – который показывает нам совокупность ОНП, характеризующую геном, а следовательно, и основную долю генетических вариаций у индивида.
Логично предположить, что чей-то набор ОНП сообщает нам не так уж и много, поскольку на эти точки приходится лишь малая доля генома, а геномы устроены сложно. Сначала так и было. В первых исследованиях по выявлению ОНП, связанных с ростом, обнаружили около 40 генетических вариантов, которые в совокупности хоть и отличимо от погрешности, но незначительно коррелировали с ростом участников эксперимента. Результаты исследований опубликовали в 2008 году, и сразу же стало очевидно, что изучать надо гораздо больше людей – даже не из-за биологии как таковой, а скорее из-за взаимосвязи между случайностью и предсказуемостью.
Вспомним главу 6 и подбрасывание монет. Представьте, что вы 10 раз подбросите подлинную монету. В среднем можно ожидать, что 5 раз выпадет решка, а 5 – орел, но вас наверняка не удивит, если решка выпадет 6 раз, а орел – 4. Вероятность такого исхода составляет целых 83 % от вероятности получения 5 к 5. Если вы подбросите монету 1000 раз, скорее всего, 500 раз выпадет решка и 500 – орел: с ростом числа попыток расхождение сглаживается. Вероятность выбросить 600 решек и 400 орлов существенно снизится и станет в миллиард раз меньше, чем вероятность выбросить 500 к 500. Допустим, вы подозреваете, что ваша монета – фальшивая и несбалансированная, из-за чего вероятность выбросить решку превышает 50 %. Если вы подбросите монету 10 раз, асимметрия вас не особо смутит: обнаружив 6 решек, вы вряд ли сразу же сделаете вывод о 60-процентной вероятности выпадания решки у этой монеты. Однако 600 решек после 1000 подбрасываний сильно укрепят ваши подозрения в «неправильности» монеты. Если быть математически точными, ваша чувствительность к фальшивым монетам растет пропорционально квадратному корню из числа подбрасываний. Этот квадратный корень, возможно, напоминает вам о статистических свойствах нашего случайного блуждающего из шестой главы. И не случайно: у этих зависимостей сходные математические обоснования.
Но вернемся к геному. Наши ОНП сравнимы с монетами, и перед нами стоит задача выяснить, в какой степени каждый из них «правильный» или «неправильный», то есть как сильно тот или иной ОНП влияет на отклонение признака от средней, ожидаемой величины. ОНП, где редкий генетический вариант с равной вероятностью встречается у высоких и низких людей, аналогичен правильной монете, которая в половине случаев ложится решкой, а в половине – орлом. Тот вариант ОНП, что заметно чаще встречается у высоких либо, наоборот, у низких, вероятно, задает предрасположенность к росту выше или ниже среднего – как неправильная монета предрасполагает к тому, чтобы общая доля выпавших решек всегда была либо больше, либо меньше 50 %. Эти тенденции могут быть не сильно выраженными. По аналогии с подбрасыванием множества монет нам нужно исследовать геномы как можно большего числа людей. Чтобы оценить масштаб отклонения от среднего показателя под влиянием того или иного ОНП, нужно проанализировать огромный массив данных по корреляции роста человека с нуклеотидом в этой точке его генома. Чем больше геномов мы анализируем, тем выше становится наша чувствительность к ОНП, связанным с ростом.