Анатолий Клёсов - Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке
для 12-маркерных гаплотипов константа равна 0.02 мутаций на гаплотип на условное поколение,
для 25-маркерных 0.046 мутаций на гаплотип на условное поколение,
для 37-маркерных – 0.09,
для 67-маркерных – 0.12,
для 111-маркерных – 0.198 мутаций на гаплотип на условное поколение.
Если это пересчитать в расчете не на гаплотип, а на маркер, то получим соответствующие константы скорости 0.00167, 0.00184, 0.00243, 0.00179, 0.00178 мутаций на маркер на условное поколение. Уже видно, что константы скорости разные для разных гаплотипов, и различаются, например, для 37-маркерных и 12-маркерных гаплотипов в 1.46 раз, то есть на 46 %. А если сравнить с 6-маркерными гаплотипами (константа скорости мутации на гаплотип равна 0.0074, на маркер 0.00123), то диапазон различий в константах в зависимости от длины маркера расходится на уже на 1.98, или на 98 %. Вывод – никак нельзя принимать константы скорости мутации на маркер за постоянные величины, одинаковые для всех гаплотипов, как делают в своих расчетах популяционные генетики. 98 % ошибки в расчетах только за это допущение – цена такого неумного (или неквалифицированного, или некомпетентного) предположения. Иначе говоря, иметь часы – дело нехитрое, но надо, чтобы они были отрегулированы. Это означает, что к ним должны прилагаться корректные константы скоростей мутаций, а корректные величины получаются корректной калибровкой.
Подходим к вопросу о калибровке констант скоростей мутаций.
Данные по калибровке были опубликованы в 2011 году в журнале Advances in Anthropology[77], и недавно изложены в популярном виде на Переформате (http://pereformat.ru/2014/11/dna-calibration/). Суть в том, что были взяты генеалогические данные для 13 семей, удовлетворяющие сформулированным жестким критериям. Эти 13 семей (или «Проектов») были отобраны из сотен других, которые были менее многочисленны или датировки которых были менее достоверны, или гаплотипы были короткими, то есть низкого разрешения.
В указанной статье[78] приведены многочисленные графики для гаплотипов разной протяженности, и каждый график иллюстрировал надежность калибровки, доверительные интервалы и прочее. Статья – редкая по глубине обоснований и достоверности полученных данных, результаты калибровок выверены на 3160 гаплотипах из 55 гаплогрупп и субкладов, из них 2489 гаплотипов были 67-маркерными.
Не будем приводить все калибровочные графики, дадим только калибровочную диаграмму для 37- и 67-маркерных гаплотипов. На рис. 12 на горизонтальной оси – число лет до общего предка каждой из документированных ДНК-генеалогических «семей», на вертикальной оси – среднее число мутаций на маркер (поскольку гаплотипы разные – 37- и 67-маркерные) в гаплотипах, принадлежащих этим семьям.
Рис. 12. Калибровочные взаимоотношения между временем, прошедшим от общих предков генеалогических серий гаплотипов в каждой группе («генеалогической семье»), и числом мутаций, накопившхся с того времени, в расчете на маркер в гаплотипах в 37- и 67-маркерном формате. Данные и принцип подхода опубликованы в журнале Advances in Anthropology (2011, Rozhanskii & Klyosov) и приведены в дополненном виде И.Л. Рожанским на Переформате (http://pereformat.ru/2014/11/dna-calibration/).
Видно, что есть четкая линейная зависимость между «возрастом» ДНК-линии и числом мутаций на маркер. Так и должно быть, поскольку мутации в гаплотипах (и маркерах) происходят случайным образом и описываются кинетикой первого порядка. Угол наклона корреляционной прямой для 37-маркерных гаплотипов выше, чем у 67-маркерных, поскольку мутации в 37 маркерах (где большая доля «быстрых» по мутациям маркеров) в совокупности происходят чаще, чем в 67-маркерных (где, напротив, маркеры с 38 до 67-го по порядку содержат высокую долю «медленных» маркеров). Отсюда и получились те константы скоростей мутаций, приведенные выше в данной статье: для 37-маркерных гаплотипов 0.00243 мутаций на маркер (0.09 мутаций на гаплотип) за условное поколение, для 67-маркерных гаплотипов 0.00179 мутаций на маркер (0.12 мутаций на гаплотип) за условное поколение. Для 67-маркерных гаплотипов точность калибровки больше, и соответствует погрешности в определении константы скорости мутаций ±2.5 %[79]. Рассмотрение тех нескольких тысяч гаплотипов, упомянутых выше, из 55 гаплогрупп и субкладов позволило заключить, что использованная калибровка и метод расчета дают точность в определении времени жизни предка с точностью ±10 % или меньше в интервале от 500 до 6000 лет назад.
Вопрос 70: Могло ли быть так, что мутации в ДНК в одном регионе планеты возникали с большей частотой, чем в другой (скажем, в местах, где радиоактивность была выше или по каким-то климатическим причинам и т. п.)?
Нет, не могло, если речь идет об обратимых мутациях в гаплотипах.
Часто слово «мутации» люди понимают ограниченно, как поломка чего-то в живых организмах под влиянием внешних воздействий, обычно радиации. Но в гаплотипах – это не поломка. Это процесс филигранной перестройки, перемещения блоков нуклеотидов в ДНК. Выше в этой книге был уже приведен пример строения маркера DYS393, в котором четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин, повторяется определенное количество раз. Например, 13 раз, как у большинства носителей разных гаплогрупп:
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше. И вот «мутация» приводит к тому, что вместо 13 раз эта четверка стала повторяться у потомков 12 или 14 раз, в результате однократной ошибки копирующей ДНК-полимеразной системы. Ну как радиация это сможет сделать? В любом случае, этого никто не показал, поэтому и вопроса как такового нет. Мы же не спрашиваем, могут ли на скорость мутации повлиять инопланетяне? Спросим, когда к такому вопросу появятся основания. Пока их нет.
Но выше шла речь в основном о мутациях в гаплотипах, с их филигранными перестройками, с вопроизводимыми константами скоростей. А вот в случае снипов картина может быть значительно более сложной и намного менее воспроизводимой. Там мутации не филигранны, там часто просто «поломки», простые превращения одного нуклеотида в другой, делеции (то есть просто выпадения нуклеотидов, иногда сразу нескольких) и прочие повреждения. Вот там внешняя среда может и влиять на мутации и частоту их появления, просто это пока мало изучено. Возможно, это поставит определенные и немалые ограничения для датировок по снип-мутациям. Иногда это видно даже простым глазом – например, выявляются десяток снип-мутаций там, где должны быть просто одна-две, чтобы было соответствие с уже выявленными закономерностями. Поэтому по снип-мутациям ошибки пока очень велики, возможно, такими и останутся.
Вопрос 71: Как производят расчет времен до общего предка серии гаплотипов?
По определению, чтобы рассчитать время до общего предка серии гаплотипов, необходимо, чтобы данная серия происходила от одного общего предка. Другими словами, чтобы современные носители этих гаплотипов все происходили от одного общего предка, в отношении которого производятся расчеты. Это, казалось бы, совершенно очевидное правило, игнорировалось популяционными генетиками на протяжении последних 20 лет, то есть практически всегда.
Давайте посмотрим, к чему это приводило и продолжает приводить попгенетиков.
Начиная с 1997 года время от времени выходят статьи израильских (в основном) популяционных генетиков, которые раз за разом утверждают, что они идентифицировали предковый гаплотип прародителя «ветхозаветных первосвященников», коэнов, который по их расчетам по мутациям в гаплотипах жил по разным расчетам между 3000 и 2600 лет назад. Он якобы имел следующий 6-маркерный гаплотип (маркеры DYS19, DYS388, DYS390, DYS391, DYS392, DYS393), который получил название «модального гаплотипа коэнов» (МГК):
14 16 23 10 11 12
В статье[80] рассматривали 306 гаплотипов евреев из Израиля, Канады и Англии, и нашли 112 вариантов гаплотипов. Из них отобрали те, которые близки к «модальному гаплотипу коэнов», исключили из рассмотрения DYS388, и в оставленных 5-маркерных гаплотипах нашли, что среднее отклонение их от усеченного МГК равно 0.226 мутаций на маркер. Поскольку авторы принимали, что средняя скорость мутаций в этих 5-маркерных гаплотипах равна 0.0021 на маркер на поколение (продолжительность поколения не была определена), то общий предок всех отобранных гаплотипов жил, по мнению авторов, 0.226/0.0021 = 108 поколений назад. У авторов при этом делении получилось 106 поколений назад, но это уже несущественно. Авторы написали, что если брать 25 лет на поколение, то общий предок жил 106х25 = 2650 лет назад, а если брать 30 лет на поколение, то он жил 3180 лет назад. Можно было бы и не упоминать, но со средней скоростью мутаций на маркер в данных гаплотипах авторы тоже ошиблись, она равна 0.00171, а не 0.0021 мутаций на маркер, и общий предок тогда жил якобы 132 поколения, или 3300 лет назад (при 25 годах на поколение) или 3960 лет назад (при 30 годах на поколение). Действительно, можно было бы не упоминать, потому что основная ошибка авторов не в делениях одного на другое, а в том, что ими постулировалось, что все рассматриваемые гаплотипы происходят от одного общего предка, хотя это оказалось, как мы покажем ниже, не так. Авторы по сути просто усреднили «отклонения величины аллелей от средней», а там были гаплотипы по меньшей мере от двух разных предков, один из которых, самый основной по количеству гаплотипов в выборке, жил всего тысячу лет назад. Никаким «ветхозаветным священником» он не был. Авторы на самом деле рассматривали разные ДНК-генеалогические линии, усредняя их, как берут хрестоматийную «среднюю температуру по больнице». Так работает популяционная генетика.