KnigaRead.com/

Анатолий Клёсов - Кому мешает ДНК-генеалогия?

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн "Анатолий Клёсов - Кому мешает ДНК-генеалогия?". Жанр: Прочая научная литература издательство -, год -.
Перейти на страницу:

Смотрим данные компании YFull, когда образовался снип Z280 по их подсчетам.

У них – 5000 лет назад. Как же так, если все так «прозрачно», что и обсуждать нечего? В чем причина? Да в том, что они берут, видимо, некое свое число снипов, одна снип-мутация у них принимается не за 120 лет, а за 144 года, и фрагмент Y-хромосомы они принимают не за 10 миллионов нуклеотидов, а за 8.47 миллионов, см. ниже. Нетрудно подсчитать, что они берут за основу примерно среднюю величину, около 35 снип-мутаций, хотя их там, как сообщено выше, между 22 и 45.

Так что у Балановского весьма примитивное представление о том, как ведутся расчеты датировок по снипам.

Но там еще менее «прозрачно», чем то, что мы сейчас показали. Смотрим на датировки образования гаплогрупп R1a и R1b по данным компании YFull.

Видим, что к R1a ведут 105 снип, к R1b – 45 снипов. Сама подача данных совершенно невразумительна, поскольку при 144 годах на снип это дает 15120 и 6480 лет, соответственно. Похоже, что это расстояния от датировки гаплогруппы R1, на что намекает разница в (27600-22000) = 5600 лет, что в целом недалеко от гаплогруппы R1b. А гаплогруппа R1a, что с ее датировкой? 27600-15120 = 12480 лет? А в таблице стоит та же 22000 лет, что и у R1b. Ах, да, по Балановскому там «столь прозрачно, что обычно даже не обсуждается». Всем понятно, что Балановский во всём натягивает, передергивает, жульничает? Это – его уровень, его квалификация. Его визитная карточка.

Теперь – мой взгляд на состояние датировки по снипам, поскольку Балановского слушать нельзя, нигде и ни в чем.

По данным разных исследователей, необратимые снип-мутации в Y-хромосоме, и, видимо, в ДНК в целом, происходят со средней скоростью между 0.5 × 10-9 и 1.0 × 10-9 на нуклеотид в год. В последнее время прошла серия работ независимых исследователей, в которых средняя скорость снип-мутаций определена как 0.78-0.82 × 10-9 на нуклеотид в год. Наконец, исследователи в компании YFull, которые занимаются расчетами скоростей мутаций в Y-хромосоме (Адамов, Гурьянов, Каржавин, Таганкин, Урасин, 2015, «Константа скорости SNP мутаций Y-хромосомы по данным полного секвенирования» принимают в своих расчетах величину скорости 0.8178×10-9 на нуклеотид за год, хотя такая точность определения совершенно нереальна. Пагубное влияние попгенетики. Поскольку вся Y-хромосома – примерно 58 миллионов нуклеотидов, и если скорость снип-мутации – 0.8178×10-9 на нуклеотид за год, то это составляет 0.8178 × 10-9×58 × 106 = 0.04743 на всю хромосому в год, или 1.185 на всю хромосому за 25 лет. Даже если скорость мутаций не такая точная, а, как свидетельствуют разные публикации, между 0.5 и 1.0 × 10-9, то снип-мутации происходят в среднем между 0.725 и 1.45 мутаций на всю Y-хромосому за 25 лет. То есть как ни считать, мутации в Y-хромосоме происходят со средней скоростью примерно одна мутация за поколение.

Сформулируем по-другому – если скорость мутации брать от 0.5X10-9 до 1.0Х10-9 на нуклеотид за год, то снип-мутация происходит раз в интервал времени между 34 и 17 лет. Мы уже видим, что если скорость мутации не откалибровать надежно, то точность метода датировки по снипам невелика. Помимо того, точность в реальных условиях еще более низкая, потому что почти никто не секвенирует полную Y-хромосому в поисках снипов, а секвенируют фрагменты, либо небольшие, в 300–500 тысяч нуклеотидов, либо в 10 миллионов нуклеотидов (как в методе BigY), либо, реже, в 30 миллионов нуклеотидов. Но когда пишут, что секвенируют фрагмент в 10 миллионов нуклеотидов, там фрагмент легко может оказаться между 8 и 11 миллионами, и это еще оптимистическое предположение.

Давайте посмотрим, к чему это приведет. Как отмечалось выше, компания YFull принимает величину константы скорости мутации 0.8178Х10-9, в таком случае одна мутация во всей Y-хромосоме происходит в среднем раз в 1/0.04743 = 21.08 лет. Во фрагменте в 30 миллионов нуклеотидов – раз в 41 год. Во фрагменте в 10 миллионов нуклеотидов – раз в 122 лет. Если фрагменты малые, в 300 тысяч нуклеотидов, то раз в 4075 лет. Вот и выбирайте. YFull сообщает, что средний размер фрагмента Y-хромосомы, по которому они ведут расчеты, составляет 8467165 нуклеотидов (такая точность тоже смешна, ну да ладно, это у попгенетиков неисправимо). Тогда одна мутация в таком фрагменте происходит в среднем раз в 144.41 лет (это опять сообщают YFull, опять с такой точностью). Когда умножают на число снипов, к этому прибавляют еще 60 лет. Как объясняют в YFull, 60 лет – это средний возраст клиента, который к ним обращается. Такая «точность» тоже вызывает усмешку.

Итак, если читатель не хочет разбираться в деталях, то на этом этапе можно резюмировать, что если исследователи сообщают, что анализируют (в поисках снипов) фрагменты Y-хромосомы в 10 миллионов нуклеотидов, то там на самом деле может быть восемь с половиной миллионов нуклеотидов, или меньше, или больше, и если при этом считать, что скорость снип-мутации составляет именно 0.8178Х10-9 на нуклеотид в год, то при фрагменте в 8.5 миллионов нуклеотидов одна снип-мутация происходит раз в 144 года. На деле там, конечно, погрешность более чем солидная.

Но это еще не всё, и погрешность часто еще значительно больше. Дело в том, что снип-мутации происходят не через равные промежутки времени, а неупорядоченно. Если при этом рассматриваются цепочки снипов протяженностью десятки и сотни тысяч лет, то это аналогично рассмотрению ситуации с сотнями бросков монеты, и погрешности из-за неупорядоченности нивелируются. Но для относительно недавних снипов метод расчета очень неточный. Например, если снип образовался 750 лет назад, то в цепочке нисходящих снипов их всего 750/144 = 5 снипов, и погрешность определения времени образования снипа, согласно формулам математической статистики, не меньше ±46 % (с 68 %-ной достоверностью) или ±92 % (с 95%ной достоверностью). В итоге погрешности у большинства датировок по снипам в таблице значительно более высокие, чем у датировок по мутациям в гаплотипах, которые рассматривает ДНК-генеалогия.

Есть еще серьезная проблема – в расчетах компании YFull часто игнорируют фактическое количество снипов, и ставят ту датировку, которая им представлется более правильной, «по понятиям». При этом они всегда постулируют, что при разветвлении снипов они образовались точно в одно и то же время, хотя это события совершенно независимые. По аналогии, если у отца двое сыновей, то их возраст далеко не всегда одинаковый, один мог родиться, когда отцу было 18 лет, другой – когда отцу было 70 лет. Такой постулат, «о равенстве возраста сыновей» часто приводит к ситуациям, когда к одному снипу от вышестоящего ведет 5 мутаций (в среднем 720 лет), к другому 20 мутаций (в среднем 2880 лет), а YFull записывает их «возраст» как одинаковый, либо 720, либо 2880 лет, выбор датировки фактически произвольный. В итоге получаются несуразные датировки.

Примеры – в переходе R1a-Y35 > YP7278 зафиксировано 9 промежуточных снипов (это приведено в таблице на сайте YFull), что соответствует 1300 лет разницы, однако датировка для обоих снипов, родительского и нисходящего, приведена как одинаковая, 4300 лет назад. В переходе CTS3402 > CTS2613 зафиксировано 17 промежуточных снипов (2450 лет разницы), однако датировка для обоих снипов в списке YFull – одинаковые 4300 лет назад, вместо 1850 лет назад для нисходящего, как должно быть (и как дает более точная датировка по гаплотипам). И так в таблицах YFull повторяется десятки и сотни раз.

Приходится на этом столь подробно останавливаться, потому что в последнее время усиленно распространяется легенда, которую безграмотно пропагандирует Балановский, что расчеты по снипам – значительно более точные, чем любыми другими методами. Историки могут принять эту легенду за чистую монету, и опять повторится ситуация последних 15 лет, когда практически все расчеты популяционными генетиками, опубликованные в академических журналах, были кардинально искажены, с завышениями до 300–400 %. Для расчетов на времена удаленные, как правило, более 5-10 тысяч лет назад, и тем более на 100–200 тысяч лет назад, когда число снип-мутаций исчисляется многими сотнями, расчеты по снипам действительно могут оказаться полезными, но вводимые постулаты, как равенство датировок для «параллельных» снипов, опять сводит эту пользу к нулю, если не к отрицательным величинам.

Так что я весьма критически отношусь к расчетам датировок по снипам, если они не подтверждены перекрестными расчетами с использованием других методов, например, по мутациям в гаплотипах. Но часто бывает, что другие методы непригодны, или нет соответствующих гаплотипов. Тогда приходится принимать то, что есть. Но часто бывает, что совпадение расчетов по снипам и гаплотипам вполне удовлетворительное. Это придает уверенность, что в принципе подход, основанный на числе снипов, правильный, но он нуждается в доработке.

Но, как мы видим, попгенетики опять в своем амплуа – Балановский уже провозгласил, что метод расчетов по снипам самый точный, и ненавистные ему расчетные подходы ДНК-генеалогии можно отставить. Это опять было провозглашено без какого-либо исследования, и единственная статья, в которой Балановский этот метод использовал, дала неверные результаты. Дело в том, что Балановский в своей манере выхватил из многих вариантов лишь одну скорость мутации – 122 года на снип, без малейшего ее обоснования или проверки, и опять получил неверные датировки (Underhill et al, 2015, 32 автора, Eur. J. Human Genetics).

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*