Анатолий Клёсов - Кому мешает ДНК-генеалогия?
Отвечу. Если даже взять 100 тысяч пар отец-сын, то те маркеры, у которых константа скорости мутации меньше чем 0.0001 мутаций на маркер на поколение, все равно покажут плохую статистику, у них в среднем будет наблюдаться меньше, чем 10 мутаций на поколение для всех этих 100 тысяч пар. То есть погрешность определения константы скорости мутации для них в лучшем случае в среднем будет ±32 %. Но это только для тех, у которых константа скорости 0.0001. А таких, с константами 0.0001 и меньше, в 111-маркерной панели девять маркеров, из них пять – в 67-маркерной панели (показана константа скорости на маркер за условное поколение в 25 лет):
DYS472 0.000008
DYS436 0.000040
DYS425 0.000042
DYS568 0.000050
DYS490 0.000070
DYS426 0.000090
DYS455 0.000100
DYS632 0.000100
DYS494 0.000100
Кстати, для всех этих девяти маркеров в серии из 1500–1800 пар отец-сын (Ballantyne, 2010) не наблюдалось ни одной мутации. То есть их данные опять неприменимы для расчетов.
А для DYS472 и 100 тысяч пар-отец-сын недостаточно и для наблюдения хотя бы одной мутации. Там маркер мутирует в среднем раз в 125 тысяч поколений, то есть раз на 125 тысяч пар отец-сын. В общем, меньше чем полумиллионом пар не обойтись, лучше – миллион пар отец-сын. Это, конечно, практически нереально.
Но и там без калибровки не обойтись, несмотря на неквалифицированное заявление Балановского – «прямой подсчет и калибровка». Как мы видим, в ряде случаев в парах отец-сын наблюдаются ошибки, как показано выше. Или надо без всякой проверки их в дело пускать? Нет, придется все равно калибровать по известным генеалогиям или историческим событиям. И еще проблема, которую Балановский опять затронул, как всегда, уклончиво, нечетко, мутно. В парах отец-сын константы получаются в расчете на поколение. А в исторических науках на поколение не считают, нужно пересчитывать в года. А как? Популяционные генетики эту проблему так и не решили, см. следующий раздел. Так что в этом отношении пары отец-сын практически бесполезны. Польза, конечно, есть, но не для расчетов. Польза «концептуальная», просто посмотреть, какой порядок скоростей мутаций, и убедиться, что он «разумный». Вот, пожалуй, и вся польза. Но попгенетики до этого не додумываются.
Балановский пишет, что «таких исследований было проведено немало… результаты всех этих работ совпали, что является важнейшим подтверждением корректности этой оценки частоты мутаций». Ничего подобного, везде наблюдается разнобой. Балановского всегда приходится ловить за руку. Выше уже показано, какая там «корректность». Хорошо, сравним данные тех же Ballantyne и др. (2010)[274] и большой, сводный список (по разным авторам) Burgarella и др. (2010), взяв для примера первые несколько маркеров из первой панели. Опять, чтобы не загромождать читателя информацией, полезной больше для специалистов, вынесем это во врезку на странице. Кого детали не интересуют, можно пропустить, не читая. Для них просто сообщу, что «частоты мутаций» у разных авторов по парам отец-сын различаются в два раза и более, и для расчетов они неприменимы. Никаких «совпали» и «корректности» там нет и близко. Балановский опять вводит в заблуждение, или попросту лжет.
DYS393, у Ballantyne 3 мутации на 1750 пар отец-сын, что в дальнейшем будем обозначать как 3/1750, у Burgarella 13/12576, то есть во втором случае 1.8/1750 мутаций вместо 3, в той же пропорции на 1750 пар, разница 167 %.
DYS390, 2/1758 и 30/14131, соответственно, то есть во втором случае 3.7/1758 мутаций вместо 2, в той же пропорции, разница 185 %.
DYS19, 7/1756 и 32/14632, соответственно, то есть во втором случае 3.8 мутаций вместо 7, в той же пропорции, разница 182 %.
DYS391, константы скоростей мутаций оценены в диапазоне 0.00126-0.00665 (Ballantyne) и 0.00198-0.00372 (Burgarella). Формально диапазоны перекрываются, но вести расчеты с таким широким диапазоном неопределенности невозможно. По нашим независимым данным (Вестник Академии ДНК-генеалогии, № 3, 2015) величина константы скорости мутации для DYS391 равна 0.00220 мутаций на маркер на 25 лет.
DYS385a,b – данных у Burgarella нет, у Ballantyne дается диапазон 0.000624-0.00506 для DYS385a, то есть 8-кратный диапазон неопределенности, и 0.00175-0.00809 для DYS385b, то есть диапазон неопределенности в 4.6 раз. По нашим независимым данным (ссылка выше) величина константы скорости мутации для DYS385a и DYS385b равна 0.00280 и 0.00360 мутаций на маркер на 25 лет, соответственно.
DYS426 – у Burgarella данных нет, у Ballantyne ноль мутаций на 1735 пар отец-сын. Тем не менее, каким-то загадочным приемом последние оценили величину константы (при полном отсутствии мутаций) в 0.000398 мутаций на маркер на поколение (обратите внимание на точность оценки при отсутствии мутаций!). По нашим независимым данным (ссылка выше) величина константы скорости мутации для DYS426 равна 0.00009 мутаций на маркер на 25 лет, соответственно. Иначе говоря, Ballantyne в своей оценке промахнулись на 440 %.
DYS388, 0/1635 и 1/2394 мутаций, соответственно, но и в такой ситуации (то есть при практическом отсутствии мутаций) Ballantyne и Burgarella оценили величины констант скоростей мутаций как 0.000425 и 0.0004177 на поколение, соответственно (опять обратите внимание на точность оценки!). Никаких оснований для таких оценок просто нет. По нашим независимым данным (ссылка выше) величина константы скорости мутации для DYS388 равна 0.00022 мутаций на маркер на 25 лет. Иначе говоря, Ballantyne и Burgarella в своих оценках промахнулись в два раза.
DYS439, 6/1736 и 51/9313 мутаций, соответственно, то есть во втором случае 9.5 мутаций вместо 6, в той же пропорции, разница 158 %.
DYS389-1, 9/1751 и 32/12651 мутаций, соответственно, то есть во втором случае 4.4 мутаций вместо 9, в той же пропорции, разница 205 %.
DYS392, константы скоростей мутаций 0.00097 и 0.0004303, соответственно, то есть разница 225 %.
Теперь посмотрим на результаты по парам отец-сын в исследованиях Gusmao (2005) и Sanchez-Diaz (2008), на которые ссылался Балановский в своей «дискуссии». В первом исследовании изучали 3026 пар отец-сын по 17 маркерам, то есть должны были бы определить мутации в 3026 × 17 = 51442 маркерах-переходах от отца к сыну. На самом деле данные представлены всего для 27029 маркеров-переходов, то есть почти половину маркеров не изучали. В итоге сообщили, что константа скорости мутации в среднем на маркер находится в диапазоне доверительности между 0.001501 и 0.002606 за поколение (неизвестной продолжительности), то есть простирающимся на 174 %. Ну и как, кому нужны расчеты с такой неопределенностью? К тому же в расчете на поколение неизвестной продолжительности. Кстати, по нашим независимым данным (ссылка выше) средняя величина константы скорости мутации для 17-маркерных гаплотипов (Y-filer) равна 0.00215 мутаций на маркер за 25 лет.
Смотрим на второе исследование, в котором изучали 701 пару отец-сын, и нашли в 17-маркерных гаплотипах суммарно 26 мутаций. Уже ясно, какая там статистика. Да, так и есть. В Абстракт авторы вынесли, что для DYS438 константа скорости мутации равна 0.000425 на поколение (опять неизвестной продолжительности), а в работе Ballantyne для 1751 пар отец-сын та же константа скорости мутации равна 0.000956 на поколение. Разница – 225 %. Ну ладно, этот маркер «медленный», хотя в 17-маркерную панель Y-Filer он входит. Но посмотрим на самый быстрый маркер этой панели, DYS458. На 701 паре отец-сын константа равна 0.00636, у Ballantyne на 1756 пар константа равна 0.00838, разница на 31 %. И это – самая благоприятная статистика, «быстрыймаркер». Как там у Балановского – «результаты совпали»? «Важнейшее подтверждение корректности»? Он на данные в статьях смотрел или нет?
Пожалуй, достаточно. Вывод – «частоты мутаций» по парам отец-сын практически невоспроизводимы, никаких расчетов с ними делать нельзя.
Любой, хоть немного понимающий в числах, оценит лживость заявления Балановского, что «результаты всех этих работ совпали, что является важнейшим подтверждением корректности этой оценки частоты мутаций». На самом деле ситуация ясна – Балановский на результаты и не смотрел, он из тех, кому результаты и не нужны. Он – политработник, так сказать. Если проще – работающий по некому уставу, где мысли и не нужны. Есть внутренние установки, которые надо выполнять. Нет ничего, более далекого от науки. Балановский не ученый, он техник-лаборант некоего негативного идеологического фронта. Поэтому научные дискуссии с ним бесполезны.
Сюда же относятся его абсолютно ненаучные рассуждения о якобы «калибровке», проведенной Л. Животовским (2004) в отношении «популяционных скоростей». Опять Балановский заводит пластинку о якобы «калибровке» по гаплотипам маори и цыган, которую якобы проводил Животовский. Эта «калибровка» детально рассмотрена мной в ряде журнальных публикаций, и в книге «Происхождение славян», глава 16. Не было там никакой «калибровки». Была откровенная подгонка данных с серийным выбрасыванием неугодных гаплотипов, причем подгонка шла в несколько кругов, и в итоге все равно подогнать не удавалось, и нужное число просто декларировалось. Либо Балановский этого не читал, либо просто лжет. Я не знаю, что хуже.
И после этого Балановский «на голубом глазу» объявляет, что «к сожалению, других работ по калибровке скорости мутирования Y-STR маркеров не было проведено». Здравствуйте, приехали. А как же статья в «Advances in Anthropology» (2011)[275] c калибровками по тысячам гаплотипов из разных гаплогрупп? А как насчет калибровки еще в 2008 году по гаплотипам МакДоналдов, опубликованной в Вестнике Академии ДНК-генеалогии? В ДНК-генеалогии еще с 2008 года используются откалиброванные значения констант скоростей мутаций гаплотипов разных форматов, описанные в книгах «Происхождение человека» (2010), «Происхождение славян» (2013), «Занимательная ДНК-генеалогия» (2013), «Арийские народы на просторах Евразии» (2015), «Славяне, кавказцы, евреи с точки зрения ДНК-генеалогии» (2015), «Евреи и пуштуны Афганистана» (2015), «Экспертиза Велесовой книги» (том третий, 2015). Как это Балановский все пропустил? Ах, да, Балановский – не читатель, Балановский – писатель…