Анатолий Клёсов - Кому мешает ДНК-генеалогия?
Дадим пример принципиального различия ДНК-генеалогии и популяционной генетики. Например, мы проводили анализ бактрийских гаплотипов, предположительно предковых к гаплотипам современных карачаево-балкарцев и осетин. Мы постhоили дерево гаплотипов, разделили его на ветви (точнее, сам вид дерева уже показал четкое разделение на ветви), определили базовый (то есть предполагаемый предковый) гаплотип для каждой ветви, рассчитали времена для общих предков каждой ветви, провели явные параллели с осетинами и карачаево-балкарцами, провели перекрестные расчеты и показали, что они согласуются со временами жизни общих предков бактрийских гаплотипов, как и современных пуштунов Афганистана и Пакистана. Это в свою очередь позволило предложить гипотезу в отношении картины и времен миграций носителей субклада G2a1 из Бактрии на Кавказ.
Посмотрим, что, имея такие же исходные данные, получают из них популяционные генетики. Эти исходные данные (гаплотипы) были опубликованы в статье[247], и, поскольку статья недавняя, она отражает современные подходы популяционной генетики. Какие же они, эти подходы? Какие главные выводы сделали авторы из опубликованного ими материала? Помогает то, что авторы приложили к статье список highlights, то есть главных выводов. Их – пять: (1) авторы определили гаплотипы для 270 человек, (2) «дискриминационная способность» для 230 гаплотипов из всех 270 была равна 85.2 %, (3) три маркера, DYS446, DYS447 and DYS449, были основными в отношении «увеличения дискриминации», (4) доминирующая гаплогруппа среди пакистанских пуштунов была R1a1a, (5) предками пакистанских пуштунов вряд ли были евреи. Всё. Резюме к статье добавляет, что (1) каждый маркер показывает «разнообразие» от 0.2506 до 0.8538, (2) «дискриминационная способность» для 17-маркерных гаплотипов была равна 73.7 %, и при увеличении их длины возросла до 85.2 %, (з) для получения информации о происхождении пуштунов сравнили носителей гаплогрупп G и Q у пуштунов и евреев (ашкенази и сефардов), но еврейского происхождения пуштунов особенно не обнаружили («little support for a Jewish origin could be found»). Все эти «разнообразия маркеров» считаются без разделения соответствующих гаплотипов на гаплогруппы, и на круг по выбранным 199 гаплотипам «разнообразие» получилось равно 0.9903, а по 230 гаплотипам оно было равно 0.9968. Ни для чего больше эти цифры в статье не использовались, датировки не считались. Да и не могли считаться, потому что для них все гаплогруппы «сваливались в кучу». Никакого практического, и тем более теоретического смысла все эти арифметические упражнения популяционных генетиков не имели и иметь не могут. Смысл там исключительно описательный, что увидели, то и записали.
В этих примерах – суть подходов и уровня работы популяционных генетиков. Теперь оцените высказывание Е. Балановской с трибуны недавней Конференции, что «Клёсов эксплуатирует собранную генетиками информацию, обрабатывает её неизвестными методами и получает красивые результаты на потребу публике». Так если попгенетики беспомощны в корректной и информативной обработке собранных ими гаплотипов, то надо заменить их некомпетентность и неумение на полученные корректными методами «красивые результаты», тут Балановская не ошиблась. А что до «неизвестных методов», то учиться надо. И придется учиться, деваться просто некуда. А уж «на потребу публике» – это ложь Балановской от беспомощности и отчаяния, от своей некомпетентности. Красивые результаты – это правильные результаты, что еще физики давно подметили.
Различия терминов в ДНК-генеалогии и популяционной генетике
Поскольку ДНК-генеалогия и популяционная генетика – разные области науки, с разными методологиями, разным характером выводов, разными целями и задачами, разным способом подачи данных, то у них, разумеется, во многом разная терминология. От страстного желания хоть как-то дискредитировать, Балановская объявила с трибуны Конференции, что я путаю термины. Да не путаю я, я просто использую другие термины, термины ДНК-генеалогии, или придаю терминам другие значения, более подходящие в данной конкретной ситуации. Она так и не поняла, что ДНК-генеалогия – другая наука, нежели попгенетика с ее терминами. Например, предковый гаплотип в ДНК-генеалогии называется «базовым», потому что он вычисляется, и нет гарантии, что он действительно предковый. Возможно, отклоняется на одну аллель. Зачем вводить читателей в заблуждение? Термина «базовый гаплотип» в популяционной генетике нет. Нет терминов «линейный метод расчета», нет «квадратичный метод», нет понятия «арии», не используется термин «химическая кинетика», впрочем, и «биологическая кинетика» тоже не используется. Нет понятия «род» в том смысле, который используется в ДНК-генеалогии. Перечислять можно долго.
В ДНК-генеалогии используются поправки на возвратные мутации, которых нет в популяционной генетике. В ДНК-генеалогии есть логарифмический метод, кратко описанный ранее. И он вовсе не «неточный», как безграмотно заявил О. Балановский, в очередной раз показав свою некомпетентность. Неточный этот метод бывает тогда, когда используется неправильно. Неточным будет микроскоп, если его использовать для рассматривания звезд. На то есть телескоп, или хотя бы подзорная труба.
Выше были приведены многие примеры применения логарифмического метода, и с линейным он зачастую расходится всего на 2–3%. А у Балановского этот метод «неточный», «неоптимальный» и вообще плохой. Хотя ни одного (!) примера неточности или неоптимальности Балановский не приводил. Да и привести не мог, как видно, он не понимает, как этот метод применять. И самое забавное – это говорит тот, ошибки у которого в расчетах датировок систематически равны как минимум 250–350 %.
В ДНК-генеалогии используются понятия констант скоростей мутаций, а не просто «скоростей», как в попгенетике. Последнее в данном контексте неверно.
В ДНК-генеалогии нет «эффекта основателя», потому что этот термин излишний, он не нужен при правильной обработке данных. В ДНК-генеалогии арии – это древние носители гаплогруппы R1a, и наоборот, древние носители гаплогруппы R1a – это арии. Хотя бы потому, что носители гаплогруппы R1a составляют до 72 % высших каст Индии[248]. И еще потому, что слово арии созвучно индексу R1a. По той же причине древние носители гаплогруппы R1b – это эрбины, поскольку их называть как-то надо, а название отсутствует. Эрбины – это хороший термин, простой и ясный. Поэтому, читая фразу «Балановский особо подчеркнул вызывающий недоумение случай создания в рамках «ДНК-генеалогии» фантомного этноса ««эрбинов», якобы представляющих собой гаплогруппу R1b», опять приходится сомневаться в способности критика соображать. О терминах, как известно, не дискутируют, их или принимают, или не принимают. Недоумение при этом выказывают только люди недалекие, что и имеем. Далее, эрбины – это вовсе не «этнос», похоже, что популяционный генетик Балановский не знает, что гаплогруппа этнос не определяет. И эрбины не «якобы» представляют гаплогруппу R1b, а буквально, по определению.
Наконец, в терминах ДНК-генеалогии гаплогруппа – это род. В основе как гаплогруппы, так и рода (это синонимы) находился патриарх, родоначальник, потомки которого выжили со своими гаплотипами до настоящего времени.
Итак, вывод: в ДНК-генеалогии своя терминология, отличная от таковой в популяционной генетике.
Расчетный аппарат ДНК-генеалогии. Калибровка. Примеры.
Читаем «мою» страничку в Википедии. Там недавно появилось следующее: «Ряд известных российских антропологов и генетиков выступил с критикой Клёсова и развиваемой им ««ДНК-генеалогии». Так, Олег Балановский, заведующий лабораторией геномной географии Института общей генетики РАН, полагает, что технические методы «ДНК-генеалогии» вовсе не оригинальны, представляя собой обычный метод молекулярных часов с рядом простейших модификаций…С его точки зрения, технические аспекты ««ДНК-генеалогии» являются ««малоэффективными, но приемлемыми»…».
Сказана глупость, и не одна, а несколько всего в нескольких строках.
Во-первых, что такое «обычный метод молекулярных часов»? Это – шаблонная фраза, за которой нет никакой мысли, обычное попугайское повторение того, что когда-то услышал. «Метод Животовского» – тоже «обычный метод молекулярных часов», только часы торопятся в три раза, давая датировки втрое завышенные. Любая реакция в химических или биологических системах, описываемая константой скорости первого порядка, есть «обычные молекулярные часы», поскольку связана с хронологией процесса на молекулярном уровне. Динамика любого такого процесса связана со временем согласно формуле с = coe-kt, где со – исходное состояние системы (например, начальное количество или концентрация изучаемого вещества; количество гаплотипов Y-хромосомы в изучаемой выборке, и т. д.), с – состояние системы в определенный момент времени t (где t – время прошедшее с начала реакции, t-to), или количество базовых, то есть исходных гаплотипов в изучаемой выборке в настоящее время, спустя время t, прошедшее со времени жизни общего предка изучаемой серии гаплотипов), k – константа скорости реакции. Эту же формулу можно переписать в виде ln(co/c) = kt, и она становится выражением логарифмического метода анализа выборок гаплотипов в ДНК-генеалогии. Берем, скажем, сто или тысячу гаплотипов, или любое другое их число, делим на число базовых (то есть одинаковых, идентичных друг другу гаплотипов, суть предковых гаплотипов, которые не успели мутировать за время t, прошеднее со времени жизни общего предка), берем натуральный логарифм (ln), и получаем произведение kt, то есть константу скорости мутации, помноженную на число лет, прошедшее со времени жизни общего предка, или на число условных поколений, опять же прошедших после общего предка – в зависимости от того, выражали константу скорости в годах, или в поколениях.