Электронная библиотека » Анатолий Клёсов » » онлайн чтение - страница 12


  • Текст добавлен: 28 ноября 2016, 12:20


Автор книги: Анатолий Клёсов


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 12 (всего у книги 47 страниц) [доступный отрывок для чтения: 12 страниц]

Шрифт:
- 100% +

Но выше шла речь в основном о мутациях в гаплотипах, с их филигранными перестройками, с вопроизводимыми константами скоростей. А вот в случае снипов картина может быть значительно более сложной и намного менее воспроизводимой. Там мутации не филигранны, там часто просто «поломки», простые превращения одного нуклеотида в другой, делеции (то есть просто выпадения нуклеотидов, иногда сразу нескольких) и прочие повреждения. Вот там внешняя среда может и влиять на мутации и частоту их появления, просто это пока мало изучено. Возможно, это поставит определенные и немалые ограничения для датировок по снип-мутациям. Иногда это видно даже простым глазом – например, выявляются десяток снип-мутаций там, где должны быть просто одна-две, чтобы было соответствие с уже выявленными закономерностями. Поэтому по снип-мутациям ошибки пока очень велики, возможно, такими и останутся.


Вопрос 71: Как производят расчет времен до общего предка серии гаплотипов?

По определению, чтобы рассчитать время до общего предка серии гаплотипов, необходимо, чтобы данная серия происходила от одного общего предка. Другими словами, чтобы современные носители этих гаплотипов все происходили от одного общего предка, в отношении которого производятся расчеты. Это, казалось бы, совершенно очевидное правило, игнорировалось популяционными генетиками на протяжении последних 20 лет, то есть практически всегда.

Давайте посмотрим, к чему это приводило и продолжает приводить попгенетиков.

Начиная с 1997 года время от времени выходят статьи израильских (в основном) популяционных генетиков, которые раз за разом утверждают, что они идентифицировали предковый гаплотип прародителя «ветхозаветных первосвященников», коэнов, который по их расчетам по мутациям в гаплотипах жил по разным расчетам между 3000 и 2600 лет назад. Он якобы имел следующий 6-маркерный гаплотип (маркеры DYS19, DYS388, DYS390, DYS391, DYS392, DYS393), который получил название «модального гаплотипа коэнов» (МГК):


14 16 23 10 11 12


В статье[80]80
  Thomas, M.G., Skorecki, K., Ben-Ami, H., Parfitt T., Bradman N., Goldstein D.B. (1998) Origins of Old Testament priests. Nature, 394, 138–140.


[Закрыть]
рассматривали 306 гаплотипов евреев из Израиля, Канады и Англии, и нашли 112 вариантов гаплотипов. Из них отобрали те, которые близки к «модальному гаплотипу коэнов», исключили из рассмотрения DYS388, и в оставленных 5-маркерных гаплотипах нашли, что среднее отклонение их от усеченного МГК равно 0.226 мутаций на маркер. Поскольку авторы принимали, что средняя скорость мутаций в этих 5-маркерных гаплотипах равна 0.0021 на маркер на поколение (продолжительность поколения не была определена), то общий предок всех отобранных гаплотипов жил, по мнению авторов, 0.226/0.0021 = 108 поколений назад. У авторов при этом делении получилось 106 поколений назад, но это уже несущественно. Авторы написали, что если брать 25 лет на поколение, то общий предок жил 106х25 = 2650 лет назад, а если брать 30 лет на поколение, то он жил 3180 лет назад. Можно было бы и не упоминать, но со средней скоростью мутаций на маркер в данных гаплотипах авторы тоже ошиблись, она равна 0.00171, а не 0.0021 мутаций на маркер, и общий предок тогда жил якобы 132 поколения, или 3300 лет назад (при 25 годах на поколение) или 3960 лет назад (при 30 годах на поколение). Действительно, можно было бы не упоминать, потому что основная ошибка авторов не в делениях одного на другое, а в том, что ими постулировалось, что все рассматриваемые гаплотипы происходят от одного общего предка, хотя это оказалось, как мы покажем ниже, не так. Авторы по сути просто усреднили «отклонения величины аллелей от средней», а там были гаплотипы по меньшей мере от двух разных предков, один из которых, самый основной по количеству гаплотипов в выборке, жил всего тысячу лет назад. Никаким «ветхозаветным священником» он не был. Авторы на самом деле рассматривали разные ДНК-генеалогические линии, усредняя их, как берут хрестоматийную «среднюю температуру по больнице». Так работает популяционная генетика.

Следующая статья по гаплотипам евреев[81]81
  Behar, D.M., Thomas, M.G., Skorecki, K., Hammer, M.F., Bulygina, E., Rosengarten, D., Jones, A.L., Held, K., Moses, V., Goldstein, D., Bradman, N., Weale, M.E. (2003) Multiple origins of Ashkenazi Levites: Y chromosome evidence for both Near Eastern and European ancestries. Am. Hum. Genet. 73, 768–779.


[Закрыть]
могла бы прояснить ситуацию, но для попгенетиков не прояснила. В статье были опубликованы 194 гаплотипа в 6-маркерном формате, из которых 91 гаплотип были идентичны друг другу, и соответствовали «модальному гаплотипу коэнов» (см. выше). Авторам должно было быть ясно, что когда половина гаплотипов представляют собой предковый гаплотип, то предок явно не древний, и не мог жить больше 3 тыс лет назад, раз половина гаплотипов не успела мутировать. Но ясно бывает тогда, когда есть соответствующие знания, «ощущение ситуации». У авторов этого, очевидно, не было. А в другой половине (точнее, в 103 гаплотипах из 194) имелось 263 мутаций от «модального гаплотипа коэнов». Если бездумно разделить общее число мутаций на общее число гаплотипов и на константу скорости мутации 0.0074 на 6-маркерный гаплотип на поколение, 263/194/0.0074, то получим 183 ^224 условных поколений (стрелка показывает поправку на возвратные мутации), или 5600±660 лет до общего предка «гаплотипов коэнов». Это неразумно высокая величина, намного превышающяя времени жизни библейского Аарона по любым библейским интерпретациям, который по толкованию Библии жил примерно 3600 лет назад, но это все «лирика». Проблема в том, что так вести расчеты, постулируя, что гаплотипы происходят от одного общего предка, вообще нельзя. Вот как выглядит ДНК-генеалогическое дерево этих 194 гаплотипов (рис 13.).

На дереве видны многочисленные ветви, в каждой из которых – свой общий предок. Нет и не может быть в такой ситуации некоего «одного общего предка», ветви нужно анализировать раздельно. Как было показано в наших работах, серия идентичных гаплотипов, идущих по кругу выше, имеют общего предка, который жил 1075±130 лет назад («академическая выборка») или 1050±190 лет назад («коммерческая выборка», то есть по коммерческим базам данных), что практически одно и то же, и разница между ними заметно проявляется уже в 67-маркерном формате гаплотипов.

Какой вывод из этого следует? Тот, что нельзя проводить расчеты по сериям гаплотипов «чохом», без разделения их на ветви. Нет ничего проще, чем выписать гаплотипы в серию, посчитать в них мутации от чего-то среднего, или от какого-то заранее заданного «предкового» гаплотипа, и разделить число мутаций на число гаплотипов и на скорость мутаций, которая нравится, или почему-то принимается. Какое-то число при этом всегда получится. Но это будет, как правило, мусор, с претензией на «научность». Популяционные генетики заполняют подобным мусором академические журналы на протяжении последних 20 лет. Никакого смысла в этих «расчетах» нет.


Рис. 13. Дерево 6-маркерных гаплотипов евреев гаплогруппы J, построено по данным Behar et al. (2003). В выборке – 194 гаплотипа.


Но как узнать, рассматриваемая серия гаплотипов «однородная», от одного общего предка, или разнородная, от разных общих предков, и дальнейшие расчеты в таком виде бессмысленны? Это – важный, и даже важнейший вопрос, который в ДНК-генеалогии решается двумя путями – графическим и аналитическим. Графический метод – это постройка дерева гаплотипов и его рассмотрение, симметричное ли дерево, или состоит из различных ветвей. Если симметричное (примеры даны ниже), то можно применять простые метода расчета, как линейный или с помощью калькулятора Килина-Клёсова. Если дерево состоит из четко разделяющихся ветвей, как на рис. 13, то расчеты (линейный или калькуляторный) следует проводить по каждой ветви раздельно.

Аналитический метод – это применение логарифмического метода анализа гаплотипов, и полученный результат (число лет до общего предка) сравнивается с результатом линейного расчетного метода, применяемого «чохом», ко всей серии гаплотипов. Если результаты различаются (пример дан ниже), то серия гаплотипов неоднородна, и надо переходить к графическому методу разделения ветвей, как описано выше.

Например, в ситуации с 194 гаплотипами евреев гаплогруппы J (рис. 13), линейный метод («чохом») дает 263/194/0.0074, и получается 5600±660 лет до общего предка «гаплотипов коэнов». Логарифмический метод дает [ln(194/91)/0.0074] = 102 → 114 условных поколений, или 2850±410 лет до общего предка. Результаты совершенно разные, значит, ни тот ни другой метод не подходят. Собственно, это и показывает рис. 13.

Вот этого попгенетики никогда не могли усвоить.


Вопрос 72: Можно несколько подробнее о линейном методе расчета?

Как было неоднократно объяснено выше, линейный метод – самый простой при вычислении времени, прошедшего от общего предка данной серии гаплотипов. Поскольку чем больше это время, тем больше мутаций накопилось в гаплотипах потомков общего предка, и мутации в гаплотипах накапливаются в основном неупорядоченно, то к расчетам применима простая формула:


n/N = kt,


где n – число мутаций в серии гаплотипов, N – число гаплотипов в серии, k – константа скорости мутации, t – время до ближайшего общего предка.

Пояснения: (1) число мутаций считается от базового гаплотипа, который или является предковым, или максимально к нему приближен, насколько позволяет подборка гаплотипов, (2) отношение числа мутаций к числу гаплотипов определяет произведение kt, которое выражается в числе мутаций; как видно, константа в таких формулах всегда связана со временем до общего предка, (3) время до общего предка обычно определяют в условных поколениях протяженностью 25 лет, и тогда константа скорости мутациях определяется в числе мутаций на условное поколение протяженностью в 25 лет. Как видно, извечный вопрос попгенетиков о том, какую протяженность поколения использовать в расчетах, лишен смысла, поскольку какую протяженность мы бы ни брали, она входит в величину константы скорости мутаций, и итоговая величина kt остается той же, равной отношению n/N. А это – независимая переменная, она задается серией гаплотипов, то есть независимой выборкой. «Независимой» здесь означает, что гаплотипы для выборки не подбираются по усмотрению исследователя, они выбираются неупорядоченно.

Пример: имеются 275 111-маркерных гаплотипов гаплогруппы N1C1. В них суммарно имеются 6270 мутаций. Общий предок жил 6270/275/0.198 = 115 → 130 условных поколения, или 3250±330 лет назад (округленно). Калькулятор Килина-Клёсова дал 3233±326 лет назад.

Поправка на возвратные мутации производится или по специальным таблицам[82]82
  Клесов, А.А. (2008) Руководство к расчету времен до общего предка гаплотипов Y-хросомому и таблица возвратных мутаций. Вестник Российской Академии ДНК-генеалогии. Том. 1, № 5, стр. 812–835.


[Закрыть]
, [83]83
  Klyosov, A.A. (2009) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186–216;


[Закрыть]
, или по формуле, приведенной в этой книге выше[84]84
  Klyosov, A.A. (2012) Ancient history of the Arbins, bearers of haplogroup R1b, from Central Asia to Europe, 16,000 to 1500 years before present. Advances in Anthropology, 2, No. 2, 87-105.


[Закрыть]
.


Вопрос 73: Можно подробнее о квадратичном (пермутационном) методе, и расчете погрешностей при его использовании?

Квадратичный метод, в отличие от линейного, есть в двух основных вариантах – с использованием базового гаплотипа и без ориентации на базовый гаплотип. В первом случае считаются не мутации от базового гаплотипа, а квадраты мутаций. Например, в серии из трех 12-маркерных гаплотипов


13 24 16 10 11 15 12 12 10 13 11 30

13 25 16 11 11 15 12 12 10 13 11 30

13 24 16 11 11 15 12 12 11 13 11 30


с базовым гаплотипом


13 24 16 11 11 15 12 12 10 13 11 30


и тремя мутациями от базового гаплотипа (выделены), линейный метод дает 3/3/0.02 = 50 → 53 условных поколения, то есть 1325±780 лет до общего предка. Столь большая погрешность вызвана малым числом гаплотипов в серии, причем гаплотипов коротких, и малым числом мутаций. Напомню, что расчет погрешности в данном случае проводится извлечением квадратного корня из трех (мутаций), что дает 1.732, далее его обратной величины (1/1.732 = 0.577), возведением ее в квадрат (0.5772 = 0.333), прибавлением 0.01 (это – квадрат принятой погрешности величины константы скорости мутации, которая принимается равной ±10 %, то есть ±0.1), что дает 0.343, и, наконец, извлечением квадратного корня из последней величины, что дает 0.586 (то есть ±58.6 %). Это и есть величина погрешности определения времени до общего предка при трех мутациях в серии гаплотипов. При величине 1325 лет погрешность равна 1325x0.586, то есть ±780 лет.

Надо сказать, что в описанном (упрощенном) варианте есть много допущений. Допущения есть всегда, в любом варианте расчета погрешностей. Например, в данном случае мы принимаем, что погрешность определения константы скорости мутации в 12-маркерных гаплотипах (ее величина равна 0.02 мутаций на гаплотип на условное поколение) составляет ±10 %. Это – эмпирическая величина, полученная при изучении серии данных документальной генеалогии. Такую же погрешность мы принимаем и в случае 67-маркерных гаплотипов, хотя сопоставление ДНК-генеалогических данных с многочисленными данными документальной генеалогии показало, что реальная погрешность равна ±3 %, и в этом случае в примере выше к величине 0.333 следует прибавлять не 0.01, а 0.0009, и итоговая погрешность получится не ±58.6 %, а 57.8 %, что практически одно и то же. Это получается, потому что при всего трех мутациях именно столь малое их число практически полностью определяет погрешность времени до общего предка серии гаплотипов. Только при большом числе гаплотипов и большом числе мутаций общую погрешность начинает определять погрешность определения константы скорости мутаций. Например, при 1000 мутаций в серии гаплотипов погрешность вычисляется, как описано выше, извлечением квадратного корня из 1000 (мутаций), что дает 31.62, далее его обратной величины (0.0316), возведением ее в квадрат (0.001), прибавлением 0.01 (при 10 % погрешности величины константы скорости мутации), что дает 0.011, и, наконец, извлечением квадратного корня из последней величины, что дает 0.105 (то есть ±10.5 %). Это и есть величина погрешности определения времени до общего предка при 1000 мутациях в серии гаплотипов. При величине 1325 лет погрешность тогда равна 1325±140 лет. А если погрешность константы скорости мутаций равна ±3 %, то к величине 0.001 (после возведения в квадрат) следует прибавить не 0.01, а 0.0009, и итоговая погрешность получится не 10.5 %, а 4.4 %, или 1324±60 лет до общего предка.

Но мы предпочитаем иметь преувеличенную погрешность, чем даже реальную, потому что это повышает доверие к получаемым результатам. Бывает, что число мутаций в реальных генеалогиях по разным причинам оказывается заниженным или завышенным по сравнению со средними величинами, и расчетная величина вылетает за пределы указанных погрешностей, вызывая недоверие и претензии к расчетам. Пусть лучше мы перестрахуемся и дадим завышенные погрешности.

Возвращаемся к квадратичным методам расчетов. В данном случае базовый гаплотип не рассматривается, и производится расчет разницы в аллелях «всех между всеми». В случае приведенных выше трех 12-маркерных гаплотипов с тремя мутациями сумма квадратов их попарных отклонений друг от друга (в мутированных маркерах) равна 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 = 12, деленная на 2, поскольку в каждом маркере число квадратов мутаций считалось дважды, деленное на число маркеров в гаплотипе (12) и на квадрат числа гаплотипов (9), и, наконец, на величину константы скорости мутации на маркер для 12-маркерных гаплотипов (0.00167). Получаем 12/2/12/9/0.00167 = 33 условных поколений, то есть 825±480 лет до общего предка. В квадратичных методах расчетов поправка на возвратные мутации не вводится, она уже учтена самим методом расчета.

Как видим, мы имеем некоторую проблему. Линейный метод показал для этих трех гаплотипов с тремя мутациями 1325±780 лет до общего предка, квадратичный метод – 825±480 лет до общего предка. В принципе, обе величины находятся в пределах погрешности расчетов, но утешение от этого малое. Причина проста – три мутации на трех гаплотипах – это не статистика. Методы, описанные выше, базируются на статистическом распределении аллелей и мутаций в гаплотипах. Аналогия – если вы бросите монету три раза, или четыре для четности, то вероятность получения 50 %-ного выпадения орла и решки будет малой. Давайте попробуем для иллюстрации. Буду использовать компьютерные «броски» для объективности. Итак,

– первая четверка бросков, все четыре орла

– вторая попытка, решка и три орла

– третья попытка, решка и три орла

– четвертая попытка, три решки и орел

– пятая попытка, решка и три орла

– шестая попытка, две решки и два орла

– седьмая попытка, три решки и орел

– восьмая попытка, две решки и два орла

– девятая попытка, три решки и орел

– десятая попытка, решка и три орла

Результат налицо – из десятка попыток по четыре броска, только два раза выпали две решки и два орла. В целом же из сорока бросков 17 раз выпала решка, и 23 раза орел. Ну как, будем считать вероятность выпадания того или другого? Или здравый смысл остановит такие расчеты? Кстати, с доверительным интервалом в две сигма (95 %) решка и орел выпадут из сорока бросков 20±6 раз для решки, и 20±6 раз для орла, так что никакого противоречия у нашего опыта со статистикой нет. А из четырех бросков получится 2±2 для решки и 2±2 раза для орла. Тоже все в порядке, никаких неожиданностей.

А люди берут три-четыре коротких гаплотипа, а то и два, и удивляются, почему результаты «бегают по всему полю».


Вопрос 74: Автоматический калькулятор Килина-Клёсова

Давайте теперь проверим, какой результат ближе к реальности в случае трех коротких гаплотипов, рассмотренных выше – расчет по линейному методу (1325±780 лет до общего предка) или квадратичному (825±480 лет до общего предка). Кликаем на линк, ведущий к калькулятору Килина-Клёсова[85]85
  Клёсов, А.А., Килин, В.В. (2015) Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): новое издание. Вестник Академии ДНК-генеалогии, т. 8, № 3, стр. 321–375.


[Закрыть]
на сайте http://dna-academy.ru/kilm-klyosov/, вводим все три серии аллелей под соответствующими маркерами, и через долю секунды получаем результат – 1304±764 лет до общего предка линейным методом и 863±456 лет – квадратичным.

Мы видим, что при столь малом числе гаплотипов и мутаций датировки нестабильны. Но в такой ситуации я бы рекомендовал склоняться к линейному методу, поскольку расчет по трем аллелям, пусть и для 12 маркеров, вряд ли является удовлетворительным. Но еще лучше – просто давать обе датировки, поясняя, какая получена каким методом.


Рис. 14. Расчет времени до общего предка для демонстрационной серии из трех гаплотипов в 12-маркерном формате на калькуляторе Килина-Клёсова. Соответствующие колонки показывают 1304±764 лет до общего предка для линейного метода, и 863±456 лет для квадратичного метода, что, впрочем, совпадает в пределах погрешности расчетов. Остальными колонками следует пренебречь.


Как работает калькулятор Килина-Клёсова? Он многофункциональный, и здесь нет возможности объяснять все его функции, кроме основной – быстро производить расчеты по гаплотипам от любых коротких (вплоть до единичных, отдельных маркеров) до 111-маркерных, в количествах до 10 тысяч гаплотипов. Калькулятор моментально, в ходе расчетов, определяет степень диперсии аллелей по каждому маркеру, и показывает ее количественную величину. Можно выставлять пороговую величину степени дисперсии, тогда калькулятор выбрасывает соответствующие маркеры из расчетов. Это особенно полезно, когда серия гаплотипов содержит включения посторонних гаплотипов, или нижестоящих субкладов, у которых некоторые маркеры имеют другие значения, чем у основной серии. Например, в серии гаплотипов гаплогруппы R1a значение маркера DYS392 обычно имеет величину 11, а в отдельной ветви «Старая европейская ветвь» это значение равно в основном (или исключительно) 13. Калькулятор «знает», что маркер DYS392 настолько «медленный» (константа скорости мутации равна 0.0004 мутаций на маркер на условное поколение), что, например, для тысячи гаплотипов в среднем должно наблюдаться примерно 40 мутаций за сто условных поколений, потому что 40/1000/0.0004 =100 условных поколений. При увеличении количества аллелей DYS393=13 в серии гаплотипов, дисперсия возрастает и в итоге превышает граничную величину 2.6, обычно используемую при расчетах. При величине 2.61 маркер блокируется, оставляя все остальные – незаблокированные – функциональными. Если в рассматриваемой серии гаплотипов блокируются сразу несколько маркеров, то это указание на то, что что-то с выборкой не так.

Поправка на возвратные мутации в калькуляторе не вводится, она уже заложена в самом калькуляторе, как для линейного метода, так и квадратичного. Калькулятор на 111 маркеров может использоваться для расчетов гаплотипов в любом формате, включая 67-маркерные, но для удобства нами создана серия калькуляторов для 17-маркерных и для самых медленных, 22-маркерных гаплотипов.

Калькулятор может быть использован для комбинаций серий гаплотипов для любых форматов. Это возможно потому, что в квадратичном методе он считает «по вертикали», по маркерам, а в линейном – «по горизонтали», по гаплотипам.


Вопрос 75: Поясните, пожалуйста, суть логарифмического метода в ДНК-генеалогии.

Логарифмический метод – самый простой в исполнении. Несколько примеров расчетов логарифмическим методом были даны выше. Суть его заключается в том, что для серии гаплотипов берется отношение общего числа гаплотипов в серии к числу идентичных (базовых) гаплотипов в той же серии, далее берется натуральный логарифм этого отношения, и делится на константу скорости мутации в данном гаплотипе. После этого вводится поправка на возвратные мутации, поскольку они возвращают мутированные гаплотипы обратно в исходные немутированные, и тем самым занижают датировку времени жизни общего предка. Поправка на возвратные мутации рссчитывается исходя из числа базовых гаплотипов в серии.

Чем больше по численности серия гаплотипов, происходящих от одного предка, тем расчет времени до этого предка точнее. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотипах. Например, если серия из сотни гаплотипов, скажем, 37-маркерных, содержит четыре одинаковых (то есть базовых) гаплотипа, то даже и без подсчета мутаций в гаплотипах можно сразу сказать, что общий предок этих ста гаплотипов жил 925±105 лет назад, потому что натуральный логарифм отношения 100/4, поделенный на константу скорости мутации для 37-маркерных гаплотипов (0.09 мутаций на гаплотип на условное поколение в 25 лет) равен 36 → 37 условных поколений, то есть общий предок этой сотни гаплотипов жил примерно 925 лет назад. Поскольку для четырех базовых гаплотипов погрешность расчетов составляет ±51 % (как это расчитывается – приводилось выше на примере четырех мутаций в серии гаплотипов), то общий предок для данной серии из ста гаплотипов жил 925±470 лет назад. Но, как уже обсуждалось выше, в любом случае, в том числе и в искаженных, неоднородных сериях, почти всегда можно найти одинаковые гаплотипы, и деление общего числа гаплотипов на случайное количество одинаковых гаплотипов всегда даст какое-то число, часто не имеющее отношения к числу лет или поколений до общего предка. Поэтому необходим критерий, что расчетные величины времен до общего предка действительно имеют смысл, и что серия гаплотипов действительно происходит от одного общего предка.

Этим критерием является совпадение (в пределах погрешности расчетов) времени до общего предка, рассчитанное как линейным (или квадратичным), так и логарифмическим методами. Например, если число мутаций во всех ста 37-маркерных гаплотипах будет равно, например, 324 (или близко к тому), тогда 324/100/0.09 = 36 → 37 условных поколений, то есть ровно тот же промежуток времени до общего предка. Совпадение времен до общего предка для «логарифмического» и «линейного» метода (в первом мутации не считаются, во втором считаются) свидетельствует, что закономерности образования мутаций в гаплотипах следуют кинетике первого порядка, что в свою очередь означает, что все сто гаплотипов действительно произошли от одного прямого общего предка. Популяционная генетика такими подходами не пользуется, они ей чужды по ряду причин, как обсуждалось выше.


Вопрос 76: На каком основании некоторые популяционные генетики критикуют логарифмический метод?

Во-первых, это не «некоторые популяционные генетики», а один Балановский. Во-вторых, это не «критика», а смех один. Характерно, что он, при полном, как правило, отсутствии культуры расчетов, нападает не только на логарифмический метод, но и на всё остальное в ДНК-генеалогии. Забавно наблюдать эту выраженную ущербность «нападающего». Вот, например, цитата из моей недавней статьи на Переформате[86]86
  Коллизия популяционной генетики и ДНК-генеалогии (часть 1). http://pereformat.ru/2014/12/ dnk-genealogiya/


[Закрыть]
: «В ДНК-генеалогии есть логарифмический метод… И он вовсе не «неточный», как безграмотно заявил О. Балановский, в очередной раз показав свою некомпетентность. Неточным любой метод бывает тогда, когда используется неправильно. Неточным будет микроскоп, если его использовать для рассматривания звезд. На то есть телескоп, или хотя бы подзорная труба.

Чем больше по численности серия гаплотипов, происходящих от одного предка, тем расчет времени жизни этого предка точнее. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотиипах. Например, из 3466 12-маркерных гаплотипов субклада R1b-L21 249 гаплотипов являются базовыми, то есть идентичными друг другу. Это дает [ln(3466/249)]/0.02 = 132 → 152 условных поколений, или 3800±450 лет до общего предка. Расчет по мутациям для этой же серии гаплотипов 3841±384 лет по 67-маркерным гаплотипам и 3810±381 лет по 111-маркерным гаплотипам. Разницы между логарифмическим и линейным (то есть по мутациям) методами расчета практически нет, на уровне сотых долей процента, хотя погрешность расчетов ее увеличивает.

Ну, и где здесь «неточный» логарифмический метод? И это говорит тот, ошибки у которого в расчетах датировок систематически равны как минимум 250–350 %».

Уж как Балановскому не нравится логарифмический метод! Он уже стал для Балановского идеей-фикс. Недавно Балановский объявил, что метод настолько «неточный», что я от него сам отказался… Казалось бы, откуда такая зацикленность на методе, который к нему, Балановскому, никакого отношения не имеет? Который он никогда не применял, видимо, потому, что не знает, что такое логарифм. А ответ прост – это злоба середнячка на что угодно новое, оригинальное, прогрессивное.

Еще цитата на ту же тему: Балановский объявил, что «технические методы «ДНК-генеалогии» вовсе не оригинальны, представляя собой обычный метод молекулярных часов с рядом простейших модификаций…С его точки зрения, технические аспекты «ДНК-генеалогии» являются «малоэффективными, но приемлемыми»…».

«С «молекулярными часами» мы уже разобрались. На что ни пойдет безграмотный человек, чтобы дискредитировать грамотного… пустится во все тяжкие, включая и свой позор на публике. Так что же такое «ряд простейших модификаций»? Введение впервые в оборот серии констант скоростей мутаций, нигде и никогда раньше не публиковавшихся? Введение в оборот логарифмического метода, совершенно незнакомого ранее попгенетикам? Введение в оборот поправок на возвратные мутации, о которых попгенетики говорили, но никто и никогда не рассчитывал и не применял? Введение в оборот калибровок констант скоростей мутаций?

Не знаю как для кого, а для меня ясно, что О. Балановский, будучи «на автопилоте» желания дискредитировать, себя уже не контролировал. Он что-то произносил, главное, чтобы было негативное, но смысла сам не понимал. Это – не наука, это и есть лженаука в исполнении О. Балановского, как и другого доктора, Е. Балановской.

Самое забавное в том, что этот незнайка, применяя «методы» популяционной генетики и ошибаясь на сотни процентов в датировках, заявляет, что «технические аспекты «ДНК-генеалогии» являются «малоэффективными, но приемлемыми»…». «Малоэффективные» произнесено на том же автопилоте, в том же раже дискредитировать. Если бы его спросили расшифровать понятие «малоэффективные», он бы не нашел, что ответить. Ни одного примера привести бы не смог. За «приемлемые» – отдельное спасибо, мой сарказм заметен?»

На конференции в РАН в ноябре 2014 года О. Балановский показал следущий слайд:



Я привел его на Переформате[87]87
  Мать и дитя, или школа пустого злословия. http://pereformat.ru/2014/12/balanovskie/


[Закрыть]
и прокомментировал: «Это какие же «многие методы датировок» известны в популяционной генетике? Что такое «неоптимальная логарифмическая формула»? Что за «калибровка, совпавшая с уже известной»? Опять сплошная ложь. Возможно (и определенно) полная некомпетенция, безграмотность. Ранее я показывал, что за «методы датировок» используют в попгенетике, и к чем это приводит. К мусору, которым заполняют журналы…»

Давайте напрямую. Никаких «многих методов» в популяционной генетике нет. Иначе бы не выбрали печально известный «популяционный метод», который системно дает завышения датировок на 300–350 %, и который с 2004 года узаконен в академических журналах популяционной генетики и применять который продолжают требовать рецензенты. «Неоптимальная» логарифмическая формула – это основное уравнение химической кинетики для процессов первого порядка, которое адаптировано к расчетам кинетики мутаций в гаплотипах, включая поправку на возвратные мутации. «Калибровки, совпавшей с уже известной» просто нет, это просто выдумано, просто для пустого негатива.

Остается с жалостью наблюдать, как Балановские выдумывают все что угодно, лишь бы «дискредитировать», как им представляется, новые подходы, им до того неведомые.

Балановским вторит некто «Алекс» в дискуссии на «Троицком варианте»[88]88
  См. ниже, раздел «Выдержки из дискуссии».


[Закрыть]
: «почему «линейный» и «логарифмический» методы названы независимыми? И общее число мутаций, и число немутировавших гаплотипов определяются временем и скоростью мутирования, так что вычисленное по ним время не может не быть одинаковым».

Я ответил: «То, что «вычисленное по ним время не может не быть одинаковым» – принципиальное непонимание того, что серии гаплотипов очень часто представляют собой смеси разного происхождения. Собрали в некоем регионе пару сотен гаплотипов, а откуда известно, что они от одного общего предка? Без этого «расчет времени до ближайшего общего предка» не имеет смысла, хотя представляется заманчивым просто посчитать у всех число мутаций и разделить на число гаплотипов. Какое-то число всегда получится. А вот если применить упомянутые два расчетных подхода, то они часто дают разные величины. Это и означает, что смесь гаплотипов «неоднородна», картина мутаций не подчиняется закономерностям кинетики первого порядка. Только если оба метода дали одинаковые результаты (в пределах погрешности расчетов), то результат верен.

Аналогия – попытка рассчитать «время полураспада» смеси разных радиоактивных материалов. Система не будет описываться кинетикой первого порядка (кроме совсем уж специальных случаев, когда у всех материалов одно и то же время полураспада).

Как часто бывает, люди безграмотные, типа Балановского или «Алекса», генерируют общий негативный шум, причем совершенно неконструктивный. Никто из них не сообщил, как надо рассчитывать, и почему логарифмический метод «неоптимальный». Что такое вообще «оптимальный»? Может, Балановский сообщит, даст пример «оптимального»? Понятно, что нет, он в подобных расчетах совершенно тёмный человек. Но ужас как хочется «критиковать», «подвергать сомнению», авось, кто нибудь, столь же темный, клюнет. Нет ничего более далекого от науки, хотя Балановский к науке имеет совершенно косвенное отношение. Это, скорее, лаборант от науки, как и Е. Балановская. Никакой научной критики от них никогда не было, были только общие инсинуации, к науке не имеющие отношения. Например, Е. Балановская с трибуны той же ноябрьской конференции в РАН оповестила: «Клёсов эксплуатирует собранную генетиками информацию, обрабатывает её неизвестными методами и получает красивые результаты на потребу публике». Так все-таки неизвестными методами, или «известными в популяционной генетике»? Мать и дитя Балановские уже настолько изолгались, что сами себе противоречат. Если действительно «неизвестными методами», и попгенетики настолько беспомощны в корректной и информативной обработке собранных ими гаплотипов, то надо заменить их некомпетентность и неумение на полученные корректными методами «красивые результаты», тут Балановская не ошиблась. А что до «неизвестных методов», то учиться надо. И придется учиться, деваться просто некуда. А уж «на потребу публике» – это ложь Балановской от беспомощности и отчаяния, от своей некомпетентности. Красивые результаты – это правильные результаты, что еще физики давно подметили.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12
  • 4.4 Оценок: 11

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации