Электронная библиотека » Анатолий Клёсов » » онлайн чтение - страница 8


  • Текст добавлен: 28 ноября 2016, 12:20


Автор книги: Анатолий Клёсов


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 47 страниц) [доступный отрывок для чтения: 12 страниц]

Шрифт:
- 100% +

Вопрос 39: Какие требования предъявляются к выборкам гаплотипов для расчетов в ДНК-генеалогии?

Как уже пояснялось выше, если взять любую выборку, тупо считать количество мутаций в гаплотипах, и разделить его на число гаплотипов и на константу скорости мутации, то что-то, конечно, получится. Именно так и проводят «расчеты» популяционные генетики. Но на самом деле там скорее всего получится некое бессмысленное число в поколениях или годах до якобы общего предка. Но откуда известно, что для данной выборки общий предок был один? А ведь так всегда и работают попгегетики, усредняя любые выборки. Поскольку после некоторых проб и ошибок ими было найдено, что таким образом происходит «умоложение» общих предков выборок, то попгенетики не нашли ничего лучшего, как втрое занизить величину константы скорости мутаций. Собственно, они ее «константой» никогда и не называли, просто «популяционная скорость мутаций». Вот так и работали – за счет усреднения время до общего предка занижали в неизвестное число раз, а за счет искусственного занижения «скорости мутаций» его опять увеличивали, правда, опять в неизвестное число раз, по принципу – «авось скомпенсируется». А оно не компенсировалось, а либо получалось значительно заниженным, либо значительно завышенным. Когда общий предок выборки был случайно один, то завышение времени до него составляло обычно 280–350 %. Так и работали, и вот такими завышенными датировками заполонили академические журналы.

Честь нанесения такого ущерба науке, если попгенетику называть наукой, принадлежит Л.А. Животовскому, сотруднику Института общей генетики РАН. На основании какого-то вывиха здравого смысла, эту «популяционную скорость» узаконили после 2004 года, и более десяти лет в академических журналах гнали откровенный мусор. Широко известны «датировки» «общего предка» гаплогруппы R1a в Индии, которые Животовский с соавторами (эстонская школа попгенетики) загнали в 12–15 тысяч лет назад, когда они на самом деле составляют 3500–4000 лет назад, для разных выборок. Это на долгие годы не только затормозило изучение истории ариев в Индии, но и направило изучение истории по ложному пути. Этим отличился, например, некто Семененко из Воронежа, представляющийся как «индолог», для которого главный аргумент для отстаивания этих безумных датировок был, что они опубликованы «уважаемыми людьми», «известными специалистами». Нет и не может быть таких критериев в науке, а если их применять, то только как вторичные, вспомогательные.

Возвращаясь к исходному вопросу, только те мутации в гаплотипах имеет смысл рассчитывать, экстраполируя ко времени общего предка, которые подчиняются определённым количественным закономерностям. ДНК-генеалогия оперирует тремя экспериментальными факторами: 1) наличием снипов, относящих человека к определённому роду; 2) наличием мутаций, позволяющих оценивать время, прошедшее от общего предка совокупности гаплотипов и – при больших выборках – от начала самого рода, от самого далёкого из предков ныне живущих потомков данного рода (то есть здесь считаются сами мутации); 3) закономерностями переходов гаплотипов в их мутированные формы, без численного учёта самих мутаций (то есть здесь мутации не считаются, считаются немутированные гаплотипы).

Это позволяет оценить, насколько достоверны расчёты времени жизни общего предка по мутациям, и даёт ещё один, независимый способ расчетов. Методы, в которых считаются мутации, называются линейным, квадратичным и пермутационным,[51]51
  Там же.


[Закрыть]
из которых наиболее прост линейный метод. Метод, в котором считаются немутированные гаплотипы, называется логарифмическим. В принципе, он использует формулы химической кинетики первого порядка (дополнительно вводя поправку на возвратные мутации). В линейном методе общее число мутаций в серии гаплотипов делится на число гаплотипов и на константу скорости мутации для данных гаплотипов, как было показано выше. В логарифмическом методе берется логарифм отношения общего числа гаплотипов к числу немутированных гаплотипов, и делится на константу скорости мутации, как тоже было показано выше.

Очень важно понять, что если линейный и логарифмический методы дают разные времена до общих предков, то выборка «кривая», то есть неоднородная, и происходит от нескольких общих предков, как минимум от двух. Получаемые времена до общих предков тогда лишены определенного смысла, предок «фантомный».

Приведем пример. Имеем неоднородную выборку из 300 гаплотипов в 25-маркерном формате, в которой 200 гаплотипов происходят от общего предка, который жил 3000 лет назад, и 100 гаплотипов – от предка, который жил 800 лет назад. Если мы построим дерево гаплотипов, то сразу увидим, что 200 гаплотипов образуют одну большую и глубокую (высокую) ветвь, и 100 гаплотипов – плоскую ветвь. Тогда сразу можно разделить ветви, и каждую из двух ветвей обсчитывать отдельно. В первой ветви из 200 гаплотипов все 25-маркерные гаплотипы будут разными (то есть логарифмический метод с ними работать не будет), что уже покажет, что общий предок жил более 2500 лет назад (при 2500 годах в выборке могли бы быть два одинаковых гаплотипа, потому что [ln(200/2)]/0.046 = 100 условных поколений, или 2500 лет до общего предка). На все 200 гаплотипов будет 1104 мутаций от базового гаплотипа, что даст 1104/200/0.046 = 120 условных поколений, или 120х25 = 3000 лет до общего предка (вкладом возвратных мутаций здесь для простоты пренебрегаем).

Во второй ветви из 100 гаплотипов в 25-маркерном формате 23 гаплотипа будут идентичными друг другу. Это даст [ln(100/23)]/0.046 = 32 условных поколений, то есть 800 лет до общего предка. Иначе говоря, если смешать эти 200 и 100 гаплотипов, то в этой смеси 23 гаплотипа будут одинаковыми (из молодой ветви), и мы получим [ln(зоо/2э)]/о.046 = 56 условных поколений, то есть якобы 1400 лет до общего предка якобы одного для всех 300 гаплотипов. А мутаций во всей составной, неоднородной выборке будет 1251, если базовые гаплотипы обеих ветвей случайно совпадут. Тогда линейный метод даст 1251/300/0.046 = 91 условное поколение, или 2275 лет до якобы общего (фантомного) общего предка. Если базовые гаплотипы обеих ветвей будут разными, то время до фантомного общего предка будет практически любым между 3000 и 800 лет.

Итак, подводим итоги. Выборка составная, неоднородная, общие предки жили 3000 и 800 лет назад. Линейный метод дал фантомного общего предка 2275 лет назад, логарифмический -1400 лет назад. То, что эти времена не совпали друг с другом, говорит о том, что так считать нельзя, и выборки надо разделять. Обычно разделение проводится с использованием деревьев гаплотипов (см. следующий раздел).


Вопрос 40: Выборки в ДНК-генеалогии обычно несоизмеримо малые по сравнению с реальными величинами самих популяций. Как таким выборкам можно доверять? Есть «мнения», что выборки должны иметь как минимум 10 тысяч гаплотипов, чтобы получать относительно разумные данные.

Это совершенно ненаучная постановка вопроса, опять «по понятиям», по «мнениям», ни на чем не основанным. На это можно задать встречный вопрос, который уже был задан выше в настоящей книге – чтобы понять, что море соленое, нужно ли пробовать воду из всех бухточек? А как же химики делают анализ растворов, беря пробу всего лишь в долю миллилитра из ведра, цистерны, озера? Когда делают анализ крови, что, всю кровь из вас выкачивают? Нет. Значит, вопрос о размере пробы поставлен некорректно. Вопрос на самом деле сводится не к каким-то с потолка взятым числам, а к к тому, равномерно ли перемешана система, чтобы по малой пробе, или выборке, судить о всей системе. Этот вопрос в ДНК-генеалогии давно проработан, и результаты сопоставительных исследований показаны, например, в следующей таблице:


Таблица. История определений времени до общего предка гаплогруппы R1a на «пост-советском пространстве» по разным сериям гаплотипов.[52]52
  Клёсов, А.А. (2011) Биологическая химия как основа ДНК-генеалогии и зарождение «молекулярной истории». Биохимия, 76, № 5, 636–653. (с дополнениями)


[Закрыть]


Из таблицы видно, что при последовательном переходе от серии из 26 гаплотипов до 2000 гаплотипов, и при увеличении числа мутаций в них в двести с лишним раз расчетное время до общего предка этих гаплотипов, в данном случае проживавшего на Русской равнине около пяти тысяч лет назад, получается практически одинаковым, в пределах погрешности расчетов. Это значит, что гаплотипы гаплогруппы R1a на пост-советском пространстве перемешаны достаточно хорошо, и все выборки вполне репрезентативны.

Конечно, могут быть и другие ситуации. Например, в горах в каждой долине состав гаплотипов (и гаплогрупп/субкладов) может заметно различаться, в отличие от того, что может наблюдаться на равнине, где гаплотипы более перемешаны за тысячелетия. Но в любом случае расчеты и выводы по гаплотипам относятся только к той конкретной выборке, которая рассматривалась, и только сопоставление разных выборок может показать, насколько система «перемешана», и решить вопрос об обобщении результатов расчетов и выводов на всю популяцию региона, или только ее конкретную часть. Но пока репрезентативность разных выборок наблюдается и в горах. Например, разные выборки осетин и карачаево-балкарцев дают воспроизводимые результаты для каждого из этих этносов. Перемешивание между ними обнаружено, но очень незначительное, практически не влияющее на результаты расчетов.

В большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они устойчивы к статистическим вариациям, если популяция достаточно перемешана и выборка произведена неупорядочено. Размер выборки увеличивает точность, и то только до определенных пределов. Это, повторяем, относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.


Вопрос 41: Что такое «деревья гаплотипов» в ДНК-генеалогии?

По ходу изложения мы будем показывать деревья гаплотипов, которые отражают ДНК-картину этносов, родов, племен. Это вовсе не значит, что гаплотипы определяют этнос. Но они его в определенной степени описывают, каждый этнос по-разному. Человеку непривычному эти деревья представляются некими абстрактными образованиями, но в них на самом деле заключен большой смысл и в их графическом виде дается большой объем информации. Для того чтобы сделать деревья в этой книге более понятными и осмысленными, приведем несколько вводных, «модельных» примеров.


Рис. 7. Дерево, состоящее из 68 гаплотипов гаплогруппы R1a в их 6-маркерном формате. Базовый гаплотип здесь 13 25 15 11 12 11 (в системе DYS 393, 390, 19, 391, 388, 392). Базовые гаплотипы образуют «гребенку» на дереве.


На рисунке выше приведено дерево реальной выборки из 68 гаплотипов гаплогруппы R1a. Гаплотипы простенькие, 6-маркерные, общий предок всех жил всего 625 лет назад, так что мутаций в гаплотипах набежало мало. Можно даже заранее посчитать, сколько. Это дерево гаплотипов потомков Джона, Лорда Британских островов, который жил в 14-м веке и умер в 1386 году. Его потомки – известный шотландский клан Мак-Доналдов (один из Мак-Доналдов был маршалом у Наполеона). Константа скорости мутации для 6-маркерных гаплотипов равна 0.0074 мутаций на гаплотип на условное поколение в 25 лет. Тогда за 625 лет (25 условных поколений) в каждом гаплотипе набежит 0.0074х25 = 0.185 мутаций, и на все 68 гаплотипов будет 0.185х68 = 13±4 мутаций. Погрешность рассчитывается по обычным правилам математической статистики.

Смотрим на дерево гаплотипов. Там – 15 мутаций, то есть в пределах погрешности. Можно посчитать самим, это все «вылезающие» из колеса спицы. А вылезают они в разных (и заранее непредсказуемых) местах, потому что мутации происходят неупорядоченно. 53 гаплотипа не мутированы, они образуют ровную гребенку, или «колесо» вокруг центральной части. Это – тот же самый гаплотип, что имел общий предок всех 68 человек, то есть Джон, Лорд Островов:


13 25 15 11 12 11


53 человека этот гаплотип полностью сохранили, потому что 625 лет – это относительно малое время, и 15 мутаций – это все отклонения от предкового гаплотипа, что за это время смогли произойти.

Показанные выше шесть чисел соответствуют шести участкам в Y-хромосоме ДНК, в которых повторяются выбранные исследователями короткие нуклеотидные последовательности. В первом участке – 13 повторов, во втором – 25 повторов, в третьем – 15 повторов и т. д. Мутация – это изменение числа повторов. Ошибся копирующий фермент при биологическом копировании Y-хромосомы, скопировал третий участок не 15 раз, как завещали предки, а 16 раз, получилось


13 25 16 11 12 11


Это – два идентичных гаплотипа, на дереве выше под номерами 054 и 060. С правой стороны – гаплотип 061, он имеет вид


14 25 15 11 12 11


У него мутация проскочила в первом участке, было 13 повторов, стало 14. То есть опять система копирования ошиблась в сторону завышения числа повторов. А вот в семерке идентичных гаплотипов под номерами 055–057, 062, 064, 066, 068 – мутация прошла во втором участке, на понижение (25 → 24) и получилось


13 24 15 11 12 11


Действительно, этот участок, или маркер, как их называют, один из самых подверженных мутациям. Теория подсказывает, что в первом участке на все гаплотипы произойдет только одна мутация, во втором – семь мутаций, в третьем – две мутации. Так и получилось на практике. То есть даже при такой малой статистике закономерности в целом выполняются. Более того, все остальные пять мутаций на дереве гаплотипов относятся к тому же (второму) быстрому маркеру. Гаплотипы под номерами 059, 063 и 065 имеют вид


13 26 15 11 12 11


то есть мутация прошла на единицу на повышение, 25 → 26. Последние две мутации, в гаплотипах под номерами 058 и 067, оказались двойными (25 → 23, 25 → 27):


13 23 15 11 12 11

13 27 15 11 12 11


Они и сидят по обе стороны «букета», потому что не происходят одна из другой. Заметьте, что длина «спицы» в двух последних случаях тоже двойная, по сравнению со всеми остальными. То есть по виду дерева гаплотипов можно сказать, какие мутации одиночные, какие – двойные или тройные.

Внешний вид «дерева» определяется настройками профессиональной компьютерной программы, которая строит его на основании вводимого списка гаплотипов. Она сортирует гаплотипы по ветвям, то есть по похожести гаплотипов, сортирует по тому, в каких маркерах произошли мутации, сколько мутаций произошло, и по тому, насколько ветви древние. Поэтому по виду дерева человек опытный сразу может понять, какова структура той или иной популяции, сколько в ней основных ветвей, каков относительный возраст ветвей, и далее по числу мутаций в ветвях рассчитать, когда жил общий предок каждой ветви. Таких компьютерных программ много, наиболее известная – PHYLIP, с преобразованием MEGA.

По виду базовых гаплотипов в разных регионах и по возрасту их ветвей можно устанавливать, откуда, куда и когда проходили древние миграции людей и где сейчас живут их потомки. То есть можно проводить ДНК-генеалогическое картирование регионов, материков, и всей планеты, как в пространстве, так и во времени. В этом – методология ДНК-генеалогии. А дальше идут интерпретации получаемых данных в терминах истории, языкознания, антропологии, стыковка их с известными данными (тогда это по сути «калибровка»), или с данными неустоявшимися, сомнительными, конфликтными – тогда это дополнительная «точка опоры», или, наконец, это введение в научный оборот совершенно новых данных, и открытие пути для их верификации, проверки, обсуждения, выдвижения новых гипотез и положений.

Следующие несколько вопросов с соответствующими ответами образуют своеобразный глоссарий, или словарь. Ряд понятий были уже рассмотрены ранее, но повторение – мать учения. Это вопросы-ответы помогут многим еще раз взвесить, насколько усвоен материал, и насколько могли быть пропущены некоторые детали.

Глава 3
Глоссарий ДНК-генеалогии

Вопрос 42: Что такое ДНК и что такое Y-хромосома?

ДНК, дезоксирибонуклеиновая кислота, сохраняет и реализует генетическую программу развития и функционирования организма человека. Находится в ядре клетки в составе 46 хромосом, одна из которых, самая маленькая по размеру – мужская половая хромосома, или Y-хромосома. В ней примерно 58 миллионов нуклеотидов, повторяющихся структурных единиц ДНК-аденина, гуанина, тимина и цитозина. Все 46 хромосом в совокупности состоят из трёх миллиардов нуклеотидов, и в их составе примерно 30 тысяч генов, в среднем по 652 гена на хромосому. В Y-хромосоме всего 27 генов, остальная часть – некодирующая, «никчёмная», как её часто называют, или, скорее, называли еще недавно. В ней находится много повторов нуклеотидных цепочек, часть которых генетики выбрали в качестве гаплотипов для ДНК-генеалогии. Копирование, или репликацию ДНК выполняет ДНК-зависимая ДНК-полимераза (в составе большого комплекса, реплисомы), которая иногда допускает ошибки, называемые мутациями.


Вопрос 43: Что такое маркер в ДНК-генеалогии?

МАРКЕР, или локус, сегмент, участок Y-хромосомы (в контексте данной книги), выбранный для определения числа повторов нуклеотидов для целей ДНК-генеалогии. Число повторов нуклеотидов в локусе называют «аллель». Маркеры нумеруют и присваивают им индексы, например, DYS19, то есть «DNA Y Segment, локус номер 19». В этом конкретном локусе повторяется четвёрка (квадруплет) ТАГА, то есть тимин-аденин-гуанин-аденин, причём повторяется у разных людей от 11 до 19 раз подряд. Эти границы чисто эмпирические. Возможно, у кого-то среди людей Земли он повторился 10 или 20 раз подряд, но вероятность такого события крайне мала. Число повторов – индивидуальная характеристика человека, и при увеличении числа маркеров совокупность аллелей становится всё более индивидуальной. В ранних академических исследованиях типировали (то есть определяли последовательности) от 5 до 9 маркеров, в современных – от 10 до 17, реже до 23 маркеров, в коммерческих работах обычно типируют от 12 до 111 маркеров, и выше – в специальных геномных исследованиях (стандартные варианты – 12, 17, 25, 37, 67 и 111 маркеров). Ниже приведен пример гаплотипа автора данной книги, в котором типировали 431 маркеров:


13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16

16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22

22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25

27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12

24 15 12 15 24 12 23 19 11 15 17 9 11 11 10 12 15 15 10 10 8 8 9 13 7 8

10 10 13 14 14 15 31 32 11 10 9 9 8 24 8 8 8 16 22 22 24 21 23 14 16

25 28 15 15 6 11 14 15 8 14 11 12 10 11 10 10 11 11 18 10 12 10 7 10 5

8 9 5 5 11 15 8 29 6 7 10 13 11 6 7 7 7 16 10 11 16 22 23 11 12 12 10 7

12 12 13 7 3 20 18 11 11 8 9 13 13 10 11 22 12 16 13 14 11 11 12 10 12

9 13 9 12 11 12 16 7 14 12 10 9 10 4 7 7 13 13 12 11 9 11 10 11 14 8 4 8

6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9 14 14 15 9 7 10 12 14 13

14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13 12 7 12 12

7 14 17 17 11 25 8 8 12 8 8 1113 11 12 10 8 13 8 13 14 10 11 9 20 17 15

36 9 13 14 39 33 36 9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11

11 11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8 16 10 9 33

27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8

27 7 5 13 7 15 28 25 60 42 12 31 22 20 12 3 4


Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.


Вопрос 44: Что такое аллель в ДНК-генеалогии?

АЛЛЕЛЬ, число тандемных повторов определенных блоков нуклеотидов в маркерах. Обычно в биологии понятие аллели относят к разным формам генов, расположенных в одинаковых маркерах хромосом одного типа, то есть гомологичных хромосом, и которые (аллели) при кодировании приводят к появлению различных вариантов одного и того же признака. В ДНК-генеалогии аллели задают разное число тандемных повторов в одном и том же маркере. Выше был приведен пример, когда в маркере DYS19 число повторов квадруплета ТАГА (TAGA) может быть от 11 до 19 раз. Числа аллелей в маркерах – важнейшая характеристика в ДНК-генеалогии, поскольку статистическое отклонение числа аллелей от предкового в каждом маркере гаплотипа позволяет рассчитывать, когда жили общие предки популяций, и эти расчеты работают на временах от сотен лет до нескольких миллионов лет.


Вопрос 45: Что такое гаплотип в ДНК-генеалогии?

ГАПЛОТИП – это совокупность аллелей, то есть наборов повторов в маркерах. Гаплотип записывается в виде набора чисел, которые отражают число аллелей в каждом маркере. Например, предковый гаплотип славян гаплогруппы R1a Русской равнины: в 12-маркерном формате (формате FTDNA)


13 25 16 11 11 14 12 12 10 13 11 30


в 25-маркерном формате


13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15

15 16


(здесь поставлено тире между первой и второй панелью маркеров, точнее – аллелей, потому что в длинных последовательностях чисел легко потеряться, а тире представляют собой метки, на которые можно ориентироваться),


в 37-маркерном формате


13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15

15 16–11 11 19 23 16 16 18 19 35 38 14 11


в 67-маркерном формате


13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15

15 16–11 11 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11

10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13


в 111-маркерном формате


13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15

15 16–11 12 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11

10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13–32 15

9 15 12 26 27 19 12 12 12 12 10 9 12 11 10 11 11 30 12 13 24 13 9 10

19 15 20 11 23 15 12 15 24 12 23 19 10 15 17 9 11 11


Вопрос 46: Что такое «стандартная запись гаплотипов в формате FTDNA»?

ФОРМАТ FTDNA – форма записи гаплотипов, принятая компанией Family Tree DNA (США), основной компанией в мире по тестированию ДНК, и далее принятая в ДНК-генеалогии. В статьях по популяционной генетике такая запись практически не используется, и по простой причине – протяженные гаплотипы там не используются. Порядок записи гаплотипов в попгенетике другой, и часто нестандартный, меняющийся у разных авторов. Но поскольку гаплотипы в попгенетике используются редко, то им такой разнобой не мешает.

Порядок маркеров в 12-, 25-, 37-, 67– и 111-маркерных гаплотипах следующий (в верхней строке – порядковый номер маркера, в нижней – индекс маркера DYS):



Вопрос 47: Что такое дерево гаплотипов, и какую программу для их построений можно использовать?

ДЕРЕВО ГАПЛОТИПОВ, серия гаплотипов, рассортированная с помощью специальной компьютерной программы и представленная в виде круговой, спиральной или линейной диаграммы (см. ниже). Эта диаграмма группирует гаплотипы по динамике их мутаций во всех маркерах, и таким образом представляет дерево в виде совокупности ветвей гаплотипов, соответствующих их наиболее вероятным ДНК-генеалогическим линиям. Например, среди гаплотипов гаплогруппы R1a встречаются гаплотипы с «типовой» мутацией, в которой маркер DYS388=12 заменён на DYS388=10. Это отдельная (и древняя) ДНК-генеалогическая линия, потому что и многие остальные мутации более присущи этой линии «10», по сравнению с мутациями для линии «12». Действительно, на дереве гаплотипов линия «10» выделяется в отдельную ветвь, которую следует анализировать отдельно. В настоящей книге деревья гаплотипов строились с помощью программы PHYLIP[53]53
  Felsenstein, J. (2004). PHYLIP (Phylogeny Inference Package). Version 3.6. Seattle: Department of Genome Sciences, University of Washington.


[Закрыть]
.

В качестве примера приведем дерево гаплотипов гаплогруппы I1 из 800 гаплотипов в 111-маркерном формате в нескольких видах графического представления (последние три дерева – фрагмент) (рис. 8.).


Вопрос 48: Что такое гаплогруппа в ДНК-генеалогии?

ГАПЛОГРУППА, совокупность гаплотипов, объединённая «групповой» необратимой мутацией, присущей определённому человеческому роду, то есть потомкам одного «патриарха», как правило, тысячелетия назад. Эквивалентна понятию «род» в ДНК-генеалогии. Эти мутации («снипы») выбирают по определённым критериям. Гаплогруппой также называют сам род в таких выражениях, как «гаплогруппа мигрировала шесть тысяч лет назад на восток», понимая, естественно, что мигрировали носители данной гаплогруппы. В настоящее время классификация включает 20 основных гаплогрупп (плюс A0 и A00), от А до Т в алфавитном порядке, и тысячи «нисходящих» гаплогрупп и субкладов. Индекс гаплогруппы с надстрочным * (например, I*) показывает, что «нисходящих» мутаций у их носителей в классификации пока не обнаружено. Все тестированные носители – прямые потомки данной гаплогруппы или субклада.



Рис. 8. Дерево гаплотипов гаплогруппы I1 из 800 гаплотипов в 111-маркерном формате в нескольких видах графического представления (последние три дерева – фрагмент)


Вопрос 49: Что такое «бинарная гаплогруппа»?

БИНАРНАЯ ГАПЛОГРУППА, устаревшее название гаплогруппы, приводится здесь, потому, что всё ещё иногда встречается в публикациях. То же, что и «биаллельная гаплогруппа», потому что у мутации, её определяющей (снип, SNP, см. ниже) есть всего два состояния – либо мутация есть, либо её нет. То есть в соответствующем участке ДНК есть две аллели – исходная и мутированная. В отличие от них, тандемные мутации, или тандемные повторы (см. выше) являются, как правило, множественными и имеются в популяции в виде различных аллелей, то есть «полиаллельными».


Вопрос 50: Что такое субклад в ДНК-генеалогии?

СУБКЛАД, подчинённая, «нижестоящая» гаплогруппа, ДНК-генеалогическая ветвь в пределах той же гаплогруппы, все члены которой имеют не только мутацию основной гаплогруппы, но и дополнительную мутацию, общую только для данной ветви/ субклада. Например, гаплогруппа R имеет «подчинённые», или «дочерние» гаплогруппы R1 и R2; R1, в свою очередь, имеет R1a и R1b и так далее. R1a в настоящее время имеет 66 субкладов, утвержденных Международным обществом генетической генеалогии, R1b в настоящее время имеет 443 «официальных» субкладов.


Вопрос 51: Что такое мутация в ДНК-генеалогии?

МУТАЦИЯ, в ДНК-генеалогии биологическая ошибка при копировании последовательности Y-хромосомной ДНК, в результате которой (ошибки) или меняется число аллелей в определённом локусе (STR мутации, от Short Tandem Repeats), или происходит модификация гаплогруппы (SNP мутации, от Single Nucleotide Polymorphism). В отличие от мутации в генах, вызванной, например, радиоактивным излученияем, и при которой нуклеотид «ломается», то есть мутация там деструктивная, мутация в гаплотипах происходит обычно путем ошибочного копирования достаточно длинных фрагментов ДНК, при котором (копировании) происходит или удлинение, или укорачивание копируемого фрагмента ДНК. Это – не деструкция, а модификация. Но поскольку происходит отклонение от исходной «матрицы», то есть происходит ошибка копирования, то это тоже называют мутацией.


Вопрос 52: Что такое тандемная мутация в ДНК-генеалогии?

ТАНДЕМНАЯ МУТАЦИЯ в гаплотипе – это изменение числа аллелей в маркере. Происходит в среднем в маркере примерно раз в 500 поколений, хотя для каждого маркера своя скорость мутаций, которая для первых 37 маркеров варьируется от одного раза в 11100 поколений (DYS426, раз примерно в 280 тысяч лет) до одного раза в 140 поколений (CDYb, раз примерно в 3500 лет). Среди 67 маркеров есть такие, в которых мутация происходит раз в 125 тысяч поколений, то есть раз в 3.1 миллионов лет. По скоростям мутаций это сопоставимо со снипами. В популяции обычно наблюдается множественность аллелей в одних и тех же маркерах, то есть вариации аллелей. Совокупность этих вариаций позволяет рассчитывать время, когда жил один или несколько наиболее отдаленных предков популяции. Разные маркеры имеют разные скорости мутации в маркере, поэтому диапазоны вариации аллелей в разных маркерах разные.

Например, DYS426 – очень «медленный» маркер, всё человечество имеет всего четыре варианта аллелей – 10, 11, 12 и 13. Действительно, этот маркер имеет малую скорость мутации, она по оценкам равна 0.00009 мутаций на маркер на условное поколение. Это значит, что через пять тысяч лет среди тысячи наших современников всего у пятнадцати произойдет мутация в этом маркере – за 5 тысяч лет! Это несложно проверить, используя логарифмическую формулу, описанную выше: [ln(1000/985)]/0.00009 = 168 → 202 условных поколения, то есть 5050 лет.

Напротив, наиболее часты мутации в маркерах DYS449, CDYa, CDYb, у которых на Земле обнаружено 12, 13 и 13 разных аллелей, а именно от 25 до 36, от 28 до 40, и от 31 до 43, соответственно.


Вопрос 53: Поясните понятие «среднее число мутаций на маркер»

Это – важнейшая величина в ДНК-генеалогии, она напрямую связана с гаплотипом прямого предка, от значения аллелей которого и отсчитываются мутации. В серии гаплотипов современников, потомков одного общего предка (то есть принадлежащих одной ДНК-генеалогической линии) насчитывается определённое суммарное количество мутаций. Чем больше прошло времени от общего предка серии гаплотипов (популяции), тем больше суммарное количество мутаций в рассматриваемой серии гаплотипов. Таким образом, отношение этого суммарного количества мутаций во всех маркерах (от всех аллелей) к общему числу маркеров есть мера того, как давно жил общий предок. Это есть базовое положение ДНК-генеалогии. Это отношение можно откалибровать в поколениях или годах по абсолютной шкале времени при наличии хронологических «реперных точек».

Поскольку число маркерах в гаплотипах достигает – для обычно используемых гаплотипов в ДНК-генеалогии – 111, то в каждом маркере за определенное число лет от общего предка накапливается определенное среднее количество мутаций. Например, в серии из 968 гаплотипов гаплогруппы I1 за 3690±370 лет, прошедшие от общего предка современных носителей гаплогруппы, в маркере DYS19 накопилось 263 мутации. При известной константе скорости мутации для маркера DYS19, полученной независимым путем и усредненной по всем выборкам и по всем гаплогруппам, и равной 0.00179 мутаций на маркер за условное поколение, получаем, что общий предок жил примерно 263/968/0.00179 = 152 условных поколений назад, или примерно 152x25 = 3800 лет назад. Как видим, это в пределах погрешности измерений, поскольку величина 3690±370 лет, показанная выше, была рассчитана по всем 968 гаплотипам в 111-маркерном формате. Мы постоянно пишем «примерно», потому все такие расчеты носят статистический характер. Даже 263 мутации, полученные прямым путем, все равно «примерные», и по законам статистики имеют погрешность ±6.2 %, что дает 263±16 мутаций, и это при щадящей достоверности в одну «сигма», то есть с надежностью 68 %. При надежности в 95 % это было бы 263±32 мутации. Далее, при расчетах по всем гаплотипам поправка на возвратные мутации вводилась, а при расчетах по одному маркеру она для простоты не вводилась. Наконец, величина константы скорости мутации (0.00179 мутаций на маркер за условное поколение) тоже определена с определенной погрешностью. Все это заставляет для корректности писать «примерно».


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 | Следующая
  • 4.4 Оценок: 11

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации