Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
6 mai 2014 2 06 /05 /mai /2014 13:14

 

 

 

 

 

[ Je n'ai pas mis en ligne de nouveaux textes depuis de longs mois et je reprends ici le flambeau en adaptant un texte publié par Anatole Klyosov. Ce texte permet d'aborder la question très actuelle de la « bonne méthode d'analyse » entre approche SNP (je vais revenir sur ces termes) et STR. L'analyse est ici faite pour Ashkénazes Lévites dont un groupe important est R1a. Les nombreux séquençages actuels ont multiplié les mutations (SNP) connues – SNP est l'acronyme pour « Single Nucleotide Polymorphism », ce sont donc les mutations ponctuelles de l'ADN, un nucléotide remplacé par un autre. Une fois acquise, une telle mutation (neutre – aucun « effet » sur la personne) reste dans la lignée et le séquençage retrouve ces traces du passé.

Avant les progrès du séquençage, on utilisait plus volontiers les STR connues en français comme « empreintes génétiques ». Il s'agit d'une organisation particulière de l'ADN, par endroit (locus). C'est expliqué en détail dans les premiers articles de ce blog mais je vais brièvement rappeler le principe ici. Un locus STR montre une succession d'un motif de quelques nucléotides en tandem. Par exemple, si le motif est CCAGG, la succession en tandem donne : [CCAGG]CCAGGCCAGGCCAGG pour une succession de 4 motifs. Le motif ADN répété change à chaque locus. Ce qui compte c'est le nombre de répétitions car celui-ci change par incrément ou décrément d'1 unité, sans que le mécanisme de ces ajouts ou pertes soit bien compris, mais on constate. On connaît de nombreux sites où l'ADN prend ainsi une configuration répétée. Typiquement on fait l'analyse de 67 sites, plus récemment sur 111 sites et on nomme « haplotype » le résultat pour l'ensemble des sites mesurés. Une « mutation » pour un haplotype, c'est l'incrément ou décrément pour un des sites mesurés. Ce qui a fait réléguer ces haplotypes avec la venue du séquençage c'est que l'analyse des haplotypes étaient l'objet de disputes sur les taux de mutations à appliquer, sachant que chaque site a son propre taux de mutation.

La mutation SNP (mutation ponctuelle) se produit avec un taux qui ne dépend pas du site et cela a été vu comme une simplification. Le texte d'Anatole Klyosov, qui a proposé dans de nombreux articles une méthode de lecture des haplotypes, a le mérite de « recadrer » un article qui, comme trop d'autres en ce moment, se trompe sur les vraies raisons qu'il faut considérer dans l'approche SNP ou STR . Cet article étant déjà illustré pour un cas que je n'avais pas encore abordé dans ce blog, j'ai trouvé bien d'en faire une traduction très libre, en simplifiant certains aspects qui auraient pu rebuter des lecteurs peu aguerris à ces discussions ADN. A part SNP et STR (« Short Tandem Repeats ») l'acronyme MRCA ou TMRCA est à connaître : « Most Recent Common Ancestor » et « Time for Most Recent Common Ancestor ». Le TMRCA est donc l'âge d'une lignée.]

*Published under Anatole A. Klyosov permission

Comment to “SNP Analysis” https://sites.google.com/site/levitedna/y-dna-analysis/snp-results



Cet article fait suite à un autre article publié sous le titre «Analyse SNP » dont les bases m'ont paru fausses dès la première phrase. L'analyse SNP tend de plus en plus à se substituer à l'analyse STR et l'auteur en voyait la raison dans une meilleure appréhension de la mutation SNP. C'est faux et il m'a paru utile de revenir sur les fondamentaux dans le cadre de l'analyse des R1a Ashkenazes. A l'aide des haplotypes (STR) on évalue la période de l'ancêtre commun entre il y a 1150 à 1300 ans (avant présent). Comme nous le montrerons cela correspond environ au temps nécessaire pour 8 SNPs sur un segment de Chromosome Y de 10 Mb (10 000 nucléotides). Sauf que 8 SNPs c'est la moyenne et qu'en réalité ce nombre de SNPs variera entre 6 et 11 SNPs. Cette fluctuation rend le maniement des SNPs mal adapté aux périodes relativement courtes, comme dans le cas choisi.

En fait, les approches SNPs et STRs se complètent et les tentatives pour justifier une approche par rapport à l'autre sont vouées à l'échec.

Résummons les conclusions de l'étude (SNP) sur l'histoire des R1a Ashkenazes Levites. L'article fournit un arbre SNP des R1a Ashkenazes Levites (situation au 22 avril 2014). L' arbre est difficile à lire. Rappelons pour en aider la lecture les 5 différents niveaux de haut en bas  : il y a CTS6, Y2619, Y2630, YP264 et les SNPs dits « privés ». Ces 5 niveaux correspondent à 5 noeuds où plusieurs branches divergent.

http://ahp.li/b20c912b43fe2b168d13.jpg

 

Fig. 1 Arbre des Ashkenazes Levites R1a-L342.2-CTS6 et sous-groupes dérivés.

 

L'article que nous suivons explique dabord que tous les R1a Ashkenazes Levites (mais seulement eux) sont repérable par la succession de SNPs : Z93 – Z94 – Z2124 – Z2122 – F1345 – CTS6. Ce qui suit est un résumé de l'analyse que l'auteur fait de cet arbre. Le niveau F1345 tout en haut de l'arbre et juste avant CTS6 est connu comme étant aussi le fait de nombreuses lignées non juives ce qui explique que l'article fixe le début de la lignée Ashkenaze Levite au second niveau Y2619. Comme il apparaît sur l'arbre (Fig1) il y a pas moins de 19 SNPs entre Y2619 et Y2630, le niveau suivant de l'arbre. C'est le niveau encore en dessous (YP264) qui est assigné à la lignée rabinique Horowitz (ce point particulier est critiqué dans l'analyse STR qui suit).

L'article suivi prend comme écart moyen entre 2 SNPs la valeur 150 ans ce qui, comme nous allons le montrer introduit (sans le dire) une fluctuation statistique importante.

Voici un autre example qui considère l'arbre R1a sur une durée plus grande (mieux adaptée). Voir, ci-dessous l'arbre de Vladimir Tagankin (à partir de l'arbre de Dr. Alexander Zolotarev) à partir du niveau R1a-Z280 partagé par les 27 individus de l'arbre (voir Fig2).

 

http://ahp.li/f898c9b919e3db3dbbf4.jpg

 

 

Comme on peut le voir, à partir de Z280, dans le même temps, le nombre de SNPs par lignée varie de 29 à 43, soit une variation de 48 % . L'étude STR a permis d'établir que Z280 est daté de 4900 ans environ. Sur cette base, l'écart entre 2 SNPs selon la branche considérée varie de 114 à 169 ans. On voit donc que les 150 ans employés par l'article « oublient » une barre d'erreur importante telle qu'en reprenant le calcul pour Z280, au lieu des 4900 ans établis par STRs on a une période de temps allant de 4350 ans à 6450 ans. De la même façon, le calcul de TMRCA à partir de SNPs seuls pour l'arbre des R1a Ashkenazes Levites ne peut que comporter une erreur du même niveau (soit 48%). Avec des haplotypes de 111 marqueurs qui mutent (en moyenne) tous les 125 ans ou des haplotypes de 67 marqueurs qui mutent (en moyenne) tous les 208 ans on tavaille avec des valeurs du même ordre de grandeur et il est donc inexacte de donner une préférence à l'approche SNP par rapport à l'approche STR . Les 2 approchent sont complémentaires et, en se privant de l'une des composantes l'auteur a perdu une bonne occasion de corriger certaines valeurs.

 

Reprenons maintenant les TMRCAs déterminés par SNPs pour les 5 niveaux pré-cités :

F1345 – CTS6 – Y2619 – Y2630 – YP264

 

Les TMRCAs suivants ont été trouvés :

4224-3975 – 3168-2925 – 1496-1725 – 1056-1425 – 440-675



Maintenant, voyons ce que peut apporter une analyse STR.



http://ahp.li/71e3eeb967b6e354e727.jpg

 

Fig. 3. Arbre des haplotypes de 181 Ashkenazes Levites du groupe R1a-L342.2-CTS6 et dérivés



Actuellement, la banque de données dite "IRAKAZ database" fournit 181 haplotypes Ashkenazes Levites parmi 3997 entrées. L'arbre des haplotypes est présenté ci-dessus. L'arbre consiste en 2 branches repérées respectivement  par DYS459b=10 ou DYS459b=11.

Parmi les 181 haplotypes il convient de séparer 3 haplotypes ayant certains allèles particuliers et l'haplotype de base suivant :

13 25 1710 11 14 12 12 10 13 11 30—14 9 10 11 11 24 14 20 30 12 12 15 15—11 11 19 23 14 16 19 20 35 4014 11—11 8 17 17 8 12 10 8 11 10 12 22 22 15 10 12 12 14 8 14 23 21 12 12 1213 10 11 12 13

 

Cet haplotype de base contient 3 mutations (marquées en gras) par comparaison avec l'haplotype de base du reste des haplotypes. L'ensemble des 3 haplotypes ne contient que 7 écarts à l'haplotype de base. Le calcul est alors 7/3/0.12 = 19 , soit 19 générations de 25 ans, ce qui correspond à : 19x25 = 475±185 ans depuis l'ancêtre commun.  (0.12 est le taux de mutation par haplotype et par génération).

 

Les 179 haplotypes restants contiennent un total de 1002 mutations par rapport à LEUR haplotype de base (ci-dessous – sur 111 marqueurs) :

 

13 25 16 10 11 14 12 12 10 13 11 30—14 9 10/11 11 11 24 14 20 30 12 12 15 15—11 11 19 23 14 16 19 20 35 38 14 11—11 8 17 17 8 12 10 8 11 10 12 22 22 15 10 12 12 14 8 14 23 21 12 12 11 13 10 11 12 13—32 15 9 17 12 27 27 19 12 12 12 12 10 9 12 11 10 11 11 30 12 12 25 13 9 10 20 15 20 11 23 15 12 15 25 12 23 19 10 15 17 9 11 11

 

Le calcul donne 1002 / 179 / 0.12 = 47 générations de 25 ans (en arrondissant), soit 1175±130 ans . Nous avons mentionné la division en 2 parties à peu près égales selon la valeur DYS459b et cela reflète 2 branches sous javentes séparées par une seule mutation soit de 8 à 9 générations. On peut décrire la suite des événements de la façon suivante : environ 200 ans après le premier R1a Ashkenaze Levite il y a eu division en 2 branches, ce que l'arbre SNP ne montrait pas.

 

On peut affiner l'analyse en reprenant les 2 haplotypes de bases qui diffèrent par 3 mutations, ce qui les place à 3/ 0.12 = 25 générations de 25 ans de distance, soit environ 650 ans et leur ancêtre vivait il y a : (650+1250+475)/2 = 1200 ans, et on retrouve l'âge de l'ensemble des haplotypes. La petite branche de 3 haplotypes a donc divergé plus récemment, il y a 650 ans.

 

Il y a parmi les haplotypes un petit ensemble de 5 haplotypes sur 111 marqueurs qui semblent être des descendants de la famille rabinique Horowitz dont le patriarche aurait vécu en 1507-1572, ce qui fait 442-507 ans. L'haplotype de base est celui utilisé plus haut avec DYS459b=10, et ces 5 ont un total de 17 mutations par rapport à cet haplotype de base ce qui donne 17 /5 / 0.198 = 17 générations de 25 ans, soit 425±110 ans depuis l'ancêtre commun de ces 5 individus, ce qui est bien dans la période où aurait vécu le Rabin Horowitz.

 

Pour finir, reprenons les données d'un article récent : “Thoughts about Jewish DNA genealogy

 

https://sites.google.com/site/levitedna/origins-of-r1a1a-ashkenazi-levites/2014-klyosov-article-on-jewish-dna-genealogy

 

L'origine commune des R1a juifs et arabiques étaient établie à 3990 ans (avant présent) alors que la calcul de TMRCA pour F1345 donne 3975-4224 . On est essentiellement sur les mêmes datations et les groupes R1a juifs et arabiques ont donc une origine commune identifiable comme le premier porteur de la mutation F1345.

Il n'y a aucune lignée juive actuelle qui ait CTS6 sans la mutation suivante Y2619. Le niveau CTS6 ne paraît donc pas un niveau ayant une signification actuelle pour les R1a juifs. Le TMRCA 1496 – 1725 calculé par SNP pour Y2619 peut être le résultat d'un goulet d'étranglement , de telle sorte que la datation de 1200 ans n'est pas retrouvée mais c'est plutôt le SNP Y2630 dont le TMRCA est calculé à 1056-1425 qui cadre avec les 1200±125 ans et il faut sans doute y voir le SNP à l'origine des R1a Ashkenazes actuels. Bien entendu, les tests pour ces nouveaux SNPs diront si c'est bien le cas et si la quasi totalité des R1a Ashkenazes sont porteurs de Y2630.

 

Enfin le 4ème niveau, YP264, avait un TMRCA calculé par SNP de 440-675 ans. Ce peut être le SNP de la lignée Horowitz mais il y a d'autres groupes candidats comme l'a montré l'analyse STR et il faudra attendre que certains descendants Horowitz testent pour YP264 pour savoir.

 

References

 

Kilin, V.V., Klyosov, A.A. (2014) A novel TMRCA calculator working in all practically possible time ranges between hundreds of years to millions of years before present, based on the random walk model. Proc. Academy of DNA Genealogy, 7, No. 3, 438-478.

 

Klyosov, A.A. (2009) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186-216.

 

Klyosov, A.A. (2012) Ancient history of the Arbins, bearers of haplogroup R1b, from Central Asia to Europe, 16,000 to 1500 years before present. Adv. Anthropol. 2, No. 2, 87-105.

 

Rozhanskii, I.L., Klyosov, A.A. (2012) Haplogroup R1a, its subclades and branches in Europe during the last 9000 years. Adv. Anthropol., 2, No. 3, 139-156.

 

Remerciements : Je remercie Anatole Klyosov pour la communication et l'autorisation concernant cet article.

 

Note sur une confirmation ultérieure :  Un article paru peu après  celui de Klyosov , "Phylogenetic applications of whole Y-chromosome sequences and the Near Eastern origin of Ashkenazi Levites". Rootsi et al.

http://www.nature.com/ncomms/2013/131217/ncomms3928/full/ncomms3928.html?WT.ec_id=NCOMMS-20131218

a  identifié un nouvel SNP, nommé  M582. Cette mutation est placée entre Z2122 et F1345 (voir ci-dessous - arbre) et il est démontré dans cet article que pas moins de 65 % des Lévites Ashkénazes  en sont porteurs et ce marqueur leur est spécifique. Les Lévites non-ashkénazes ne sont que 8% porteur de M582. C'est la confirmation SNP prédite dans le texte Klyosov avec comme seule différence que F1345 (seul connu) était envisagé, au lieu de M582 qui lui est immédiatement adjacent.

 

Annexe :  La phylogénie  R1a  -  Comment le rameau Lévite Ashkénaze se rattache au tronc principal R1a

 

Arbre  Z93-R1a :

 

http://ahp.li/9b71f16a994bf3e08034.gif

Le rameau  Z93 --> Z94 --> Z2124 --> Z2122 --> F1345 --> CTS6  est bien indiqué.

 

 

Arbre R1a  général : comment  Z93 (ci'dessus) se  place  dans l'arbre  R1a

 

http://ahp.li/68d641283586ddc6b5c5.gif

 

Et  pour finir, une carte récente de la répartition Z93 (tous les Z93) :

 

http://3.bp.blogspot.com/-yo928Hon9Ww/UzN-U-aGWMI/AAAAAAAAJiM/3AE7m5bNwCY/s1600/ejhg201450f3.jpg

Partager cet article

Repost 0
Published by Didier
commenter cet article

commentaires