Le blog de Bernard

Aller au contenu | Aller au menu | Aller à la recherche

jeudi, juillet 17 2014

Le campaniforme du nord de l'estuaire du Tage au Portugal

Le campaniforme de la région de l'estuaire du Tage au Portugal est particulièrement important du fait de ses estimations de son âge très précoce par rapport au campaniforme européen. João Luís Cardoso vient de publier un papier intitulé: Absolute chronology of the Beaker phenomenon North of the Tagus estuary: demographic and social implications. Cette étude semble indiquer que le campaniforme portugais quoique le plus précoce d'Europe semble intrusif dans la culture Chalcolithique locale.

Le modèle jusqu'ici établi pour le campaniforme de cette région est constitué de trois phases temporelles. La première voit l'apparition de la poterie de style international composé de gobelets de type maritime décorés de bandes horizontales constituées de hachures obliques alternées. Le décor est fait d'impressions pointillées. Cette vaisselle est retrouvée principalement dans des sites de hauteurs, et est associée à la vaisselle de type feuilles d'acacia représentative du chalcolithique local. Dans ce modèle, cette première phase est suivie d'une seconde phase caractérisée par un métissage des styles décoratifs: le décor maritime pointillé se mélange avec les techniques du chalcolithique local pour obtenir le style dit de Palmela caractérisé notamment par des bols dont les bords ont un décor particulièrement élaboré. Enfin une dernière phase chronologique du campaniforme local voit la prédominance des décors incisés retrouvés principalement dans des sites domestiques qui sont probablement des petites fermes familiales. Selon ce modèle, le campaniforme correspond à la dernière phase du chalcolithique portugais et précède le Bronze Ancien. Durant le campaniforme les sites fortifiés du chalcolithique ancien, sont progressivement abandonnés pour une occupation plus dispersée dans des sites ouverts propices à l'agriculture et l'élevage.

Cependant ce modèle bien que robuste en apparence, a été mis à mal par la publication récente des premières datations radiocarbones issues de contextes campaniformes. En effet, les datations obtenues sur le site fortifié de Leceia dans une hutte de pierre nommée FM, située en dehors des fortifications, font apparaître le campaniforme dès le second quart du troisième millénaire av. JC. De plus cette hutte qui ne contient que des poteries campaniformes donne la possibilité d'associer le phénomène campaniforme à une population indépendante du chalcolithique portugais. Il y a donc la coexistence de deux populations contemporaines distinctes dans le même espace sur le site de Leceia. Cette étude rassemble les données archéologiques de la région obtenues durant la dernière décade:
2014 Cardoso Figure 1

L'exemple de la hutte FM de Leceia détruit de plus le modèle temporelle jusqu'ici admis puisque l'on retrouve tous les styles campaniformes (international, Palmela et incisé) mélangés dans la même couche stratigraphique d'une structure qui a eu forcément une courte durée de vie. La conclusion est donc que les styles campaniformes n'ont pas de signification chronologique.

Leceia

Les fouilles archéologiques du site fortifié de Leceia ont mis à jour des vestiges campaniformes à l'intérieur des murs de fortification et dans deux huttes situées à l’extérieur des mur d'enceinte:
2014 Cardoso Figure 2

Vers 2600 ou 2500 av. JC, le site fortifié était déjà en déclin. Cette période correspond à la transition entre le Chalcolithique Ancien caractérisé par de la poterie cannelée et le Chalcolithique Moyen. Les occupants situés à l'intérieur de l'enceinte, voient alors l'apparition d'un important influx de poteries campaniformes de style maritime. Cette poterie est associée à de la vaisselle de style feuilles d'acacia. Ces deux traditions ont donc coexisté. La poterie campaniforme pointillée est alors beaucoup plus nombreuse que la poterie incisée (34 tessons contre 5). Les datations radiocarbones indiquent un début de la phase campaniforme au troisième quart du troisième millénaire av. JC, et une fin au dernier quart de ce même millénaire:
2014_Cardoso_Figure3.jpeg

Deux huttes de plan ellipsoïde ont été identifiées en dehors des fortifications. Dans ces huttes toute la poterie retrouvée est exclusivement campaniforme. On ne retrouve pas de céramique cannelée ou à décor de feuilles d'acacia représentative du Chalcolithique local. La hutte FM a pu abriter une cellule familiale. Elle a été construite sur un habitat du néolithique final daté de la seconde moitié du quatrième millénaire av. JC. La poterie retouvée est partagée entre des décors pointillés (69 fragments) et des décors incisés (39 fragments). De nouvelles datations radiocarbones ont été réalisées et confirment l'ancienneté de la hutte FM au second quart du troisième millénaire av. JC avant donc le campaniforme situé à l'intérieur des fortifications.

La hutte EN a également un plan ellipsoïde, mais elle est plus petite que la hutte FM avec une dimension de ses axes de 4m et 2m. Elle a été recouverte par des pierres issues de l'écroulement du mur de fortification. Dans cette hutte la décoration incisée est plus fréquente que la pointillée. Il n'y a pas non plus de décor de style maritime. Les datations radiocarbones indiquent une habitation au troisième quart du troisième millénaire av. JC, contemporaine de celle de l'intérieur des fortifications.

Monte do Castelo

Un petit groupe de céramique campaniforme a été recueilli à la surface du sol, sur la rive droite de la rivière Barcarena, 700 m au sud du site de Leceia. Cela suggère un habitat isolé. L'ensemble de la poterie est décoré avec des incisions, et 5 tessons sont de style maritime:
2014_Cardoso_Figure4.jpeg

Les datations radiocarbones indiquent la fin du second quart du troisième millénaire av. JC.

Freiria

C'est une habitation ouverte localisée près d'un ruisseau, avec différentes structures de combustions et plusieurs huttes. Elle est construite directement sur le sol rocheux. Les fouilles ont donné une abondante céramique campaniforme. Les datations conduisent à des valeurs comprises entre le dernier quart du troisième millénaire av. JC et le début du second millénaire av. JC. Les décors de la céramique sont incisés avec des tessons de style maritime. Le style de Palmela est très rare sur cet habitat:
2014 Cardoso Figure 5

Grotte de Ponte da Lage

Cette grotte est localisée sur la rive gauche de la rivière Lage. Du matériel campaniforme a été retrouvé au 19ème siècle en contexte funéraire avec des restes pré-campaniformes et du Bronze Ancien. Le mobilier campaniforme consiste en un poignard en cuivre, d'autres pièces métalliques et une abondante céramique dominée par le décor incisé. Ce site a été récemment daté du troisième quart du troisième millénaire av. JC.
2014 Cardoso Figure 6

Penha Verde

Cet habitat est situé en hauteur dans les monts Sintra. Un mur et deux huttes de plan circulaire ont été identifiés. Une des deux huttes est associée avec du matériel campaniforme dans un fossé situé en dehors de la structure, et un pavement sur le sol à l’intérieur de la structure. La céramique campaniforme est associée à de la céramique à décor de feuilles d'acacia. La céramique campaniforme est à majorité de style international pointillé. Les 6 dates radiocarbones obtenues suggèrent une habitation qui s'étale sur l'ensemble de la seconde moitié du troisième millénaire av. JC. Si la majorité de la céramique campaniforme est pointillée la dernière phase d'habitation semble être reliée à de la céramique incisée, notamment des bols de Palmela.
2014 Cardoso Figure 8

Moita da Ladra

L'habitat fortifié est localisé en haut d'une cheminée basaltique surplombant l'estuaire du Tage. Des vestiges de métallurgie ont été retrouvés. La céramique campaniforme de style majoritairement maritime pointillé, avec un seul tesson incisé, est associée à de la céramique à décors de feuilles d'acacia. Les datations radiocarbones donnent un âge situé au dernier quart du troisième millénaire av. JC.
2014 Cardoso Figure 10

Grotte de Verdelha dos Ruivos.

44 sépultures campaniformes ont été retrouvées sur 4 niveau de cette petite grotte. La majorité des corps sont déposés en décubitus latéral, et recouverts d'une dalle. La céramique est dominée par le style incisé, notamment sur des bols de Palmela. Les datations radiocarbones situent cette occupation funéraire au second quart et au début de la seconde moitié du troisième millénaire av. JC,
2014 Cardoso Figure 11

Discussion

  • La céramique incisée est dominante sur les sites de Leceia dans la hutte EN, de Freiria, et de la grotte de Ponte da Lage, datés de la seconde moitié du troisième millénaire av. JC et au début du second millénaire av. JC. Les exceptions sont la grotte de Verdelha dos Ruivos et le site de Monte do Castelo qui correspondent au second quart et au milieu du troisième millénaire av. JC, Cette conclusion contredit le modèle en trois phases qui inscrit le style incisé à la fin de la période campaniforme.
  • La céramique maritime pointillé est associée aux sites fortifiés de Leceia à l'intérieur de l'enceinte, de Moita da Ladra, et de Penha Verde. Elle est associée à la céramique à décor de feuilles d'acacia. Ces deux derniers sites confirment la continuité de l'usage de fortification par les campaniformes, dans la seconde moitié du troisième millénaire av. JC.
  • Il est claire que les deux principaux types de céramique campaniforme (pointillé et incisé) ont coexisté à la fois dans l'espace et dans le temps. La différence vient du type d'habitat puisque le style pointillé se retrouve principalement dans les fortifications alors que le type incisé se retrouve dans les petites structures familiales en zone ouverte. Il est tentant d'associer ces deux types de céramique à des classes sociales différentes. La classe supérieure habitait dans les fortifications et fabriquait de la céramique pointillée alors que la classe inférieure habitait dans des petites fermes et fabriquait de la céramique incisée. C'est probablement la classe supérieure qui est associée aux poignard en cuivre, aux pointes de Palmela et aux objets en or.
  • L'antiquité de la céramique campaniforme de la hutte FM de Leceia est un des plus importants aspect de cette étude. Au Portugal d'autres dates sont en accord avec cette précocité. Ainsi une occupation campaniforme située à Porto Torrão dans le nord du Portugal, correspond à une date comprise entre 2823 et 2658 av. JC. Ce site est associé quasiment exclusivement à de la céramique maritime pointillée. Un autre site à Crasto de Palheiros est associé à de la céramique variée: maritime, pointillé géométrique, incisé. Il est daté entre 2861 et 2466 av. JC. De plus une sépulture située à Baião confirment la contemporanéité des différents styles de céramiques. On y a trouvé des tessons campaniformes de style maritime pointillé, du style pointillé géométrique, du style incisé, un bol de Palmela à décor pointillé, ainsi que 7 objets en cuivre: deux poignards et 5 pointes de Palmela. Finalement, au nord-est de la péninsule ibérique, à Buraco da Pala, des dates précoces ont été obtenues en contexte campaniforme, entre 2888 et 2348 av. JC.

Conclusions

  • Les premières productions campaniformes dans l'estuaire du Tage ont coexisté avec peu d'interaction avec les populations du Chalcolithique local qui vivaient dans les sites fortifiés et utilisaient de la céramique cannelée. Cependant, dans d'autres cas, la coexistence de ces deux populations s'est traduite par une interaction plus importante comme à Zambujal par exemple. Cette interaction a continué durant tout le troisième millénaire av. JC.
  • Durant la seconde moitié du troisième millénaire av. JC, la céramique fine de type maritime ou pointillé géométrique se retrouve dans les sites fortifiés où vivait la classe supérieure. La céramique incisée de moindre qualité se retrouve dans des petits habitats ouverts vers les terres où vivait une population d'agriculteurs et de pasteurs.
  • La complexité du phénomène campaniforme dans la région du Tage ne correspond pas bien au modèle classique de trois phases successives caractérisées par leur type de poterie. De plus, sa précocité a des parallèles au sud et au nord du Portugal, ainsi qu'en Espagne.
  • Si la société campaniforme est scindée en deux composantes (classes supérieure et inférieure), il s'agit néanmoins d'une culture unique qui coexiste avec une autre culture du Chalcolithique local. Ainsi certains sites comme Penedo de Lexim ou Outeiro Redondo présentent une absence complète de mobilier campaniforme.
  • La chronologie absolue des premiers campaniformes dans la région du Tage est maintenant bien établie autour de 2700 ou 2600 av. JC, avant la transition du Chalcolithique Ancien (céramique cannelée) au Chalcolithique Moyen (céramique à décor de feuilles d'acacia) datée entre 2600 et 2500 av. JC. La culture campaniforme semble donc complètement indépendante de la culture Chalcolithique locale. Ces deux entités évoluent parallèlement dans la région, et il n'est plus possible d'associer le campaniforme avec le Chalcolithique récent de la région.

mardi, juillet 15 2014

Variation du chromosome Y à Taïwan et dans les îles de l'Asie du sud-est

Jean A Trejaut vient de publier un papier intitulé: Taiwan Y-chromosomal DNA variation and its relationship with Island Southeast Asia.

La population Taïwanaise comprend 3 types d'habitants: les Hans sont les plus nombreux et descendent d'immigrants qui sont arrivés sur l'île il y a environ 400 ans, les tribus des montagnes incluent 12 des 14 groupes ethniques de l'île et représentent 2% de sa population totale, les tribus des plaines qui se sont beaucoup mélangés avec les Hans représentent 1% de la population totale. Les tribus des montagnes, ainsi que les Philippins et et les Indonésiens parlent des langues austronésiennes. Cette famille linguistique comprend 10 branches à sa base dont 9 sont situées exclusivement sur l'île de Taïwan. La dixième branche est parlée à Madagascar, dans les îles de l'Asie du sud-est et en Océanie jusqu'à l'île de Pâques. On suppose que l'origine des langues Austronésienne est située à Taïwan à cause de sa diversité linguistique.

Les indices archéologiques indiquent que la culture Austronésienne s'est diffusée dans les îles de l'Asie du sud-est via Taïwan il y a environ 4500 ans, avant l'âge de fer. Les études génétiques mitochondriales montrent également que les individus qui parlent l'Austronésien, ont leur origine en Asie du sud-est, via Taïwan. La théorie de la Sortie de Taîwan (Out Of Taïwan) indique qu'une unique migration a propagé les langues Austronésiennes dans les îles de l'Asie du sud-est il y a un peu plus de 4000 ans. Cependant, d'autres études semblent indiquer un mouvement inverse des îles de l'Asie du sud-est vers Taïwan.

Plusieurs études génétiques du chromosome Y ont montré l'importance de l'expansion de l'haplogroupe O-M175 en Asie de l'est et dans les îles de l'Asie du sud-est. Cette expansion prend son origine en Chine du sud-est aux temps pré-néolithiques. Cependant la résolution phylogénétique de cet haplogroupe O reste mal connue. Dans cette étude, les auteurs ont testé 81 SNPs et 17 marqueurs STRs sur 1660 individus appartenant à 35 populations de Taïwan, les Philippines, l'Indonésie, de Thaïlande, du Viet-Nam et de Chine:
2014 Trejaut Figure 1

Pour comparaison, des données issues d'autres populations du sud de la Chine, des îles de l'Asie du sud-est et d'Océanie, ont été prises en compte. La distribution des fréquences des différents haplogroupes a ensuite été déterminée pour chacune de ces populations:
2014_Trejaut_Figure2.jpeg

Dans toutes ces populations, l'haplogroupe O est largement majoritaire. Ensuite, des cartes de distribution ont été tracées pour certains haplogroupes:
2014 Trejaut Figure 3

L'estimation de l'âge des différents haplogroupes a été également déterminée en utilisant le taux de mutation de Zhivotovsky appliqué sur 13 marqueurs STRs:
2014 Trejaut Table 2

Sur l'île de Taïwan, l'haplogroupe O représente environ 90% de l'ensemble de la population Han, 95% des tribus des plaines et plus de 99% des tribus des montagnes. L'haplogroupe O* est très rare: un seul représentant aux Philippines, chez les tribus des plaines et chez les Hans de Chine.

L'haplogroupe O1a-M119* se retrouve à 42% sur l'île de Batan aux Philippines, de 4 à 33% aux Philippines et de 4 à 18% en Indonésie. Il a une distribution éparse de 3 à 33% parmi les tribus des montagnes à Taïwan, bien que les fréquences supérieures à 10% se retrouvent dans le sud. Sa diversité décroit de la Chine vers le sud, bien qu'il y ait un second pic autour des Moluques. L'estimation de son âge est maximale autour de 20.000 ans dans les tribus des montagnes à Taïwan et aux Philippines.

L'haplogroupe O1a1-P203* est le plus fréquent chez les tribus des montagnes du nord et les Tsou avec une fréquence proche de 90%. Chez les tribus des montagnes du sud il est plus faible autour de 50%. Il est également fréquent chez les tribus des plaines. Il est nettement moins fréquent aux Philippines (13,7%) et en Indonésie (16,3%). Il est cependant plus fréquent au Kalimantan à Bornéo (36%). Il est également relativement fréquent parmi les Hans de Chine (22%) ou de Taïwan (14,2%). Il est rare en Thaïlande (2,7%) et inexistant au Viet-Nam. Le réseau des haplotypes est en forme d'étoile. Son âge est maximal chez les tribus des montagnes de Taïwan et aux Philippines avec une valeur voisine de 16.000 ans.

L'haplogroupe O1a2-M50 est fréquent parmi les tribus des montagnes du sud (entre 18 et 28%) et chez les Bunun (61%). Il est variable aux Philippines entre 3 et 16,7%. Il est plutôt rare dans l'ouest de l'Indonésie (5,3%). Cependant une très haute fréquence (80%) a été détectée dans l'île de Nias du sud dans l'océan indien, au large de Sumatra. Il est rare chez les Hans de Taïwan et de Chine, en Thaïlande, au Viet-Nam et en Malaisie. L'estimation maximale de son âge se situe dans les tribus des montagnes avec une valeur de 17.500 ans.

L'haplogroupe O2 se divise en deux branches. La première comprend O2-P31* observé chez les Hans (4%), les tribus des plaines (5,7%), les Philippines (4,7%), et l'Indonésie (3,25%). et O2a-PK4 observé principalement dans le sud de la Chine, en Indochine et en Indonésie. La seconde branche comprend O2b-SRY465 trouvés parmi les coréens, les japonais et les chinois du nord.

Les sous-clades de l'haplogroupe O3 les plus largement distribuées géographiquement sont O3a1c*, O3a2-P201*, O3a2b-M7* et O3a2c-P164*. O3a1c* se retrouve à 25% chez les Hans de Chine, à 13 et 21% chez les Minnan et Hakka de Taïwan, 12% chez les tribus des plaines. Il est très rare chez les tribus des montagnes, aux Philippines et en Indonésie. O3a2-P201* est maximal chez les Puyuma (4,35%), et n'excède pas 2% dans les autres populations. O3a2b-M7* est rare chez les Hans de Chine, à Taïwan, et aux Philippines. Il est cependant plus fréquent en Indonésie (8,54%), en Indochine (12,5% au Viet-Nam et 6,7% en Thaïlande). O3a2c-P164* est fréquent chez les tribus des montagnes de la côte est (entre 5 et 36%), aux Philippines (entre 8 et 50%) et à l'ouest de l'Indonésie (11,8 à 20%). Il est plutôt rare en Indochine et chez les Hans.

Enfin les haplogroupes: C, D, F*, H, K*, N, P*, Q et R sont observés à basse fréquence dans la région avec une distribution éparse.

Une Analyse à l’Échelle Multidimensionnelle a été réalisée:
2014 Trejaut Figure 5

Beaucoup de populations sont localisées au centre du graphe avec des groupes parlant une langue Austronésienne en Indonésie et aux Philippines entourés par des populations du Viet-Nam, de Thaïlande et de Malaisie. La plupart des tribus des montagnes sont situées dans le quart du bas à droite, et les Hans de Chine ou de Taïwan en haut à gauche. Les tribus des plaines s'étendent de la gauche des Hans (Yunlin et Papora) jusqu'à proximité des tribus des montagnes du sud (Pazeh et Siraya). Ces deux derniers groupes sont probablement les moins sinisés. La relation de ce graphe avec les haplogroupes est la suivante. L'haplogroupe O2 se retrouve principalement dans les groupes situés en haut à gauche, alors que l'haplogroupe O1 croit en fréquence lorsque on se rapproche du coin en bas à droite pour être maximal avec les tribus des montagnes du nord.

Les groupes Bunun, Akha, Atayal et Tsou se distinguent par leur faible diversité. Ainsi on ne trouve que 3 haplogroupes parmi les 56 individus Bunun (O1a2-M50 à 61% et O2a1a-M88 à 37.5%). On ne trouve également que 3 haplogroupes parmi les 41 Tsous et 52 Atayal pour lesquels l'haplogroupe O1a1-P203* se retrouve à 90%. Les tribus des montagnes du nord se distinguent par la très haute fréquence de cet haplogroupe O1a1-P203*.

Une simulation de mélange génétique a été réalisée en prenant deux populations source: les Hans ancestraux et les Austronésiens ancestraux. les résultats obtenus sont les suivants:
2014 Trejaut Table 3

Seules les tribus des plaines ont une majorité issue de la population Han ancestrale (62 ou 79% selon le modèle).

La variance moléculaire a également été calculée. Elle est minimale chez les tribus des montagnes ce qui est consistant avec la faible diversité génétique de ces populations.

Discussion

L'haplogroupe O reflète une relation ancestrale des populations contemporaine avec les premières populations d'Asie de l'est. La faible diversité génétique des tribus des montagnes est associée à des variations à l'intérieur de l'haplogroupe O1. Par contraste les populations non originaire de Taïwan, ainsi que les tribus des plaines ont une plus grande diversité génétique qui regroupe 26 branches distribués dans les sous-clades O1,O2 et O3. Ces résultats suggèrent un mélange génétique important chez les tribus des plaines qui n'existe pas chez les tribus des montagnes. Une dérive génétique importante due à une faible taille de la population et à un isolement est l'explication probable de la faible diversité des tribus des montagnes.

Une récente étude de l'ADN mitochondrial à Taïwan a mis en évidence un décroissement de la diversité génétique du nord vers le sud. De manière intéressante cette étude sur le chromosome Y montre une tendance inverse puisque la diversité génétique décroit du sud vers le nord. Cette décroissance est liée avec l'accroissement de la fréquence de l'haplogroupe O1a1-P203*. Ces résulats suggèrent une histoire démographique différente entre les hommes et les femmes des tribus des montagnes. L'haplogroupe O1a1-P203* est observé à hautes fréquences entre 40 et 60% dans toutes les tribus des montagnes du sud et de l'est, et à plus de 87% dans toutes les tribus des montagnes du nord. A l'inverse sa fréquence n'excède pas 20% aux Philippines et en Indonésie. Il est cependant commun dans le sud et l'est de la Chine où il est probablement originaire. Un autre haplogroupe important: O1a2-M50 est fréquent parmi les tribus des montagnes du sud, mais rare chez les Hans de Taïwan. Cette étude supporte une expansion de Taïwan vers les Philippines et l'Indonésie.

Un résultat également intéressant est la haute fréquence de O2a1a-M88 chez les Bunun (37,5%). Les haplotypes de cet haplogroupe chez les Bunun se rapprochent de ceux des groupes parlant une langue daïque et des groupes d'Indochine ou d'Indonésie. Ceci implique une probable origine de l'haplogroupe O2 à Madagascar ou les îles Salomon.

L'haplogroupe O3 est le plus diversifié sur le continent sud-est asiatique. Il représente probablement un flux génétique lié à la migration des Hans.

Le modèle de pince

Il a été proposé qu'après la colonisation initiale de l'Asie du sud-est et de l'Indochine il y a 50.000 ans, apportant les haplogroupes C, M et S, l'origine et la diffusion de plusieurs haplogroupes peuvent être retracées en 4 étapes suivant un modèle démographique paternel. Les étapes B,C et D correspondent à un flux génétique originaire du continent vers les îles de l'Asie du sud-est suivant un modèle de pince. Une branche du nord se diffuse à travers Taïwan et une branche du sud à travers l'Indonésie. Ces deux branches se rejoignent aux Philippines. Les résultats de cette étude sont cohérents avec ce modèle, avec un gradient à faible diversité à travers l'Indonésie et un autre à faible diversité à travers Taïwan. La branche du nord a apporté les haplogroupes O1a-M119*, O1a1-P203* and O1a2-M50, d'abord à Taïwan, puis aux Philippines et en Indonésie. Elle correspond à une dispersion Austronésienne d'agriculteurs. La branche du sud a apporté les haplogroupes O2a1-M95/M88, O3a-M324*, O3a1a-M121, O3a1c*, O3a2-P201*, O3a2a-M159, O3a2b-M7*, O3a2c-P164* et O3a2c1a-M133. Elle correspond à un influx de chasseurs-cueilleurs en provenance du continent asiatique. Les bouts des deux branches se sont croisés aux Philippines.

Il est probable que les deux haplogroupes: O1a2-M50 et O2a1-M95/M88 ont atteint l'Indonésie selon deux migrations différentes. O1a2-M50 est arrivé avec la branche du nord alors que O2a1-M95/M88 est arrivé avec la branche du sud du modèle de pince. Ils se sont rencontrés en Indonésie de l'ouest, à Bornéo ou à Sumatra. Plus tard, de nouvelles migrations, les ont apporté avec O3a2c-P164, vers l'est jusqu'aux îles Salomon et vers l'ouest jusqu'à Madagascar.

Enfin, bien que les tribus des plaines à Taïwan ressemblent génétiquement aux Hans de Taïwan, leur forte diversité des haplotypes non partagés avec les Hans suggèrent une arrivée de ces tribus des plaines à Taïwan avant l'arrivée des Hans, probablement il y a entre 2 et 6.000 ans.

mardi, juin 24 2014

Faible taux d'infidélité en Europe Occidentale

Voici un papier intéressant de Maarten Larmuseau: Low historical rates of cuckoldry in a Western European human population traced by Y-chromosome and genealogical data.

Différentes études ont essayé d'estimer le taux d'événements de non paternité (événements pour lesquels un fils n'est pas le fils biologique de son père: adultère, adoption, ...) chez les êtres humains. Ainsi les études liées aux transplantations de moelle osseuse ont montré que ce taux est de 0,94% en Allemagne, et 0,65% en Suisse. Ces estimations sont des mesures sur la population existante. Il peut être intéressant d'effectuer cette même estimation pour les populations passées, notamment avant l'existence de la contraception. Les auteurs de cette étude ont utilisé des tests ADN du chromosome Y associés à des enregistrement généalogiques pour estimer ce taux dans les populations passées de Belgique.

Des tests ADN du chromosome Y ont été effectués sur des hommes belges dont la généalogie est connue et remonte avant 1800. Des familles de toutes les classes sociales ont contribué à ces échantillons. 38 marqueurs STR et des SNPs ont été testés sur un ensemble d'individus regroupés par couples de la même famille mais éloignés d'au moins 7 générations (ascendantes et descendantes). Par exemple, 2 frères sont éloignés de 2 générations, 2 cousins germains sont éloignés de 4 générations. Connaissant le taux de mutation de ces marqueurs STR, il est très peu probable que 2 individus reliés généalogiquement aient plus de 7 mutations d'écart sur ces 38 marqueurs STR.

Sur un total de 1071 individus, 60 couples reliés généalogiquement ont été identifiés, séparés d'au moins 7 générations. La plus grande distance parmi ces couples est de 31 générations. La distance moyenne est de 16 générations. Parmi ces 60 couples, 8 couples généalogiquement reliés ne sont pas reliés biologiquement d'après le chromosome Y et montrent donc l'existence d'au moins un événement de non paternité. Sur ces 8 couples, 7 couples ont des individus d'haplogroupes différents. Pour le huitième couple, les deux individus ont le même haplogroupe: I1*, mais sont séparés par les marqueurs STR de 23 mutations d'écart. A partir de cette valeur, les auteurs ont estimé le taux d'événements de non paternité par génération à 0,91%.

Une seconde méthode a été utilisée pour estimer ce taux d'événements de non paternité. Elle est basée sur la comparaison de fréquences d'haplotypes entre 2 populations: la première est une population de Flandres authentique (cAFS) et la seconde est une population d'émigrés français en Flandres (cFRS), survenue au 16ème siècle. Cette distinction est basée sur l'étude du patronyme de chaque individu. Ensuite chacune de ces 2 populations a été divisée en deux. Ainsi à partir de la population authentique de Flandres, les auteurs ont conservés uniquement les individus dont l'ancêtre paternel le plus ancien connu est né en Flandres avant 1750, et dont le patronyme est présent en Flandres avant 1600. Cela a donné le groupe nommé rpAFS. Les fréquences d'haplotypes pour la population rpFRS a été déterminé à partir des données de l'étude de Ramos-Luis pour les régions Île de France et Nord Pas de Calais. Ensuite la distance génétique Fst entre ces 4 groupes a été calculée. Puis un modèle de simulation a été construit pour simuler l'arrivée d'une population française en Flandres, il y a 16 générations. La taille de la population AFS est supposée égale à 10 fois la taille de la population FRS à la fois en 1600 et en 2010. Ensuite en supposant un taux d'événements de non paternité constant sur le temps Pnp , les fréquences d'haplotypes pour les populations cAFS et cFRS ont été estimées. En effet les événements de non paternité vont se traduire par l'introduction d'haplotypes spécifiques d'une population dans la seconde et vice-versa. Ainsi la population AFS est caractérisée par une plus haute fréquence de l'haplogroupe R1b-U106 et une plus faible fréquence des haplogroupes R1b-M529 et R1b-U152 par rapport à la population FRS:
2014 Larmuseau2 Figure 1

La valeur de Fst entre les populations rpAFS et rpFRS est de 0,03072, et entre les populations cAFS et cFRS de 0,02110. Cette diminution de la distance génétique entre les 2 populations est due au taux d'événements de non paternité. Ces valeurs conduisent à une estimation du taux d'événements de non paternité d'environ 2%.

Discussion

Les deux méthodes utilisées pour estimer le taux d'événements de non paternité ont abouti à des valeurs comparables comprises entre 1 et 2%. Ces valeurs sont faibles et comparables à celles obtenues à partir d'une population contemporaine liée à la transplantation de moelle osseuse. Cela suggère que ce taux n'a pas évolué au cours des derniers siècles, et donc n'a pas diminué avec l'arrivée des méthodes contraceptives dans les années 1960s.

mercredi, juin 18 2014

Investigation bioarchéologique sur le site celtique du Glauberg (Allemagne)

Corina Knipper vient de publier un papier concernant les résultats bio-archéologiques de plusieurs squelettes dont celui du prince celte du Glauberg. Ce papier est intitulé: Social differentiation and land use at an Early Iron Age “princely seat”: bioarchaeological investigations at the Glauberg (Germany).

Les périodes de Hallstatt et de La Tène voient un fort accroissement de la métallurgie du fer. Aux 6ème et 5ème siècles av. JC, de riches tombes sous tumulus et des places fortifiées apparaissent dans le sud de l'Allemagne, l'est de la France, la Suisse, la Bohème et l'Autriche, et attestent de la concentration du pouvoir politique et économique dans les mains de quelques privilégiés. Le site du Glauberg en Allemagne est un excellent exemple de ce phénomène. L'occupation la plus dense de ce lieu est datée de la fin du Hallstatt et du début de La Tène entre les 6ème et 4ème siècles av. JC. Des tombes princières exceptionnellement riches de la fin du 5ème siècle av. JC, ainsi qu'une statue quasiment complète en grès symbolisent l'importance de ce site:
2014 Knipper Figure 1

Le but de cette étude est d'analyser les restes humains des tombes les plus riches, des tombes plus simples trouvés dans les fossés entourant les tumulus, et des fosses situées en deux endroits autour du site.

Les fouilles du premier tumulus ont révélé des restes humains faiblement préservés appartenant à une inhumation et une crémation. Le tumulus 2 a révélé une inhumation avec des restes humains encore moins bien préservés. Cependant ces tombes renfermaient un mobilier archéologique très riche, notamment des objets en or, des armes et de la vaisselle en bronze. De plus, deux tombes ont été trouvées dans un fossé à proximité du premier tumulus:
2014 Knipper Figure S2

Ce sont deux inhumations en position dorsale sans mobilier archéologique à part un bracelet en bronze. Ces inhumations sont contemporaines de la statue de grès et des tombes à l'intérieur du premier tumulus, c'est à dire la seconde moitié du 5ème siècle av. JC. Autour du Glauberg, deux sites ont été fouillés: Hunzgrund et Klause II, et ont révélé la présence de restes de 22 squelettes humains situés dans des fosses: 3 fosses de Hunzgrund contenaient une tombe double et deux tombes simples, 6 fosses de Klause II contenaient trois tombes simples, une tombe double et deux tombes multiples contenant respectivement 8 et 5 individus:
2014 Knipper Figure 2

Les squelettes étaient dans des positions diverses: sur le ventre, sur le dos, accroupis. Ils étaient accompagnés d'objets métalliques.

L'objet de ce papier est d'étudier ces différentes tombes contrastées entre les plus riches sous tumulus et les plus communes dans des fosses. Des analyses ostéologiques, d'ADN et isotopiques ont été réalisées sur ces restes humains appartenant à 27 individus.

Les tombes sous tumulus ont des restes humains très dégradés. Les squelettes des 2 inhumations dans le fossé, ainsi que 4 individus issus des fosses du site de Hunzgrund et 18 individus du site de Klause II sont mieux préservés et ont donné des résultats ostéologiques. La détermination du sexe a permis d'identifier 9 hommes, 9 femmes et 7 enfants dont le sexe est indéterminé. Le prince inhumé dans le tumulus 1 est probablement un jeune homme décédé entre 21 et 28 ans. Le squelette issu de l'inhumation du tumulus 2 est celui d'un adolescent entre 16 et 20 ans. La taille moyenne des hommes est de 1,68 m et celle des femmes de 1,53 m. Un seul individu issu du site de Hunzgrund présente des traces de violence. De manière générale les restes humains présentent des traces de maladie articulaire, de petites inflammations, de maladies dentaires et de fractures des os. Un individu présente un exemple de fracture de la 7ème vertèbre cervicale spécifique d'une activité de pelletage. Un enfant a souffert de déficience en vitamine C.

13 individus du site de Klause II et les deux inhumations dans le fossé proche du tumulus 1 ont été sélectionnés pour des tests ADN. 10 résultats mitochondriaux ont été obtenus sur ces 15 échantillons. Les régions HVR1 et HVR2 ont été séquencées, et 22 SNPs ont été testés dans la région codante. 3 individus sont de l'haplogroupe H, 3 sont de l'haplogroupe K, 1 est HV, 1 est V, 1 est I et 1 est U5. Ces haplogroupes sont typiques d'Europe Centrale. Deux squelettes partagent le même haplotype K et pourrait être reliés maternellement: un est situé dans le fossé du tumulus 1 et l'autre sur le site de Klause II. Les tests du chromosome Y n'ont pas permis d'obtenir de résultat valide.

La diversité des sols géologiques autour du Glauberg est reflétée par les différents taux isotopiques du strontium. Les feuillages issus de la zone basaltique conduisent au taux minimal. Ensuite vient ceux issus de la zone Rotliegendes, puis de la zone de loess. Finalement les plantes issus de la zone Buntsandstein donnent les taux les plus élevés. Les coquilles d'escargots et les végétaux issus des pentes du Glauberg donnent des valeurs diverses qui sont le résultat d'un mélange entre les diverses zones précédemment décrites. Les os fauniques et les coquilles d'escargots du site de Klause II donnent des valeurs comprises entre 0,7090 et 0,7095. Les os humains du même site sont compris entre 0.70941 et 0.71008. Les coquilles d'escargots du site d'Hunzgrund ont une valeur plus faible de 0.70840. L'émail d'un putois d'Hunzgrund donne la valeur la plus faible: 0.70682, probablement déterminée par une contribution importante des zones volcaniques:
2014 Knipper Figure 4

L'émail issus des dents fauniques conduit à des valeurs diverses probablement le fruit des différentes régions entourant le Glauberg. L'émail issu des dents humaines montre des valeurs isotopiques du strontium plus variées que celles issus des dents d'animaux, allant de 0.70763 à 0.71384. 8 individus ont des valeurs supérieures à celles issus des restes fauniques. 8 autres individus ont des valeurs comparables à celles issus des restes végétaux et des coquilles d'escargots relevés autour du Glauberg. Les valeurs mesurées sur l'émail du prince du Glauberg sont de 0.71279 sur une première molaire et de 0.71179 sur une troisième molaire. Ces valeurs sont supérieurs à celles issus des restes fauniques.

Les valeurs isotopiques de l'oxygène issus des dents humaines (2de et 3ème molaires) sont comprises entre 15,1 et 17,1‰:
2014 Knipper Figure 5

Un premier groupe comprend 3 hommes, 2 femmes et le prince avec des valeurs entre 16,9 et 17,1‰. Un second groupe comprend 1 homme, 4 femmes, 1 enfant et 1 nourrisson avec des valeurs comprises entre 16,1 et 16,5‰. Enfin 2 hommes ont des valeurs faibles de 15,1 et 15,5‰. Ces 2 derniers individus sont probablement d'origine étrangère au site du Glauberg, alors que les autres individus peuvent être d'origine locale.

Les mesures isotopiques du carbone pour la faune varie de -23,4‰ pour le cerf à -20,8‰ pour le cochon. Les mesures isotopiques de l'azote pour la faune varie de 4,5‰ pour le cochon à 7,9‰ pour les chèvres et moutons. Les herbivores ont des valeurs isotopiques du carbone plus faible que celles des omnivores, alors qu'ils ont les mêmes valeurs isotopiques de l'azote. Les valeurs isotopiques du carbone pour les humains varient de -20 à -14,9‰. Les valeurs isotopiques de l'azote pour les humains varient de 7,4 à 14‰:
2014 Knipper Figure 6

Il y a peu de différence entre les hommes et les femmes. Les valeurs obtenues pour le prince du Glauberg tombent en dehors des valeurs pour les autres humains du fait de la haute valeur isotopique de l'azote (10,8‰) et de la faible valeur isotopique du carbone (-19,8‰). De fortes valeurs isotopiques de l'azote sont également trouvés pour les enfants élevés au sein maternel.

La différence de valeurs obtenues entre les animaux et les humains pour les mesures isotopiques du carbone, s'expliquent par la consommation d'un aliment spécifique pour ces derniers. Cet aliment pour être le millet que l'on retrouve fréquemment dans les restes archéologiques de la région du Glauberg ou d'autres sites de l'âge du fer. La consommation du millet devait être réservée aux humains. Les hautes valeurs isotopiques de l'azote chez les humains s'expliquent par la consommation de viande et de produits laitiers. Il est à noter que le prince du Glauberg possède la plus haute valeur isotopique de l'azote chez les adultes. Ceci est probablement caractéristique d'une nourriture spécifique chez les élites qui est riche en viande et en produits laitiers, et plus pauvre en millet.

mardi, juin 17 2014

Génétique des Mexicains

Andrés Moreno-Estrada vient de publier un papier intitulé: The genetics of Mexico recapitulates Native American substructure and affects biomedical traits. Les Natifs Américains possèdent la plus faible diversité génétique parmi tous les groupes continentaux, bien qu'il y ait de fortes divergences d'un groupe à un autre. En conséquence, ces populations abritent des allèles rares pouvant cibler des maladies génétiques. Dans cette étude, les auteurs ont analysé environ 1 millions de SNPs autosomaux dans 511 individus Natifs Américains issus de 20 populations indigènes, couvrant la plupart des régions du Mexique. Ces données ont été comparées à des échantillons africains et européens.

Une Analyse en Composantes Principales a été réalisée. Les deux premières composantes séparent les populations Africaines et Européennes des populations Natives Américaines. La troisième composante permet cependant de séparer les différentes populations Natives Américaines. Ces dernières suivent un clair gradient géographique du nord-ouest vers le sud-est:
2014 Moreno-Estrada Figure 1a

Les groupes Seri et Lacandon montrent les plus hauts niveaux de différentiation inter-populations. Ces niveaux sont supérieurs aux différences entre européens et chinois. Ces fortes différences impliquent un haut degré d'isolation de ces populations. Certains groupes comme les Seri, les Huichol ou les Lacandon possèdent de longs segments d'homozygotie. D'autres groupes comme les Mayas ou les Nahuan ont un taux plus faible d'homozygotie. Ils sont les descendants d’importantes civilisations pré-colombiennes qui étaient moins isolées que d'autres groupes Natifs Américains. Ces derniers sont caractérisés par une taille de la population faible qui a subi un effet de goulot génétique.

L'isolation est aussi corrélée au degré de parenté à l'intérieur et entre les groupes ethniques. Un graphe de parenté entre les populations a ainsi été tracé en fonction des segments IBD supérieurs à 13 cm:
2014 Moreno-Estrada Figure 1c

La plupart des parentés sont ainsi à l'intérieur des groupes ethniques. Les quelques connexions entre les différents groupes apparaissent le long des côtes.

Ensuite un arbre a été tracé afin de visualiser les liens de parentés d'un groupe à l'autre:
2014 Moreno-Estrada Figure 1d

On retrouve ainsi dans cet arbre les différentiations sud-nord et est-ouest. Les populations avec haut degré d'homozygotie ont une branche plus longue. Les regroupements suivent un schéma géographique. Les groupes du nord sont en bleu foncé, les groupes du sud sont en vert et les groupes Maya sont en orange.

Ces signaux sont les héritiers d'une diversité pré-colombienne des populations Natives Américaines. Cependant, ces 500 dernières années, les choses ont beaucoup évolué. La plupart des Mexicains contemporains sont des métis qui ont des origines Natives Américaines, Européennes et Africaines. Pour étudier ce phénomène, les auteurs ont analysés des échantillons issus de 500 individus appartenant à 12 groupes métis. Ils ont utilisé pour cela le logiciel ADMIXTURE pour estimer les proportions d'ascendance dans chaque individu. Lorsque le paramètre K=3, on retrouve les 3 ascendances principales: Natives Américaine, Européenne et Africaine. Cette dernière est cependant très faible, toujours inférieure à 5%. Le meilleur modèle correspond à une valeur de K=9:
2014 Moreno-Estrada Figure 2b

Les groupes Natifs Américains se divisent alors en 6 composantes différentes. Trois d'entre elles correspondent à des groupes ethniques isolés: les Seri en bleu marine, les Lacandon en jaune et les Tojolabal en marron. Les trois autres composantes sont plus largement distribuées: une composante du nord en bleu clair, une composante du sud en bleu et une composante Maya en orange. Cette composante Maya est également présente avec une proportion qui varie de 10 à 20% dans le centre du Mexique. Cette relation entre Mayas et populations du centre du Mexique est probablement ancienne.
2014 Moreno-Estrada Figure 2c

La répartition des composantes Natives Américaines se retrouvent chez les métis. Les Sonora et populations du nord du Mexique ont la plus grande proportion de la composante Native Américaine du nord. Inversement les populations métis du sud du Mexique ont la plus grande proportion de la composante Native Américaine du sud. Enfin, les populations de la péninsule du Yucatán ont la plus grande proportion de la composante Maya. Il y a donc une très forte corrélation entre génétique et géographie qui se retrouve également chez les populations métis.

lundi, juin 16 2014

Retour vers l'Afrique

Jason A. Hodgson vient de publier un papier intéressant: Early Back-to-Africa Migration into the Horn of Africa.

Le plus important événement démographique de l'espèce humaine moderne est sa sortie d'Afrique et ses migrations sur Terre. A la suite de cette sortie, les échanges démographiques entre l'Afrique sub-saharienne et le reste du globe sont rares. Les populations de la corne de l'Afrique (Ethiopie, Érythrée, Djibouti, et Somalie) ont une ascendance non Africaine qui n'est pas négligeable. Les précédentes études génétiques ont montré que certaines de ces populations parlant une langue couchitique ou sémitique, ont entre 30 et 50% d'ascendance non Africaine datant principalement d'environ 3000 ans. Cette date correspond environ à l'origine des langues Ethiosémitiques et à des restes archéologiques datant du premier millénaire av. JC. Cependant des recherches archéologiques plus récentes ont montré que les influences non Africaines dans la corne de l'Afrique étaient limitées et transitoires, et ne pouvaient expliquer de larges mouvements de population. Les analyses de l'ADN mitochondrial et du chromosome Y suggèrent des migrations non Africaines dans la corne de l'Afrique plus anciennes. L'haplogroupe mitochondrial M1 indique un retour vers l'Afrique il y a 20 ou 30.000 ans, les haplogroupes mitochondriaux N1a et N2a supposent des migrations datées entre 15 et 20.000 ans, et certaines branches des haplogroupes mitochondriaux HV1 et R0a suggèrent des mouvements de populations entre la péninsule arabique et la corne de l'Afrique entre 6 et 10.000 ans. Les tests du chromosome Y suggèrent au moins 2 migrations vers la corne de l'Afrique: l'expansion de l'haplogroupe E-M78 est arrivé dans la corne de l'Afrique il y a environ 6.000 ans en provenance d'Afrique du Nord accompagné de flux non Africains. L'haplogroupe T est originaire du Levant il y a environ 21.000 ans. Sa sous-clade T-M70 est arrivée en Afrique du nord-est il y a 14.000 ans et dans la corne de l'Afrique il y a 5.000 ans.

Afin de mieux étudier cet écart entre les données archéologiques et les données génétiques, les auteurs de ce papier ont analysé l'ADN autosomal de 61 échantillons originaires du Yémen. Ces données ont été comparées à des données génétiques préalablement obtenues dans la corne de l'Afrique, le Moyen Orient, l'Afrique du Nord, le Qatar, l'Afrique du Sud, l'Afrique de l'Ouest, le projet HapMap3, et le projet Human Genome Diversity. Le total des échantillons représentent 2194 individus appartenant à 81 populations, analysés sur 16.766 SNPs autosomaux.

Une analyse en Positionnement Multidimensionnel a été réalisée. La première dimension sépare les les Africains sub-sahariens des non Africains:
2014 Hodgson Figure 1a

Ensuite, les auteurs ont effectué un zoom sur les populations de la corne de l'Afrique uniquement:
2014 Hodgson Figure 1b

Les différents regroupements des échantillons sur ce graphe correspondent à des groupes linguistiques: les Gumuz parlent une langue Nilotique, les Ari et Wolayta parlent une langue Omotique, et les autres groupes parlent des langues Couchitiques ou Sémitiques. La dispersion de ces groupes entre les Africains sub-sahariens et les non Africains suggèrent différents mélanges génétiques entre des Africains et des non Africains.

Afin de mieux comprendre la structure génétique de ces populations, les auteurs ont utilisé le modèle implémenté dans le logiciel ADMIXTURE pour des valeurs de K comprises entre 2 et 20. Le modèle est optimal pour une valeur de K=12, avec cependant peu de différences pour une valeur de K comprise entre 9 et 14. Si on se focalise sur les valeurs de K de 10, 11 et 12 ont voit des choses particulièrement intéressantes:
2014 Hodgson Figure 2a

  • Il y a 4 composantes dominantes dans les populations sub-sahariennes: une est à hautes fréquences chez les pygmées Mbuti et Biaka en rose, une à hautes fréquences chez les Khoesan d'Afrique du sud en violet clair, une à hautes fréquences chez les populations parlant le Niger-Congo en bleu foncé, et une à hautes fréquences chez les populations parlant le Nilo-Saharien en bleu clair.
  • Il y a 5 composantes dominantes dans les populations eurasiennes: une est à hautes fréquences en Asie Centrale et du Sud en rouge, une à hautes fréquences chez les européens en orange clair, une à hautes fréquences en Europe du Sud, au Moyen-Orient et en Asie Centrale en orange foncé, une à hautes fréquences dans la péninsule arabique en marron, et une à hautes fréquences en Asie Centrale en gris.
  • Une dixième composante est colorée en vert clair et est à hautes fréquences en Afrique du Nord.

Entre les valeurs de K de 10 à 12, les changements interviennent dans les populations de la corne de l'Afrique. Pour une valeur de K=10, la corne de l'Afrique est dominée par la composante Nilo-Saharienne. A K=11, une nouvelle composante colorée en violet foncé apparait, appelée Ethiopique. Cette composante est maximale dans le groupe des populations Ari et Wolayta parlant un langage Omotique. Pour une valeur de K=12, une nouvelle composante apparait colorée en vert foncé, appelée Ethio-Somalienne. Cette composante est maximale dans les populations Somaliennes parlant un langage Couchitique, mais est également importante dans toutes les populations parlant un langage Couchitique ou Sémitique:
2014 Hodgson Figure 2c

Des tests supplémentaires de statistique f3, de statistique D et de tests LD pondérés montrent que 8 populations de la corne de l'Afrique (Afar, Amhara, Ari Cultivator, Oromo, Ethiopian Somali, Somali, Tygray, et Wolayta) présentent un mélange génétique significatif avec des populations non Africaines. Ces résultats suggèrent les hypothèses suivantes:

  • l'ascendance des populations de la corne de l'Afrique est proche de celle des populations Nilo-Sahariennes
  • il y a une ascendance africaine distincte présente dans les populations de la corne de l'Afrique: la composante Ethiopique
  • les populations de la corne de l'Afrique ont une ascendance non Africaine proche des populations de la péninsule arabique et une autre proche des populations du Maghreb
  • il y a une ascendance non africaine spécifique dans les populations de la corne de l'Afrique: la composante Ethio-Somalienne.

L'estimation de la date des mélanges génétiques a été fait avec les méthodes ROLLOFF et ALDER. Les valeurs obtenues sont situées entre 2000 et 3000 ans. Cependant, si dans la réalité plusieurs épisodes de mélanges génétiques ont eu lieu, ces méthodes estiment seulement l'épisode le plus récent. Or l'analyse avec le logiciel ADMIXTURE, montre que la composante Ethiopique se retrouve à hautes fréquences dans toutes les populations de la corne de l'Afrique. Elle doit probablement être la plus ancienne. Ensuite la composante Nilo-Saharienne se retrouve dans toutes les populations sauf les Ari Blacksmiths. Enfin la composante Ethio-Somalienne se retrouve dans toutes les populations parlant un langage Couchitique, Sémitique, ou Omotique. Les composantes Arabes, Eurasienne et Niger-Congo sont respectivement de moins en moins largement distribués parmi les populations de la corne de l'Afrique.

Les dates de divergence entre les différentes composantes ont été estimées. Ainsi la composante Ethio-Somalienne est estimée avoir divergé avec les autres composantes il y a environ 23.000 ans. Cette composante ne contient pas l'allèle de tolérance au lactose incluse dans la composante Arabe et qui a émergé il y a environ 4000 ans. Le mélange génétique correspondant à la composante Ethio-Somalienne correspond donc à l'arrivée d'une population non Africaine dans la corne de l'Afrique à une date située entre 23.000 et 4.000 ans. Elle a été suivie par l'arrivée d'une autre population non Africaine en provenance de la péninsule arabique apportant la tolérance au lactose et les langages sémitiques il y a environ 3000 ans.

L'agriculture est arrivée dans la corne de l'Afrique il y a au moins 7000 ans. La population devait être déjà élevée à cette époque. Pour que l'influence de la migration Ethio-Somalienne soit suffisamment importante, on suppose qu'elle est arrivée à une date correspondant à une population de faible importance et donc située avant le néolithique. Les données paléo-climatiques indiquent que cette migration a du arriver soit avant le Dernier Maximum Glaciaire situé il y a environ 21.500 ans, soit entre le Dernier Maximum Glaciaire et le Dryas récent situé il y a environ 12.000 ans.

La composante Maghrébine dans la population d'Afrique du Nord correspond également à une migration correspondant à un retour en Afrique d'une population ouest asiatique. Une unique migration préhistorique conduisant à l'arrivée de la composante Maghrébine en Afrique du Nord et à l'arrivée de la composante Ethio-Somalienne dans la corne de l'Afrique est la solution la plus parcimonieuse. Les lignages mitochondriaux M1 et U6 pourraient correspondre à cette migration. U6 est situé principalement au Maghreb et M1 dans la corne de l'Afrique. Cependant, récemment une étude a montré que ces deux haplogroupes ont suivi une histoire différente, la migration U6 étant antérieur d'environ 10.000 ans à la migration M1.

En résumé, la majorité de l'ascendance non Africaine des populations de la corne de l'Afrique vient d'une composante Ethio-Somalienne qui se retrouve principalement dans les populations parlant une langue Couchitique ou Sémitique. Cette arrivée est datée du paléolithique et pourrait correspondre à l'arrivée des langues Afro-Asiatiques. Une migration plus récente datée d’environ 3000 ans expliquerait l'arrivée des langages Ethiosémitiques dans la corne de l'Afrique.

mardi, juin 10 2014

Mélange génétique dans l'Altaï à l'Âge du Bronze Moyen

Voici un papier publié par Clémence Hollard à propos de tests d'ADN ancien sur des squelettes de l'Âge du Bronze Moyen dans l'Altaï: Strong genetic admixture in the Altai at the Middle Bronze Age revealed by uniparental and ancestry informative markers.

Les steppes eurasiennes s'étendent de la Moldavie à la Sibérie jusqu'au lac Baïkal, via l'Ukraine, connectant ainsi l'Europe, l'Asie Centrale, la Chine, l'Asie du sud et le Moyen Orient. Elles ont été le témoin de nombreux mouvements de population à différentes périodes. Les preuves archéologiques suggèrent que des populations se sont diffusées de l'ouest vers l'est durant l'âge du cuivre et l'âge du bronze. Plus tard au Moyen Âge, des turcs puis des mongols se sont dispersés de l'est vers l'ouest au même endroit. Ces différents mouvements expliquent pourquoi les populations actuelles de ces régions présentent des caractères génétiques orientaux et occidentaux. Des tests génétiques sur des squelettes anciens peuvent donner des résultats intéressants au sujet du peuplement de ces régions.

Dans sa partie orientale la steppe eurasienne est bordée par les montagnes de l'Altaï longues de 2000 km et culminant entre 3000 et 4000 m. Dans cette étude, les auteurs ont travaillé sur deux nécropoles de la partie mongole de ces montagnes: Tsagaan Asga à la frontière chinoise et Takhilgat Uzuur à la frontière sibérienne:
2014 Hollard Figure 1a

Ces sites sont datés de l'Âge du Bronze Moyen et les tombes sont des Kourganes. Des tests uni-parentaux (ADN mitochondrial et ADN du chromosome Y) ont été réalisés sur les restes humains. Des marqueurs autosomaux ont également été analysés pour déterminer le sexe des individus et leurs éventuelles relations familiales, ainsi que pour déterminer certains traits physiques. En tout 14 squelettes ont été étudiés, 7 dans chacune des nécropoles. Les fouilles archéologiques datent de 2011.

15 marqueurs STRs autosomaux ont été analysés pour déterminer le sexe. 9 individus sont des hommes, 2 sont des femmes et les 3 derniers n'ont pas été déterminés.

La région HVR1 de l'ADN mitochondriale a été testée, ainsi que 13 SNPs de la région codante. Le résultat a été obtenu pour 12 individus. Tous les haplotypes sont différents. Les SNPs de la région codante ont pu être déterminés pour 10 individus sur 12. Les résultats indiquent 6 haplogroupes différents: 4 individus ont des haplogroupes occidentaux: U, T et H, et 6 individus des haplogroupes orientaux: A, C et D.

2014 Hollard Table 1

Les 9 individus masculins ont été testés sur 17 marqueurs STRs du chromosome Y. Puis deux ensembles de SNPs ont été testés: 13 pour caractériser l'haplogroupe R et ses sous-clades (M207, M173, M420, M516, M17, M458, M434, Z280, Z93, M343, P297, M73 et M269), et 14 pour caractériser les principaux haplogroupes asiatiques (M214, M175, M231, Tat, M128, P43, M242, M346, L54, M3, M120, M130, M217 et M174):
2014 Hollard Figure 2

Les résultats ont abouti sur tous les individus et 6 haplotypes différents ont été obtenus. Ils appartiennent à 4 haplogroupes différents: R1a-Z93, Q1a-L54, Q-M242 et C-M130.

24 SNPs autosomaux ont été testés pour prédire la couleur des cheveux et des yeux. 9 individus ont les yeux marrons et seulement un a les yeux bleus. La couleur des cheveux est plus délicate à obtenir car elle implique un plus grand nombre de SNPs. 1 individu a les cheveux blond foncé, 1 a les cheveux châtain, 3 ont les cheveux bruns et 5 ont les cheveux noirs.

5 SNPs autosomaux ont été testés pour déterminer l'ascendance des individus. 3 d'entre eux ont une ascendance mixte avec des composantes européennes et asiatiques. Les autres individus ont, en majorité, une ascendance européenne.

Discussion

Il y a beaucoup plus d'hommes enterrés dans ces kourganes que de femmes. Ceci est probablement dû aux pratiques culturelles et sociales de ces anciennes sociétés. Sur le site de Tsagaan Asga, deux lignages masculins sont partagés chacun par 2 hommes (TA11/TA12 et TA4/TA10). Cela suggère que 2 fois 2 hommes reliés paternellement ont été enterrés dans le même kourgane. Cependant la diversité génétique indique qu'un seul kourgane n'était pas dédié à une seule famille à travers les âges. La très forte diversité mitochondriale renforce ce résultat. De plus un individu de Tsagaan Asga partage l'haplotype d'un individu de Takhilgat Uzuur, tous les deux de l'haplogroupe R1a, suggérant qu'une même famille pouvait être distribuée sur plusieurs sites.

Parmi les haplotypes mitochondriaux occidentaux, 3 ont déjà été observés sur des squelettes de l'Âge du Bronze au Kazakhstan et en Sibérie du sud, indiquant un flux de gène occidental dans cette région qui se superpose au pool génétique oriental. Les données issues du chromosome Y suggère un résultat analogue. L'haplogroupe Q est très fréquent dans le sud de la Sibérie. C'est également cet haplogroupe qui est le plus fréquent parmi les populations Natives Américaines. L'haplogroupe Q représente donc probablement un vieil haplogroupe de cette région présent bien avant l'Âge du Bronze. L'haplogroupe R1a-Z93 a été trouvé également en Sibérie du Sud et dans le Bassin du Tarim. Son origine et sa dispersion reste controversée à cause de sa très large distribution en Eurasie. Cependant, la distribution des haplotypes STRs suggère un lien avec l'Europe Centrale et de l'Est, le Proche-Orient et l'Asie du Sud. L'haplogroupe R1a se divise en deux sous-clades: l'une R1a-Z280 est européenne et l'autre R1a-Z93 est asiatique avec un recouvrement des deux groupes en Asie Centrale. Dans ce contexte l'origine de l'haplogroupe R1a pourrait se situer entre l'Asie du Sud et l'Europe de l'Est (Steppes eurasiennes ou Moyen-Orient). Ainsi la présence de l'haplogroupe R1a en Sibérie du sud à l'Âge du Bronze suggère un mouvement de population de l'ouest vers l'est.

Les traits physiques déterminés montrent que 2 individus avaient les cheveux clairs dont 1 avec les yeux bleus. Cela suggère un phénotype européen. Les autres ont les cheveux et les yeux foncés. Cependant l'étude de l'ascendance montre que la majorité des individus ont une ascendance occidentale. Cependant le nombre de SNPs autosomaux étudiés étaient trop faible pour obtenir un résultat précis.

Un seul individu est plus ancien et date de l'Âge du cuivre appartenant probablement à la culture Afanasievo. Un seul échantillon est trop faible pour conclure sur cette culture archéologique et une prochaine étude sur ce sujet sera nécessaire dans le futur.

En conclusion, on peut dire qu'un pool génétique occidental s'est mêlé à l'Âge du Bronze à un pool génétique oriental déjà présent dans la région, suite à une migration de l'Ouest vers l'Est.

dimanche, juin 8 2014

ADN ancien des premiers fermiers du Proche-Orient

Eva Fernández vient de publier un article intitulé: Ancient DNA Analysis of 8000 B.C. Near Eastern Farmers Supports an Early Neolithic Pioneer Maritime Colonization of Mainland Europe through Cyprus and the Aegean Islands concernant des test d'ADN ancien sur des squelettes de la civilisation néolithique PPNB datés entre 8.700 et 6.600 av. JC.

Le néolithique a émergé au Proche-Orient il y a 12.000 à 10.000 ans dans une région appelée le croissant fertile. Puis il s'est propagé en Anatolie et en Europe en moins de 3.000 ans en suivant 2 routes principales: la route Danubienne qui a donné naissance à la culture rubanée (LBK) en Europe Centrale et la route maritime le long des côtes méditerranéennes qui a donné naissance à la culture cardiale. Deux modèles de diffusion s'opposent: le modèle migratoire qui implique l'arrivée de populations du Proche-Orient en Europe et le modèle culturel qui implique une continuité génétique en Europe depuis le paléolithique. La mauvaise identification des haplogroupes associés à la diffusion néolithique et l'effet d'expansions post néolithiques dans la composition génétique européenne ont introduit un biais important dans la compréhension de ce phénomène. Cependant, dernièrement les différents tests d'ADN sur des squelettes anciens ont permis de lever partiellement ce voile. Ainsi en Europe Centrale et en Europe du Nord un modèle migratoire a été proposé pour expliquer la discontinuité génétique observée entre les squelettes du paléolithique et ceux du néolithique. Dans le sud de l'Europe, des résultats contradictoires ont été obtenus. D'un côté l'ADN mitochondrial sur des squelettes de la culture cardiale semble indiquer l'arrivée de migrants en provenance du Proche-Orient, d'un autre côté, les résultats obtenus sur des squelettes du milieu et de la fin du néolithique semble indiquer un héritage paléolithique. De plus les résultats d'ADN du chromosome Y obtenus sur des squelettes du milieu et de la fin du néolithique semble indiquer l'arrivée de migrants en provenance du Proche-Orient pointant ainsi une différence d'interprétation en fonction de la lignée masculine ou féminine envisagée. Dans ce contexte, la connaissance du pool génétique des premiers fermiers du Proche-Orient est importante afin d'identifier les haplogroupes associés à la culture néolithique.

Dans cette étude les auteurs ont étudié des squelettes appartenant à 3 sites archéologiques localisés en Syrie dans la vallée du Moyen Euphrate et dans l'oasis de Damas:
2014 Fernandez Figure 1

Ces sites sont datés de la période pré-poterie: PPNB entre 8.700 et 6.600 av. JC. Un total de 63 squelettes appartenant aux 3 sites de Tell Halula, Tell Ramad et Dja’de El Mughara ont été testés. Cependant seuls 15 résultats sur l'ADN mitochondrial ont été obtenus. La région HVR1 a été séquencée et quelques SNPs de la région codante ont été également testés afin de déterminer les haplogroupes:
2014 Fernandez Table 1

Neuf haplotypes différents sont identifiés. Deux sont partagés entre 2 individus de Tell Halula (16311C) et entre 3 individus de Tell Ramad (16224C, 16311C 16366T). Un haplotype est partagé entre 3 individus de Tell Halula et de Tell Ramad (16293C). Ces haplotypes ont ensuite été comparés avec une base de données de 9.821 résultats issus de 59 populations contemporaines du Proche-Orient et de l'Europe du sud-est et avec 2 populations anciennes du début du néolithique en Europe Centrale et dans le nord-est de la péninsule ibérique. La figure ci-dessous représente le pourcentage d'haplotpes présents dans la population PPNB pour chacune de ces populations:
2014 Fernandez Figure 2

Deux des haplotypes de la population PPNB ne se retrouvent pas dans les populations contemporaines ou néolithiques d'Europe: 16356C et 16293C. Parmi les autres haplotypes, un seul (16224C 16311C) se retrouve dans les 2 populations néolithiques d'Europe dans les proportions de 9,5% de la population cardiale et 23% de la population rubanée. Cet haplotype se retrouve aujourd'hui dans le sud-est de l'Europe et le Proche-Orient à une fréquence moyenne de 4%. Cependant des populations comme les juifs Ashkénazes, les Csángó de Moldavie et la population de Chypre, ont une fréquence de cet haplotype supérieurs à 10%. Les autres haplotypes de la population PPNB sont très rares aujourd'hui.

L'haplogroupe K est le plus fréquent dans la population PPNB avec une valeur de 40%. Les autres haplogroupes sont R0 (20%), H (13,3%), HV, N*, U* et L3 (6,7% chacun). L'haplogroupe K se retrouve dans toutes les populations modernes avec une valeur moyenne de 7% environ. Ses plus hautes fréquences se retrouvent chez les juifs Ashkénazes, les Csángó de Moldavie et la population de Chypre. On le retrouve également dans les populations néolithiques cardiales (15,6%) et rubanée (23,1%). L'haplogroupe R0 se retrouve aujourd'hui dans les populations du Proche-Orient et d'Afrique du Nord, avec un maximum dans le sud de la péninsule arabique. L' haplogroupe rare U* se retrouve à 2% dans le Proche-Orient, 0,9% dans le Caucase et 1% en Europe. De même N* se retrouve à moins de 1% dans toutes les populations. On a cependant un pic de fréquence de U* en Crète. De plus N* se retrouve à haute fréquence dans une population néolithique de Catalogne.

Une Analyse en Composantes Principales a été utilisée pour comparer les fréquences des haplogroupes pour les différentes populations:
2014 Fernandez Figure 3

Six groupes ont été définis. Les deux plus gros sont les groupes 1 et 3. Le groupe 1 inclut les populations européennes qui se distinguent par les hautes fréquences des haplogroupes H, U5, U4 et HV0. Le groupe 3 inclut les populations du Proche-Orient et du Caucase qui se distinguent par les hautes fréquences des haplogroupes J et T. De manière intéressante la population néolithique rubanée est aussi incluse dans ce groupe. Le groupe 2 comprend la population PPNB étudiée dans cette étude ainsi que les juifs Ashkénazes, les Csángó de Moldavie, la population de Chypre et la population néolithique cardiale. Il se distingue par les hautes fréquences des haplogroupes K et N*. Le groupe 4 inclut les populations africaines et se distingue par les hautes fréquences des haplogroupes L et U6. Les groupes 5 et 6 comprennent les populations asiatiques.

La première composante représente 48,3% de la variance et sépare les populations asiatiques. La seconde composante représente 19,8% de la variance et sépare les populations africaines. La population PPNB incluse dans le groupe 2 se retrouve à égale distance du centre des groupes 2 et 3. Elle est proche des populations du croissant fertile. Le rapprochement de la population PPNB avec le groupe 3 est dû principalement aux hautes fréquences de l'haplogroupe R0.

Les auteurs ont également calculé la distance génétique entre la population PPNB et les autres populations. Cette distance n'est pas significative avec la population de Chypre, les juifs Ashkénazes, les Csángó de Moldavie et les Ouzbeks Khoremian d'Asie Centrale. La carte ci-dessous représente cette distance génétique:
2014 Fernandez Figure 4
La distance est minimale pour le croissant fertile, et Chypre. Elle est faible également dans le bassin des Carpates, le Yémen et le nord de l’Ouzbékistan.

Discussion

Des résultats d'ADN ancien issus de squelettes du néolithique du Proche-Orient, sont montrés pour la première fois dans cette étude. Même si ces résultats montrent que l'ADN mitochondrial des fermiers du néolithique est proche de celui des populations modernes du Proche-Orient, des différences dans les fréquences des haplotypes et des haplogroupes persistent. Il n'est donc pas possible d'estimer génétiquement, de manière précise, la population des premiers fermiers néolithiques par la population proche orientale contemporaine. Tous les haplotypes détectés, sauf un, ont une distribution nulle ou faible dans les populations modernes. Cela suggère qu'un grand nombre des lignages néolithiques n'a pas survécu jusqu’à aujourd'hui ou a été remplacé par des migrations postérieures. Ceci est en accord avec d'autres études précédentes. Cependant les résultats obtenus dans cette étude suggèrent que des lignages néolithiques ont survécu dans certaines populations isolées comme les Druzes. Un autre cas intéressant concerne les juifs Ashkénazes qui montrent une fréquence de l'haplogroupe K comparable à la population PPNB. Cela suggère pour cette population une origine Proche Orientale, en contradiction avec une étude récente (Costa et al., 2013).

La population PPNB étudiée possède un fort pourcentage de lignages dont le temps de coalescence est ancien et date du paléolithique: K, R0 et U*. Elle diffère de la population moderne du Proche-Orient dont les haplogroupes principaux sont J, T1 et U3. Ces derniers ont été traditionnellement liés à la diffusion du néolithique. Or l'haplogroupe T1 est absent de toutes les populations anciennes du néolithique et U3 a été déterminé dans un seul échantillon de la population rubanée d'Europe Centrale. L'haplogroupe J est présent dans la population rubanée d'Europe Centrale à une fréquence de 12%, mais aussi dans un échantillon chasseur-cueilleur tardif (3000 av. JC). Il est également présent à basse fréquence dans la population cardiale. Son absence dans la population PPNB jette un doute sur son origine. Ces résultats suggèrent que des mouvements démographiques de la fin du néolithique ou post néolithiques sont responsables de la répartition géographiques actuelles de ces haplogroupes.

Cette étude montre également que la population PPNB est à l'origine des populations néolithiques européennes. Ainsi les haplogroupes K et N* sont probablement des contributeurs génétiques néolithiques. En effet l'haplogroupe K est présent dans toutes les populations néolithiques avec une fréquence variant de 8 à 43%, et N* est présent dans les populations cardiales et épi-cardiales du nord-est de la péninsule ibérique. L'haplogroupe N1a représente 13% de la population rubanée, mais n'est cependant pas présent dans la population PPNB.

La proximité des populations PPNB et de Chypre et de Crète montre que la route de la première expansion néolithique vers l'Europe a été maritime, via Chypre et les îles de la Mer Égée.

vendredi, juin 6 2014

Amélioration de la phylogénie de l'haplogroupe du chromosome Y: K-M526 et sa rapide expansion en Asie du sud-est

Voici un papier intéressant publié par Tatiana Karafet: Improved phylogenetic resolution and rapid diversification of Y-chromosome haplogroup K-M526 in Southeast Asia. La mutation M168 du chromosome Y définit un lignage conduisant au groupe majeur CT qui contient presque tous les individus non africains, et a donc été proposé pour représenter une première expansion des hommes modernes hors d'Afrique. La diversification de cette clade a produit de nombreuses branches dont une est définie par la mutation M9 (haplogroupe K). Cette dernière se ramifie ensuite en de nombreuses sous-clades que l'on retrouve un peu partout en Eurasie, Océanie et Amérique. Il a été proposé que cette mutation M9 a émergé au Moyen-Orient peu après la sortie d'Afrique. Jusqu'ici la structure de l'haplogroupe K n'était pas bien connue. La découverte des mutations M526 et P326 sépare cette clade en deux groupes, l'un contenant les haplogroupes L et T, l'autre plusieurs lignages K, ainsi que les haplogroupes M, NO, P et S:
2014 Karafet Figure 1a

Les auteurs de ce papier ont découvert 13 nouveaux SNPs qui améliorent beaucoup la phylogénie de l'haplogroupe K, et jettent de la lumière sur l'origine géographique de l'haplogroupe P. Un ensemble de 4413 échantillons appartenant à l'haplogroupe K-M526 ont été testés. Ces nouvelles mutations sont: P315, P336, P378, P401, P402, P403, P304, P307, P308, P331, P397, P399 et P405:
2014 Karafet Figure 1b

La mutation P331 contient presque tous les échantillons qui ne sont pas de l'haplogroupe NO, à l'exception de la mutation P261 observée à Bali, P402/P403 observées à Java, et quelques M526* observés à Sumatra et Sulawesi. Le rare haplogroupe M147 détecté chez 2 individus d'Asie du sud, n'a pas été observé dans cette étude. Le groupe P331 se divise en 2 sous-clades: P397/P399 (haplogroupe K2b1) et P295 (haplogroup P ou K2b2). Ces deux sous-clades ont des distributions géographiques très différentes. L'haplogroupe P (avec ses clades sœurs Q et R) est le plus fréquent en Europe, en Amérique et en Asie du Centre et de l'Est. L'haplogroupe K2b1 est lui restreint à l'est de l'Indonésie, l'Océanie, l'Australie et les Philippines:
2014 Karafet Figure 2

A l'intérieur de K2b1, les auteurs ont découvert une nouvelle sous-clade P405 qui regroupe les lignages: K-P60, K-P79, S-M230, K-P315 et K-P401. Il y a également dans K2b1 l'haplogroupe M-P256, et les lignages K-P336 et K-P378. Ceux-ci sont principalement distribués dans les îles de l'Asie du sud-est et en Océanie. A l'intérieur de l'haplogroupe P, le groupe P* est observé dans les îles de l'Asie du sud-est (Timor, Sumba, Sulawesi) et chez les Negrito des Philippines.

Les auteurs ont également estimé le temps entre l'émergence des mutations M9 et P331 à une valeur inférieure à 3000 ans, le temps entre les mutations M9 et P295 à une valeur inférieure à 5000 ans, et le temps entre les mutations P295 et P27 à environ 12.300 ans.

Discussion

La rapide diversification de l'haplogroupe K-M526 représente une reprise de la croissance démographique après un effet de goulot durant lequel la population a stagné. En général, si tous les lignages descendants d'un unique individu se retrouvent dans la même région géographique, il est probable que l'ancêtre commun vivait dans cette même région. Ainsi, à l'exception de P-P27, tous les lignages de K-M526 se regroupent en Asie du sud-est et en Océanie. Ceci implique une origine probable pour l'haplogroupe P-P295 en Asie du sud-est, suivie d'une expansion des ancêtres des haplogroupes Q et R en Asie. De manière intéressante, les tests d'ADN ancien suggèrent que l'haplogroupe R1b le plus fréquent en Europe occidentale, n' a pas atteint ces hautes fréquences avant la fin du néolithique.

lundi, juin 2 2014

Histoire des Austronésiens dans les îles du sud-est asiatique

Mark Lipson vient de publier un papier intitulé: Reconstructing Austronesian population history in Island Southeast Asia.

L'histoire des Austronésiens pointe leur origine à Taïwan selon les découvertes archéologiques (poteries rouges, néphrite de Taïwan). Cependant des auteurs ont mis en avant une diffusion culturelle plus que démographique. De plus l'archéologie n'explique pas la différence linguistique entre les îles de l'ouest et les îles du centre et de l'est. La génétique peut apporter des données complémentaires de l'archéologie et la linguistique. Dans cette étude, les auteurs ont séquencé le génome de divers échantillons issus d'individus austronésiens comparés à des populations répartis sur la terre entière.

Un arbre a été construit à partir de 18 populations chinoises, thaïlandaises, sud-américaines, papoues et africaines, indépendantes les unes des autres:
2014 Lipson Figure 1a

A partir de cet arbre, les auteurs ont obtenu des résultats fiables de mélanges pour 25 populations austronésiennes différentes:
2014 Lipson Figure 2

Toutes les populations austronésiennes sont le résultats de mélange de 2 ou 3 populations à partir de 4 populations source identifiées: une population mélanésienne proche des papous, une population negrito, une population austronésienne issue de Taïwan et une population austro-asiatique proche des H'tin de Thaïlande. 14 populations sont le mélange de seulement 2 populations: 8 des Philippines (austronésiens et negritos), 4 de l'est de l'Indonésie et 2 d'Océanie (austronésiens et mélanésiens). Les autres populations sont le mélange de 3 populations (austronésiens, negritos et austro-asiatique). La part d'ascendance austronésienne varie de 30 à 90% selon les groupes, et la part d'ascendance austro-asiatique varie de 10 à 60%. On n'a pas retrouvé d'ascendance austronésienne dans les groupes continentaux ne parlant pas l'austronésien. L'estimation des dates de mélanges génétiques pour les populations des Philippines, de l'est de l'Indonésie et d'Océanie, est entre 900 et 1800 ans. Cette date est beaucoup plus récente que la date d'expansion austronésienne documentée par l'archéologie, et doit refléter probablement plusieurs vagues de migration en provenance d'Asie faisant suite à la migration austronésienne initiale en provenance de Taïwan. L'estimation de la date de mélange des populations de l'ouest des îles donne une valeur proche de 2200 ans. Ici encore cette date correspond à l'arrivée de la dernière vague migratrice et non pas de la première.

jeudi, mai 22 2014

Histoire de l'haplogroupe mitochondrial U6 en Afrique, en Eurasie et en Amérique

Je pouvais difficilement passé sous silence ce nouveau papier concernant l'haplogroupe mitochondrial U6 intitulé: The history of the North African mitochondrial DNA haplogroup U6 gene flow into the African, Eurasian and American continents.

Après sa sortie de l'Afrique, un des plus important mouvement migratoire de l'homme moderne a été de retourner en Afrique. Un signal de cette migration est donné par les haplogroupes mitochondriaux U6 et M1 qui ont une distribution principalement en Afrique du Nord et de l'Est. L'expansion de l'haplogroupe U6 a été corrélé à différentes cultures archéologiques nord africaines comme l'Atérien, le Dabbéen, l'Ibéromaurusien et le Capsien.On pensait que l'Atérien était vieux d'environ 40.000 à 20.000 ans, mais de récentes découvertes archéologiques ont montré qu'il datait en réalité entre 90.000 et 40.000 ans. Comme l'haplogroupe U6 est daté d'environ 35.000 ans, cela exclu l'Atérien des cultures qui lui sont associées. Des tests d'ADN ancien sur des squelettes marocains de la culture Ibéromaurusienne datés d'environ 12.000 ans ont montré qu'ils appartenaient aux haplogroupes mitochondriaux: H, JT, U6 et V. Ceci indique bien que l'haplogroupe U6 était déjà présent en Afrique du nord-ouest dans la culture Ibéromaurusienne.

Dans cette étude, les auteurs ont analysé 230 séquences mitochondriales complètes et 761 séquences limitées à la région HVR1, toutes de l'haplogroupe U6. Cela a permis d'améliorer considérablement notre connaissance de la phylogénie de l'haplogroupe U6 et d'identifier certaines sous-clades associées à un lieu géographique ou un groupe ethnique spécifique. Ainsi U6a1 est un groupe méditerranéen (européen ou maghrébin), U6a2 est relié principalement à des groupes éthiopiens, U6a8 est un groupe maghrébin, U6a3 se divisent en des groupes européens (U6a3a), maghrébins (U6a3b et U6a3e), ou ouest-Africains (U6a3c et U6a3f), U6a5 inclus deux groupes ouest africains et U6a6 est maghrébin. U6a7 est principalement européen, et contient un sous-groupe acadien (U6a7a1a) et un sous-groupe séphardique (U6a7a1b). U6b est un groupe moins fréquent que U6a, mais il est largement distribué le long du Sahel des Iles Canaries au Soudan, jusque dans la péninsule arabique. On le retrouve également dans la péninsule ibérique. U6d se retrouve en Afrique de l'Est, au Maghreb et en Europe. Le groupe U6c se retrouve au Maghreb, aux Canaries et en Europe méditerranéenne:
2014 Secher Figure 2

Neuf des onze séquences appartenant à la sous-clade U6a7a1a appartiennent à des descendants directs de 2 sœurs d'origine française qui se sont mariées en Acadie au 17ème siècle. Cela a permis de dessiner un arbre généalogique sur 15 générations à partir de 1625, soit une moyenne d'environ 25 ans par génération:
2014 Secher Figure 1

Dans cette famille, 2 polymorphismes hétéroplasmiques aux positions 146Y et 3202Y et 1 substitution à la position 15152 ont été détectées. Cela conduit à un taux de mutation de 1 substitution pour 90 événements soit 0.027 substitution par site et millions d'années. Cette valeur est plus élevée que la taux de mutation communément admis. Cette différence peut néanmoins s'expliquer par le taux d'hétéroplasmie, et le sexe des individus chez qui les mutations apparaissent puisque les hommes ne transmettent pas leur ADN mitochondrial à leurs enfants.

Discussion

L'origine probable de l'haplogroupe U6 est an Asie de l'ouest. Son âge est estimé à environ 35.300 ans, au début du paléolithique supérieur. On est situé avant le Dernier Maximum Glaciaire, mais la période est cependant suffisamment froide pour imposer un retour vers l'Afrique le long de la côte nord. La sous-clade U6a est âgée d'environ 26,200 ans et a probablement émergée en Afrique du Nord-Ouest. Si on considère la longueur de la côte nord de l'Afrique à environ 5.000 km, on peut considérer que la migration U6 initiale à mis 9.000 ans pour réaliser ces 5.000 km, soit une moyenne d'environ 0,56 km par an ou 14 km par génération. C'est une distance raisonable pour des chasseurs-cueilleurs.

L'arrivée de l'haplogroupe U6 en Afrique du Nord-Ouest correspond probablement à la culture Ibéromaurusienne et à l'expansion de la sous-clade U6a. Autour de 20.000 ans plusieurs sous-clades se sont dispersées au Maghreb (U6a3, U6a6, U6a6b, U6a7 et U6a7b), ou même jusqu'en Ibérie (U6a1 et U6a1b). Les aléas climatiques (aridité) ont probablement poussé l'haplogroupe U6a2 jusque sur les hauteurs d'Afrique de l'Est il y a environ 16.000 ans. Ensuite le climat est devenu plus humide en Afrique. La période entre 13.000 et 10.000 ans voit l'émergence des sous-clades U6b, U6d et U6c. U6b s'étend du Maghreb, à travers le Sahel, à l'Afrique de l'ouest jusqu'aux Iles Canaries d'un côté et en Afrique de l'Est et en Arabie de l'autre côté. U6c et U6d sont beaucoup plus localisés au Maghreb. Plusieurs autres dispersions traversent également le Sahara: U6a5a, U6a5b. Puis un assèchement du désert a mis fin à ce chemin. Les expansions ont continué le long de la côte ouest: U6a3f, U6a3c et U6b3, et également au Maghreb jusqu'en Europe: U6b2, U6a3e, U6a1b et U6a3b1.

La théorie de la coalescence permet d'estimer la taille des populations dans le passé, notamment à l'aide du logiciel BEAST. La figure a ci-dessous estime ainsi l'évolution de la population U6 totale en fonction du temps:
2014 Secher Figure 3

On remarque ainsi une expansion continue jusque vers 15.000 ans, puis une stagnation jusque vers 3000 ans suivie par une brusque expansion. La figure b ci-dessus redonne la même estimation uniquement à partir des séquences africaines. On remarque alors une croissance jusque vers 20.000 ans suivi par une stagnation de la population durant le Dernier Maximum Glaciaire. La croissance repart ensuite à partir de 8.000 ans, correspondant au tout début du néolithique.

L'archipel des Iles Canaries est seulement à 100 km des côtes africaines. Quand il a été découvert par les européens au 15ème siècle, il était habité par une population appelée Guanche. Ces Guanches ont de proches affinités avec les berbères d'Afrique du Nord. Les analyses mitochondriales ont montré que les haplogroupes U6b1a et U6c1 étaient présents dans les Iles Canaries avant l'arrivée des européens. On considère que les premiers habitants sont arrivés il y a seulement 2500 ans. Cette date ne correspond pas à l'âge estimée pour la clade U6b1a (3600 ans) que l'on ne trouve qu'aux Iles Canaries. On suppose effectivement que plusieurs lignages sont arrivés ensemble dans l'archipel: U6b1a1, U6b1a2, U6b1a3 et U6c1b âgés respectivement de 1500, 2600, 1300 et 1300 ans environ. Connaissant la marge d'erreur, ces dates sont plus en accord avec les données archéologiques.

Les fréquences de U6 sont très faibles en Europe, bien que plus élevées dans les régions méditerranéennes: Portugal (2.5%), Espagne (1.1%) ou Sicile (0.4%), avec un gradient décroissant de l'ouest vers l'est. Les résultats de cette étude montrent que U6 est arrivée en Europe aussi bien aux temps préhistoriques qu'historiques. On trouve ainsi des traces d'arrivée en Europe aux racines de la sous-clade U6a1 âgée de 18.600 ans. Il y a également des séquences européennes à la racine de U6a2 (16.800 ans). La sous-clade U6a4 âgée de 10.600 ans semble montrer un signal de dispersion lié à la diffusion du néolithique en Europe. De même, les sous-clades U6a3a (9600 ans) et U6a7a (7600 ans) montres des expansions européennes au néolithique. D'autres groupes se dispersent en Europe seulement au chalcolithique: U6a3a1, U6a7a1, U6a7a2 et U6c1. Enfin 14 lignages européens montrent une diffusion aux périodes historiques: U6d1a semble lié à la conquête romaine des Iles Britanniques, U6a7a1b est une diffusion des juifs séphardiques, Enfin U6a1a1a2, U6a7a1a, U6a7a2a1 et U6b1a montrent une colonisation européenne de l'Amérique.

Les français sont arrivés en Acadie au début du 17ème siècle. La sous-clade U6a7a1a est représentative de cette colonisation. Onze séquences complètes appartiennent à ce lignage. L'âge de ce groupe est estimé à 467 ans en accord avec son histoire. Une autre séquence très proche de ce groupe bien qu'elle diffère d'une mutation ancre son origine en France au milieu de l'Age du Bronze.

Diverses séquences américaines se regroupent avec des individus de diverses origines: Europe, Europe méditerranéenne, Afrique du Nord, Afrique sub-saharienne. La fréquence de U6 reste faible dans les 3 principales communautés ethniques américaines: 0,62% chez les afro-américains, 0,31% chez les caucasiens et 0,75% chez les hispaniques.

vendredi, mai 16 2014

ADN mitochondrial d'un squelette paléo-américain du Mexique

Les études génétiques des Natifs Américains contemporains et des squelettes préhistoriques des premiers américains ont supporté l'hypothèse que les premiers américains sont les descendants de Sibériens qui ont traversé le détroit de Bering il y a 26.000 à 18.000 ans. Cependant cette hypothèse est controversée car les squelettes des paléo-américains antérieurs à 9.000 ans présentent des caractères morphométriques différents des Natifs Américains, des Sibériens et des Asiatiques du nord-est contemporains. Les squelettes des paléo-américains sont plus proches des Africains, des Australiens ou des habitants du sud du Pacifique. Ces différences suggèrent que l'Amérique a été colonisée par des migrations distinctes à différentes périodes, à moins qu'elles ne soient dues à des évolutions locales qui sont apparues après l'arrivées des premiers américains. Jusqu'ici les analyses génétiques concernant les paléo-américains, ont été faites sur des restes humains issus de sujets immatures ou trop fragmentaires pour pouvoir analyser leur morphologie. Un seul cas présente des tests ADN sur un crâne complet mais proche morphologiquement des Natifs Américains contemporains. La résolution de ce problème a été entravée jusqu'ici par la rareté des squelettes paléo-américains: seuls 30 échantillons d'Amérique du Nord sont antérieurs à 10.000 ans et parmi eux seuls 12 ont été datés de manière précise.


Pour éclairer ce problème, James C. Chatters vient de publier un nouveau papier intitulé: Late Pleistocene Human Skeleton and mtDNA Link Paleoamericans and Modern Native Americans. Un squelette du Pléistocène supérieur avec une dentition intacte a été découvert dans une grotte immergée située à Hoyo Negro dans le Yucatán au Mexique:
2014 Chatters Figure 1

Des restes fauniques du Pléistocène ont également été découverts à proximité du squelette humain: tigres à dents de sabre, éléphants préhistoriques, paresseux terrestres, pumas, lynx, tapirs, coyotes, pécaris, coatis, ours, ...

L'âge du squelette humain a été mesuré à 13.000 ou 12.000 ans. Le squelette est bien préservé, complet. Il correspond à une femme dont l'âge est compris entre 15 et 16 ans. Les caractéristiques morphologiques de ce squelette sont voisines des caractéristiques des squelettes paléo-américains jusqu'ici découverts, et donc très différents des caractéristiques des squelettes des Natifs Américains contemporains. De l'ADN a été extrait d'une molaire et l'haplogroupe mitochondrial a été déterminé: D1. Ce lignage est spécifique des Natifs Américains et est probablement arrivé en Amérique avec la migration d'une population asiatique qui a traversé le détroit de Bering.

Ainsi les paléo-américains représentent une population venue d'Asie et qui a traversé le détroit de Bering. Ceci est consistant avec l'hypothèse qui affirme que les paléo-américains et les Natifs Américains sont issus de la même population ancestrale. La différences entre leurs traits morphologiques est probablement due à une évolution de la population qui est intervenue en Amérique.

samedi, mai 3 2014

Structure génétique uniparentale de Sicile et du sud de l'Italie

Stefania Sarno vient de publier un nouveau papier sur la génétique de l'Italie intitulé: An Ancient Mediterranean Melting Pot: Investigating the Uniparental Genetic Structure and Population History of Sicily and Southern Italy.

A cause de sa position centrale en Méditerranée, la Sicile et le sud de l'Italie ont abrité des groupes humains variés durant la préhistoire et les temps historiques, à la croisée des chemins entre l'Europe, l'Afrique du Nord et le Levant. La première colonisation indubitable de la Sicile remonte à l'épigravettien. Des groupes préhistoriques ont alors franchi le détroit de Messine en provenance du continent. Des restes humains récemment découverts en Italie du Sud dans la grotte de Paglicci et en Sicile dans la grotte d'Oriente ont été affectés à l'haplogroupe mitochondrial HV et sont interprétés comme les descendants des chasseurs-cueilleurs de Sicile et du sud de l'Italie qui occupaient ces lieux avant et après le Dernier Maximum Glaciaire. Ensuite, la révolution néolithique est apparu à l'ouest de la Sicile et à la pointe sud-est de l'Italie 6000 à 5700 av. JC., se déplaçant ensuite vers l'ouest en Calabre et dans l'est de la Sicile. Aux temps historiques, quatre mouvements migratoires sont notables:

  • l'occupation massive des grecs au 8ème siècle av. JC. en provenance des Balkans.
  • la colonisation phénicienne et carthaginoise à l'ouest de la Sicile au premier millénaire av. JC en provenance du Levant.
  • les invasions romaines et post-romaines à partir de la péninsule italienne, entre 300 av. JC et 500 après JC.
  • les conquêtes plus récentes islamiques (aux 8ème et 9ème siècles) et normandes (aux 11ème et 12ème siècles) de la Sicile.


Dans cette étude, les auteurs ont analysé l'ADN mitochondrial et du chromosome Y dans le sud de l'Italie et en Sicile. Plus de 300 individus issus de 8 régions différentes ont été testés sur 42 SNP et 17 marqueurs STR du chromosome Y, sur les régions HVR1 et HVR2 de l'ADN mitochondrial et sur 22 SNP de la région codante.
2014 Sarno Figure S1

Ces données ont ensuite été comparées avec des échantillons d'Europe Centrale, de l'ouest et du sud, d'Afrique du Nord et du Levant. Les questions principales étaient:

  • la Sicile est elle structurée génétiquement selon un axe est-ouest? Comment est-elle reliée à l'Italie du sud ?
  • les résultats génétiques sont ils reliés à des événements démographiques anciens ou récents? Il y a t-il des différences entre les points de vue maternels ou paternels?
  • comment la variabilité génétique de la région est-elle reliée au domaine méditerranéen?


Un sous-ensemble de 129 échantillons du chromosome Y, a été sélectionné sur la base de leur patronyme. Leur appartenance a d'anciennes familles de la région permet de définir une cartographie génétique à la fin du Moyen-Age, quand les patronymes se sont diffusés dans la région.

Les 326 individus testés sur le chromosome Y appartiennent à 33 haplogroupes différents:
2014 Sarno Table S2a

Les haplogroupes les plus fréquents sont G-P15 (12.3%), E-V13 et J-M410* (les deux 9.5%), et R-M269* (7.4%). Ils sons suivis par 5 sous-clades de R1 (R-M17, R-L2, R-P312*, R-U152* et R-U106) et J-M267. Tous ces groupes sont européens ou du Proche-Orient. Les groupes africains (E-V12, 2.76%; E-V22, 2.15%; E-M81, 1.53%) apportent beaucoup moins de contribution à la diversité génétique de la région. Il n'y a pas de différenciation notable entre les régions de Sicile ou du sud de l'Italie. Il n'y a pas de différences non plus entre la cartographie génétique globale à partir de tous les échantillons et la cartographie génétique représentative du Moyen-Age basée sur un sous-ensemble sélectionné à partir de leur patronyme.

Afin de comparer les échantillons avec des populations méditerranéennes, une Analyse en Composantes Principales a été effectuée:
2014 Sarno Figure 1

Une structure globale significative apparait clairement séparant le nord-ouest, le centre et le sud-est du bassin méditerranéen. La péninsule ibérique, l'Europe Centrale et le nord-ouest de l'Italie se regroupent, de même que les Balkans et le Levant d'un autre côté. La Sicile et le sud de l'Italie se regroupent avec le sud-est du bassin méditerranéen, sauf la Catane qui a plus d'affinité avec le groupe du nord-ouest. La première composante montre une différentiation en longitudes (figure 1a), alors que la seconde composante montre une différentiation en latitudes (figure 1b). De manière intéressante, la seconde composante sépare les parties ouest et est de la Sicile (l'ouest se regroupe avec le sud, alors que l'est se regroupe avec le nord et le sud de l'Italie).

L'estimation de l'âge des différentes sous-clades du chromosome Y montre que ceux-ci sont relativement récents sauf G2a-P15:
2014 Sarno Table 1a

Ainsi, si la diffusion du groupe G2a-P15 semble dater du début du néolithique, les autres groupes se sont diffusés entre la fin du néolithique (âge du cuivre) et les temps historiques.

Les 313 échantillons testés sur l'ADN mitochondrial appartiennent à 40 haplogroupes:
2014 Sarno Table S2b

La diversité mitochondriale correspond typiquement à l'Europe Méditerranéenne avec une majorité correspondant à l'haplogroupe H (38%). A l'intérieur de H, H1 représente la sous-clade dominante avec 10,9% suivie par H5 (3,2%) et H3 (2,6%). A côté de H, il faut noter la présence de l'haplogroupe HV (4,8%). La plupart des autres séquences appartiennent aux haplogroupes U5, K1, J1, J2, T1 et T2 d'origine européenne ou proche-orientale. Les haplogroupes d'origine africaine sont rares: M1 (1,3%), U6 (0,6%) et L3 (0,6%). L'ouest de la Sicile montre moins de diversité que le sud de l'Italie. La Sicile ne montre pas de sous-structure relative à l'ADN mitochondrial. Il n'y a pas non plus de différenciation entre la Sicile et le sud de l'Italie.

Afin de comparer les échantillons avec des populations méditerranéennes, une Analyse en Composantes Principales a été effectuée:
2014 Sarno Figure 3

Comme pour le chromosome Y, l'ADN mitochondrial présente un gradient du nord-ouest vers le sud-est pour la première composante. La Sicile et le sud de l'Italie sont reliés au sud-est du bassin méditerranéen. La seconde composante sépare l'Italie du reste du bassin méditerranéen.

Contrairement à l'ADN du chromosome Y, l'estimation de l'âge des haplogroupes mitochondriaux pointe vers une dispersion pré-néolithique:
2014 Sarno Table 1b

Discussion

Cette étude montre une homogénéité importante de la diversité génétique de la Sicile et de l'Italie du Sud. Cette homogénéité n'est pas récente mais date au moins de la diffusion des patronymes au Moyen-Age. Si l'influence du Levant et des Balkans (et dans une moindre mesure de l'Italie du Nord-Ouest) est importante dans cette région, celle de l'Afrique du Nord est par contre négligeable. La forte variabilité génétique de cette région est cohérente avec le fait que les régions européennes méditerranéennes sont plus diversifiées que les régions du nord de l'Europe. A la fin de l'âge du bronze, le bassin méditerranéen a subi de nombreux mouvements migratoires comme celui des grecs ou des phéniciens. Ainsi l'haplogroupe du chromosome Y E-V13 est supposé originaire des Balkans et s'être diffusé en Sicile avec l'expansion grecque. L'haplogroupe G2a-P15 pourrait correspondre à une diffusion durant le néolithique. A l'inverse, les haplogroupes mitochondriaux reflètent des expansions paléolithiques. Ainsi les haplogroupes V, H1 et H3 ont été associés à une expansion post-glaciaire en Europe. Ce pourrait être également le cas pour l'haplogroupe H5. De manière intéressante, l'haplogroupe HV semble le plus ancien et représente le candidat le plus solide concernant les ancêtres paléolithiques de cette région.

vendredi, mai 2 2014

Le sang qui imbibe le mouchoir contenu dans la gourde datée de la révolution n'appartient pas à Louis XVI

Une gourde gravée datée de la révolution française est sensée contenir un mouchoir imbibé du sang de Louis XVI:
2014 Olalde Figure 1

Des tests ADN ont été effectués en 2012 sur cet échantillon et comparés avec des tests effectués sur la tête momifiée présumée de Henri IV. L' analyse avait alors montré que les 2 résultats obtenus sur l'ADN du chromosome Y étaient compatibles. L'haplogroupe obtenu était G2a. Cependant, dernièrement une étude sur des descendants directs des Bourbons, a montré que ceux-ci étaient de l'haplogroupe R1b. Ce dernier papier a donc jeté un sérieux doute sur l'authenticité des 2 reliques présumées des rois de France: Henri IV et Louis XVI. Afin de lever ces derniers doutes, Iñigo Olalde vient de publier un papier intitulé: Genomic analysis of the blood attributed to Louis XVI (1754–1793), king of France, afin de comparer l'ADN issu du sang contenu dans la gourde avec l'origine et les traits physiques connus de Louis XVI.

Ainsi, les auteurs de cette étude ont déterminé le génome complet du sang contenu dans la gourde. Selon les enregistrements historiques les ancêtres de Louis XVI sont Allemands (50%), Polonais (25%), Français (12,5%), Autrichiens (6,25%) et Savoyards (6,25%). Les analyses de l'ADN du chromosome Y ont confirmé un haplogroupe G2a2a. Ensuite une Analyse en Composantes Principales a été effectuée à partir de 236 échantillons du projet des 1000 génomes:
2014 Olalde Figure 4a

L'échantillon issu de la gourde est le point noir sur le schéma ci-dessus. Il se situe à proximité des échantillons nord-italiens du projet des 1000 génomes. Ce n'est pas vraiment ce qui était attendu au vu de l'ascendance de Louis XVI, puisqu'il devait se situé entre les Allemands et les Polonais. Un seul de ses ancêtres à la cinquième génération avait des ancêtres nord-italiens.

D'autre part, les enregistrements historiques montrent que Louis XVI avaient les yeux bleus, était grand, obèse et avait un diabète de type 2. Ces deux derniers traits sont plus difficilement discernable à partir de l'ADN. Ainsi, les auteurs se sont concentrés sur la couleur des yeux et la taille de l'échantillon issu de la gourde. Les résultats ont montré que le sang contenu dans la gourde appartenait à une personne avec les yeux marrons. Sa probabilité d'avoir les yeux bleus est seulement de 2,4%. De plus ce sang appartenait à une personne de taille plutôt moyenne.

En conclusion, le sang contenu dans la gourde n'est probablement pas celui du roi de France: Louis XVI.

mardi, avril 29 2014

Histoire maternelle de l'Océanie

Ana Duggan vient de publier un papier intéressant intitulé: Maternal History of Oceania from Complete mtDNA Genomes: Contrasting Ancient Diversity with Recent Homogenization Due to the Austronesian Expansion.

L'occupation humaine de la Nouvelle-Guinée et de l'Australie qui étaient regroupés en une seule terre nommée Sahul a eu lieu il y a environ 44.000 ans. Les hommes se sont alors dispersé aussitôt à travers le détroit de Vitiaz et les îles de l'archipel de Bismarck. Les descendants de cette expansion initiale ont voyagé et se sont installés au moins jusqu'à l'île de Buka au nord de l'archipel Salomon, il y a environ 28.000 ans, puis l'île de Manus dans les îles de l'Amirauté, il y a 12.000 ans. Ils possédaient ainsi suffisamment de compétence marine pour naviguer sur plus de 200 km. Cependant, ils n'ont pas été plus loin. En fait, il semble que la colonisation de la Lointaine-Océanie (Iles Reef, Santa Cruz, Vanuatu, Nouvelle Calédonie, Fiji, et la Polynésie), et probablement la plupart des îles Salomon a été réalisée par les descendants d'une expansion qui a débuté à Taiwan il y a 5000 à 6000 ans, atteignant d'abord la Proche-Océanie il y a 3500 à 3300 ans, puis la Lointaine-Océanie il y a seulement 3100 ans culminant avec la colonisation de l'archipel d'Hawaï, l'île de Pâques et la Nouvelle-Zélande il y a seulement 800 à 1200 ans.

Chacune de ces 2 expansions est associée à des peuples, phénotypes, culture et langage distincts. Ainsi la première expansion est associée à des papous vivant dans une société patriarcale, ayant une peau sombre et parlant un très vieux langage. Au contraire, la seconde migration est associée à un style de poterie, une langue austronésienne descendant d'un langage proto-océanique. Ils vivaient dans une société matriarcale et avaient une peau plus claire que les papous.

Les précédentes études génétiques ont montré que l'expansion austronésienne est associée à la diffusion de l'haplogroupe B (notamment B4a1) de l'ADN mitochondrial, alors que l'expansion papoue est associée à la diffusion des haplogroupes Q, P, M27, M28 et M29.

Dans cette étude, les auteurs ont analysé 1331 séquences complètes mitochondriales appartenant à 34 populations réparties entre l'archipel de Bismarck et la Polynésie:
2014 Duggan Figure 1

Les fréquences relatives en fonction des différents haplogroupes, pour les 34 populations sont décrites dans la figure ci-dessous:
2014 Duggan Figure 2

En général, les fréquences des haplogroupes d'origine Proche-Océanienne (P, Q, M27, M28 et M29) décroissent lorsque l'on s'éloigne de la Nouvelle-Guinée à l'intérieur du Pacifique. Cependant, 2 populations contredisent cette tendance: Nagovisi de Bougainville avec 97% d'haplogroupe B et Santa Cruz avec 85% d'haplogroupes Proche-Océaniens.

L'haplogroupe B est de loin l'haplogroupe dominant dans cette étude avec 76% des séquences. La sous-clade B4a1a1a correspond à elle toute seule à 69% des séquences. L'analyse des haplotypes montre que cet haplogroupe s'est propagé récemment et rapidement dans la région. Ce résultat est également conforté par l'analyse Bayesian Skyline Plot qui estime l'évolution en fonction du temps.

Les plus vieux haplogroupes: Q, P, M27, M28 et M29 sont supposés être autochtones à la Proche-Océanie. Ainsi trois lignages de l'haplogroupe M27 divergent il y a environ 60.000 ans:
2014 Duggan Figure 5

L'haplogroupe M28a est très largement répandu dans tous les groupes de populations sauf en Polynésie. Q1 est également largement répandu et représente 40% des échantillons de Santa Cruz. Enfin un nouveau lignage nommé M* a été découvert dans cette étude à Bougainville, les îles Salomon et Santa Cruz. Il diverge d'environ 60.000 ans des haplogroupes M28 et M29. La dispersion de ce lignage M* remonte à environ 5900 ans, ce qui est plus récent que les autres lignages Proche-Océaniens.

La présence d'haplogroupes différents de B et des haplogroupes Proche-Océaniens comme l'haplogroupe E indique d'autres influences migratoires. Ainsi E1b1 représente 45% de la population Ata. L'haplogroupe E1 se retrouve uniquement à la Nouvelle Bretagne, Bougainville et les îles Salomon. L'haplogroupe E2a se retrouve seulement dans 3 échantillons sur l'île Isabelle dans les îles Salomon. L'haplogroupe E se retrouve également à relativement haute fréquence dans les îles du sud-est de l'Asie et à Taiwan. La dispersion de l'haplogroupe E en Océanie est estimée à environ 14.000 ans, bien avant l'expansion austronésienne.

La haute proportion de lignages Proche-Océaniens sur l'île de Santa-Cruz est connue et non expliquée. Cette île est peuplée depuis 3200 ans probablement à partir de l'archipel de Bismarck. Les habitant parlent une langue austronésienne. La raison de la composition génétique de cette île reste une énigme. On ignore si sa colonisation remonte à l'arrivée de la vague austronésienne ou si elle est plus ancienne.

vendredi, avril 25 2014

La diversité et les mélanges génétiques diffèrent entre les chasseurs-cueilleurs et les fermiers scandinaves

Pontus Skoglund vient de publier un nouveau papier sur des tests d'ADN ancien effectués sur des chasseurs-cueilleurs et des fermiers scandinaves. Il est intitulé: Genomic Diversity and Admixture Differs for Stone-Age Scandinavian Foragers and Farmers.

Les auteurs ont étudié 6 chasseurs-cueilleurs de la culture de la Céramique Perforée, 4 fermiers néolithiques de la culture des Vases à Entonnoirs, et 1 chasseur-cueilleur mésolithique. Tous les individus néolithiques ont été découverts en Suède et sont datés d'environ 5000 ans. L'individu mésolithique a été découvert également en Suède et date d'environ 7500 ans.

Les résultats des tests de l'ADN mitochondrial sont les suivants:
2014 Skoglund Table 1

Les 6 chasseurs-cueilleurs néolithiques et le chasseur-cueilleur mésolithique sont de l'haplogroupe U et V. Les 4 fermiers sont de l'haplogroupe H et K.

Un unique chasseur-cueilleur néolithique mâle a été testé pour son chromosome Y. Il est de l'haplogroupe I2a1. Cet haplogroupe est rare aujourd'hui en Scandinavie. Ce résultat est néanmoins conforme aux précédents résultats de tests sur le chromosome Y de mésolithiques scandinaves également de l'haplogroupe I.

Des études récentes ont montré que certains variants associés au phénotype et au système immunitaire diffèrent entre chasseurs-cueilleurs et fermiers. Cependant, peu de différences ont été trouvés dans cette étude sauf pour le marqueur SLC24A5 associé à la pigmentation de la peau. Les chasseurs-cueilleurs portent l'allèle ancestrale (peau sombre) alors que les fermiers portent l'allèle dérivée (peau claire).

Une Analyse en Composantes Principales a été réalisée pour comparer les échantillons anciens avec les populations contemporaines:
2014 Skoglund Figure 1A

Les 6 chasseurs-cueilleurs néolithiques scandinaves (en bleu ci-dessus) se regroupent en dehors de la zone de variation des populations contemporaines. Ils sont également réunis avec les chasseurs-cueilleurs mésolithiques scandinave et ibérique (en bistre). Ceci est consistant avec une continuité génétique dans la population des chasseurs-cueilleurs. Tous les fermiers néolithiques scandinaves (en rouge) se regroupent au milieu de la population actuelle du sud de l'Europe, de même que Ötzi, l'homme des glaces (en rose). Parmi les populations actuelles ce sont les Lituaniens qui se rapprochent le plus génétiquement des chasseurs-cueilleurs et les Sardes qui se rapprochent le plus des fermiers néolithiques.

Comme les chasseurs-cueilleurs et les fermiers néolithiques contribuent génétiquement aux populations européennes actuelles, les auteurs de l'étude ont regardé si ce mélange génétique avait déjà commencé au néolithique. Ainsi l'homme des glaces Ötzi forme un groupe avec les Sardes actuels, alors que le fermier scandinave est plus proche des chasseurs-cueilleurs. Cependant les chasseurs-cueilleurs de la culture de la Céramique Perforée qui sont plus récents que l'arrivée de l'agriculture en Scandinavie, ne montrent pas de flux génétique en provenance des premiers fermiers. Ces résultats suggèrent que les fermiers néolithiques scandinaves ont reçu un flux génétique en provenance des populations mésolithiques, alors que les chasseurs-cueilleurs néolithiques n'ont pas reçu de flux génétique en provenance des populations de fermiers, durant l'expansion néolithique vers le nord, malgré une coexistence d'au moins 40 générations en Scandinavie.

Si on représente un graphe de mélanges génétiques, on obtient les résultats suivants (la position géographique des échantillons d'ADN anciens est située sur la figure A en haut):
2014 Skoglund Figure 2

Le chasseur-cueilleur sibérien (MA1) contribue génétiquement pour environ 15% au chasseur-cueilleur scandinave (Ajvide58) mais pas au chasseur-cueilleur ibérique (LaBrana1). Les fermiers néolithiques reçoivent un flux génétique d'un groupe basal de chasseurs-cueilleurs européens différent de tous les échantillons connus d'ADN ancien. Celui-ci est plus important chez le fermier scandinave (Gökhem2) que chez Ötzi (Iceman).

Une phase possible de contact au nord de l'Europe entre les fermiers et les chasseurs-cueilleurs est la période entre 7500 et 6000 ans quand la culture de chasseurs-cueilleurs Ertebølle a coexisté pendant plus de 1000 ans avec la culture rubanée LBK.

La comparaison de niveaux relatifs de diversité génétique dans les populations peut fournir des informations sur la taille de ces populations. En effet, les petites populations ont souvent une diversité moindre. Cette diversité a été estimé dans les groupes scandinaves néolithiques. Ainsi la diversité chez les chasseurs-cueilleurs scandinaves est plus faible que chez les fermiers:
2014 Skoglund Figure 3A

Ces estimations suggèrent une stratification importante de la population néolithique scandinave. Mais contrairement à aujourd'hui, cette stratification n'est pas liée à la distance géographique, mais au mode de subsistance.

Ces résultats ont de fortes implications sur notre compréhension des histoires démographiques de ces groupes préhistoriques. La plus grande diversité chez les fermiers a pu être influencé par le flux génétique en provenance des chasseurs-cueilleurs. La faible diversité des chasseurs-cueilleurs peut être du au fait que leurs ancêtres résidaient dans un refuge glaciaire durant le Dernier Maximum Glaciaire, causant potentiellement des effets de goulot génétique. Les changements climatiques et d'éventuels effondrements de population ont probablement affecté la taille des populations de chasseurs-cueilleurs. Par la suite, leur mobilité a décru lorsqu'elles se sont installées dans les zones côtières. Pendant ce temps là, les ancêtres des populations de fermiers vivaient dans des régions plus chaudes qui pouvaient soutenir une population plus importante durant le Dernier Maximum Glaciaire.

L'université d'Uppsala en Suède qui abrite le centre de biologie évolutionnaire dirigé par Mattias Jakobsson vient de créer un Atlas des Anciens Génomes Humains de Suède.

lundi, avril 21 2014

Cartographie génétique de la population algérienne

Asmahan Bekada a publié un papier intitulé: Introducing the Algerian Mitochondrial DNA and Y-Chromosome Profiles into the North African Landscape.

Le nord-ouest de l'Afrique (Maroc, Algérie et Tunisie associés à la Mauritanie et la Lybie) est considéré comme une entité géographique, archéologique et historique distincte du reste de l'Afrique. Au paléolithique moyen, pendant que Néanderthal occupait l'Europe et l'ouest de l'Asie, les hommes modernes créaient l'industrie atérienne dans le Maghreb. Après un hiatus, l'industrie ibéromaurusienne a remplacé les Atériens dans cette région, toujours au paléolithique. Une période humide commencée il y a 9000 ans a apporté une influence néolithique Saharienne et Méditerranéenne à la culture Capsienne épi-paléolithique. Depuis cette époque la langue berbère a donné une unité culturelle au Maghreb. Aux périodes historiques, le nord de l'Afrique a subi les expansions de plusieurs civilisations méditerranéennes, particulièrement les phéniciens et les romains qui ont laissé une empreinte davantage culturelle que génétique. Néanmoins, la langue berbère n'a été réellement menacée que par l'expansion islamique à partir de la fin du 7ème siècle de notre ère. Aujourd'hui, la langue berbère est confinée aux régions montagneuses et désertiques.

Des études génétiques des populations de cette région ont apporté une vision non seulement dans la structure et les relations des Nord-Africains avec ses voisins, mais aussi l'origine probable et une estimation de la date d'arrivée des principaux lignages. Depuis le début une composante principale Eurasienne a été observée dans la région suivie d'influences subsahariennes. La comparaison entre l'Afrique du Nord et l'Europe Méditerranéenne indique une forte discontinuité génétique entre ces deux régions. Enfin les berbères constituent un groupe très hétérogène montrant de fortes différences d'une région à l'autre. Cependant peu de différences génétiques ont été trouvées entre les communautés berbères et arabes de la région, indiquant une influence plus culturelle que migratoire de l'expansion arabe. Cependant la présence du lignage spécifiquement arabe J-M267 plus importante dans les villes que dans les campagnes pointe vers un influx génétique dans cette région en provenance du Moyen-Orient. Les lignages mitochondriaux U6, M1et X1ont leur origine au Moyen-Orient et se sont diffusés en Afrique du Nord au paléolithique. D'autres comme U5b1b, H1, H3 et V sont originaires d'Europe et ont atteint l'Afrique du Nord via la péninsule ibérique après le Maximum Glaciaire. Une étude d'ADN ancien à Taforalt au Maroc sur des restes de la culture ibéromaurusienne a détecté la présence des haplogroupes U6, V, T et H pointant vers une continuité génétique dans cette région depuis le paléolithique. La contrepartie masculine analysée à partir des tests du chromosome Y supporte également une diffusion de l'Asie vers l'Afrique du lignage R1b-V88 probablement durant l'holocène. D'autres lignages comme E-M81 et E-M78 sont probablement originaires de la région avec des expansions au paléolithique et au néolithique.

Cette information génétique concernant l'Afrique du Nord est cependant altérée par un vide au niveau de l'Algérie qui est cependant le plus grand pays du continent africain. Seules quelques échantillons ont été testés dans le passé. Pour combler cette lacune, les auteurs de cette étude ont testé des échantillons de la région d'Oran: 240 ont été testés sur la région HVR-I de l'ADN mitochondrial et 16 SNPs de la région codante. Enfin 102 échantillons masculins ont été testés sur des marqueurs STR et des SNPs du chromosome Y, notamment choisis pour affinés les haplogroupes importants R et E. A titre de comparaison, des populations de la péninsule ibérique, du Maroc, de Mauritanie et de Tunisie ont également été testés. Enfin, pour une analyse statistique, les auteurs ont considéré 18050 séquences mitochondriales testées sur la région HVR1, issues du bassin méditerranéen, du Moyen-Orient et du Caucase, ainsi que 19343 échantillons de ces mêmes régions, testés sur le chromosome Y.

Les résultats mitochondriaux obtenus dans cette étude ont été comparés aux résultats de 2 autres études concernant une population diverse d'Algérie et des Mozabites:
2013 Bekada Table 1

Les Mozabites présentent un excès de U3 et U6a, alors que la précédente étude sur une population diverse avait un manque de HV0 et un excès de J/J1c/J2, L3e5 et L2a1. La présente étude correspond davantage à ce que l'on pouvait attendre de la région avec seulement un déficit de K* et un excès de M1. Ces 3 études ont été mélangées dans l'Analyse à Composantes Principales montrée ci-dessous:
2013 Bekada Figure 2A

Ainsi la population d'Algérie se regroupe avec les autres populations du Maghreb. La fréquence de H1 en Algérie est intermédiaire entre le Maroc (51,6%) et la Tunisie (29,4%) indiquant ainsi une décroissance progressive de cet haplogroupe en Afrique du Nord, de l'ouest vers l'est. En Algérie les lignages eurasiens sont les plus fréquents (80%) loin devant les lignages africains (20%). Au moins 2 lignages eurasiens: M1 et U6 sont d'origine paléolithique en Afrique du Nord. U6 se répartit davantage au nord-ouest et M1 davantage au nord-est du continent Africain. Les autres lignages eurasiens sont probablement d'origine Proche ou Moyen Orientale, bien que certains comme H1, H3, HV0 et U5b1b viennent probablement de la péninsule ibérique. L'Algérie a environ le même taux de lignages subsahariens que le Maroc (20,4%) et l’Égypte (22,9%), mais un peu plus faible que la Tunisie (30,1%) et la Libye (27,1%).

Les résultats pour le chromosome Y concernant les haplogroupes E-M78 et R-M343 sont donnés pour la péninsule ibérique et les pays d'Afrique du Nord dans la figure ci-dessous:
2013 Bekada Figure 1

Les résultats obtenus pour E-M78 sont en accord avec les précédentes études. E-V13 est le sous-haplogroupe le plus fréquent dans la péninsule ibérique. L'absence de E-M78 en Mauritanie est notable. On remarque également le même nombre de E-M78* et de E-V65 en Afrique du Nord. Les résultats obtenus pour R-M343 dans la péninsule ibérique reflètent une origine européenne sauf pour un échantillon R1b-V88. Au contraire tous les échantillons R de Mauritanie sont R1b-V88, atteignant une fréquence de 7% pour cet haplogroupe en accord avec les autres pays du Sahel. Pour les autres pays du Maghreb, R1b-V88 descend à environ 1% de la population. D'un autre côté la présence de R-M412, R-S116, RU152 et R-M529 en Afrique du Nord pointe vers un influx européen à travers la Méditerranée. La comparaison de ces résultats avec les autres pays indique une origine nord-africaine pour les haplogroupes E-V65, E-M81 et J1-M267. Les haplogroupes G-M201, L-M20, R2-M124, T-M70, J2-M172 et autres sous-clades de J2 indiquent une influence de l'ouest de l'Asie sur l'Europe avec seulement une très faible influence sur l'Afrique du Nord. Inversement, certaines sous-clades de I montrent une influence de l'Europe vers l'Asie de l'ouest sans influence vers l'Afrique du Nord. Ces influences apparaissent graphiquement sur l'Analyse en Composantes Principales:
2013 Bekada Figure 2B

Ainsi les pays européens sont alignés sur une diagonale qui relie la péninsule ibérique à la Turquie et au Caucase. Ils sont biens séparés des pays d'Afrique du Nord. L'Egypte se retrouve en position intermédiaire entre les pays du Maghreb et les pays du Levant et de la péninsule arabique.

Discussion

Quoique l'Algérie et la Mauritanie montrent les plus hautes fréquences pour l'haplogroupe U6, la majorité des séquences mauritanienne sont U6a*, alors que la majorité des séquences algériennes sont de la sous-clade U6a1'2'3 caractérisée par la mutation 16189. De la même façon, l'Algérie et l’Égypte sont les pays avec les plus hautes fréquences pour l'haplogroupe M1, la majorité des séquences égyptiennes sont de la sous-clade M1a1, alors que les séquences algériennes sont M1*. Concernant les haplogroupes E-V65 et E-M81, l'Algérie possède les plus basses fréquences des pays du Maghreb, alors qu'elle a les plus hautes fréquences pour l'haplogroupe J-M267. Les relativement hautes fréquences des haplogroupes européens: R-M412, R-S116, R-U152 et R-M529 au Maghreb pourraient être la contrepartie masculine des haplogroupes mitochondriaux H1, H3 et HV0. La fréquence des haplogroupes typiquement nord africains E-M81 et E-V65 est respectivement de 40% et 3,4% en Afrique du Nord et de 1,9% et 0,3% en Europe méditerranéenne. Ceci implique un influx génétique d'environ 5% de la population masculine de l'Afrique du Nord vers l'Europe du Sud. L'inverse estimé à partir des haplogroupes E-V13, R-M412, R-S116 et R-U152 indique un influx génétique d'environ 8% de la population masculine de l'Europe du Sud vers l'Afrique du Nord. Un calcul similaire à partir des haplogroupes mitochondriaux U6 et M1 implique un influx génétique d'environ 10% de la population féminine de l'Afrique du Nord vers l'Europe du Sud. L'étude de la répartition des haplogroupes H1, H3 et HV0 donne des valeurs identiques de leur fréquence de part et d'autre de la méditerranée. Elles ne peuvent donc pas être utilisée pour déterminer l'influx génétique de la population féminine de l'Europe du Sud vers l'Afrique du Nord. Ceci demande des études supplémentaires pour mieux comprendre ces différentes valeurs.

Il y a également des différences génétiques importantes selon le sexe. Ainsi la Tunisie est le plus proche pays de l'Algérie quand on considère l'ADN mitochondrial, alors que la Mauritanie est le plus proche de l'Algérie quand on considère l'ADN du chromosome Y. D'autre part, la France est la plus éloignée de l'Algérie suivant l'ADN mitochondrial, alors que la péninsule ibérique est la plus éloignée considérant l'ADN du chromosome Y, parmi les pays étudiés. L'Italie est le plus proche pays européen de l'Algérie à la fois concernant l'ADN mitochondrial et du chromosome Y.

lundi, mars 31 2014

Diffusion de l'haplogroupe du chromosome Y: R1a à l'âge du cuivre à partir de l'Iran

Peter A. Underhill vient de publier un nouveau papier intitulé: The phylogenetic and geographic structure of Y-chromosome haplogroup R1a.

L'haplogroupe du chromosome Y: R se divise en deux composantes principales: R1-M173 et R2-M479. R1 se divise ensuite en deux groupes importants: R1a-M420 et R1b-M343. En Europe R1a est plus fréquent à l'est, alors que R1b est prédominant à l'ouest. Les études précédentes ont suggéré que cette division reflète l'expansion de populations à une période post-glaciaire notamment durant le néolithique. Plus de 10% des hommes habitant une région s'étendant de l'Asie du sud à la Scandinavie partage un ancêtre commun appartenant à l'haplogroupe R1a-M420. La majorité d'entre eux appartient à la sous-clade R1a-M198. La découverte des marqueurs Z93 et Z280 dans le projet des 1000 génomes a permis de diviser ces échantillons R1a en deux régions asiatique et européenne.

Cette étude a testé 16.244 hommes appartenant à 126 populations eurasiennes. 13 de ces échantillons appartenant à l'haplogroupe R ont été totalement séquencés sur 9,99 millions de paires de base sur le chromosome Y. Sur l'ensemble des échantillons, 2923 individus appartiennent à l'haplogroupe R1a-M420. Ceux-ci ont été ensuite testé pour les SNPs suivants: SRY10831.2, M17, M198, M417, Page7, Z282/S198, Z284/S221, M458, M558/CTS3607, Z93/S202, Z95, Z2125, M434, M560, M780, M582, M746, M204 et L657:
2014 Underhill Figure 1

La fréquence de R1a a été calculée pour toutes les populations. Sur les 2923 échantillons, 2893 appartiennent à la sous-clade: R1a-M417/Page7 (1693 sont européens et 1200 sont asiatiques). Parmi les séquences rares, il y a 24 R1a*-M420(xSRY10831.2), 6 R1a1*-SRY10831.2(xM198), et 12 R1a1a1-M417/Page7*(xZ282,Z93). Parmi les 1693 européens R1a-M417, plus de 96% appartiennent à la sous-clade: R1a-Z282. Parmi les 490 sud et centre asiatiques R1a-M417, plus de 98,4% appartiennent à la sous-clade R1a-Z93. Ces deux sous-clades se retrouvent parmi les 560 échantillons du Proche-Orient, du Moyen-Orient ou du Caucase.

La sous-clade européenne R1a-Z282 se répartit géographiquement de la façon suivante:
2014 Underhill Figure 2

La sous-clade R1a-Z282* se situe principalement au nord de l'Ukraine, en Biélorussie et en Russie. La sous-clade R1a-Z284 est confinée en Scandinavie. R1a-M458 et R1a-M558 ont une distribution similaire avec leurs plus hautes fréquences en Europe Centrale et de l'Est. Cependant R1a-M558 est présent dans la région Volga-Oural, contrairement à R1a-M458.

La sous-clade asiatique R1a-Z93 se répartit géographiquement de la façon suivante:
2014 Underhill Figure 3

La sous-clade R1a-Z93* est plus commune dans le sud de la Sibérie, dans la région de l'Altaï. La sous-clade R1a-Z2125 se retrouve au Kirghizstan et chez les Pashtuns d'Afghanistan, ainsi que dans des population du Caucase et de l'Iran. La sous-clade R1a-M780 se situe dans le sud de l'Asie: Inde, Pakistan, Afghanistan et dans l'Himalaya. On retrouve ce groupe également en Iran et chez les Roms de Croatie et Hongrie. Enfin la rare sous-clade R1a-M560 se retrouve chez 2 individus parlant le Burushaski dans le nord du Pakistan, 1 individu Hazara d'Afghanistan, et 1 individu Azeri iranien.

1335 échantillons R1a ont ensuite été testés sur 10 à 19 marqueurs STR. Un réseau a été construit pour les R1a-Z282 et les R1a-Z93. Cependant, peu de sous-structures ont été identifiées dans ces réseaux. Les plus faibles diversités apparaissent dans la sous-clade: R1a-Z93*, chez les juifs R1a-M582 et chez les Roms R1a-M780. Ces résultats sont consistants avec des effets fondateurs dans ces groupes.

Afin de déterminer l'origine de l'haplogroupe R1a, les auteurs ont identifié les populations hébergeant au moins une des sous-clades basales et possédant la plus forte diversité génétique. 6 populations remplissent ces critères, et parmi elles 5 sont situées en Iran. Ce qui fait de cette région l'origine probable de l'haplogroupe R1a.

Une analyse en composantes principales permet de différencier les groupes européens et asiatiques sur la première composante, et les groupes juifs (notamment ashkénazes) sur la seconde composante.

Le plus ancien échantillon R1a en Europe, testé jusqu'à maintenant, correspond à des individus de la culture cordée datés de 2600 av. JC. Les échantillons antérieurs du début du néolithique sont F* et G2a. Ceci suppose une rapide diffusion de l'haplogroupe R1a-Z282 en Europe au chalcolithique ou à l'âge du bronze ancien, de la rivière Volga jusqu'au Rhin. La diffusion équivalente de R1a au Moyen-Orient et en Asie du sud est plus obscure. Cependant la civilisation de l'Indus pourrait correspondre à cette période (voir notamment la répartition géographique de R1a-M780).

Pour évaluer le rôle potentiel de R1a dans ces deux événements archéologiques, les auteurs ont utilisé 2 approches pour estimer l'âge des ancêtres communs des différentes sous-clades de R1a. La première utilise les taux de mutations des marqueurs STR. Cependant les dates obtenues avec le taux généalogique sont largement sous-estimées. Les dates obtenues avec le taux de Zhivotovsky sont elles sur-estimées et doivent être considérées comme des bornes supérieures. La seconde approche est basée sur le séquençage complet du chromosome Y. Pour cela, 13 individus (8 R1a et 5 R1b) ont été testés, et 928 SNPs appartenant à l'arbre R1 ont été utilisés:
2014 Underhill Figure 5

Il n'y a pas encore de consensus sur le taux de mutations à utiliser pour un séquençage sur 9,99 millions de paires de bases. Cela varie de 1 mutation tous les 100 ans jusqu'à 1 mutation tous les 162 ans. En utilisant un taux de 1 mutation tous les 122 ans, les auteurs ont estimé la séparation entre R1a et R1b à environ 25.000 ans. L'âge de R1a-M417 est estimé à 5.800 ans. La forme de l'arbre obtenu pour R1a implique une rapide diffusion de cet haplogroupe.

En conclusion, les auteurs de cette étude estiment que l'haplogroupe R1a s'est diffusé à partir de l'Iran et de l'est de la Turquie il y a environ 5800 ans. Cela suppose une dispersion au chalcolithique ou à l'âge du bronze.

vendredi, mars 28 2014

Distribution de l'haplogroupe E du chromosome Y en Afrique et son implication dans la diffusion du pastoralisme et des langues Afro-Asiatiques

La forte corrélation entre la distribution géographique de quelques sous-clades majeures de l'haplogroupe E du chromosome Y et la distribution des langues Afro-Asiatiques a poussé Eyoab I. Gebremeskel à mener cette étude concrétisée par un nouveau papier intitulé: Y-chromosome E haplogroups: their distribution and implication to the origin of Afro-Asiatic languages and pastoralism. Le Sahel qui s'étend de l'Atlantique aux côtes soudanaises et érythréennes de la mer rouge, est le témoin d’événements démographiques importants dans la préhistoire et l'histoire humaine. Des preuves archéologiques et paléontologiques suggèrent une contribution importante des côtes érythréennes de la mer rouge dans des événements majeurs comme la sortie de l'Afrique de l'homo sapiens. De plus, cette région, riche en diversité génétique et linguistique, est une des rares enclaves qui abritent un pastoralisme traditionnel.

Un total de 1214 échantillons appartenant à l'haplogroupe E du chromosome Y, a été pris en compte dans cette analyse. Parmi toute la population érythréenne testée pour le chromosome Y, l'haplogroupe E représente 49%. Le langage et la culture de subsistance des différentes populations testées ont été répertoriés. 17 marqueurs de l'haplogroupe E ont été testés: E-M96, E-M33, E-P2, E-M2, E-M58, E-M191, E-M154, E-M329, E-M215, E-M35, E-M78, E-M81, E-M123, E-M34, E-V6, E-V16/E-M281 et E-M75.:
2014 Gebremeskel Figure S1

Les marqueurs E-V13, E-V12, E-V22 et E-V32 ont été regroupés ensemble sous E-M78.

Un réseau median-joining a été construit:
2014 Gebremeskel Figure 1

La racine se situe dans la population Kunama. Un groupe principal (en rose ci-dessus) englobe la plupart des populations érythréennes et soudanaises, incluant des populations de langues afro-asiatiques et nilo-sahariennes. Ceci indique que soit la divergence linguistique est un événement postérieur à la divergence génétique, soit qu'il y a eu un remplacement linguistique dans certaines populations, soit que les deux familles linguistiques ont une origine commune. Les populations sud-africaines sont issues de l'Afrique de l'est via une population somalienne. Cela pourrait résulter de la dispersion du pastoralisme de l'Afrique de l'est vers l'Afrique du sud. Les populations du Yémen, d'Arabie Saoudite et d'Oman forment un groupe du Moyen-Orient relié à la population de Afar et Saho. Les populations d'Afrique du nord se scindent en deux groupes: le premier contient les marocains arabes et berbères et les Sahraouis et dérive d'un groupe d'Afrique de l'est, le second inclut les algériens, égyptiens et tunisiens connectés à la fois aux européens et aux érythréens.

Un taux de mutation de 3.8 à 4.4x10-4 mutation par nucléotide et par génération a été pris pour calculer les temps de divergence des différentes populations.

Un arbre neighbor-joining a également été construit. Il montre des regroupements similaires au réseau précédent. A quelques exceptions près, toutes les populations de l'haplogroupe E sont reliées au pastoralisme.

Enfin, une échelle multi-dimensionnelle et une Analyse en Composantes principales ont été calculées à partir de la distance génétique:
2014 Gebremeskel Figure 3

Les deux analyses montrent un regroupement en 4 clusters. Le premier groupe (zone grise) comprend les populations d'Afrique de l'est. Les populations d'Afar et Saho se regroupent avec les populations du Moyen-Orient (zone bleue). Les populations d'Afrique de l'ouest et du sud forment le troisième groupe (zone marron). Le quatrième groupe (zone verte) est formé par les populations d'Afrique du nord.

Discussion

Les données de cette étude ont montré qu'il n'y a pas de différence génétique entre les différentes populations érythréennes quel que soit leur position géographique ou leur langue. Cela implique que cette région est probablement la scène d'événements démographiques les plus anciens, notamment la sortie d'Afrique de l'espèce humaine. Le groupe érythréen qui prend sa source chez les Kunamas pourrait représenter une dispersion ancienne le long des côtes de la mer rouge, tout juste postérieure à la sortie d'Afrique, à une date probablement proche de l'origine de l'haplogroupe E. L'expansion de l'haplogroupe E s'est ensuite propagée en différents endroits du continent africain. Ce type de migrations liées aux changements climatiques ou à la diffusion du pastoralisme est courant dans l'histoire humaine.

Ce groupe ancestral comprend les Fulani qui ont une histoire commune avec les Hausa. Ces derniers ont porté la langue Afro-asiatique à l'ouest du Sahel. Les Fulani qui parlent une langue Niger-Kordofanienne ont probablement perdu leur langue d'origine pour s'associer à un groupe sédentaire. Le groupe ancestral comprend également des populations de langue Nilo-saharienne comme les Kunamas d’Érythrée ou les Nilotiques du Soudan qui sont des pasteurs nomades mais ne parlent pas la langue Afro-asiatique pourtant majoritaire parmi les porteurs de l'haplogroupe E.

Les sous-clades du réseau dont certaines sont associées au pastoralisme, ont probablement émergé dans le Sahara, parmi une population qui parlait une langue ancestrale aux langages Afro-asiatiques et Nilo-sahariens. Le pastoralisme pourrait prendre ses origines à une date comprise entre 22.000 et 12.000 ans. Un scénario intéressant permettrait de regrouper l'origine du pastoralisme et l'origine des langues Afro-asiatiques et Nilo-sahariennes dans la même population ancestrale.

Le réseau regroupe les marocains arabes et berbères et les Saharaouis ensemble dans un cluster qui a probablement divergé des groupes d'Afrique de l'est il y a environ 32.000 ans à l'origine de l'haplogroupe E. Il est probable également que la haute fréquence de la sous-clade E-M81 en Afrique du nord et son association avec les populations de langue berbère soit consécutif à la scission de ce groupe ancien.

Un autre épisode migratoire est associé à la diffusion de la sous-clade E-M35 au delà des côtes de la mer rouge jusqu'au Moyen-Orient. Cet événement est probablement relié à des mouvements de plus vaste ampleur en Afrique de l'est, Afrique du nord, Europe et Afrique du sud, reliés à la diffusion du pastoralisme.

vendredi, février 28 2014

Une récente diffusion de l'haplogroupe R-M269 en Europe de l'ouest a entrainé une forte ressemblance des haplotypes Y-STR

Maarten Larmuseau vient de publier un nouveau papier intitulé: Recent Radiation within Y-chromosomal Haplogroup R-M269 Resulted in High Y-STR Haplotype Resemblance.

1028 échantillons ont été sélectionnés dans le projet généalogique ADN du Brabant, pour lesquels leurs ancêtres vivaient dans la région des Flandres belges, du nord Brabant ou du Limbourg des Pays-Bas, avant 1800. Les tests réalisés ont porté sur 38 marqueurs Y-STR, puis sur un certain nombre de Y-SNPs permettant de définir l'haplogroupe. L'arbre phylogénétique utilisé pour l'haplogroupe R est le suivant:
2014 Larmuseau Figure 1

Un total de 53 haplogroupes différents a été observé dans l'ensemble des données. Leur fréquence est la suivante:
2014 Larmuseau Table 1

61% appartiennent à l'haplogroupe R-M269, et 14 sous-haplogroupes de R-M269 ont été détectés. Parmi ces derniers les plus fréquents sont R-L48 (11,8%), R-P312* (9,9%), R-Z381* (9,3%), R-M529* (8,1%) et R-L2 (5,3%).

Ensuite, les auteurs ont recherché les paires d'échantillons qui correspondaient sur 17 marqueurs STR, puis sur les 38 marqueurs STR. Ainsi 98 paires d'échantillons ont le même haplotype sur 17 marqueurs STR, dont 67 paires appartiennent à l'haplogroupe R-M269. Parmi ces 67 paires, 21 paires ont chacun de leur membre appartenant à 2 sous-haplogroupes de R-M269 différents. Parmi les 46 paires dont les 2 membres sont du même haplogroupe, seules 21 paires sont reliés paternellement par des documents généalogiques. Parmi les 31 paires n'appartenant pas à l'haplogroupe R-M269, les 2 membres appartiennent toujours au même haplogroupe. Ensuite, les auteurs ont trouvé que 519 paires d'échantillons ont une seule mutation de différence sur 17 marqueurs STR. Parmi ces 519 paires, 452 sont de l'haplogroupe R-M269. Parmi ces 452 paires, 314 ont chacun de leur membre appartenant à 2 sous-haplogroupes de R-M269 différents. Parmi les 67 paires d'un haplogroupe différent de R-M269, une seule paire a ses deux membres d'haplogroupes différents: il s'agit de I-M223* et I-P95.

Sur les 38 marqueurs STR, il y a 26 paires à l'intérieur de R-M269 avec une correspondante parfaite, ou avec une seule différence ou avec seulement deux différences. Les deux membres appartiennent toujours au même haplogroupe et 16 paires parmi les 26 ont leurs deux membres qui sont reliés paternellement par des documents généalogiques. Plus de 42% des paires ayant plus de 3 mutations de différences à l'intérieur de l'haplogroupe R-M269, ont leurs deux membres d'haplogroupes différents. Dans les autres haplogroupes, seulement 2 paires sur 110 ont leurs 2 membres appartenant à deux sous-haplogroupes différents. Il n'y a aucune paire dont les différences sur les 38 marqueurs STR sont inférieures à 6, affectés à 2 haplogroupes différents et reliés paternellement par des documents généalogiques.

Un réseau des haplotypes R-M269 a été tracé:
2014 Larmuseau Figure 4

Seuls les échantillons de l'haplogroupe R-U198 se regroupent dans le réseau (points roses). Il n'est pas possible de regrouper les haplotypes appartenant aux autres sous-haplogroupes.

Ensuite, pour chacun des sous-haplogroupes de R-M269, la valeur modale des haplotypes a été calculée (moyenne et variance). Tous les haplogroupes ont presque tous la même valeur modale. Seule, la valeur modale du sous-haplogroupe R-U198 diffère par rapport à la valeur modale de R-M269 sur 4 marqueurs STR. Ceci est consistant avec les résultats obtenus sur le réseau des haplotypes dans lequel seul les échantillons du sous haplogroupe R-U198 se regroupent entre eux. Deux différences sont trouvées pour R-L20 et une seule différence pour R-Z18 et R-L48.

La combinaison des Y-SNP, Y-STR et des données généalogiques montre une forte ressemblance des haplotypes Y-STR parmi les individus d'Europe de l'ouest appartenant à l'haplogroupe R-M269, qui est probablement dû à une expansion rapide de la population. Il n'est donc pas possible de prédire le sous-haplogroupe à l'intérieur de R-M269, à partir d'un haplotype, à l'inverse d'autres haplogroupes.

L'haplogroupe R-M269 est porté par environ 110 millions d'européens, augmentant en fréquence de l'est (12% en Turquie de l'est) vers l'ouest (85% en Irlande). Le développement rapide des sous-haplogroupes de R-M269 peut être dû à un seul événement démographique, ou une combinaison de plusieurs expansions. La période d'expansion de cet haplogroupe est débattue depuis longtemps. Les premières données ont abouti à une expansion de R-M269 en Europe au paléolithique (Semino, 2000). Cependant, les études plus récentes semblent montrer que cet événement a eu lieu plus récemment au néolithique (Balaresque, 2010 ou Sjödin, 2011). Plus récemment encore, Mike Hammer suggère que l'expansion de l'haplogroupe R-M269 a eu lieu seulement au début des âges des métaux: voir notamment sa conférence intitulée: Men, Metal, and the Recent Re-Peopling of Western Europe. Il se base notamment sur les résultats d'ADN ancien en Europe qui montrent que R-M269 est absent au mésolithique et au néolithique. L'échantillon R-M269 le plus ancien a été détecté sur des squelettes du Campaniforme à Kromsdorf en Allemagne. Ils sont datés d'environ 2500 av. JC.

Les observations établies dans cette étude ont des conséquences importantes pour la recherche médico-légale ou pour la généalogie génétique. Le nombre de marqueurs STR ne doit pas étre trop faible, mais doit être supérieur notamment à 17 pour pouvoir discriminer des familles. De plus il peut être également intéressant d'utiliser les SNP, notamment pour déterminer l'origine géographique probable d'un échantillon.

- page 1 de 5