banner
Heim / Blog / Alte Genome aus dem Himalaya beleuchten die genetische Geschichte der Tibeter und ihres Tibeto
Blog

Alte Genome aus dem Himalaya beleuchten die genetische Geschichte der Tibeter und ihres Tibeto

Jun 08, 2023Jun 08, 2023

Nature Communications Band 13, Artikelnummer: 1203 (2022) Diesen Artikel zitieren

17.000 Zugriffe

6 Zitate

46 Altmetrisch

Details zu den Metriken

Die heutigen Tibeter haben sich sowohl genetisch als auch kulturell an die Höhenlage des tibetischen Plateaus angepasst, grundlegende Fragen zu ihrer Herkunft bleiben jedoch unbeantwortet. Jüngste archäologische und genetische Untersuchungen deuten darauf hin, dass es auf dem Plateau in den letzten 40.000 Jahren eine frühe Population gab, gefolgt von der Ankunft weiterer Gruppen innerhalb der letzten 10.000 Jahre. Hier erhalten wir neue genomweite Daten für 33 alte Individuen aus hochgelegenen Standorten am südlichen Rand des tibetischen Plateaus in Nepal, von denen wir zeigen, dass sie am engsten mit heutigen Tibetern verwandt sind. Der Großteil ihrer Abstammung stammt von Gruppen ab, die mit spätneolithischen Populationen am nordöstlichen Rand des tibetischen Plateaus verwandt sind, sie tragen aber auch eine geringfügige genetische Komponente aus einer ausgeprägten und tiefpaläolithischen eurasischen Abstammung in sich. Im Gegensatz zu ihren tibetischen Nachbarn bilden die heutigen nicht-tibetischen Tibeto-Burman-Sprecher, die in mittleren Höhenlagen am südlichen und östlichen Rand des Plateaus leben, eine genetische Linie, die eine ausgeprägte genetische Geschichte widerspiegelt. Schließlich bestätigt ein Vergleich zwischen alten und heutigen Hochlandbewohnern die anhaltende positive Selektion von adaptiven Allelen in großer Höhe.

Das tibetische Plateau ist durch hypobare Bedingungen, unwegsames Gelände, kalte Temperaturen und eine relativ geringe biologische Produktivität gekennzeichnet. Trotz dieser Einschränkungen haben sich ethnische Tibeter erfolgreich an diese Umgebung angepasst und leben seit Jahrtausenden auf dem Plateau1. Das Verständnis ihrer genetischen und kulturellen Anpassungen an diese anspruchsvolle hypoxische Umgebung ist von großem archäologischen, anthropologischen, genetischen und physiologischen Interesse2. Um dies vollständig zu erreichen, müssen viele grundlegende Fragen zu den Ursprüngen der heutigen tibetischen Bevölkerung beantwortet werden, einschließlich der Ursprungspopulationen und der anfänglichen Wanderungen der Völker auf das Plateau, des Zeitpunkts der Etablierung dauerhafter Plateaupopulationen und der Etablierung der Genpools der Vorfahren für die heutigen Tibeter.

Obwohl archäologische Daten über frühe Bevölkerungsbewegungen auf das Plateau spärlich sind, deutet die Stätte der Baishiya-Karsthöhle (3280 m ü. M., Meter über dem Meeresspiegel) am äußersten nordöstlichen Rand des tibetischen Plateaus auf die Anwesenheit von Denisova-Völkern zwischen 160.000 und 60.000 hin vor (kya)3,4,5 Jahren. Daten am Standort Nywa Devu (4600 m ü. M.) auf dem Zentralplateau deuten auf eine moderne menschliche Präsenz zwischen 30 und 40.000 Jahren hin6. Ob einer dieser Standorte eine dauerhafte Ansiedlung von Menschen auf dem Plateau widerspiegelt, ist unbekannt. Meyer et al.7 schlagen eine anfängliche dauerhafte Besetzung des Zentralplateaus bei Chusang (4270 m.ü.M.) durch Jäger und Sammler zwischen 7,4 und 12,7 kya vor. Im Gegensatz dazu haben Chen et al.8 und andere argumentiert, dass eine dauerhafte Bevölkerung auf dem Zentralplateau erst mit dem Aufkommen der auf Gerste basierenden Landwirtschaft um etwa 3,6.000 Jahre möglich war. Das letztgenannte Modell geht im Allgemeinen davon aus, dass die Landwirtschaft durch Einwanderer aus tiefer gelegenen Standorten (<2500 m ü. M.) entlang der nordöstlichen Ränder des Plateaus auf das Plateau gebracht wurde; Es wird angenommen, dass diese Migranten wesentlich zum Genpool der heutigen Tibeter beigetragen haben9.

Belege für eine komplexere, vielfältigere Herkunft der heutigen Tibeter werden jedoch auch durch genetische Daten gestützt. Dicht beprobte uniparentale Marker können zum größten Teil auf Abstammungslinien zurückgeführt werden, die seit dem frühen Holozän in Nordostasien vorkommen, aber auch ältere Haplogruppen wie das mitochondriale M16 und das Y-chromosomale D-M174, die aus einer tiefen eurasischen Abstammungslinie stammen, sind unter den heutigen einzigartig -Tages-Tibeter10,11,12. Basierend auf Daten zur Gesamtgenomsequenz wurde auch die Idee eines altpaläolithischen Beitrags zum tibetischen Genpool vorgeschlagen. Eine Studie, die heutige tibetische Genome mit denen der alten Sibirier und archaischen Homininen verglich, kam zu dem Schluss, dass eine Mischung alter Vorfahren – archaischer und nicht-archaischer – unter den hypothetischen frühen Völkern auf dem Plateau einen Beitrag leistete13. Dieser Vorschlag steht im Einklang mit der Entdeckung eines Haplotyps am EPAS1-Locus (Endothelial PAS Domain Protein 1), der von einer Denisova-ähnlichen Population in den heutigen tibetischen Genpool eingedrungen ist und einen selektiven Vorteil in hochgelegenen Umgebungen verschafft14,15,16 ,17.

Insgesamt deuten aktuelle genetische Daten auf eine mehrstufige Besiedlung des Plateaus hin: Bewegungen von Populationen aus dem Pleistozän mit einem gewissen Maß an archaischer Beimischung auf das Plateau, gefolgt von Migrationen aus dem Holozän von den nordöstlichen Rändern des Plateaus. Obwohl die Identität und Herkunft der Bevölkerung aus dem Pleistozän weiterhin unbekannt ist, hat eine aktuelle Analyse eine klare Ost-West-Linie der genetischen Variation innerhalb der heutigen geografisch verstreuten tibetischen Bevölkerung identifiziert18. Dieser Anstieg spiegelt möglicherweise neolithische Bevölkerungsbewegungen wider, die beispielsweise mit der Ausbreitung des Gerstenanbaus in Zusammenhang standen. Vor der Ausbreitung auf dem Plateau wurde Gerstenanbau von Bevölkerungsgruppen aus dem späten Neolithikum und der frühen Bronzezeit in der Region Gansu-Qinghai betrieben, wie sie beispielsweise mit der Qijia-Kultur in Verbindung stehen (ca. 2300–1800 v. Chr.)19,20. Diese Neigung könnte auch durch spätere historische Ereignisse begründet oder verstärkt worden sein, wie etwa die Expansion des tibetischen Reiches seit dem 7. Jahrhundert n. Chr., oder durch einen längeren Prozess des Genflusses zwischen nahegelegenen Bevölkerungsgruppen in einer durch Entfernung isolierten Art und Weise, was nicht der Fall war beinhalten weiträumige Wanderungen.

Daten über alte DNA (aDNA) haben das Potenzial, diese Fragen zu klären, unter anderem weil genetische Schlussfolgerungen aus alten Populationen nicht durch aktuelle historische Ereignisse verfälscht werden. Frühere aDNA-Studien an Personen aus drei hochgelegenen Himalaya-Standorten im Mustang-Distrikt im nördlichen Zentralnepal aus der Zeit zwischen 800 v. Chr. und 650 n. Chr. zeigten, dass diese Standorte von Populationen eindeutig ostasiatischer Abstammung bewohnt wurden, die wahrscheinlich vom tibetischen Plateau eingewandert waren21.

Hier erhalten wir aDNA-Daten von weiteren Individuen aus diesen und vier weiteren Himalaya-Standorten in den Distrikten Mustang und Manang (MMD), wodurch sich die zeitliche Abdeckung um mehr als 600 Jahre erhöht, von ca. Chr.–650 n. Chr. und liefert den bisher frühesten genetischen Beweis für Plateau-Populationen. Wir zeigen, dass sich diese alten Himalaya-Populationen genetisch mit den heutigen Tibetern vereinen und dass sie einen frühen Zweig innerhalb der tibetischen Abstammungslinie darstellen, was sie besonders aufschlussreich macht, um Rückschlüsse auf die Geschichte des tibetischen Genpools, seine Ursprünge und seine aktuelle Verteilung in der Gegenwart zu ziehen -Tag-Tibeter und ihre Nachbarn.

Hier analysieren wir genomweite Daten von 38 alten Individuen aus sieben Standorten in der MMD-Region Nepal (Abb. 1; Ergänzende Daten 1–3): Suila (n = 1; 1494–1317 v. Chr.), Lubrak (n = 2; Chr.), Chokhopani (n = 3; 801–770 v. Chr.), Rhirhi (n = 4; 805–767 v. Chr.), Kyang (n = 7; 695–206 v. Chr.), Mebrak (n = 9; 500 v. Chr.). –1 n. Chr.) und Samdzong (n = 12; 450–650 n. Chr.). Von diesen 38 Personen wurden 31 in dieser Studie neu gemeldet und sieben wurden bereits in einer früheren Studie der Region gemeldet21. Wir haben auch neue Daten für zwei der zuvor veröffentlichten Personen erstellt, was zu neuen genomweiten Daten für 33 Personen führte (Ergänzungsdaten 1, 2). Alle Daten wurden aus menschlichem Zahnmaterial generiert. Aufgrund von Störungen im Leichenbestattungskontext wurde zunächst angenommen, dass einige Zähne von unterschiedlichen Individuen stammten, später jedoch anhand genetischer Daten als Replikatproben identifiziert, was zu neun Individuen mit Daten von mehreren Zähnen führte (Ergänzungsdaten 4). Daten von mehreren Zähnen und Bibliotheken, die zu einem einzelnen Individuum gehörten, wurden vor den nachgelagerten Analysen entsprechend zusammengefasst. Unter den sieben archäologischen Stätten wurden Suila, Lubrak, Rhirhi und Kyang bisher nicht beschrieben (Ergänzungstext 1). Nach dem ersten genetischen Screening wurde das gesamte Genom von 13/33 Individuen mit geringer Abdeckung sequenziert (0,5–6,6x pro Individuum; Ergänzende Daten 1). Wir haben zusätzlich Capture-Anreicherungsmethoden angewendet, um auf zwei Sätze von Einzelnukleotidpolymorphismen (SNPs) abzuzielen: (1) einen Satz von „1240K“-Varianten, die so konzipiert sind, dass sie sich mit Markern auf den Affymetrix Human Origins- und Illumina-Genotypisierungsarrays22 überschneiden und hier für alle erfasst werden 33 Personen; und (2) ein zusätzlicher Satz von 50 K-Varianten, ausgewählt und kuratiert aus Selektionsscans und Phänotyp-Assoziationssignalen in heutigen tibetischen Populationen23 und für 21 Individuen erfasst (Ergänzungsdaten 1). Die kombinierten individuellen Daten erfüllten die standardmäßigen Qualitätskontrollmaßnahmen für alte Genomdaten (Ergänzungsdaten 2). Für die nachgelagerte Analyse haben wir zwei Referenzdatensätze zusammengestellt, die hauptsächlich aus veröffentlichten genomweiten Genotypdaten stammen, die auf den Genotypisierungsarrays Affymetrix Human Origins („HO“; ~500 K SNPs) und Illumina („Illumina“; ~220 K SNPs) erstellt wurden ( Ergänzende Daten 5, 6). Wir haben diese Datensätze mit veröffentlichten alten Genomen sowie Genomen heutiger Sherpa- und Tibeter-Individuen aus Nepal ergänzt (Ergänzungsdaten 5, 6). Während wir uns bei den meisten unserer Analysen auf den HO-Satz aufgrund seiner höheren SNP-Dichte konzentrierten, verwendeten wir den Illumina-Satz auch für eine eingehende Analyse verschiedener Himalaya-Populationen in Nepal, Bhutan, Indien und der Autonomen Region Tibet24.

Kreise stellen antike Gruppen dar und sind nach archäologischen Perioden gefärbt. Quadrate repräsentieren die heutige Bevölkerung von Tibeto-Burman-Sprechern. Linker Einschub: eine vergrößerte Ansicht der sieben aMMD-Standorte. Einschub unten links: eine vergrößerte Ansicht der heutigen nepalesischen und bhutanischen Bevölkerung: 1. Bahing; 2. Die Berge; 3. Baram; 4. Hernien; 5. Brokpa; 6. Bumthang; 7. Chali; 8. Chamling; 9. Chantyal; 10. Chepang; 11. Chetri; 12. Dakpa; 13. Damai; 14. Dhimal; 15. Dumi; 16. Hunger; 17. Gongduk; 18. Gurung; 19. Khengpa; 20. Kulung; 21. Kurz; 22. Lakha; 23. Layap; 24. Limbu; 25. Lower_Mustang; 26. Magar; 27. Majhi; 28. Mangde; 29. Monpa; 30. Nachiring; 31. Newar; 32. Fischer; 33. Nubri; 34. Nup; 35. Puma; 36. Sampang; 37. Sarki; 38. Sherpa; 39. Sherpa_Knock; 40. Sonar; 41. Sunwar; 42. Tamang; 43. Thakali; 44. Tshangla; 45. Tsum; 46. ​​​​Upper_Mustang; 47. Wambule. Die Basiskarte wurde in R v4.0.0 mit den Paketen MapData v2.3.0 und Elevatr v0.3.4 erstellt.

Um das genetische Profil der alten Individuen aus Nepal (aMMD) im Kontext der weltweiten menschlichen Vielfalt zu beschreiben, führten wir zunächst eine Hauptkomponentenanalyse (PCA)25 durch. Nachdem wir bestätigt hatten, dass sie sich mit anderen ostasiatischen Individuen zusammenschließen (ergänzende Abbildung 1), projizierten wir die aMMD-Individuen auf die ersten beiden PCs, die für heutige ost-eurasische Individuen berechnet wurden (Abb. 2; ergänzende Daten 4). Die heutigen Populationen bilden eine Struktur mit drei Ausläufern, die jeweils Abstammungslinien darstellen, die den südchinesischen und südostasiatischen (SC-SEA), nordostasiatischen und tibeto-burmesischen Populationen entsprechen. Der Ami in Taiwan, der Ulchi im unteren Amur-Becken im Fernen Osten Russlands und der Sherpa in Nepal bilden jeweils die distalen Enden der drei Ausläufer. Der tibeto-burmesische Sporn stimmt mit der genetischen Ost-West-Linie der heutigen Tibeter überein, die in einer früheren Studie beschrieben wurde18. In Übereinstimmung mit unseren vorherigen Ergebnissen21 bilden alle aMMD-Individuen, einschließlich derjenigen aus den neu untersuchten Standorten Suila, Lubrak, Rhirhi und Kyang, eine Gruppe mit heutigen tibetischen Populationen. Die mit der unbeaufsichtigten modellbasierten Clustering-Methode ADMIXTURE erhaltenen genetischen Profile stimmen mit denen der PCA überein, wobei aMMD-Individuen einzigartige Vorfahrenkomponenten mit heutigen Populationen mittlerer und großer Höhen teilen (ergänzende Abbildung 2). Ebenso deuten Outgroup-f3-Statistiken26 darauf hin, dass die aMMD-Individuen den höchsten Grad an gemeinsamer genetischer Drift untereinander aufweisen, gefolgt von den heutigen Sherpa und Tibetern und dann von Tibeto-Burman-Sprechern in geringer Höhe wie Naxi, Yi und Nagaland Populationen in Indien (Ergänzende Abbildungen 3, 4).

Wir haben PCs von 486 heutigen asiatischen Individuen im HO-Datensatz berechnet und aMMD-Individuen auf die Top-PCs projiziert. Graue Punkte stellen heutige Individuen dar, die wir zur Berechnung der PCs verwendet haben. Kreise stellen die mittleren Positionen heutiger Gruppen dar, gefärbt nach ihren Sprachfamilien und ihren jeweiligen Gruppenabkürzungen. Rote Großbuchstaben „U, L, C, R, K, M, S“ stehen für projizierte aMMD-Individuen.

Die uniparentalen Haplogruppen der aMMD-Individuen stützen auch ihre enge genetische Verwandtschaft mit heutigen Sherpa/Tibetern (Supplementary Data 2). Wir haben Y-Haplogruppen für 14 aMMD-Individuen zugewiesen. Wir beobachteten eine geringe Diversität: 13 der 14 Männchen trugen abgeleitete Marker der Y-Haplogruppe O-M117 und 12 Männchen trugen abgeleitete Marker der Unterlinie Oα1c1b-CTS5308 (ergänzende Abbildung 5)27. In der heutigen Bevölkerung kommt diese Unterlinie vor allem bei Tibetern und Sherpas auf dem Plateau vor, im Gegensatz zu ihrer Schwesterlinie Oα1c1b-Z25929, die heute hauptsächlich in Südchina und Nordostindien vorkommt27. Schätzungen zufolge kam es zwischen 7.000 und 5.000 v. Chr. zu einer raschen Ausstrahlung aller vorhandenen O-M117-Linien. Dies wurde als Ausdruck der Verbreitung chinesisch-tibetischer Sprachen interpretiert, die wahrscheinlich aus Nordchina stammen27. Bemerkenswert ist, dass die Y-Haplogruppe O-M117 auch bei antiken Individuen aus den oberen jungsteinzeitlichen Yangshao- und spätneolithischen Qijia-Kulturen des Gelben Flusses gefunden wurde, was den Beweis dafür liefert, dass die Mehrzahl der männlichen aMMD-Abstammungslinien auf diese Region zurückgeht. Ein männliches aMMD-Individuum (S41) gehörte einer anderen Y-Haplogruppe, D1a, an, die heute eine weitere häufige Haplogruppe auf dem tibetischen Plateau ist10. Die mitochondrialen Haplogruppen der aMMD-Individuen sind zwar vielfältiger, aber auch bei heutigen Tibetern weit verbreitet (Supplementary Data 2).

Obwohl die aMMD-Individuen am engsten miteinander verwandt sind (ergänzende Abbildungen 3, 4), weisen sie subtile Unterschiede in ihrer genetischen Affinität auf, die auf eine genetische Heterogenität im Feinmaßstab zwischen ihnen hindeuten könnten (ergänzende Abbildung 3). Am auffälligsten ist, dass alle aMMD-Gruppen mit Lubrak die höchste Outgroup-f3-Statistik aufweisen, während sie mit Chokhopani den niedrigsten Wert aufweisen. Tatsächlich sind alle anderen aMMD-Gruppen, einschließlich der frühesten Suila, deutlich näher an Individuen bei Lubrak als an Chokhopani, gemessen mit f4 (Mbuti, aMMD; Chokhopani, Lubrak) (>+4,4 SEM, Standardfehlermaß). Das gleiche Muster ist auch bei heutigen nepalesischen Sherpa/Tibetern zu beobachten (>+2,7 SEM), während ostasiatische Tieflandpopulationen symmetrisch mit Chokhopani und Lubrak verwandt sind (Supplementary Data 7). Mit qpWave haben wir die beiden Topologien ((Lubrak, aMMD), Chokhopani) und ((Chokopani, aMMD), Lubrak) formal verglichen. Wir zeigen, dass Suila, Rhirhi, Mebrak und Samdzong innerhalb der Grenzen unserer Auflösung (p > 0,192) zu Lubrak gehören (d. h. die frühere Topologie gilt), und dass sich Kyang nur geringfügig von Lubrak unterscheidet (p = 0,027; Ergänzungstabelle 1). ). Im Gegensatz dazu schlug die Modellierung der aMMD-Gruppen als Schwestergruppe von Chokhopani durchweg fehl und daher kann die letztere der beiden Topologien abgelehnt werden (p < 1,38 × 10−4). Eine Kombination von Lubrak mit einem geringen Beitrag einer südasiatischen Gruppe (z. B. Pulliyar) passt angemessen zu allen vier Gruppen, mit einem geschätzten südasiatischen Abstammungsbeitrag von nur 1,9–5,1 % (p > 0,179; Ergänzungstabelle 2). Für Chokhopani passen weder Lubrak + South Asian noch Lubrak + Naxi/Yi/Naga (p < 3,67 × 10−4); Suila + Naxi/Yi/Naga passt jedoch zu einem erheblichen Beitrag der Tiefländer (31–40 %; Ergänzungstabelle 3). Wir entdecken auch ein signifikantes Signal der Beimischung in Chokhopani mithilfe von DATES, was auf eine Beimischungszeit in Chokhopani von 46 ± 11 Generationen vor der Zeit von Chokhopani schließen lässt und sie auf ca. 1500–2800 v. Chr. (für Mittelwert ± 2 SEM; ergänzende Abbildung 6). Dies impliziert, dass ein Genfluss zwischen Chokhopani und den Vorfahren dieser Populationen in niedriger/mittlerer Höhe vor 800 v. Chr. und plausibel vor 1500 v. Chr. stattgefunden haben muss.

Wie aMMD-Gruppen sind heutige Sherpa/Tibetaner-Gruppen aus der MMD-Region und den nahegelegenen Distrikten Gorkha/Solukhumbu in Nepal23 sowie Tibeter aus weiter entfernten Orten genetisch dem Lubrak und dann unter den alten und heutigen Tages-Ostasiaten (Ergänzende Abbildung 7; Ergänzende Daten 8). Die früheste aMMD-Gruppe aus Suila sowie spätere aMMD-Gruppen gehören ebenfalls zu den besten Outgroup-f3-Signalen der heutigen Sherpa/Tibeter. Chokhopani zeigt kleinere Outgroup-f3-Werte, wie aufgrund seines Beimischungssignals mit Tieflandbewohnern zu erwarten ist. Daher kommen wir zu dem Schluss, dass Lubrak/Suila bisher die frühesten bekannten Vertreter eines Genpools sind, der in den Hochgebirgspopulationen auf dem tibetischen Plateau und im Himalaya am stärksten vertreten ist; Wir bezeichnen diesen Genpool in dieser Studie als „tibetische“ Abstammungslinie.

Archäologische Daten deuten darauf hin, dass neolithische Populationen im oberen/mittleren Einzugsgebiet des Gelben Flusses einen großen kulturellen Einfluss auf die Ausbreitung der Landwirtschaft auf dem Plateau hatten8. Diese Region wurde auch als wahrscheinliche Heimat der chinesisch-tibetischen Sprachfamilie vorgeschlagen29,30. Interessanterweise weisen unter den alten Ostasiaten im Tiefland 28, 31, 32, 33 mittel-/späte neolithische Gruppen aus der Region des oberen Gelben Flusses und ihrer Peripherie (Abb. 1) die größte genetische Affinität zu den aMMD-Gruppen auf (ergänzende Abb. 8). Dazu gehören spätneolithische Individuen aus den Stätten Jinchankou und Lajia in der Region des Oberen Gelben Flusses, die zur Qijia-Kultur gehören (ca. 2300-1800 v. Chr.; Upper_YR_LN), Individuen aus der spätneolithischen Shimao-Stätte Shengedaliang in der Provinz Shaanxi (ca. 2250-1800 v. Chr.). 1950 v. Chr.; Shimao_LN) und solche aus der mittelneolithischen Stätte Miaozigou in der Inneren Mongolei (ca. 3550–3050 v. Chr.; Miaozigou_MN). Diese drei Gruppen haben ein ähnliches genetisches Profil und stammen zu etwa 80 % aus einem Genpool, der mit den mittelneolithischen Individuen der Yangshao-Kulturstätten Wanggou und Xiaowu in der Zentralebene (ca. 4000–3000 v. Chr.; YR_MN) verwandt ist die restlichen ca. 20 % stammen aus dem Genpool des antiken Nordostasiens (ANA), der mit Jägern und Sammlern aus der Jungsteinzeit aus der Devil's Gate-Höhle im Fernen Osten Russlands („DevilsCave_EN“) verwandt ist28,32. Wir nahmen Upper_YR_LN und YR_MN als Vertreter der Tiefland-Genpools und modellierten die Beziehung zwischen aMMD und Upper_YR_LN/YR_MN über einen graphbasierten Ansatz unter Verwendung von qpGraph34. YR_MN ahmt die primäre Quelle der aMMD-Gruppen und der heutigen Sherpa/Tibeter nicht nach, hauptsächlich aufgrund der zusätzlichen Affinität von aMMD zum ANA-Genpool (Ergänzungstabelle 4). Im Gegensatz dazu wird Upper_YR_LN, das eine stärkere genetische Affinität zu ANA aufweist, in den am besten bewerteten Diagrammen durchweg als ihre primäre genetische Quelle ausgewählt (Abb. 3). Zusammen mit ihrer geografischen und zeitlichen Nähe zu den frühen Gerstenbauern auf dem Plateau stützen unsere Ergebnisse einen wichtigen genetischen Zusammenhang zwischen Plateau-Populationen und den Vorfahren der frühen Gerstenbauern am nordöstlichen Rand des Plateaus. Wir stellen jedoch fest, dass diese genetische Verbindung bereits in den frühesten aMMD-Gruppen aus den Jahren 1494–1317 kal. hergestellt wurde. Chr. am äußersten südlichen Ende des Plateaus (Ergänzungsdaten 3). Dieses Datum liegt nur etwa 200 Jahre nach dem vorgeschlagenen Beginn des ca. 1650 v. Chr. Expansion der Gerstenbauern vom nordöstlichen Rand des Plateaus aus8. Zur Erklärung dieser Ergebnisse müsste eine rasche Bevölkerungsexpansion vom Gelben Fluss über das gesamte Plateau, eine Strecke von mehr als 1800 km über unwegsames Gelände, herangezogen werden. Daher fand wahrscheinlich vor der Gerstenexpansion ein erheblicher genetischer Austausch mit Tieflandbewohnern statt.

aMMD-Gruppen werden als Zwei-Wege-Mischungen mit Upper_YR_LN als einer Quelle und einer tiefen Abstammungslinie als anderer Quelle modelliert. Es wird vermutet, dass die phylogenetische Position der tiefen Abstammungslinie etwa an der Grenze zwischen westlichen und östlichen eurasischen Abstammungslinien liegt, aber aufgrund der begrenzten Auflösung unseres Datensatzes konnten keine weiteren Angaben gemacht werden. Hier präsentieren wir eine Grafik für Suila, die eine tief im Osten Eurasiens gelegene Quelle bevorzugt, und eine für Lubrak mit einem Zweig der Länge Null, was auf eine Affinität weder zu westlichen noch zu östlichen eurasischen Abstammungslinien hindeutet. Alternative Topologien und solche ohne tiefen eurasischen Genfluss sind in der ergänzenden Abbildung 9 dargestellt. Z-Scores werden durch 5-cM-Block-Jackknifing berechnet, wie im qpGraph-Programm implementiert.

Obwohl 80–92 % ihrer Abstammung aus einer Linie stammt, die mit Upper_YR_LN verwandt ist (Ergänzungstabelle 4), werden die aMMD und die heutigen Sherpa/Tibeter nicht angemessen als Schwesterklade von Upper_YR_LN modelliert, wie angesichts der einzigartigen genetischen Komponenten der Tibeter zu erwarten war nicht mit Tieflandbewohnern geteilt, einschließlich des EPAS1-Allels aus einer Denisovan-verwandten Beimischung. Vielmehr stammen die verbleibenden 8–20 % ihrer Abstammung aus einem tiefen Teil des Bevölkerungsdiagramms in der Nähe der Spaltung zwischen westlichen und östlichen eurasischen Zweigen (Abb. 3; ergänzende Abb. 9). Diese Quelle stammt jedoch nicht von archaischen Homininen (Neandertaler oder Denisova-Menschen, die weniger als 0,5 % der genomweiten Abstammung ausmachen), und unsere Ergebnisse lehnen zuvor vorgeschlagene Quellen des Genflusses in die tibetische Abstammungslinie ab13,35,36, einschließlich tief verzweigter östlicher Abstammungslinien Eurasische Abstammungslinien, wie das 45.000 Jahre alte Ust'-Ishim-Individuum aus Südsibirien, das 40.000 Jahre alte Tianyuan-Individuum aus Nordchina und mit Hoabinhian/Onge verwandte Abstammungslinien in Südostasien (ergänzende Abbildung 10), deuten darauf hin Stattdessen handelt es sich um eine weitere nicht beprobte Abstammungslinie innerhalb der frühen genetischen Vielfalt Eurasiens. Diese tiefe eurasische Abstammungslinie repräsentiert wahrscheinlich das paläolithische genetische Substrat der Plateau-Populationen.

Die nach Süden ausgerichteten Hänge des Himalaya beherbergen viele ethnolinguistische Gruppen, die ein auffälliges Schichtungsmuster über die Höhenlagen hinweg aufweisen: Indoiranisch sprechende südasiatische Bevölkerungsgruppen bewohnen die Tiefebene, Sherpa/Tibeter besiedeln das Hochland und verschiedene nicht-tibetische tibeto-burmanischsprachige Gruppen , wie Tamang und Gurung, liegen im mittleren Höhenbereich37,38. Während Sherpa/Tibeter in Nepal wahrscheinlich vom Plateau (d. h. über die nördliche Route) in den Himalaya gelangten39, deutete eine frühere genetische Studie auf eine separate südliche Migrationsroute für die tibetisch-burmanischen Gruppen mittlerer Höhe hin37. Allerdings blieb unklar, in welcher Beziehung nicht-tibetische tibeto-burmanischsprachige Gruppen untereinander und zur tibetischen Abstammungslinie stehen. Hier nutzen wir Lubrak, die repräsentativste antike Gruppe innerhalb der tibetischen Abstammungslinie, um die genetische Geschichte der tibeto-burmanischsprachigen Bevölkerungsgruppen zu untersuchen. Insbesondere modellieren wir Sherpa/Tibeter und andere tibeto-burmanische Gruppen, wobei wir nepalesische Tibeter aus Tsum als eine Quelle und Upper_YR_LN/YR_MN als andere Quelle verwenden, während wir Lubrak als wichtige Außengruppe verwenden, um die tibetische Abstammungslinie mit hoher Auflösung von Tieflandvorfahren zu unterscheiden. In Übereinstimmung mit einem früheren Bericht18 stellen wir fest, dass die tibetischen Gruppen aus dem Plateau und dem Himalaya eine genetische Linie bilden. Erstens stammen nepalesische Tibeter aus den Distrikten Mustang und Gorkha (Upper Mustang, Nubri, Tsum), die miteinander verwandet sind, und Sherpa aus dem Distrikt Solukhumbu zu 87–92 % aus der tibetischen Abstammungslinie, die durch Tsum repräsentiert wird (Abb. 4; Ergänzungstabelle 5). Zweitens leiten Tibeter relativ nahe am Himalaya (z. B. Lhasa, Shigatse, Shannan) einen Großteil ihrer Vorfahren aus der tibetischen Abstammungslinie ab (76–86 %). Schließlich weisen tibetische Gruppen weiter östlich oder nordöstlich einen viel höheren Anteil der Tieflandlinie auf (21–58 %). Während wir aus der Radiokarbondatierung wissen, dass die beiden Pole dieser Kline, dargestellt durch aMMD und Upper_YR_LN, bereits vor ca. 30 Jahren vorhanden waren. 1420 v. Chr. könnte der Vermischungsprozess zwischen den beiden Polen, der den heutigen Berghang bildete, später stattgefunden haben. Weitere archäogenetische Studien im Plateau sind erforderlich, um zu verstehen, wann sich die Kline zu bilden begann und wie sie sich im Laufe der Zeit auf dem Plateau entwickelte.

Wir modellieren tibeto-burmanische Gruppen mit nepalesischem Tibetisch aus der Tsum-Region („Tsum“) und Upper_YR_LN als den beiden Quellen unter Verwendung von qpAdm. Tibeter aus dem Hochland und Tibeter in der Nähe des Himalayas leiteten den Großteil ihrer Abstammung von der tibetischen Abstammungslinie ab, während die tibeto-burmanischen Gruppen weiter östlich einen viel höheren Anteil ihrer Abstammung von der Abstammungslinie der Tiefländer abstammten. Die nummerierten Kreise/Rechtecke stellen Punktschätzungen von qpAdm dar, und die dicken und dünnen vertikalen Segmente stellen ±1 bzw. ±2 Standardfehlermaße (SEM) dar, die durch 5-cM-Block-Jackknifing geschätzt werden.

In Bezug auf die nicht-tibetischen tibeto-burmesischen Populationen schließen wir genetische Verbindungen zwischen ihnen entlang der Route um das Plateau herum (Abb. 5). Wir beschreiben die Ergebnisse beginnend am südöstlichen Rand des Plateaus mit den Naxi und Yi und gehen dann im Uhrzeigersinn nach Südwesten vor (Abb. 5). Erstens haben Naxi und Yi aus dem Südwesten Chinas ein genetisches Profil, das dem von YR_MN sehr ähnlich ist, sich jedoch von dem von Upper_YR_LN unterscheidet (ergänzende Abbildung 11). Mit qpAdm modellieren wir Naxi/Yi als Schwesterklade von YR_MN, ohne dass ein Beitrag der tibetischen Linie erforderlich ist (Ergänzungstabelle 5). Modelle, die Upper_YR_LN als Proxy verwenden, schlagen fehl, indem sie Abstammungskoeffizienten größer als 1 von Upper_YR_MN zurückgeben. Naga aus dem Nordosten Indiens werden als Mischung aus 68–78 % YR_MN/Naxi/Yi und 22–32 % tibetischer Abstammung modelliert (Abb. 5; Ergänzungstabellen 5–6). Schließlich haben Tamang und Gurung aus der Mittelgebirgsregion des südlichen Himalaya einen noch höheren Anteil ihrer Abstammung aus der tibetischen Abstammungslinie (60–63 %), sowie zusätzlich einen südasiatischen Zustrom (9–19 %). YR_MN-ähnliche Abstammung (Ergänzungstabelle 7). Modelle, die Naxi/Yi/Naga als Quelle anstelle von YR_MN verwenden, passen ebenfalls (Ergänzungstabelle 7). Das gleiche Drei-Wege-Beimischungsmodell, tibetische Abstammung + YR_MN/Naga + südasiatisch, passt auch angemessen zu den 16 zuvor veröffentlichten bhutanischen Himalaya-Gruppen24, mit heterogenen Beitragsniveaus von YR_MN/Naga (21–47 % YR_MN oder 32–75 %). Naga) und tibetische Abstammungslinien (20–82 %; Ergänzende Abbildung 12; Ergänzende Daten 9). Insgesamt ist der südasiatische Beitrag für viele bhutanische Gruppen gering, aber nicht zu vernachlässigen und liegt zwischen 0 und 7 %. Interessanterweise repräsentieren südindische Stammesgruppen (z. B. Pulliyar) für die Bevölkerungsgruppen in Nepal mit erheblicher südasiatischer Abstammung (z. B. Baram, Chantyal, Chepang, Gurung) ihre südasiatische Abstammung besser als nordindische Gruppen (Supplementary Data 9). Diese Ergebnisse verdeutlichen die Komplexität und vielschichtige Vermischungsgeschichte der tibeto-burmesischen Populationen im Himalaya.

Tibetische Gruppen aus dem Plateau und dem Himalaya bilden eine genetische Kline, wobei die beiden Pole durch die heutigen nepalesischen Tibeter (sowie aMMD) und Upper_YR_LN („die tibetische Kline“) repräsentiert werden. Die nicht-tibetische tibeto-burmanische Klippe spiegelt die Beimischung entlang der Route rund um das Plateau wider und umfasst Populationen mittlerer Höhe wie Naxi, Yi, Naga, Tamang und Gurung. Naxi und Yi können nicht als Teil der tibetischen Linie modelliert werden, dh Tsum+Upper_YR_LN; Stattdessen modelliert YR_MN allein sie angemessen. Nicht-tibetische Tibeto-Burman-Sprecher haben einen größeren Beitrag von der tibetischen Abstammungslinie (repräsentiert durch nepalesische tibetische Tsum), und die weit westlich gelegenen Populationen in mittlerer Höhe, Tamang und Gurung, haben darüber hinaus südasiatischen Zustrom. Quadrate geben die in Abstammungsmodellen verwendeten Quellpopulationen an (Kreise).

Unsere vorherige Studie berichtete, dass abgeleitete Allele für positiv ausgewählte SNPs im EPAS1-Gen nur bei den späteren Samdzong-Individuen beobachtet wurden, nicht jedoch bei den älteren Chokhopani- und Mebrak-Individuen21. Einschließlich unserer neuen aMMD-Genome erkennen wir immer noch keine abgeleiteten Allele im EPAS1-Haplotypblock bei den Chokhopani- und Suila-Individuen, beobachten sie jedoch mit mittlerer Häufigkeit an den anderen fünf Standorten (25–58 %). Interessanterweise ist die abgeleitete Allelhäufigkeit in den antiken Proben insgesamt geringer als bei heutigen Tibetern (75 %), was darauf hindeutet, dass die Selektion in der jüngeren Vergangenheit noch auf diese Allele einwirkte (Ergänzende Abbildung 13; Ergänzende Tabellen 8, 9). Wir haben auch versucht, die Frequenzänderungen bei zwei adaptiven nicht-synonymen Allelen im EGLN1-Gen zu untersuchen: rs12097901, das bei Ostasiaten häufig vorkommt, und rs186996510, das praktisch nur bei Tibetern vorkommt16,40. Leider schränken ungünstige Einfangbedingungen die Abdeckung dieser beiden SNPs ein. Dennoch deuten Ergebnisse der Shotgun-Sequenzierung darauf hin, dass die Häufigkeit abgeleiteter Allele im Genomfenster, das das EGLN1-Gen in den aMMD-Proben umfasst, der Häufigkeit heutiger tibetischer Populationen ähnlich ist (Ergänzungstabelle 8); Ob dieser Befund darauf hindeutet, dass sich die Selektion auf den EGLN1-Allelen nicht über den von den aMMD-Proben abgedeckten Zeitraum erstreckte oder einfach auf die spärlichen Sequenzdaten zurückzuführen ist, ist unklar.

Als nächstes nutzten wir 18 Personen mit Schrotflintensequenzierung in dieser Studie und unserer vorherigen Studie18, um einen genomweiten Selektionsscan mit fensterbasierter f3-Statistik41 durchzuführen (Abb. 6; Ergänzungstabelle 10). Die Methode quantifiziert Allelfrequenzunterschiede zwischen alten und heutigen Tibetern unter Verwendung von Han-Chinesen als Fremdgruppe und zielt daher darauf ab, eine positive Selektion bei heutigen Tibetern seit der Zeit der aMMD-Proben zu erkennen. Bei der Kombination von 17 alten Individuen (ausgenommen ein Individuum aufgrund der Verwandtschaft) zeigen die Genomfenster, die das EPAS1-Gen überlappen, die stärksten Signale, was die anhaltende positive Selektion an diesem Ort unterstützt. Die mit dem EGLN1-Gen überlappenden Genomfenster zeigen die zweitstärksten Signale. Interessanterweise werden die erhöhten f3-Statistiken in diesen Fenstern nicht durch die nicht-synonymen SNPs rs12097901 und rs186996510 verursacht, die bei aMMD bereits eine hohe Häufigkeit erreicht hatten, sondern durch SNPs, die sowohl bei aMMD als auch bei Han häufig vorkommen, bei heutigen Tibetern jedoch selten sind ( Ergänzende Daten 10). Als nächstes untersuchten wir die Überlappung zwischen den Signalen, die in diesem Auswahlscan gefunden wurden (unter Verwendung eines Z-Score-Schwellenwerts von 4) und einem früheren Satz von Signalen (oberste 0,1 % PBS-Werte im gesamten Genom), die nur mithilfe aktueller Bevölkerungsdaten identifiziert wurden23. Bis auf drei scheinen alle überlappenden Signale auf die starke Signatur an den EPAS1- und EGLN1-Loci zurückzuführen zu sein (Supplementary Data 11). Von den drei verbleibenden Regionen umfassen zwei die Gene PET112 und MCL1, die keine etablierten Kandidaten für die Reaktion auf Hypoxie sind, und eine enthält das AKT3-Gen, das an der Angiogenese beteiligt ist und an der Kontrolle der Merkmale roter Blutkörperchen beteiligt ist in einer Kandidatengenstudie42.

Wir haben f3 (Tibeter; aMMD, Han) mithilfe eines Schiebefensteransatzes mit einer Fenstergröße von 500 kb und einer Schrittgröße von 10 kb berechnet. Z-Scores für jedes Fenster wurden mit einem Resampling-Ansatz berechnet (siehe Methoden). Fenster, die die Gene EPAS1 und EGLN1 umfassen, enthalten die beiden wichtigsten Signale.

In dieser Studie analysieren wir das genetische Profil von 38 alten Himalaya-Individuen und zeigen, dass die Abstammung, die heute unter Ostasiaten in großer Höhe (dh Tibetern und Sherpa) zu finden ist, sich bereits zwischen 1494 und 1317 v. Chr. deutlich von der Abstammung der Tiefländer unterschied. Dies verschiebt den frühesten Beweis für den tibetischen Genpool um mindestens 500 Jahre im Vergleich zu unseren vorherigen Berichten über Chokhopani21. Mithilfe dieser frühen Genome beleuchten wir wichtige Merkmale der genetischen Geschichte der Tibeter und ihrer Verwandten auf dem tibetischen Plateau und seiner Peripherie. Wir stellen fest, dass die tibetische Abstammungslinie als eine Mischung aus zwei genetischen Abstammungsquellen gut modelliert ist: Die eine ist ein altes und bisher nicht charakterisiertes paläolithisches Substrat, das bis zu 20 % der heutigen tibetischen Abstammung ausmacht, und die andere ist mit Tieflandbewohnern verwandt, die dort leben nordöstlicher Rand des Plateaus im Spätneolithikum. Das paläolithische Substrat scheint ausschließlich zum tibetischen Genpool unter den heute untersuchten Populationen beigetragen zu haben.

Unsere umfassende Modellierung heutiger tibetischer und nicht-tibetischer Tibeto-Burman-Sprecher identifiziert zwei genetische Linien, um ihre genetische Geschichte zu erklären. Diese Abhänge spiegeln vermutlich zwei unterschiedliche Routen der Bevölkerungsausbreitung wider, die sich in der Verbreitung verschiedener tibeto-burmanischer Sprachen im Himalaya widerspiegeln: eine durchquert das Plateau von seinem nordöstlichen Rand bis zum Himalaya (die „nördliche“ Route) und die andere entlang Peripherie des Plateaus und der südliche Rand des Himalaya (die „südliche“ Route) (Abb. 5). Wir liefern eine formelle Beimischungsmodellierung der tibetischen Populationen entlang des nördlichen Abhangs und bestätigen unseren vorherigen Bericht über diesen Abhang18,43. Die genetische, kulturelle und sprachliche Vielfalt der heutigen tibeto-burmanischen Sprecher entlang des Südhangs des Himalaya spiegelt den Zusammenfluss alter Bevölkerungsgruppen wider, die über diese beiden Routen nach ihrer Trennung seit dem späten Neolithikum ankamen.

Die einzigartigen Merkmale des tibetischen genetischen Profils haben Forscher lange Zeit verwirrt und zu völlig unterschiedlichen und oft inkompatiblen Bevölkerungsgeschichtsmodellen geführt, die von Tibetern, die eine Schwestergruppe darstellen, die sich vor weniger als 3000 Jahren von Han-Chinesen trennte, bis hin zu Tibetern, die von einem Han-Chinesen abzweigten, reichen -verwandte Abstammungslinie vor mehr als 9000 Jahren mit Genfluss von paläolithischen Sibiriern (Ust'-Ischim) oder sogar von einem unbekannten archaischen Hominin13,35. Darüber hinaus wurden diese früheren Modelle, die einander widersprachen, nur auf der Grundlage heutiger Daten von Tibetern und Han-Chinesen entwickelt und akzeptierten eine zu vereinfachte Annahme, dass beide Populationen repräsentativ für die alten Gruppen sind, die Vorfahren der beiden Hauptzweige der Sino waren -Tibetische Sprachfamilie, dh Tibeto-Burmanisch bzw. Sinitisch. Hier verwendeten wir antike Genome aus wichtigen Zeiträumen und geografischen Standorten, die die modellierten Abstammungslinien besser repräsentieren als heutige Populationen, um einen direkten Test der vorgeschlagenen demografischen Modelle durchzuführen.

In unserer Studie zeigen wir, dass Vorfahren der heutigen Tibeter seit mindestens ca. 300 v. Chr. im Himalaya präsent sind. 1420 v. Chr., als an aMMD-Standorten wie Suila und Lubrak die frühesten direkten Beweise für eine anhaltende menschliche Präsenz auftauchen. Darüber hinaus bestätigen wir die enge Beziehung zwischen frühen Himalaya-Populationen und spätneolithischen Gruppen, die um 2300–1800 v. Chr. am nordöstlichen Rand des Plateaus lebten (Upper_YR_LN). Zu den neolithischen Gruppen in der Gansu-Qinghai-Region gehören wahrscheinlich die Vorfahren derer, die später auf das Plateau expandierten; Der genaue Zeitpunkt der Erweiterung ist jedoch nicht klar. Der Anbau von Gerste, die für das kühlere und trockenere Klima des Plateaus besser geeignet ist als Hirse, soll seit langem die neolithische Ausbreitung auf das Plateau ermöglicht haben. Während unsere Ergebnisse angeblich zur seit langem vertretenen Hypothese einer durch Gerste verursachten Expansion auf das Plateau passen könnten. Es ist unwahrscheinlich, dass eine so massive demische Ausbreitung von Qinghai in den Himalaya in nur etwa 200 Jahren um 1650 v. Chr. die alleinige Erklärung für die alte genetische Verbindung zwischen dem Plateau und der Gansu-Qinghai-Region darstellt. Wir schlagen ein alternatives Szenario vor, in dem sich die genetische Verbindung zwischen Plateau- und Tieflandpopulationen möglicherweise viel früher gebildet hat und daher möglicherweise nicht mit der Einführung von Gerste oder anderen domestizierten Pflanzen oder Tieren westeurasischen Ursprungs zusammenhängt. Die Karou-Stätte in Osttibet (ca. 5000–3000 v. Chr.) und die Qugong-Stätte in der Nähe von Lhasa (ca. 3800–3000 v. Chr.) weisen eine indigene archäologische Tradition auf und weisen eine Assemblage-Komposition und Keramikmotive auf, die sich von denen in Qijia2 unterscheiden. Darüber hinaus deuten die Beweise aus der Zongri-Stätte (ca. 2600–2000 v. Chr.) darauf hin, dass Jäger und Sammler auf dem Plateau viel früher als vermutliche Einführung der Gerste Hirse mit Tieflandbewohnern gehandelt haben44. Das Fehlen einer EGLN1-Selektionssignatur im Upper_YR_LN in Kombination mit einem geschätzten EGLN1-Selektionsdurchlauf von etwa 8000 BP40,45 lässt darauf schließen, dass sich die beiden Populationen möglicherweise bereits lange vor der Ankunft der Gerste in Gansu-Qinghai getrennt haben. Gerste wurde in Gansu-Qinghai bereits ca. als Nebenfrucht angebaut. Chr., was die Möglichkeit einer früheren, durch Gerste vorangetriebenen Expansion vor 1650 v. Chr. offen lässt, aber es fehlen archäologische Beweise, die ein solches Szenario stützen. Wir erkennen an, dass unsere vorliegenden Daten die Gerstenhypothese nicht vollständig widerlegen können; Daher fordern wir eine Suche nach alten Genomen aus dem Plateau, die älter als 1650 v. Chr. sind, um sie direkt zu testen.

Schließlich zeigt unsere Studie die anhaltenden Auswirkungen der natürlichen Selektion auf die Gestaltung des Genpools von Ostasiaten in großer Höhe. Bemerkenswert ist, dass der Anstieg der EPAS1-Allelhäufigkeit über den Zeitraum zwischen den aMMD-Proben und den heutigen Tibetern die langsame, aber stetige Wirkung der positiven Selektion auf diese vom Denisova-Menschen abgeleitete genetische Variante unterstreicht. Zukünftige Studien zu weiteren alten Genomen auf dem tibetischen Plateau werden uns zu einem umfassenden Verständnis der Evolutionsgeschichte der beiden tibetischen Signaturgene EGLN1 und EPAS1 führen und die in der Studie vorgeschlagenen polygenen Anpassungssignaturen weiter untersuchen können heutiger Genome23.

Alle in diesem Manuskript genannten Exemplare wurden von 2007 bis heute unter der Aufsicht des Department of Archaeology (DoA) der nepalesischen Regierung über die Genehmigungen der Sky Door Foundation Nepal/USA an den Co-Autor MA exportiert. Die Probenahme archäologischer Proben vor Ort wurde von Vertretern des DoA vor Ort in Rhirhi, Lubrak, Suila, Kyang und Samdzong überwacht. Vertreter von Dorfentwicklungskomitees und andere Mitglieder der Nachkommengemeinschaften waren bei der Feldprobenahme von archäologischem Material in Rhirhi, Lubrak, Suila und Samdzong anwesend. Den Anwesenden wurde das für den Export vorgesehene Material gezeigt und es wurden keine Einwände erhoben. Die Probenahme des Materials aus dem Kapilvastu-Museum wurde von Mitarbeitern vor Ort und einem Vertreter des DoA überwacht. Die Probenahme von Materialien der Mebrak-Überreste wurde vom DoA in Kathmandu überwacht. Die Genehmigung für destruktive Analysen und genetische Untersuchungen wurde vom Verteidigungsministerium im Rahmen des Genehmigungs- und Exportverfahrens erteilt. Die Kontaktaufnahme mit Nachkommengemeinschaften umfasste: (1) örtliche Kuratierung und Kontrolle der ausgegrabenen Materialien in den Dörfern Samdzong, Chuksang (für Rhirhi), Lubrak (im Bon-Tempel im Dorf aufbewahrte und verfügbare Materialien) und Suila (in den Dörfern aufbewahrte und verfügbare Materialien). buddhistisches Kloster in Ghiling) unter der Vormundschaft von Gemeindevorstehern; (2) In Samdzong und Chuksang wurden kleine Museen zur Ausstellung von in Samdzong und Rhirhi ausgegrabenen Materialien eingerichtet. (3) Ein Malbuch über archäologische Wissenschaftsmethoden und über die Stätte Samdzong wurde von CW et al. entwickelt. und wurde von den Ghiling-Gemeindemitgliedern Nawang Tsering Gurung und Tsering Dorjee Gurung ins Nepalesische und Tibetische übersetzt und den örtlichen Gemeinden zur Verfügung gestellt. Diese sind online unter https://doi.org/10.17617/2.3367799 (Nepali) und https://doi.org/10.17617/2.3367804 (Tibetisch) zu finden und werden kostenlos verteilt; und (4) alle erforderlichen Berichte wurden dem DoA vorgelegt; Die Sky Door Foundation/Nepal bereitet die Veröffentlichung kurzer Zusammenfassungen (auf Nepali, möglicherweise auf Tibetisch) der wichtigsten Projektergebnisse vor, die weiterführenden Schulen in Jomsom und Lo Manthang sowie größeren Dörfern in Upper Mustang angeboten werden.

Der ursprüngliche Ablagerungskontext in Chokhopani wurde durch die Installation einer Mikro-Wasserkraftpipeline zerstört. Die Datenwiederherstellung beschränkte sich auf die Sammlung von Artefakten und menschlichen Überresten, die im Höhlenkomplex entdeckt oder hangabwärts davon gefunden wurden46. Der Standort Suila wurde 2018 entdeckt, nachdem die Höhle durch Straßenbauarbeiten beschädigt wurde. Die Dorfbewohner sammelten die freigelegten Materialien und brachten sie zu einem Klosterkomplex in Ghiling. Diese Materialien wurden unserem Vermessungsteam kurz nach der Zerstörung der Stätte gezeigt; Sie wurden fotografiert und Proben wurden unter Aufsicht des Vertreters des DoA entnommen. Es war keine Ausgrabung möglich. Die archäologischen Materialien der Fundstelle Lubrak wurden 2018 nach der Erosion eines Flussufers im gleichnamigen Dorf entdeckt. Dorfbewohner retteten das Material, das zu einem Kloster gebracht wurde. Unser Vermessungsteam kartierte und fotografierte die Gräber, aus denen die Materialien geborgen wurden, und dokumentierte den Inhalt der Gräber. Unter der Aufsicht des Vertreters des DoA wurden Proben menschlicher Überreste entnommen. Die Gräber bleiben an Ort und Stelle, es wurden jedoch keine weiteren Datenwiederherstellungen durchgeführt. Die Rhirhi-Stätte wurde bei archäologischen Untersuchungen im Jahr 2016 entdeckt. Die Stätte war in der Vergangenheit geplündert worden und beim Betreten der Höhle wurde einiges Kulturmaterial gefunden. Das Profil der Plünderergrube wurde gereinigt, gezeichnet und dabei wurden im Profil weitere Proben kulturellen Materials entdeckt. Mebrak 63 wurde von einem nepalesisch-deutschen Team47 gründlich ausgegraben und dokumentiert. Die Erhaltung organischer Materialien, einschließlich menschlicher Überreste, war ausgezeichnet. Ein Großteil des Inneren des Geländes war mit einer 40 cm dicken Schicht Vogelguano bedeckt, die sorgfältig entfernt wurde. Viele der Überreste im Grab wurden durch wiederholte Besuche vermischt, um die kürzlich Verstorbenen dem Grab hinzuzufügen. Insgesamt acht Palimpsestebenen wurden kartiert und anschließend sorgfältig von Hand ausgegraben; die Matrix wurde nicht gescreent. Der Kontext wurde ausführlich mit Strichzeichnungen und Fotografien dokumentiert. Die in der Vergangenheit geplünderte Kyang-Stätte wurde zunächst fotografisch dokumentiert. Ein 1-m-Gitter wurde über die Lagerstätte gelegt und Oberflächenmaterialien, darunter menschliche Knochen, Holz und andere organische Materialien, wurden von einer Gittereinheit eingesackt. Der Aushub erfolgte mit willkürlichen Ebenen von 10 cm; Es wurden zwei Ebenen erfasst und die Lagerstätte bis zum Grundgestein ausgegraben. Die Bodenmatrix wurde mit einem feinen Sieb gesiebt. Der Großteil der Artefakte und anderen Überreste wurde an der Oberfläche geborgen; In beiden willkürlichen Ebenen wurden nur wenige gefunden48. Die Samdzong-Stätte48,49 besteht aus 10 Höhlen, höchstwahrscheinlich Schachtgräbern, die in die steile Felswand gegraben wurden. Seismische Aktivitäten hatten die Gräber zum Einsturz gebracht und der ursprüngliche Ablagerungskontext wurde aufgewühlt und mit Erde und Gestein von oben vermischt. Das Höhleninnere war im Allgemeinen recht flach; Jedes wurde fotografisch dokumentiert und an der Oberfläche sichtbares Material wurde gesammelt und verpackt. Aufgrund der gemischten Beschaffenheit der Lagerstätte wurden keine Ausgrabungen in stratigraphischen Ebenen durchgeführt. Alle Ausgrabungen wurden von Hand durchgeführt und größere gefundene Artefakte wurden bei der Entdeckung eingesackt. Die Matrix der Höhlen wurde mit feinen Maschen gesiebt; Dies förderte die Entdeckung kleinerer Artefakte wie Metallreste, Fragmente tierischer und menschlicher Knochen, Holz und zahlreicher Glasperlen.

Beschleuniger-Massenspektrometrie (AMS) 14C-Datierung von 15 Proben wird in dieser Studie neu berichtet (Ergänzungsdaten 3): Suila (n = 1), Lubrak (n = 1), Rhirhi (n = 2), Mebrak (n = 2) , Kyang (n = 2) und Samdzong (n = 7). Für Suila, Lubrak, Rhirhi wurden die in der Genomstudie verwendeten menschlichen Zähne direkt in der WM Keck Carbon Cycle AMS-Einrichtung (Laborcode UCIAMS) der University of California, Irvine datiert. Für Mebrak, Kyang, Samdzong wurden unkarbonisierte Holz- oder Tierzahnproben im Curt-Engelhorn-Zentrum Archäometries-Zentrum (Laborcode MAMS) datiert. Alle 14C-Daten wurden mithilfe der Kalibrierungskurve der nördlichen Hemisphäre in der Online-Version von Calib 8.2 (http://calib.org/calib/calib.html) (Supplementary Data 3) kalibriert.

Insgesamt 54 geeignete Zähne und ein Felsenbein (aus U2) wurden für die Analyse aus sieben archäologischen Stätten in der MMD-Region ausgewählt: Suila (n = 2; 1494–1317 v. Chr.), Lubrak (n = 2; 1269–1123 v. Chr.) , Chokhopani (n = 3; 801–770 v. Chr.), Rhirhi (n = 6; 805–767 v. Chr.), Kyang (n = 11; 695–206 v. Chr.), Mebrak (n = 10; 500 v. Chr.–1 n. Chr.), und Samdzong (n = 20; 450–650 n. Chr.) (Ergänzende Daten 1–3). Die Proben wurden ausgewählt, um zuvor veröffentlichte Gesamtgenomdaten von acht Individuen in Chokhopani (n = 1), Mekbrak (n = 3) und Samdzong (n = 4)21 zu ergänzen. Bioturbation und Faunastörungen der menschlichen Überreste machten es jedoch in einigen Fällen schwierig, Skelett- und Zahnmaterial eindeutig einzelnen Individuen zuzuordnen. Aus diesem Grund wurden die Daten aller 62 aMMD-Skelettmaterialien erneut analysiert, von denen 55 ausreichend gut erhalten waren, um genetische Verwandtschaftstests durchzuführen. Dies führte zur Identifizierung von 42 verschiedenen Personen, von denen 34 neu in dieser Studie sind (ergänzende Abbildung 14). ; Ergänzende Daten 4). Es wurde festgestellt, dass drei in dieser Studie analysierte Zähne von zwei Personen (M63 und S10) stammten, die zuvor veröffentlicht wurden21.

Die Bearbeitung alter DNA (aDNA) für alle Proben wurde in speziellen aDNA-Einrichtungen an der University of Oklahoma (OU) und dem Max-Planck-Institut für Menschheitsgeschichte (MPI-SHH) durchgeführt. Beide Labore betreiben HEPA-gefilterte aDNA-Reinräume (Bewertung ISO7 oder besser), und die DNA-Manipulation wurde zusätzlich in speziellen Laminar-Flow-Abzügen durchgeführt. Der Zugang und die Arbeitsabläufe im Reinraumlabor sind eingeschränkt, und das gesamte Personal trägt persönliche Schutzausrüstung (bestehend aus Ganzkörperanzügen aus Tyvek, Handschuhen, Masken und Schutzbrillen/Gesichtsschutz). Alle Oberflächen werden routinemäßig mit verdünnter Bleichlösung (NaOCl) sterilisiert und täglich UV-bestrahlt, und alle PCR- und Post-PCR-Aktivitäten werden in separaten Laboreinrichtungen durchgeführt. Die DNA-Extraktion für die neuen Proben aus Chokhopani, Rhirhi, Kyang, Mebrak und Samdzong (n = 50) wurde an der OU durchgeführt. Kurz gesagt wurden die Zahnoberflächen mit 2 % NaOCl abgewischt, gefolgt von mechanischem Abrieb und UV-Bestrahlung, um Oberflächenverunreinigungen zu entfernen. Zahndentin (100 mg) wurde zu einem groben Pulver zerkleinert und in einer 1 ml-Lösung von 0,45 M EDTA und 0,25 mg/ml Proteinase K aufgeschlossen. Die DNA wurde unter Verwendung eines Qiagen MinElute/Zymo-Reservoirs gemäß einem veröffentlichten Protokoll50 gereinigt und konzentriert. Kurz gesagt, 13 ml PB-Puffer wurden mit dem DNA-Überstand im Reservoirapparat kombiniert und zentrifugiert, um die DNA an die Silica-Säulenmembran zu binden. Die Säule wurde zweimal mit PE-Puffer gewaschen, gefolgt von einem Trockenschleudern. Gereinigte DNA wurde mit 60 μl EB-Puffer von der Säule eluiert.

Die DNA-Extraktion für Proben aus Suila und Lubrak (n = 4) wurde am MPI-SHH mit ähnlichen Methoden mit geringfügigen Modifikationen durchgeführt. Die Probenahme folgte einem zuvor beschriebenen Protokoll51. Kurz gesagt, die Zähne wurden mechanisch gereinigt und UV-bestrahlt, um Oberflächenverunreinigungen zu entfernen. Die Zähne wurden geschnitten und mit einem mechanischen Bohrer wurde Dentinpulver aus der inneren Pulpahöhle gewonnen. Die DNA-Extraktion wurde wie zuvor beschrieben durchgeführt52. Kurz gesagt, Dentinpulver (50 mg) wurde in einer 1 ml-Lösung von 0,45 M EDTA und 0,25 mg/ml Proteinase K aufgeschlossen. Die DNA wurde mit dem Roche High Pure Viral Nucleic Acid Kit gereinigt und konzentriert. Kurz gesagt, 10 ml Bindungspuffer (5 M GuHCl, 40 % Isopropanol) und 400 μl 3 M Natriumacetat wurden mit dem DNA-Überstand in der High Pure Extender Assembly kombiniert und zentrifugiert, um die DNA an die Silica-Säulenmembran zu binden. Die Säule wurde trocken zentrifugiert, zweimal mit Waschpuffer (20 mM NaCl, 2 mM Tris-HCL in Ethanol) gewaschen und dann erneut trocken zentrifugiert. Gereinigte DNA wurde in 100 μl TET-Puffer (10 mM Tris, 0,1 mM EDTA, 0,05 % Tween 20) von der Säule eluiert.

Um auf Konservierung zu prüfen, wurden DNA-Extrakte aus Chokhopani-, Rhirhi-, Kyang-, Mebrak- und Samdzong-Proben zu doppelsträngigen, doppelt indizierten Illumina-Bibliotheken unter Verwendung eines Blunt-End-Protokolls an der OU unter Verwendung eines NEBNext DNA Library Prep Master-Kits konstruiert, wie zuvor beschrieben21 . Kurz gesagt, die DNA wurde mit einem NEB-Endreparaturmix (enthaltend T4-Polymerase und T4-PNK) endrepariert, gefolgt von einer Qiagen MinElute-Reinigung. Illumina-kompatibler P5- (IS1+IS3) und P7-Adaptermix (IS2+IS3)53 wurde mit Quick T4-Ligase hinzugefügt, gefolgt von einer Qiagen MinElute-Reinigung. Eine Adapter-Auffüllreaktion wurde unter Verwendung von Bst-DNA-Polymerase durchgeführt, gefolgt von einer Hitzeinaktivierung. Nach einer qPCR zur Bestimmung der Bibliothekskonzentration wurde die Vervollständigung der Bibliothek durch PCR-Amplifikation in dreifacher Ausfertigung unter Verwendung der Indexierungsprimer P5 und P753,54 und des KAPA HiFi+Uracil HotStart-Enzyms durchgeführt, gefolgt von der Qiagen QiaQuick-DNA-Reinigung. Insgesamt 49/50 Extrakte wurden erfolgreich in Bibliotheken eingebaut und dann an der University of Chicago auf einem Illumina HiSeq 4000 unter Verwendung von 2 × 75 bp-Chemie sequenziert, um auf Konservierung zu prüfen.

Um die Proben aus Suila und Lubrak (die später im Projekt verfügbar wurden) zu screenen, haben wir DNA-Extrakte in entweder doppelsträngige (für Lubrak) oder einzelsträngige (für Suila) doppelt indizierte Illumina-Bibliotheken am MPI-SHH eingebaut Befolgen ähnlicher Protokolle, jedoch mit geringfügigen Änderungen, wie in veröffentlichten Protokollen55,56,57 beschrieben. Kurz gesagt: Bei doppelsträngigen Bibliotheken wurde die DNA mit einem Endreparaturmix (enthaltend T4-Polymerase und T4-PNK) am Ende repariert und anschließend mit Qiagen MinElute gereinigt. Illumina-kompatibler Adaptermix aus P5 (IS1+IS3) und P7 (IS2+IS3)58 wurde mit Quick T4-Ligase hinzugefügt, gefolgt von einer Qiagen MinElute-Reinigung. Eine Adapter-Auffüllreaktion wurde unter Verwendung von Bst-DNA-Polymerase durchgeführt, gefolgt von einer Hitzeinaktivierung. Nach einer qPCR zur Bestimmung der Bibliothekskonzentration wurde die Bibliotheksvervollständigung56 durch PCR-Amplifikation unter Verwendung von P5- und P7-Indexierungsprimern und Pfu Turbo Cx HotStart-DNA-Polymerase und anschließender Qiagen MinElute-DNA-Reinigung durchgeführt. Indizierte Bibliotheken wurden dann mit dem Herculase II Fusion-Enzym59 erneut amplifiziert und dann mit einem Qiagen MinElute gereinigt und für die Sequenzierung gepoolt.

Bei einzelsträngigen Bibliotheken wurde die DNA dephosphoryliert und hitzedenaturiert, woraufhin der erste Adapter (CL78/TL137) mithilfe von T4-Ligase an die DNA ligiert wurde. Dynabeads MyOne Streptavidin C1-Magnetkügelchen wurden an die Bibliotheken gebunden, mit BWT-SDS-Lösung (0,1 M NaCl, 0,01 M Tris-HCl, 0,001 M EDTA, 0,05 % Tween 20, 0,5 % SDS) gewaschen und in Stringenz-Waschpuffer inkubiert. Die Bibliotheken wurden mit BWT-Lösung (0,1 M NaCl, 0,01 M Tris-HCl, 0,001 M EDTA, 0,05 % Tween 20) gewaschen und mit dem Verlängerungsprimer CL130, gefolgt von Klenow-Fragment, inkubiert. Die Bibliotheken wurden mit BWT-SDS-Lösung gewaschen und in stringentem Waschpuffer (0,015 M NaCl, 1,5 mM Trinatriumcitrat, 0,1 % SDS) inkubiert. Die Bibliotheken wurden mit BWT-Lösung gewaschen und dann mit T4-Ligase inkubiert, um den zweiten Adapter (CL53/CL73) zu ligieren. Die Bibliotheken wurden mit BWT-SDS-Lösung gewaschen und in Stringenz-Waschpuffer inkubiert. Die Bibliotheken wurden mit BWT-Lösung gewaschen und in TT-Puffer (10 mM Tris, 0,05 % Tween 20) bei 95 °C inkubiert, um die DNA aus den Perlen freizusetzen. Nach der Bestimmung der Bibliothekskonzentration mittels qPCR wurde die Bibliothek durch PCR-Amplifikation unter Verwendung von P5- und P7-Indexierungsprimern und Pfu Turbo Cx HotStart-DNA-Polymerase indiziert56, gefolgt von einer Qiagen MinElute-DNA-Reinigung. Indizierte Bibliotheken wurden dann mit dem Enzym Herculase II Fusion erneut amplifiziert59 und anschließend gereinigt und für die Sequenzierung mit einem Qiagen MinElute gepoolt. Insgesamt 4/4 Extrakte wurden erfolgreich in Bibliotheken eingebaut und dann am MPI-SHH auf einem Illumina HiSeq 4000 unter Verwendung der 1 × 75-bp-Chemie sequenziert.

Insgesamt ergaben 47 der neuen 54 Proben beim Screening ausreichend endogene DNA (>0,1 %) für die weitere Analyse. Davon wurden 25 Proben (21 Personen) für eine benutzerdefinierte In-Lösung-Erfassung unter Verwendung von Oligonukleotidsonden ausgewählt, die 50 K manuell ausgewählten Zielstellen mit funktioneller Bedeutung entsprechen („50 K“, siehe Beschreibung des Assay-Designs unten). Um eine ausreichende genomweite Abdeckung von abstammungsinformativen Markern für die Abstammungsanalyse im gesamten Probensatz sicherzustellen, führten wir eine In-Lösungserfassung für ca. 1,2 Millionen informative Kern-SNPs („1240K“)22,60 an allen 47 gut erhaltenen Proben durch. Um jedoch die Bibliothekskomplexität der 43 Proben zu verbessern, die ursprünglich an der OU verarbeitet wurden, haben wir zunächst am MPI-SHH neue doppelsträngige, doppelt indizierte Bibliotheken für diese Proben generiert, indem wir die für die Lubrak-Proben beschriebene Methode verwendet haben. Wir haben die 1240K-Erfassung auf alle 47 Proben angewendet und sie auf einem Illumina HiSeq 4000 mit 1 × 75-Chemie und einem Illumina NextSeq 500 mit 2 × 75-bp-Chemie sequenziert, bis wir eine ausreichende Abdeckung der erfassten SNPs oder der erschöpften Bibliothekskomplexität erreicht haben (Ergänzende Daten 1). ). Nach der Entfernung von drei Proben, die unsere Qualitätskontrollkriterien nicht erfüllten (C2 für geringe Abdeckung, M3490 und U2 für 4 % bzw. 9 % mitochondriale Kontamination), wurden 44/47 Proben (33 Personen) in unsere Analyse einbezogen. Schließlich wurden 15 Proben (13 Personen) für die Tiefensequenzierung des gesamten Genoms (WGS) ausgewählt. Sieben dieser Proben wurden bei Macrogen, Inc. unter Verwendung eines Illumina HiSeq × 75-bp-Chemie (Ergänzungsdaten 1); Am MPI-SHH sequenzierte WGS-Proben wurden einer UDG-Halbbehandlung unterzogen61. Diese Daten wurden dann für die anschließende Analyse mit 7 zuvor veröffentlichten, tief sequenzierten aMMD-Genomen (Individuen C1, M63, M344, S10, S35, S40 und S41; M240 wegen seiner Ausreißerposition in PCA ausgenommen) kombiniert, was insgesamt 20 Individuen ergab wobei ganze Genome bis zu einer Tiefe von 0,1–6,6x sequenziert wurden. Insgesamt wurden genomweite ('1240K') Abstammungsdaten für 33 Individuen, funktionelle SNP ('50K')-Daten für 21 Individuen und Gesamtgenomdaten für insgesamt 20 Individuen analysiert, was zu 38 Individuen führte im endgültigen Datensatz (der Personen aus dieser Studie und der vorherigen Studie umfasst21).

Die Anreicherung der 1240K-Panel-SNPs wurde am MPI-SHH gemäß den zuvor beschriebenen Protokollen22 durchgeführt. Bei jeder Aufnahme wurde eine Menge von 1–2 μg verwendet. Kurz gesagt, die DNA-Bibliotheken wurden auf etwa 200–400 ng/μL verdünnt und mit blockierenden Oligos (menschliche Cot01-DNA, Lachssperma-DNA, P5, P7) gemischt. Der Bibliothekspool wurde 5 Minuten lang bei 95 °C denaturiert, gefolgt von 10 Minuten lang bei 37 °C, und dann zu einer Platte mit 96 Vertiefungen gegeben, die zuvor mit Hybridisierungspuffer und biotinylierten DNA-Sonden vorbereitet worden war. Die Hybridisierung erfolgte 24 Stunden lang bei 65 °C, danach wurden die biotinylierten Sonden auf Dynabeads MyOne Streptavidin T1-Perlen immobilisiert. Ungebundene DNA wurde durch drei Hochtemperaturwäschen mit HWT-Puffer entfernt, gefolgt von einer Inkubation in Schmelzlösung, um die DNA-Bibliotheken freizusetzen. Der Überstand der DNA-Bibliothek wurde auf eine neue Platte übertragen und an SeraMag Speedbeads gebunden. Die Perlenlösung wurde wiederholt mit Ethanol gewaschen und getrocknet. Die Perlen wurden in TT-Puffer resuspendiert, um DNA freizusetzen, und nach dem Pelletieren der Perlen wurde der Überstand mit den Bibliotheken gesammelt. Nach der qPCR-Quantifizierung der angereicherten Bibliotheken wurden die Bibliotheken mittels Herculase II Fusion PCR-amplifiziert. Das verwendete thermische Profil war: anfängliche Denaturierung bei 95 °C für 2 Minuten, 30 Zyklen mit 95 °C für 30 Sekunden, 60 °C für 30 Sekunden und 72 °C für 30 Sekunden und eine abschließende Verlängerung für 5 Minuten bei 72 °C C. Die Post-Capture-Bibliotheken wurden mit SPRI-Perlen gereinigt und mit einem NanoDrop (ThermoFisher) quantifiziert. Ein Aliquot einer 100-ng-Post-Capture-Bibliothek wurde mithilfe eines Rekonditionierungsassays erneut amplifiziert, um Heteroduplexe zu entfernen. Das verwendete thermische Profil war: 1 Zyklus mit 95 °C für 2 Minuten, 58 °C für 2 Minuten und 72 °C für 5 Minuten. Aliquote der resultierenden Bibliotheken wurden in äquimolaren Mengen gepoolt und auf einem Qiagen MinElute gereinigt. Die Konzentrationen des Bibliothekspools wurden vor der Sequenzierung mit einem NanoDrop und einer TapeStation (Agilent) gemessen.

Die Anreicherung der funktionellen SNPs („50K“) wurde an der Universität von Chicago unter Verwendung spezieller biotinylierter RNA-Sonden durchgeführt, die von MYBaits (Arbor Biosciences) generiert wurden. Die Erfassung wurde gemäß den Empfehlungen des Herstellers durchgeführt. Bei jedem Fang wurde eine Menge von 200 ng DNA verwendet. Die Hybridisierung erfolgte 48 Stunden lang bei 55 °C, danach wurden die biotinylierten Sonden auf Dynabeads MyOne Streptavidin C1-Kügelchen immobilisiert. Vor der PCR-Amplifikation mit Kapa HiFi HotStart wurden die Anweisungen des Herstellers befolgt, um jegliche ungebundene DNA abzuwaschen. Die Bead-gebundene DNA wurde direkt verwendet. Das verwendete thermische Profil war: anfängliche Denaturierung bei 98 °C für 2 Minuten, 14 Zyklen mit 98 °C für 20 Sekunden, 60 °C für 30 Sekunden und 72 °C für 30 Sekunden und eine abschließende Verlängerung für 5 Minuten bei 72 °C C. Die Post-Capture-Bibliotheken wurden dann über MinElute (Qiagen) gereinigt und gemäß den Anweisungen des Herstellers in 20 μl EB-Puffer eluiert. Die Fragmentlängenverteilung der angereicherten Bibliotheken wurde mit dem BioAnalyzer (Agilent) untersucht und die Konzentration mit Qubit (Invitrogen) überprüft, um die Zusammenführung der Proben in äquimolaren Mengen für die Sequenzierung zu ermöglichen. Die Proben wurden in 6er-Chargen auf einer Spur eines Illumina HiSeq 4000-Instruments unter Verwendung von 2×100-bp-Chemie sequenziert.

Illumina-Adaptersequenzen wurden mit AdapterRemoval v2.2.062 abgeschnitten und PCR-Duplikate wurden mit DeDup v0.12.263 entfernt. Die Lesevorgänge wurden mithilfe von BWA v0.7.1264 mit Täuschungssequenzen (hs37d5) auf das menschliche Referenzgenom abgebildet. Für alle Proben haben wir die mitochondriale Kontamination mithilfe des Schumutzi-Pakets geschätzt. Für im gesamten Genom sequenzierte und/oder 1240K-erfasste männliche Individuen haben wir auch die Kontamination mithilfe der Haploidie auf dem X-Chromosom mithilfe des ANGSD-Kontaminationsmoduls65 geschätzt. Keine Sequenzierung des gesamten Genoms oder 1240K-Bibliotheken haben eine geschätzte mitochondriale oder nukleare (nur Männer) Kontamination von mehr als 5 % (Ergänzende Daten 1).

Um den Y-Haplotyp-Zweig männlicher alter Individuen zu bestimmen, analysierten wir SNPs auf dem Y-Chromosom. Als Referenz haben wir Marker von https://isogg.org/tree (Version: 13.238, 2018) verwendet. Wir haben außerdem verfeinerte Y-Haplogruppe-O-SNPs zusammengeführt, die von Wang et al. definiert wurden. 201827. Wir haben bei jedem der alten Männchen in unserem Datensatz nach angestammten und abgeleiteten Messwerten dieses Satzes von SNPs gesucht. Haplotyp-Aufrufe basierten auf einer manuellen Überprüfung der angestammten und abgeleiteten Lesezahlen pro Haplogruppenzweig unter Berücksichtigung von Abdeckungs- und Fehlerschätzungen. Da sich die Konventionen zur Benennung von Haplogruppen ändern können, kommentieren wir Haplogruppen dahingehend, dass sie den abgeleiteten Zustand bei einem definierenden SNP tragen. Um die mitochondriale Haplogruppe zu bestimmen, haben wir zunächst die Konsensussequenz mithilfe des log2fasta-Skripts im Schmutzi-Paket mit einem Qualitätsschwellenwert von 10 bestimmt. Anschließend haben wir jeder Konsenssequenz mit Haplogrep v266 Haplogruppen zugewiesen.

Um die Auswirkungen postmortaler Schäden bei der Genotypisierung abzumildern, haben wir mithilfe des Bam-Moduls von BamUtil v1.0.1467 5 Bps an beiden Enden der Lesevorgänge gekürzt. Für die 1240K-SNPs haben wir für jede Bibliothek ein Pileup mit samtools68 mpileup v1.9 mit den Flags „-R“ und „-B“ erstellt. Um dann „pseudohaploide“ Genotypen zu nennen, haben wir zufällig eine einzelne hochwertige Basis (Phred-skalierter Basisqualitätsfaktor 30 oder höher) aus einem hochwertigen Read (Phred-skalierter Mapping-Qualitätsfaktor 30 oder höher) pro Bibliothek gezogen , unter Verwendung des PileupCaller-Programms in sequenceTools v1.4.0.5 (https://github.com/stschiff/sequenceTools). Für die Suila-Individuen haben wir „pileupCaller“ mit dem Flag „--singleStrandMode“ ausgeführt, das eine zufällige Stichprobe für C/T-SNPs nur aus Lesevorgängen des negativen Strangs und für G/A-SNPs nur aus Lesevorgängen des positiven Strangs nahm. Anschließend haben wir Bibliotheken derselben Individuen entdeckt, indem wir die paarweise Fehlpaarungsrate (PMR) pseudohaploider Genotypen für alle Bibliothekspaare berechnet haben (ergänzende Abbildung 14A): Duplikatpaare zeigen PMR-Werte von ~0,12, während Paare von nicht verwandten Individuen ~0,24 haben (Ergänzende Daten 4), doppelt so hoch wie der Wert der Duplikate69. Nachdem wir Duplikate entdeckt hatten, führten wir die BAM-Dateien pro Individuum zusammen und wiederholten das Genotypisierungsverfahren, um pro Individuum pseudohaploide Genotypdaten zu erstellen. Anschließend berechneten wir die PMR anhand der individuellen Daten neu und identifizierten 7 Verwandte ersten Grades und 5 Verwandte zweiten Grades (Ergänzende Abbildung 14B; Ergänzende Daten 4). Wir berechneten außerdem Genotypwahrscheinlichkeiten aus maskierten BAM-Dateien pro Person mithilfe des Skripts „SNPbam2vcf.py“ im Programm lcMLkin v0.5.070 und schätzten die Koeffizienten IBD1 und IBD2 mithilfe des Programms lcMLkin, was zur Unterscheidung der Verwandten ersten Grades in vier Eltern führte. Nachkommenpaare und drei Vollgeschwister.

Wir haben zwei Referenzdatensätze für die Analyse der Populationsgenetik zusammengestellt: die HumanOrigins („HO“)- und die „Illumina“-Datensätze. Für den HO-Datensatz haben wir genomweite Genotypdaten heutiger weltweiter Populationen aus dem Affymetrix Axiom Genome-Wide Human Origins 1-Array zusammengeführt, darunter eine große Anzahl von Süd- und Ostasiaten23,36,71,72. Anschließend haben wir dieses Panel mit vollständig genomsequenzierten heutigen tibetischen und Sherpa-Individuen23,43,73 und zwei hochkarätigen antiken Individuen ergänzt: einem mittelsteinzeitlichen europäischen Jäger und Sammler aus Luxemburg („Loschbour“)71 und einem 45.000 Jahre alten Individuum aus Westsibirien („Ust'-Ishim“)74. Wir haben auch pseudohaploide Genotypdaten der folgenden antiken Individuen einbezogen: Natufian75, Ganj Dareh Neolithic76, Villabruna77, Anatolia Neolithic22, MA-126, Botai78, Tyumen_HG und Sosonivoy_HG76, zuvor veröffentlichte antike ostasiatische Genome, einschließlich Hoabinhian Jäger und Sammler, Devil's Gate Cave , YR_MN, Upper_YR_LN28,31,32,33 und die aMMD (Supplementary Data 5). Für den Illumina-Datensatz haben wir südasiatische79, tibetische und Sherpa-Individuen in Nepal23,43,73, Himalaya-Individuen24 mit Individuen im Human Genome Diversity Project80 (Supplementary Data 6) zusammengeführt. Anschließend haben wir burmesische und thailändische Individuen aus dem Simon Genome Diversity Project73 zusammengeführt. Wir haben die gleiche Gruppe antiker Individuen wie im HO-Datensatz einbezogen. Wir haben strangmehrdeutige SNPs aus den Datensätzen entfernt.

Für den HO-Datensatz haben wir PCs für zwei Gruppen heutiger Populationen berechnet: (i) 2096 eurasische Individuen und (ii) 486 ostasiatische Individuen (Abb. 2; ergänzende Abb. 1; ergänzende Daten 5). Für PCA haben wir das Programm smartpca v16000 im EIGENSOFT-Paket v7.2.125 verwendet, mit der Option „lsqproject: YES“ für beide Sets und zusätzlich mit der Option „shrinkmode: YES“ für das ostasiatische Set. Personen, die nicht in die PC-Berechnung einbezogen werden, werden mit diesen Optionen auf den PC-Raum projiziert. Diese beiden Optionen berücksichtigen die Schrumpfung aufgrund von Fehlen bzw. Projektionen.

Wir haben Beimischungsprofile für die 486 ostasiatischen Individuen und die aMMD-Individuen mit dem ADMIXTURE81-Programm v1.3.0 analysiert. Wir entfernten SNPs mit einer geringfügigen Allelfrequenz von weniger als 1 % und behielten unabhängige SNPs bei, indem wir SNPs durch Verknüpfungsungleichgewicht beschneiden, indem wir den Befehl „indep-pairwise 200 25 0.2“ in PLINK v1.982 verwendeten, sodass 374.924 SNPs in der Analyse übrig blieben. Für jeden K-Wert von zwei bis sechs haben wir zehn Durchläufe mit zufälligen Startwerten durchgeführt. Wir haben die abgeleiteten Abstammungskomponenten (die Q-Matrizen) mit pong83 visualisiert.

Wir haben die Programme qp3Pop v650 und qpDstat v970 im Admixtools-Paket v7.025 zur Berechnung der Outgroup-f3- bzw. f4-Statistiken verwendet. Für den HO-Datensatz haben wir f3 (Mbuti; Abb. 3; Ergänzende Daten 5). Mit dem gleichen Satz von Ys führten wir auch f4-Symmetrietests in der Form f4 (Mbuti, Y; Chokhopani, Lubrak), f4 (Mbuti, Y; Chokhopani/Lubrak, heutiger nepalesischer Sherpa/Tibetaner), f4 (Mbuti) durch , Y; YR_MN/Upper_YR_LN, Naxi/Yi) und f4 (Mbuti, Devil's Gate; YR_MN/Upper_YR_LN, aMMD) (Ergänzende Abbildung 11; Ergänzende Daten 7, 8). Wir haben auch die gleichen Outgroup-f3-Statistiken unter Verwendung des Illumina-Datensatzes mit Ys berechnet, einschließlich der Himalaya-Populationen und der ostasiatischen Populationen. Standardfehler werden durch 5-cM-Block-Jackknifing berechnet, wie in den Programmen qp3Pop und qpDstat implementiert.

Wir haben die Programme qpWave v1200 und qpAdm v1201 im admixtools-Paket v7.0 zum Testen der Kladalität zwischen zwei Gruppen und zum Testen verschiedener Zwei- bzw. Drei-Wege-Beimischungsmodelle verwendet. In allen Tests mit dem HO-Datensatz verwendeten wir einen Basissatz von sechs Außengruppen, um die Hauptzweige eurasischer Vorfahren in hoher Auflösung zu unterscheiden: zentralafrikanische Mbuti (n = 10), Onge von den Andamanen (n = 11), zentralamerikanische Mixe (n = 10), Iran_N vom neolithischen Standort Ganj Dareh im Iran (n = 8), der europäische Jäger und Sammler Villabruna aus dem Jungpaläolithikum (n = 1) und der taiwanesische Ami (n = 10) (Ergänzungsdaten 5). Darüber hinaus haben wir eine zusätzliche Außengruppe hinzugefügt, die zur tibetischen Abstammungslinie gehört, um die statistische Aussagekraft zu erhöhen und die tibetische Abstammungslinie von anderen osteurasischen Abstammungslinien zu unterscheiden: Suila, Lubrak, Chokhopani. QpAdm-Ergebnisse für aktuelle Populationen basieren hauptsächlich auf dem Basissatz+Lubrak. Für den Illumina-Datensatz haben wir Mixe durch südamerikanisches Karatiana (n = 13) ersetzt. Um die Datennutzung zu maximieren, haben wir eine nicht standardmäßige Option „allsnps: YES“ verwendet, die alle verfügbaren SNPs zur Berechnung der individuellen F-Statistik verwendet, anstatt einen gemeinsamen Satz von SNPs zu verwenden, die durch Ziel, Quellen und Fremdgruppenpopulationen abgedeckt werden. Für die Beimischungsmodellierung heutiger tibetischer und anderer tibeto-burmanischer Bevölkerungsgruppen verwendeten wir Tsum23 als Referenz für Tibet, YR_MN/Upper_YR_LN/Naga/Naxi/Yi als Referenz für Tiefland-Ostasien und Pathan/Mala/Pulliyar die südasiatischen Quellen (Ergänzungstabellen 1–3, 5–7). Für den Illumina-Datensatz haben wir Mala durch Sindhi ersetzt (Supplementary Data 9).

Wir haben die plausibelste Admixture-Graph-Topologie mit qpGraph v7365 im Admixtools-Paket v7.0 abgeleitet. Wir haben zunächst ein Skelettdiagramm mit fünf Populationen ohne Beimischungsereignisse von Mbuti, MA-1, Tianyuan, Ami und DevilsGate erstellt. Anschließend fügten wir der Topologie nacheinander Mixe und Upper_YR_LN sowie eine aMMD-Gruppe oder das heutige f3 Tibetan/Sherpa hinzu. Beim Hinzufügen einer Gruppe haben wir alle möglichen Admixture-Graph-Topologien bis hin zur bidirektionalen Admixtur aufgelistet, indem wir bis zu zwei vorhandene Zweige als proximale Quellgruppen ausgewählt haben. Wir wählten dann die Topologie, die zu der geringsten Anzahl von Z-Scores > 2 führte, wobei die Scores durch 5-cM-Block-Jackknifing berechnet wurden. Wir bevorzugen auch Topologien mit positiven internen Zweiglängen. Beachten Sie, dass das obige Verfahren insofern gierig ist, als eine andere Reihenfolge, in der diese Populationen hinzugefügt wurden, zu einer anderen endgültigen Topologie führen kann. Wir wiederholten unsere Graphsuchprozedur, indem wir Tianyuan durch zwei Hoabinhian-Jäger und -Sammler in Südostasien ersetzten („McColl_SEA_GR1“; La368 und Ma911; Supplementary Data 5). Wir haben dann versucht, archaische Homininen (Altai-Neandertaler und Denisovaner) oder Ust-Ischim in unser Skelett aus fünf Populationen aufzunehmen. Zuletzt haben wir versucht, eine Gruppe hinzuzufügen, die aus zwei äneolithischen Botai, Tyumen_HG und Sosonivoy_HG, besteht, in der Hoffnung, dass diese Gruppe herausfinden könnte, ob die tiefe Abstammungslinie mehr Ost- oder West-Eurasische Affinität aufweist.

Wir haben einen Genfluss von nicht-tibetischen tibeto-burmanischen Populationen zu Chokhopani getestet und das Datum dieser Beimischung mithilfe von DATES v75376 mit den Optionen „Jackknife: YES“ und „Binsize 0.01“ geschätzt. Wir verwendeten Suila und eine Kombination der heutigen Naxi und Yi als zwei Quellen.

Wir haben Outgroup-f3-Statistiken der Form f3 (Tibeter; aMMD, Han) für den Auswahlscan berechnet. Die Allelzahlen für heutige Tibeter und Han wurden aus Genotypen von 27 im gesamten Genom sequenzierten, nicht verwandten heutigen tibetischen Nepalesen und 103 Han (CHB)-Individuen aus dem 1000 Genome Project berechnet. Die Allelzahlen für aMMD wurden aus 17 Shotgun-sequenzierten pseudohaploiden aMMD-Genomen berechnet (ausgenommen KS8 aufgrund der Verwandtschaft der 18 Individuen). Wir haben einen Schiebefenster-Ansatz mit einer Fenstergröße von 500 kb und einer Schrittgröße von 10 kb41 angewendet. Die F3-Statistiken in einem Fenster wurden aus biallelischen SNPs im Fenster berechnet, die entweder in CHB oder in heutigen Tibetern getrennt sind, vorausgesetzt, es gibt mehr als 15 aMMD-Individuen mit mehr als einem Lesevorgang, der einen SNP abdeckt. Darüber hinaus haben wir Fenster mit <250 SNPs ausgeschlossen. Diese rohen f3-Werte wurden durch die Heterozygotie heutiger Tibeter in den entsprechenden Fenstern normalisiert, um ihre Abhängigkeit von Allelfrequenzen zu verringern34. Wir haben zufällig einen f3 in jedem LD-Block84 abgetastet, um Mittelwerte und Standardfehler der f3-Werte zu schätzen und fensterbasierte f3-Werte in Z-Scores umzuwandeln.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Research Reporting Summary.

Die in diesem Artikel beschriebenen Roh-DNA-Sequenzen (FASTQ) und Alignment-Daten (BAM) wurden im European Nucleotide Archive (ENA) unter der Zugangsnummer PRJEB41752 hinterlegt. Die Genotypdaten für die Panels 1240K und HumanOrigins wurden im Edmond Data Repository der Max-Planck-Gesellschaft [https://edmond.mpdl.mpg.de/imeji/collection/H8mcNv5pbSen6sLg?q=] hinterlegt. Die 15 neuen AMS-Daten, die in dieser Studie gemeldet wurden, ihre zugehörigen Laborcodes und ihre entsprechenden Laborprotokolle sind in den Zusatzdaten 3 aufgeführt. Zuvor veröffentlichte genomweite Daten von in dieser Studie verwendeten antiken Individuen sind in den Zusatzdaten 5 aufgeführt und sind über verfügbar die folgenden Quellen: (1) die kombinierten Genotypdaten für die 1240K-Panel-SNPs, bereitgestellt vom Reich Lab [https://reich.hms.harvard.edu/datasets], (2) BAM-Dateien der Devil's Gate Cave-Individuen in der ENA unter der Zugangsnummer PRJEB29700 und (3) die Genotypdaten für die 1240-K-Panel-SNPs antiker Individuen aus China im Genome Sequence Archive im Beijing Institute of Genomics Data Center unter der Zugangsnummer HRA000123.

Alle in dieser Studie durchgeführten Analysen basieren auf öffentlich verfügbaren Softwareprogrammen. Spezifische Versionsinformationen sowie nicht standardmäßige Argumente werden im Abschnitt „Methoden“ beschrieben.

Aldenderfer, M. Bevölkerung des tibetischen Plateaus: Erkenntnisse aus der Archäologie. Hoch. Alt. Med. Biol. 12, 141–147 (2011).

PubMed Google Scholar

d'Alpoim Guedes, J. & Aldenderfer, M. Die Archäologie des frühen tibetischen Plateaus: neue Forschungen zur anfänglichen Bevölkerung bis in die frühe Bronzezeit. Alter. J. Archaeol. Res. 28, 339–392 (2020).

Google Scholar

Zhang, D. et al. Denisova-DNA in spätpleistozänen Sedimenten aus der Baishiya-Karsthöhle auf dem tibetischen Plateau. Wissenschaft 370, 584–587 (2020).

CAS PubMed Google Scholar

Chen, F. et al. Ein Denisova-Unterkiefer aus dem späten Mittelpleistozän vom tibetischen Plateau. Natur 569, 409–412 (2019).

ADS CAS PubMed Google Scholar

Zhang, X. et al. Die Geschichte und Entwicklung des Denisova-EPAS1-Haplotyps bei Tibetern. Proz. Natl Acad. Wissenschaft. 118, e2020803118 (2021).

ADS CAS PubMed PubMed Central Google Scholar

Zhang, XL et al. Die früheste menschliche Besetzung des hochgelegenen tibetischen Plateaus vor 40.000 bis 30.000 Jahren. Science 362, 1049–1051 (2018).

ADS CAS PubMed Google Scholar

Meyer, MC et al. Dauerhafte menschliche Besetzung des zentralen tibetischen Plateaus im frühen Holozän. Wissenschaft 355, 64–67 (2017).

ADS CAS PubMed Google Scholar

Chen, FH et al. Die Landwirtschaft erleichterte die dauerhafte Besetzung des tibetischen Plateaus durch Menschen nach 3600 v. Chr. Science 347, 248–250 (2015).

ADS CAS PubMed Google Scholar

Dong, G. et al. Räumliche und zeitliche Vielfalt prähistorischer menschlicher Siedlungen und ihre Einflussfaktoren im oberen Tal des Gelben Flusses, Provinz Qinghai, China. J. Archaeol. Wissenschaft. 40, 2538–2546 (2013).

Google Scholar

Qi, X. et al. Genetischer Beweis der paläolithischen Kolonisierung und neolithischen Ausbreitung des modernen Menschen auf dem tibetischen Plateau. Mol. Biol. Entwicklung 30, 1761–1778 (2013).

CAS PubMed Google Scholar

Qin, Z. et al. Eine mitochondriale Offenbarung früher menschlicher Wanderungen auf dem tibetischen Plateau vor und nach dem letzten Gletschermaximum. Bin. J. Phys. Anthropol. 143, 555–569 (2010).

PubMed Google Scholar

Zhao, M. et al. Mitochondriale Genomnachweise belegen eine erfolgreiche spätpaläolithische Besiedlung des tibetischen Plateaus. Proz. Natl Acad. Wissenschaft. USA 106, 21230–21235 (2009).

ADS CAS PubMed PubMed Central Google Scholar

Lu, D. et al. Abstammung und genetische Geschichte der tibetischen Hochländer. Bin. J. Hum. Genet. 99, 580–594 (2016).

CAS PubMed PubMed Central Google Scholar

Yi, X. et al. Die Sequenzierung von 50 menschlichen Exomen zeigt die Anpassung an große Höhen. Wissenschaft 329, 75–78 (2010).

ADS CAS PubMed PubMed Central Google Scholar

Beall, CM et al. Natürliche Selektion auf EPAS1 (HIF2alpha) im Zusammenhang mit niedriger Hämoglobinkonzentration bei tibetischen Hochlandbewohnern. Proz. Natl Acad. Wissenschaft. USA 107, 11459–11464 (2010).

ADS CAS PubMed PubMed Central Google Scholar

Simonson, TS et al. Genetischer Beweis für die Höhenanpassung in Tibet. Wissenschaft 329, 72–75 (2010).

ADS CAS PubMed Google Scholar

Huerta-Sánchez, E. et al. Höhenanpassung bei Tibetern durch Introgression Denisova-ähnlicher DNA. Natur 512, 194–197 (2014).

ADS PubMed PubMed Central Google Scholar

Jeong, C. et al. Ein Längskeil charakterisiert die genetische Struktur menschlicher Populationen auf dem tibetischen Plateau. PLoS ONE 12, 1–12 (2017).

CAS Google Scholar

Ren, L. et al. Die Transformation der Anbaumuster vom späten Neolithikum bis zur frühen Eisenzeit (5900–2100 v. Chr.) in der Region Gansu–Qinghai im Nordwesten Chinas. Holozän https://doi.org/10.1177/0959683620941137 (2020).

Artikel Google Scholar

Brunson, K. et al. Zooarchäologie, alte mtDNA und Radiokarbondatierung liefern neue Beweise für die Entstehung von Hausrindern und Ziegen im Tao-Flusstal der Provinz Gansu im Nordwesten Chinas. J. Archaeol. Wissenschaft. Rep. 31, 102262 (2020).

Google Scholar

Jeong, C. et al. Langfristige genetische Stabilität und ein hochgelegener ostasiatischer Ursprung für die Völker der Hochtäler des Himalaya-Bogens. Proz. Natl Acad. Wissenschaft. US A 113, 7485–7490 (2016).

CAS PubMed PubMed Central Google Scholar

Mathieson, I. et al. Genomweite Selektionsmuster bei 230 alten Eurasiern. Natur 528, 499–503 (2015).

ADS CAS PubMed PubMed Central Google Scholar

Jeong, C. et al. Aufdeckung früherer und anhaltender natürlicher Selektion bei ethnisch tibetischen Frauen in großer Höhe in Nepal. PLoS Genet. 14, 1–29 (2018).

Google Scholar

Arciero, E. et al. Demografische Geschichte und genetische Anpassung in der Himalaya-Region, abgeleitet aus genomweiten SNP-Genotypen von 49 Populationen. Mol. Biol. Entwicklung 35, 1916–1933 (2018).

CAS PubMed PubMed Central Google Scholar

Patterson, N., Price, AL & Reich, D. Bevölkerungsstruktur und Eigenanalyse. PLoS Genet. 2, 2074–2093 (2006).

CAS Google Scholar

Raghavan, M. et al. Das Genom Sibiriens aus dem Jungpaläolithikum zeigt die doppelte Abstammung der amerikanischen Ureinwohner. Natur 505, 87–91 (2014).

ADS PubMed Google Scholar

Wang, LX et al. Die Rekonstruktion der Y-Chromosomen-Phylogenie zeigt zwei neolithische Ausbreitungen der tibeto-burmesischen Populationen. Mol. Genet. Genom. 293, 1293–1300 (2018).

CAS Google Scholar

Ning, C. et al. Alte Genome aus Nordchina deuten auf Zusammenhänge zwischen Veränderungen des Lebensunterhalts und menschlicher Migration hin. Nat. Komm. 11, 1–9 (2020).

ADS Google Scholar

Sagart, L. et al. Datierte Sprachphylogenien geben Aufschluss über die Abstammung des Chinesisch-Tibetischen. Proz. Natl Acad. Wissenschaft. USA 116, 10317–10322 (2019).

CAS PubMed PubMed Central Google Scholar

Zhang, M., Yan, S., Pan, W. & Jin, L. Phylogenetische Beweise für den chinesisch-tibetischen Ursprung in Nordchina im Spätneolithikum. Natur 569, 112–115 (2019).

ADS CAS PubMed Google Scholar

McColl, H. et al. Die prähistorische Bevölkerung Südostasiens. Wissenschaft 361, 88–92 (2018).

ADS CAS PubMed Google Scholar

Sikora, M. et al. Die Bevölkerungsgeschichte Nordostsibiriens seit dem Pleistozän. Natur 570, 182–188 (2019).

ADS CAS PubMed Google Scholar

Yang, MA et al. Alte DNA weist auf Verschiebungen und Vermischung der menschlichen Bevölkerung in Nord- und Südchina hin. Wissenschaft 369, eaba0909 (2020).

ADS Google Scholar

Patterson, N. et al. Antike Beimischung in der Menschheitsgeschichte. Genetics 192, 1065–1093 (2012).

PubMed PubMed Central Google Scholar

Hu, H. et al. Evolutionsgeschichte der Tibeter, abgeleitet aus der Sequenzierung des gesamten Genoms. PLUS Genet. 13, e1006675 (2017).

PubMed PubMed Central Google Scholar

Wang, C.-C. et al. Die genomische Bildung menschlicher Populationen in Ostasien https://doi.org/10.1101/2020.03.25.004606 (2020). bioRxiv 2020.03.25.004606.

Gnecchi-Ruscone, GA et al. Die genomische Landschaft der nepalesischen Tibeto-Burmanen offenbart neue Erkenntnisse über die jüngste Besiedlung des südlichen Himalaya. Wissenschaft. Rep. 7, 1–12 (2017).

CAS Google Scholar

Cole, AM et al. Genetische Struktur in den Sherpa- und benachbarten nepalesischen Populationen. BMC-Genom. 18, 102 (2017).

Google Scholar

Oppitz, M. Mythen und Fakten: Überarbeitung einiger Daten zur Clangeschichte der Sherpas. Kailash 2, 121–131 (1974).

Google Scholar

Lorenzo, FR et al. Ein genetischer Mechanismus für die Höhenanpassung Tibets. Nat. Genet. 46, 951–956 (2014).

CAS PubMed PubMed Central Google Scholar

Skoglund, P. et al. Rekonstruktion der prähistorischen afrikanischen Bevölkerungsstruktur. Zelle 171, 59–71.e21 (2017).

CAS PubMed PubMed Central Google Scholar

Buroker, NE et al. AKT3-, ANGPTL4-, eNOS3- und VEGFA-Assoziationen mit Höhenkrankheit bei Han-Chinesen und tibetischen Chinesen auf dem Qinghai-Tibetischen Plateau. Int. J. Hämatol. 96, 200–213 (2012).

CAS PubMed Google Scholar

Jeong, C. et al. Beimischung erleichtert genetische Anpassungen an die große Höhe in Tibet. Nat. Komm. 5, 1–7 (2014).

ADS Google Scholar

Ren, L. et al. Nahrungssuche und Landwirtschaft: archäobotanische und zooarchäologische Beweise für den neolithischen Austausch auf dem tibetischen Plateau. Antike 94, 637–652 (2020).

Google Scholar

Xiang, K. et al. Identifizierung einer tibetisch-spezifischen Mutation im hypoxischen Gen EGLN1 und ihr Beitrag zur Höhenanpassung. Mol. Biol. Entwicklung 30, 1889–1898 (2013).

CAS PubMed Google Scholar

Tiwari, D. Höhlenbestattungen aus Westnepal. Mustang Anc. Nepal 136, 51–75 (1984).

Google Scholar

Angela Simons (Hrsg.): Hirten im Himalaya – Prähistorische Mumien im Höhlengrab Mebrak 63 (Mustang/Nepal) - Propylaeum eBooks. Available at: https://books.ub.uni-heidelberg.de/propylaeum/catalog/book/596. (Accessed: 20th August 2020).

Eng, J. & Aldenderfer, M. Interdisziplinäre Ansätze zur Rekonstruktion der frühen Bevölkerungsgeschichte im hohen Himalaya Nepals. Bioarchäol. Int. 4, 1–20 (2020).

Google Scholar

Aldenderfer, M. & Eng, JT Tod und Bestattung in zwei alten Hochgebirgsgemeinden Nepals. in A Companion to South Asia in the Past 374–397 (John Wiley & Sons, Inc, 2016). https://doi.org/10.1002/9781119055280.ch24.

Dabney, J. et al. Vollständige mitochondriale Genomsequenz eines mittelpleistozänen Höhlenbären, rekonstruiert aus ultrakurzen DNA-Fragmenten. Proz. Natl Acad. Wissenschaft. USA 110, 15758–15763 (2013).

ADS CAS PubMed PubMed Central Google Scholar

Neumann, GU, Andrades Valtuena, A., Fellows Yates, JA, Stahl, R. & Brandt, G. Zahnprobenahme aus der inneren Pulpakammer zur Extraktion antiker DNA V.2 In 2 Sammlungen, https://doi.org/ 10.17504/protocols.io.bqebmtan (2020).

Velsko, I., Skourtanioti, E. & Brandt, G. Antike DNA-Extraktion aus Skelettmaterial., https://doi.org/10.17504/protocols.io.baksicwe (2020).

Meyer, M. & Kircher, M. Vorbereitung der Illumina-Sequenzierungsbibliothek für hochmultiplexte Zielerfassung und -sequenzierung. Kalter Frühling Harb. Protokoll. 5, pdb.prot5448 (2010).

Google Scholar

Kircher, M., Sawyer, S. & Meyer, M. Doppelte Indizierung überwindet Ungenauigkeiten bei der Multiplex-Sequenzierung auf der Illumina-Plattform. Nukleinsäuren Res. 40, e3 (2012).

CAS PubMed Google Scholar

Aron, F., Neumann, GU & Brandt, G. Nicht-UDG-behandelte doppelsträngige alte DNA-Bibliotheksvorbereitung für die Illumina-Sequenzierung, https://doi.org/10.17504/protocols.io.bakricv6 (2020).

Stahl, R. et al. Illumina-Doppelstrang-DNA-Dualindizierung für alte DNA, https://doi.org/10.17504/protocols.io.bakticwn (2020).

Gansauge, MT et al. Herstellung einer einzelsträngigen DNA-Bibliothek aus stark abgebauter DNA unter Verwendung von T4-DNA-Ligase. Nukleinsäuren Res. 45, e79 (2017).

CAS PubMed PubMed Central Google Scholar

Aron, F. & Brandt, G. Vorbereitung des Bibliotheksadapters für die Illumina-Sequenzierung doppelsträngiger DNA mit zwei Indexen, https://doi.org/10.17504/protocols.io.bem5jc86 (2020).

Aron, F. & Brandt, G. Amplification and Pooling, https://doi.org/10.17504/protocols.io.beqkjduw (2020).

Haak, W. et al. Die massive Migration aus der Steppe war eine Quelle indogermanischer Sprachen in Europa. Natur 522, 207–211 (2015).

ADS CAS PubMed PubMed Central Google Scholar

Rohland, N., Harney, E., Mallick, S., Nordenfelt, S. & Reich, D. Teilweise Uracil-DNA-Glykosylase-Behandlung zum Screening alter DNA. Philos. Trans. R. Soc. B Biol. Wissenschaft. 370, 20130624 (2015).

Google Scholar

Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2: Schnelles Adapter-Trimmen, Identifizieren und Zusammenführen von Lesevorgängen. BMC Res. Anmerkungen 9, 88 (2016).

PubMed PubMed Central Google Scholar

Peltzer, A. et al. EAGER: effiziente Rekonstruktion des antiken Genoms. Genombiol. 17, 60 (2016).

PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

CAS PubMed PubMed Central Google Scholar

Korneliussen, TS, Albrechtsen, A. & Nielsen, R. ANGSD: Analyse von Sequenzierungsdaten der nächsten Generation. BMC Bioinforma. 15, 1–13 (2014).

Google Scholar

Weissensteiner, H. et al. HaploGrep 2: Klassifizierung der mitochondrialen Haplogruppen im Zeitalter der Hochdurchsatzsequenzierung. Nukleinsäuren Res. 44, W58–W63 (2016).

CAS PubMed PubMed Central Google Scholar

Jun, G., Wing, MK, Abecasis, GR & Kang, HM Ein effizientes und skalierbares Analyse-Framework für die Variantenextraktion und -verfeinerung aus DNA-Sequenzdaten im Populationsmaßstab. Genomres. 25, 918–925 (2015).

CAS PubMed PubMed Central Google Scholar

Li, H. et al. Das Sequence Alignment/Map-Format und SAMtools. Bioinformatik 25, 2078–2079 (2009).

PubMed PubMed Central Google Scholar

Kennett, DJ et al. Archäogenomische Beweise zeigen eine prähistorische matrilineare Dynastie. Nat. Komm. 8, 1–9 (2017).

Google Scholar

Lipatov, M., Sanjeev, K., Patro, R. & Veeramah, KR Maximum-Likelihood-Schätzung der biologischen Verwandtschaft anhand von Sequenzierungsdaten mit geringer Abdeckung, https://doi.org/10.1101/023374 (2015). bioRxiv 023374.

Lazaridis, I. et al. Alte menschliche Genome deuten auf drei Vorfahrenpopulationen der heutigen Europäer hin. Natur 513, 409–413 (2014).

ADS CAS PubMed PubMed Central Google Scholar

Nakatsuka, N. et al. Das Versprechen, bevölkerungsspezifische krankheitsassoziierte Gene in Südasien zu entdecken. Nat. Genet. 49, 1403–1407 (2017).

CAS PubMed PubMed Central Google Scholar

Mallick, S. et al. Das Simons Genome Diversity Project: 300 Genome aus 142 verschiedenen Populationen. Natur 538, 201–206 (2016).

ADS CAS PubMed PubMed Central Google Scholar

Fu, Q. et al. Genomsequenz eines 45.000 Jahre alten modernen Menschen aus Westsibirien. Natur 514, 445–449 (2014).

ADS CAS PubMed PubMed Central Google Scholar

Lazaridis, I. et al. Genomische Einblicke in den Ursprung der Landwirtschaft im alten Nahen Osten. Natur 536, 419–424 (2016).

ADS CAS PubMed PubMed Central Google Scholar

Narasimhan, VM et al. Die Bildung menschlicher Populationen in Süd- und Zentralasien. Science 365, eaat7487 (2019).

CAS PubMed PubMed Central Google Scholar

Fu, Q. et al. Die genetische Geschichte des eiszeitlichen Europas. Natur 534, 200–205 (2016).

ADS CAS PubMed PubMed Central Google Scholar

de Barros Damgaard, P. et al. Die ersten Pferdehirten und die Auswirkungen der frühbronzezeitlichen Steppenausbreitung nach Asien. Science 360, eaar7711 (2018).

PubMed PubMed Central Google Scholar

Metspalu, M. et al. Gemeinsame und einzigartige Komponenten der menschlichen Populationsstruktur und genomweite Signale positiver Selektion in Südasien. Bin. J. Hum. Genet. 89, 731–744 (2011).

CAS PubMed PubMed Central Google Scholar

Li, JZ et al. Weltweite menschliche Beziehungen, abgeleitet aus genomweiten Variationsmustern. Wissenschaft 319, 1100–1104 (2008).

ADS CAS PubMed Google Scholar

Alexander, DH, Novembre, J. & Lange, K. Schnelle modellbasierte Abstammungsschätzung bei nicht verwandten Personen. Genomres. 19, 1655–1664 (2009).

CAS PubMed PubMed Central Google Scholar

Chang, CC et al. PLINK der zweiten Generation: Sich der Herausforderung größerer und umfangreicherer Datensätze stellen. Gigascience 4, 7 (2015).

PubMed PubMed Central Google Scholar

Behr, AA, Liu, KZ, Liu-Fang, G., Nakka, P. & Ramachandran, S. pong: schnelle Analyse und Visualisierung latenter Cluster in populationsgenetischen Daten. Bioinformatik 32, 2817–2823 (2016).

CAS PubMed PubMed Central Google Scholar

Berisa, T. & Pickrell, JK Ungefähr unabhängige Bindungsungleichgewichtsblöcke in menschlichen Populationen. Bioinformatik 32, 283–285 (2015).

PubMed PubMed Central Google Scholar

Referenzen herunterladen

Wir möchten Rowan K. Flad für hilfreiche Kommentare zu den früheren Versionen des Papiers danken. Wir danken auch Karma Ngodup für die hilfreichen Diskussionen im Verlauf dieses Projekts. Diese Arbeit wurde von den National Institutes of Health (R01HL119577 an AD), der US National Science Foundation (BCS-1528698 an MA) und der National Research Foundation (NRF) von Korea mit einem von der koreanischen Regierung finanzierten Zuschuss (MSIT) (2020R1C1C1003879 an CJ) unterstützt ), der Europäische Forschungsrat im Rahmen des Forschungs- und Innovationsprogramms Horizon 2020 der Europäischen Union (Fördervereinbarungsnummern 804884-DAIRYCULTURES an CW) und die Max-Planck-Gesellschaft.

Anna Gosling

Aktuelle Adresse: Department of Anatomy, University of Otago, Dunedin, 9054, Neuseeland

Harald Ringbauer

Aktuelle Adresse: Department of Human Evolutionary Biology, Harvard University, Cambridge, MA, 02138, USA

Richard Hagan

Aktuelle Adresse: Department of Archaeology, University of York, York, YO10 5DD, UK

Nisha Patel

Aktuelle Adresse: Kintai Therapeutics, Cambridge, MA, 02139, USA

Abteilung für Humangenetik, University of Chicago, Chicago, IL, 60637, USA

Chi-Chun Liu, David Witonsky, Anna Gosling, Harald Ringbauer, John Novembre und Anna Di Rienzo

School of Biological Sciences, Seoul National University, Seoul, 08826, Republik Korea

Ju Hyeon Lee & Choongwon Jeong

Abteilung für Anthropologie, University of Oklahoma, Norman, OK, 73019, USA

Richard Hagan

Abteilung für Pflanzen- und Mikrobiologie, University of Oklahoma, Norman, OK, 73019, USA

Nisha Patel

Max-Planck-Institut für evolutionäre Anthropologie, 04103, Leipzig, Deutschland

Raphaela Stahl & Christina Warinner

Abteilung für Anthropologie und Kulturerbestudien, University of California, Merced, CA, 95343, USA

Mark Aldenderfer

Abteilung für Anthropologie, Harvard University, Cambridge, MA, 02138, USA

Christina Warinner

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

CJ, AD, CW und MA konzipierten und betreuten die Studie. AG, RH, NP, RS führten die Laborarbeiten durch. MA und CW stellten archäologisches Material und zugehörige Informationen zur Verfügung. CC.L., CJ, DW, AG, JL, HR analysierten Daten. CC.L., CJ, AD, CW, MA, JN haben den Artikel unter Einbeziehung aller Mitautoren verfasst.

Korrespondenz mit Mark Aldenderfer, Christina Warinner, Anna Di Rienzo oder Choongwon Jeong.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt Elena Arciero und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Liu, CC., Witonsky, D., Gosling, A. et al. Alte Genome aus dem Himalaya beleuchten die genetische Geschichte der Tibeter und ihrer tibeto-burmanischsprachigen Nachbarn. Nat Commun 13, 1203 (2022). https://doi.org/10.1038/s41467-022-28827-2

Zitat herunterladen

Eingegangen: 10. Januar 2021

Angenommen: 14. Februar 2022

Veröffentlicht: 08. März 2022

DOI: https://doi.org/10.1038/s41467-022-28827-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.