Menü Schließen

Vollständige Khoisan- und Bantu-Genome aus dem südlichen Afrika

Vier indigene namibische Jäger und Sammler !Gubi, G/aq’o, D#kgao und !Aî (hier als KB1, NB1, TK1 bzw. MD8 bezeichnet), jeweils das älteste Mitglied ihrer Gemeinschaft, wurden aufgrund ihrer Sprachgruppe, ihres geografischen Standorts und ihrer Y-Chromosom-Haplogruppe für die Genomsequenzierung ausgewählt (Abb. 1 und ergänzende Tabelle 1). Bei der Bantu-Person handelt es sich um Erzbischof Desmond Tutu (ABT), der Sotho-Tswana- und Nguni-Sprecher (aus dem breiten Spektrum der Niger-Kongo-Sprachen), die beiden größten Bantu-Gruppen im südlichen Afrika, vertritt.

Abbildung 1: Karte des südlichen Afrika.
Abbildung1

Die Abbildung zeigt die ethnische Gruppierung und die Orte der Studienteilnehmer KB1, NB1, TK1, MD8 und ABT (jeweils a-e), die Gebiete mit Trocken- und Wüstenklima sowie die geografische Verbreitung der Khoisan- und Niger-Kongo-Sprachen30. Die Khoisan-Sprachen zeichnen sich durch Klicklaute aus, die zusätzliche Konsonanten bezeichnen. ! ist ein palataler Klick; / ist ein dentaler Klick; und # ist ein alveolarer Klick26. Man beachte, dass die ABT Y-Chromosomen-Haplogruppe sowohl durch Genotypisierung als auch durch Sequenzierung von Daten aus dieser Studie bestimmt wurde.

PowerPoint-Folie

Da davon auszugehen war, dass die Genome unserer Studienteilnehmer stärker vom menschlichen Referenzgenom abweichen als die öffentlich zugänglichen jorubischen, europäischen und asiatischen Genome4,5,6,7,8, wollten wir eine Genomsequenz generieren, die eine ausreichende Qualität sowohl für die Kartierung gegen das menschliche Referenzgenom als auch für die de novo-Assemblierung bieten würde. Daher wurde das Genom von KB1 mit der Roche/454 GS FLX-Plattform und Titanium-Chemie mit einer 10,2-fachen Abdeckung sequenziert, was eine durchschnittliche Leselänge von 350 Basenpaaren (bp) ergab. Um Aspekte der Genomstruktur zu untersuchen, wurden zusätzliche Long-Insert-Bibliotheken für KB1 mit der Roche/454 Titanium Paired-End-Technologie sequenziert, mit Insert-Größen von bis zu 17 Kilobasen (kb) und 12,3-facher nicht redundanter Klonabdeckung. Das Genom von NB1 wurde mit der gleichen Plattform mit zweifacher Abdeckung sequenziert. Das Genom von ABT wurde mit der Short-Read-Technologie SOLiD 3.0 von Applied Biosystems mit über 30-facher Abdeckung sequenziert. Darüber hinaus wurden die Genome aller fünf Studienteilnehmer bis zu einer mindestens 16-fachen Abdeckung in proteincodierenden Regionen (Exomen) sequenziert, die durch Nimblegen Sequenzerfassung (2,1-M-Array) angereichert und anschließend auf der Roche/454 Titanium-Plattform sequenziert wurden (1,5-1,9 Gigabasen (Gb) Sequenz pro Person). Die ergänzende Tabelle 2 zeigt das Volumen der gewonnenen Daten, während die ergänzende Tabelle 3 Exom-Statistiken enthält.

Die Sequenzdaten wurden durch eine Vielzahl von Techniken validiert, einschließlich des Vergleichs der Ganzgenom- und Exom-Sequenzen, der Ganzgenom-Sequenzierung durch eine andere Plattform (Illumina, 23.2-fach für KB1 und 7,2-fach für ABT), Genotypisierung mit hoher Dichte (Illumina 1 Million SNPs), Vergleich der Lesetiefeninformationen mit vergleichenden genomischen Hybridisierungsdaten sowie Validierung ausgewählter Varianten mittels TaqMan-Allel-Diskriminierung und/oder Sanger-Sequenzierung. Wir schätzen die Falsch-Positiv-Rate unserer endgültigen SNP-Aufrufe für KB1 auf 0,0009 und die Falsch-Negativ-Rate auf 0,09 (siehe ergänzende Informationen für Details).

Wir erstellten eine De-novo-Assemblierung des KB1-Genoms mit dem Phusion-Assembler9. Die assemblierten Contigs umfassen insgesamt 2,79 Gb, mit einer N50-Contig-Größe von 5,5 kb. Die Gesamtgröße des Gerüsts, einschließlich der geschätzten Lücken, beträgt 3,09 Gb, mit einer N50-Gerüstgröße von 156 kb. Das größte zusammengesetzte Gerüst hat eine Größe von 3,2 Mb. Die Roche GS FLX-Sequenzdaten führten häufig zu Contigs und Scaffolds, die nicht mit dem menschlichen Referenzgenom übereinstimmen. Viele dieser Gerüste entsprachen Lücken im aktuellen menschlichen Referenzgenom, darunter auch Lücken von über 200.000 bp Länge (siehe ergänzende Informationen).

Einzelne Nukleotidunterschiede zum menschlichen Referenzgenom (NCBI Build 36, auch bekannt als hg18) wurden für die fünf südafrikanischen Genome identifiziert und mit denen von acht verfügbaren persönlichen Genomen4,5,6,7,8 verglichen. Im Folgenden bezeichnet der Begriff „SNP“ einen Einzel-Nukleotid-Unterschied zum menschlichen Referenzgenom, ohne Einfügungen/Deletionen einer Base und ohne Einschränkungen hinsichtlich der Allelhäufigkeit in einer Population. Die SNPs wurden mit der Software Newbler (für Roche/454), Corona Lite (für SOLiD) und MAQ10 (für Illumina) bestimmt.

In Übereinstimmung mit der Ansicht, dass die Menschen im südlichen Afrika zu den am stärksten divergierenden menschlichen Populationen gehören, haben wir in KB1 und in geringerem Maße in ABT mehr SNPs identifiziert als in anderen individuellen menschlichen Genomen (Abb. 2 und Tabelle 1), obwohl ein Teil der Unterschiede in der Anzahl der SNPs auf Unterschiede in der Technologie und dem Abdeckungsgrad zurückzuführen sein könnte. Die Anzahl der neuartigen SNPs (d. h. der SNPs, die zuvor nicht bei anderen Individuen gefunden wurden) ist bei KB1 und ABT weitaus höher als bei anderen individuellen Ganzgenomen (Tabelle 1). KB1 und ABT haben jeweils etwa 1 Million SNPs, die weder untereinander noch mit den veröffentlichten jorubischen, asiatischen oder europäischen Gesamtgenomen4,5,6,7,8 übereinstimmen (Abb. 2). In den 117 Megabasen (Mb) der sequenzierten Exom-enthaltenden Intervalle betrug die durchschnittliche Rate der Nukleotidunterschiede zwischen einem Paar der Buschmänner 1,2 pro Kilobase, verglichen mit durchschnittlich 1,0 pro Kilobase, die sich zwischen einem europäischen und einem asiatischen Individuum unterscheiden. Die höhere SNP-Rate bei den Buschmännern wird durch den Versatz der roten und schwarzen Linien in Abb. 3b deutlich. Die autosomale Vielfalt der Studienteilnehmer spiegelt sich in der Vielfalt der mitochondrialen Genome wider. Während Europäer im Durchschnitt etwa 20 Unterschiede zur Cambridge-Referenzsequenz (CRS)11 aufweisen, sind bei unseren Teilnehmern aus dem südlichen Afrika bis zu 100 mitochondriale SNPs im Vergleich zur CRS zu finden (ergänzende Tabellen 4 und 5 sowie ergänzende Abbildungen 1 und 2). Noch wichtiger ist, dass trotz der Zugehörigkeit aller mitochondrialen Sequenzen zur gleichen Haplogruppe L0 bis zu 84 Unterschiede zwischen den mitochondrialen Genompaaren der Teilnehmer beobachtet wurden (ergänzende Tabelle 4).

Abbildung 2: Dreifache Beziehungen zwischen SNPs.
Abbildung2

SNPs von KB1 werden mit denen der Yorubaner NA19240 und ABT (linke Tafel) sowie mit einem Amerikaner europäischer Abstammung (J. C. Venter) und einem Chinesen (YH) (rechte Tafel) verglichen. Die Zahlen sind in Tausend angegeben. Variantenpositionen, die in allen acht früheren Genomen vorkommen, wurden ignoriert, was zu einer etwas geringeren Gesamtzahl von SNPs (z. B. 3.761.019 Unterschiede zum Referenzassembly für KB1, verglichen mit 4.053.781, wenn sie einbezogen werden) und weniger SNPs in jeder Drei-Wege-Kreuzung führt. Ähnliche Beziehungen werden gefunden, wenn andere Individuen aus den geografischen Gruppen untersucht werden.

PowerPoint-Folie

Tabelle 1 Anzahl der SNPs im Genom und in den sequenzierten exom-enthaltenden Regionen
Abbildung 3: Variation der SNP-Dichten.
Abbildung 3

a, Ein SNP-Hotspot für KB1 und J. Watson auf Chromosom 17; beide Individuen sind heterozygot für den 17q21.3 H2-Haplotyp. Auf beiden Seiten befinden sich repetitive Regionen, in denen keine SNPs gefunden werden können (grau). Die lokalen SNP-Raten werden durch die autosomweite Rate des Individuums geteilt, so dass die erwarteten Raten 1,0 betragen (horizontale gepunktete Linie). KB1 weist eine fast 2,5-fache Anreicherung von SNPs für 650.000 Basen auf. b, Verteilung der SNPs aus den Genomen der Buschmänner (rote Linie) und der Nicht-Buschmänner (schwarze Linie), verglichen mit den Nukleosomenpositionen (gefülltes graues Diagramm), das die nukleosomenfreie Region (NFR) und die -1- und +1-Nukleosomen anzeigt. TSS, Transkriptionsstartstelle.

PowerPoint-Folie

Um festzustellen, ob es sich bei den neuen SNPs um Vorfahren-Allele handelt oder ob sie nach der Trennung der Buschmänner von anderen Populationen entstanden sind, haben wir das homologe Nukleotid im Schimpansengenom untersucht. SNPs, die mit dem Schimpansengenom übereinstimmen, deuten darauf hin, dass es sich um ein angestammtes Allel handelt, während Unterschiede zum Schimpansen auf ein abgeleitetes Allel hindeuten. Von den 743.714 neuen SNPs in KB1 stimmt das menschliche Referenzgenom bei 87 % mit dem Schimpansengenom überein, während das KB1-Genom nur bei 6 % mit dem Schimpansengenom übereinstimmt. Bei den restlichen 7 % konnte das Nukleotid des Schimpansen nicht bestimmt werden (6 %) oder unterschied sich sowohl vom Buschmann als auch von der Referenz (1 %). Diese Anteile bleiben im Wesentlichen unverändert, wenn wir die geschätzten 3.600 falsch-positiven SNP-Calls (d. h. 0,0009 von 4 Millionen) berücksichtigen, von denen angenommen werden kann, dass sie als neue Varianten auftreten. Somit sind nur sehr wenige der neuen Unterschiede im Genom von KB1 Nukleotide, die bei den Buschmännern als Vorfahren erhalten geblieben sind; stattdessen handelt es sich bei der überwiegenden Mehrheit um Veränderungen, die sich seit der Abspaltung der Buschmänner von anderen menschlichen Populationen angesammelt haben.

Die große Anzahl neuer SNPs gibt Anlass zu Bedenken hinsichtlich der Fähigkeit aktueller Genotypisierungs-Arrays, das wahre Ausmaß der genetischen Vielfalt und der Haplotyp-Struktur im südlichen Afrika effektiv zu erfassen. Bei der Bewertung der prozentualen Heterozygotie für 1.105.569 autosomale SNPs unter Verwendung von Illumina-Arrays mit aktuellem Inhalt waren wir überrascht, dass die Heterozygotie in KB1 im Vergleich zu einer regionsangepassten europäischen Kontrolle niedriger war (ergänzende Daten und ergänzende Abb. 3a, b), da die genetische Vielfalt in Afrika bekanntlich am höchsten ist. Die Analyse der Ganzgenomsequenzierungsdaten für KB1 und ABT ergab jedoch erwartungsgemäß einen hohen Prozentsatz heterozygoter SNPs (59 % bzw. 60 %). Diese Diskrepanz unterstreicht die Unzulänglichkeit aktueller SNP-Arrays für die Analyse südafrikanischer Populationen.

Die lokale Dichte der in KB1 identifizierten SNPs variiert beträchtlich über das Genom (ergänzende Abb. 4), und diese Variation in der Dichte ist auch in anderen individuellen Genomen zu sehen (Daten nicht gezeigt). Einige der Hotspots sind allen untersuchten Individuen gemeinsam, während andere auffällige lokale Unterschiede zwischen den Individuen aufweisen, wie der statistisch signifikante (P < 10-5; siehe ergänzende Informationen) KB1-Hotspot in Abb. 3a. Diese Region entspricht der 17q21.3-Inversion12, die mehrere Gene enthält, darunter solche, die für CRHR1 (Corticotropin-Releasing-Hormon-Rezeptor) und MAPT (Mikrotubuli-assoziiertes Protein Tau) kodieren. Die Analyse diagnostischer Sequenzvarianten sowie die direkte Typisierung eines 238-Bp-Indels13 (ergänzende Abb. 5) bestätigen, dass KB1 heterozygot für den Haplotyp 17q21.3 H2 ist, ein überraschender Befund, da das H2-Allel in außereuropäischen Populationen mit geringer Häufigkeit vorkommt12. Die Lesetiefe und das Array-CGH zeigen, dass das von KB1 getragene H2-Allel nicht die 75-kb-Duplikation enthält, die bei allen analysierten europäischen H2-Allelen vorhanden ist14,15,16 (ergänzende Abb. 6a, b). Der H2-Haplotyp von KB1 könnte die ursprüngliche Sequenz und Struktur des H2-Haplotyps repräsentieren, der in afrikanischen Populationen vorhanden war, bevor seine Häufigkeit in europäischen und nahöstlichen Populationen zunahm12.

Wir beobachteten auch einen genomweiten Trend zu erhöhten SNP-Werten in Promotorregionen (Abb. 3b). Regulatorische Promotorelemente sind in der Regel in der Nähe der Nukleosomengrenzen angereichert, wo wir die höchsten SNP-Werte beobachteten, insbesondere in den zusammengesetzten Buschmann-Genomen. Es ist möglich, dass eine erhöhte SNP-Häufigkeit in diesen Genomregionen zu phänotypischen Veränderungen beim Menschen führen könnte.

Wir haben bei unseren fünf Teilnehmern 27.641 verschiedene Aminosäure-Substitutionen im Vergleich zur menschlichen Referenzsequenz identifiziert, von denen viele bei mehr als einem Individuum vorkommen. Davon tauchen 10.929 in einem oder mehreren der zuvor sequenzierten persönlichen Genome auf, die hier berücksichtigt wurden, weitere 3.566 sind in öffentlichen Datenbanken zu finden (siehe ergänzende Informationen) und die verbleibenden 13.146 sind neu und auf 7.720 verschiedene Gene verteilt. Die folgende Erörterung mutmaßlicher Phänotypen für die bei Buschmännern gefundenen Genotypen soll veranschaulichen, wie das Vorhandensein beobachteter SNPs und ihre frühere Verbindung mit Phänotypen zu prüfbaren Hypothesen führen kann. Es handelt sich dabei nur um Kandidaten für die vorgeschlagenen Funktionen, und es müssen experimentelle Tests durchgeführt werden, um sie weiter zu untersuchen.

Von den 14.495 (d.h. 10.929 + 3.566) zuvor identifizierten Aminosäure-SNPs wurden 621 in Datenbanken gefunden, die Krankheitsassoziationen oder andere phänotypische Informationen liefern. Einige dieser SNPs lassen sich leicht mit dem Lebensstil der Buschmänner in Verbindung bringen, wie z. B. das Fehlen des aus Europa stammenden Laktase-Persistenz-Allels (eine funktionelle Promotorvariante im LCT-Gen) und des SLC24A5-Allels, das mit heller Haut assoziiert wird. In anderen Fällen ist die Übereinstimmung mit der menschlichen Referenzsequenz aufschlussreich, wie z. B. das Fehlen des afrikaspezifischen Duffy-Null-Allels (DARC) für Malaria-Resistenz17. Das Fehlen von Malaria-Resistenz-Allelen bei den Buschleuten könnte erhebliche Folgen für eine bereits schwindende Population gut angepasster Jäger haben, wenn sie zu einem landwirtschaftlichen Lebensstil gezwungen werden, der eine erhöhte Belastung durch Krankheitserreger mit sich bringt17. Daher können diese genetischen Marker die Rückverfolgung der menschlichen Anpassungsrate an sich verändernde Umwelten ermöglichen18 (siehe ergänzende Informationen).

Obwohl eine Reihe von SNPs, die bei den Buschleuten beobachtet wurden, in der Literatur und in Online-Datenbanken mit Phänotypen anderer ethnischer Gruppen in Verbindung gebracht wurden, sollte man skeptisch bleiben, was die Gültigkeit ungeprüfter Assoziationen angeht. In den ergänzenden Informationen veranschaulichen wir diesen Punkt anhand des dbSNP-Eintrags rs1051339 für das LIPA-Gen, das in einer öffentlichen Datenbank mit dem „Wolman-Syndrom“, einer verheerenden Störung des Fettstoffwechsels, in Verbindung gebracht wird (ergänzende Abb. 7).

Wir beobachteten SNPs, von denen berichtet wird, dass sie mit einer verbesserten Physiologie in Verbindung stehen (ergänzende Tabelle 6). KB1, MD8, TK1 und ABT sind homozygot für ein VDR-Allel, das mit einer höheren Knochenmineraldichte assoziiert ist; KB1 ist homozygot für ein UGT1A3-Allel, das mit einem erhöhten Metabolismus von Endo- und Xenobiotika assoziiert ist; KB1, NB1 und ABT sind homozygot für ein ACTN3-Allel, das mit einer erhöhten Sprint- und Kraftleistung assoziiert ist; KB1 ist heterozygot für ein Allel von CLCNKB, das für einen Chloridkanal kodiert, der eine größere Fähigkeit zur Rückresorption von Chloridionen aus dem Nierenglomerulus besitzt – eine Eigenschaft, die in der Wüste wahrscheinlich von Vorteil wäre. Zu den weiteren interessanten SNPs gehören einer, der die Funktion des CYP2G-Gens beibehält (siehe ergänzende Abb. 8a, b), und zwei an Positionen im Geschmacksrezeptor-Gen TAS2R38, die die Fähigkeit verleihen, eine bittere Verbindung (Phenylthiocarbamid) zu schmecken, was ein Bedürfnis der Jäger und Sammler widerspiegeln könnte, giftige Pflanzen zu meiden (siehe ergänzende Informationen für eine detaillierte Diskussion).

Die hier berichteten 13.146 neuen Aminosäure-SNPs werden eine reichhaltige Ressource für künftige Arbeiten darstellen, da sie viele neue Kandidaten für funktionelle Stellen liefern, die bisher nicht in Ganzgenom-Assoziationsstudien erfasst wurden. Für etwa 25 % dieser SNPs wurde durch eine Reihe von Berechnungsmethoden eine funktionelle Bedeutung vorhergesagt (siehe ergänzende Informationen). Zu den Kategorien der Gene Ontology, die in den 6.623 Genen mit einem oder mehreren neuen Buschmann-SNPs prominent vertreten sind (d. h. ohne die 7.720 Gene mit neuen SNPs, die nur bei ABT vorkommen), gehören viele Funktionen, von denen bekannt ist, dass sie sich beim Menschen schnell weiterentwickeln, wie z. B. Immunreaktion, Fortpflanzung und Sinneswahrnehmung (siehe ergänzende Tabelle 7). Detaillierte Beschreibungen der computergestützten Analysen von Genen, die mit dem Fettstoffwechsel und der Sinneswahrnehmung zusammenhängen, sind in den ergänzenden Informationen zu finden.

Da alle unsere Studienteilnehmer ein hohes Alter (∼80 Jahre) haben und offensichtlich bei guter Gesundheit sind, können die in dieser Studie beschriebenen neuartigen kodierenden Varianten mit dem Gesundheitszustand und den Phänotypen über die gesamte menschliche Lebensspanne hinweg korreliert werden. Die teilnehmenden Buschmänner haben ihr hohes Alter erreicht, obwohl sie aufgrund von regelmäßigen Hungersnöten und unbehandelten Krankheiten unter rauen Bedingungen leben. Da einige der kodierenden Allele der Buschmänner in der veröffentlichten Literatur mit Krankheiten in Verbindung gebracht wurden, können unsere Ergebnisse dazu beitragen, diese früheren Berichte neu zu bewerten und potenzielle bevölkerungsspezifische pharmakogenetische Unverträglichkeiten bestimmter Medikamente, die weltweit verschrieben werden, zu identifizieren.

Segmentale Duplikationen wurden in 17.601 verschiedenen autosomalen Genen im KB1-Genom entdeckt und die Kopienzahlen nach den bereits beschriebenen Verfahren geschätzt19 (ergänzende Abb. 6a, b). Die anhand der Lesetiefe geschätzten Kopienzahlen sind für längere Segmente zuverlässiger, weshalb wir gezielt Regionen mit einer Größe von mehr als 20 kb untersuchten. Insgesamt entdeckten wir 886 Intervalle (jedes >20 kb) mit autosomaler segmentaler Duplikation (93,5 Mb), darunter 100 Intervalle (3,9 Mb), für die in der Probe NA18507 (einer HapMap-Probe aus Yoruba, Nigeria) keine Duplikation vorhergesagt wurde19. Mit Hilfe von Array-CGH wurde festgestellt, dass 58 dieser Intervalle (2,6 Mb) in KB1 im Vergleich zu NA18507, dem einzigen anderen veröffentlichten afrikanischen Genom, eine erhöhte Kopienzahl aufweisen. Zu den validierten Duplikationen gehört ein 140 KB großes Intervall auf Chromosom 10, das das CYP2E1-Gen umfasst, das für ein Cytochrom-P450-Protein kodiert, das durch Ethanol induziert wird und viele toxikologische Substrate verstoffwechselt20 (ergänzende Abb. 6a).

Als Nächstes schätzten wir speziell die Kopienzahlen für alle autosomalen RefSeq-Gene und entwarfen einen benutzerdefinierten Oligonukleotid-Array, der auf Gene abzielte, bei denen ein Unterschied zwischen KB1 und NA18507 von mindestens einer Kopie vorhergesagt wird. Auf diese Weise wurden 193 Gene validiert, die sich in der Kopienzahl zwischen KB1 und NA18507 unterscheiden (53, bei denen NA18507 mehr Kopien hat, und 140, bei denen KB1 mehr Kopien hat; ergänzende Tabelle 8). Bei 26 dieser Gene hat KB1 schätzungsweise mindestens zwei Kopien mehr als in NA18507, Han-Chinesen und J. Watson europäischer Abstammung. Zu diesem Gensatz gehören Speichelamylase (AMY1A, geschätzte KB1-Kopienzahl = 15; dies könnte mit dem Lebensstil von Futtersammlern übereinstimmen21), die Alpha-Defensine (DEFA1, geschätzte KB1-Kopienzahl = 12,5) und γ-Glutamyltransferase 1 (GGT1, geschätzte KB1-Kopienzahl = 13,2).

Die Sequenzierung und die umfassende Genotypisierung ergaben genetische Beziehungen zwischen unseren Teilnehmern und anderen menschlichen Gruppen. Die Platzierung vollständiger mitochondrialer Genome (ergänzende Tabelle 9), einschließlich zusätzlicher Tuu- (KB2) und Juu- (NB8) Frauen auf dem mütterlichen Baum von ref. 1 (Supplementary Fig. 1a-c) positionierten unsere Teilnehmer innerhalb des Kladens L0 basalen Zweiges. Überraschenderweise wurde ABT in Klade L0d eingeordnet, einer Buschmann-spezifischen mitochondrialen Linie. Wir identifizierten 75 (von 1.220) Buschmann-informative SNPs auf dem Y-Chromosom (ergänzende Abb. 9). Im Gegensatz zu den anderen Buschmännern zeigte MD8 eine Bantu-Y-Chromosom-Linie, die mit ABT übereinstimmt. Die Analyse der Y-Marker der Klade A (ergänzende Tabelle 10), B (ergänzende Tabelle 11) und E (ergänzende Tabelle 12) ermöglichte die Validierung der Haplogruppe und die Klassifizierung von ABT als E1b1a8a (http://ycc.biosci.arizona.edu/)22.

Wir führten eine Hauptkomponentenanalyse (PCA) mit der Software EIGENSTRAT23 für 174.272 autosomweite SNPs durch, die in allen Datensätzen vorkommen (generiert mit 1M oder 610K Illumina oder Affymetrix SNP6.0 Arrays). Die Daten von 10 Buschmännern und 20 Xhosa24 wurden mit 20 Yoruba und 20 Europäern aus verfügbaren Daten (HapMap und Coriell) und 5 Buschmännern (SAN) aus Daten des Human Genome Diversity Panel (HGDP) projiziert. Die bevölkerungsweite PCA definiert die Buschmänner ebenso deutlich von den Niger-Kongo-Populationen wie von den Europäern (Abb. 4a). Eine innerafrikanische Analyse trennt die Buschmänner von den divergierenden west- und südafrikanischen Populationen (Abb. 4b), während ABT eindeutig in den südlichen Bantu-Cluster fällt. Die variable Verwandtschaft der Xhosa mit den Yoruba könnte auf eine frühere Vermischung und/oder historische Vielfalt innerhalb dieser weit gefassten Population hindeuten24. Innerhalb der Gruppe der Buschmänner gehen wir davon aus, dass die Ju/’hoansi und die HGDP San im Wesentlichen die gleiche Population sind. Die Divergenz von KB1 und MD8 kann durch rezente Bantu-Beimischung (für MD8 angenommen) oder durch einzigartige Teilpopulationen mit einem geringen Anteil an alter Bantu-Beimischung erklärt werden. Obwohl durch die Stichprobengröße begrenzt, deutet ein Test mit vier Populationen17 auf eine schwache und/oder nicht schlüssige Vermischung bei KB1 und unseren Ju/’hoansi-Teilnehmern hin. Ein anderer Test (siehe ergänzende Tabelle 14) zeigt einen Genfluss zwischen den Vorfahren von KB1 und ABT, der die mitochondrialen Ergebnisse bestätigt, ohne jedoch die Richtung des Flusses zu bestimmen. Im Gegensatz zu KB1, NB1 und TK1 konnte der Genfluss zwischen Buschmännern und südafrikanischen Bantu durch die L0-Typ Mitochondrien von ABT und die Bantu-spezifischen Y-chromosomalen Marker in MD8 bestätigt werden. Ob die diesen Fällen zugrundeliegenden Migrationen einem allgemeinen Muster von Patri- oder Matrilokalität25 folgten, muss eine detaillierte Populationsstrukturanalyse auf der Grundlage von Arrays mit neuem Inhalt abwarten, die die 1,3 Millionen neuen genetischen Marker aus dieser Studie enthalten.

Abbildung 4: Dreifache Populationsstruktur auf der Grundlage von 174.272 autosomalen SNPs unter Verwendung von PCA.
Figure4

a, b, Die PCA von Europäern, Afrikanern (Niger-Kongo) und Buschleuten (a) und nur afrikanischen Populationen (b) unterscheidet die Buschleute von Yorubanern und Bantus. Der Anteil der erklärten Varianz in a beträgt 0,09 für Eigenvektor 1 und 0,04 für Eigenvektor 2, während er in PCA b 0,06 bzw. 0,02 beträgt, mit einem Tracy-Widom-P-Wert <10-12. ABT, sequenziertes Bantu; CEU, europäische HapMap; JHO, Juu-Sprecher (einschließlich NB1 und TK1); MD8, sequenziertes !Kung; NOH, Tuu-Sprecher (einschließlich KB1); SAE, südafrikanischer Europäer; SAN, HGDP San; XHO, südafrikanischer Xhosa; YRI, Yoruba HapMap.

PowerPoint-Folie

Da die Jäger und Sammler der Buschmänner im Laufe ihrer Kulturgeschichte26 nie landwirtschaftliche Praktiken übernommen haben, könnten die in ihren Genomen gefundenen Sequenzvarianten eine uralte Anpassung an eine auf Nahrungssuche ausgerichtete Lebensweise widerspiegeln. Bei den Kalahari-Buschmännern muss auch eine Anpassung an das Leben in trockenem Klima stattgefunden haben, denn es wurden mehrere phänotypische Merkmale festgestellt, die bei anderen Menschengruppen fehlen, z. B. die Fähigkeit, Wasser und Lipidmetaboliten in Körpergeweben zu speichern26. Diese physiologischen und genetischen Unterschiede könnten künftige Studien zu der viel diskutierten Frage leiten, ob die Ausbreitung der Landwirtschaft in den südlichen Regionen Afrikas durch Bevölkerungsaustausch und nicht durch kulturellen Austausch vorangetrieben wurde27, wie dies bei spätsteinzeitlichen Populationen in Europa beobachtet wurde28,29.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.