Menu Zamknij

Kompletne genomy Khoisan i Bantu z południowej Afryki

Czterech rdzennych namibijskich łowców-zbieraczy !Gubi, G/aq’o, D#kgao i !Aî (zwani tu odpowiednio KB1, NB1, TK1 i MD8), z których każdy był najstarszym członkiem swojej społeczności, zostali wybrani do sekwencjonowania genomu na podstawie ich grupy językowej, położenia geograficznego i reprezentacji haplogrupy chromosomu Y (ryc. 1 i dodatkowa tabela 1). Osobnik Bantu to arcybiskup Desmond Tutu (ABT), który reprezentuje Sotho-Tswana i Nguni głośniki (z szerokich języków Niger-Congo), dwa największe południowoafrykańskie grupy Bantu.

Figure 1: Mapa południowej Afryki.
figure1

Na rysunku przedstawiono ugrupowanie etniczne i miejscowości uczestników badania, KB1, NB1, TK1, MD8 i ABT (odpowiednio a-e), obszary o klimacie jałowym i pustynnym oraz rozmieszczenie geograficzne języków Khoisan i Niger-Congo30. Charakterystyczne dla języków Khoisan są kliknięcia, oznaczające dodatkowe spółgłoski. ! jest kliknięciem podniebiennym; / jest kliknięciem zębowym; a # jest kliknięciem zębodołowym26. Należy zauważyć, że haplogrupa ABT chromosomu Y została określona przy użyciu zarówno genotypowania, jak i sekwencjonowania danych wygenerowanych w tym badaniu.

Slajd PowerPoint

Ponieważ spodziewano się, że genomy uczestników naszego badania będą bardziej odbiegać od ludzkiego genomu referencyjnego niż publicznie dostępne genomy Jorubów, Europy i Azji4,5,6,7,8, dążyliśmy do wygenerowania sekwencji genomu, która zapewniłaby wystarczającą jakość zarówno do mapowania w stosunku do ludzkiego genomu referencyjnego, jak i do montażu de novo. Dlatego genom KB1 został zsekwencjonowany z 10,2-krotnym pokryciem przy użyciu platformy Roche/454 GS FLX z chemią Titanium, co dało średnią długość odczytu 350 par zasad (bp). W celu zbadania aspektów struktury genomu, dodatkowe biblioteki z długimi insertami dla KB1 sekwencjonowano przy użyciu technologii sparowanych końców Roche/454 Titanium, uzyskując inserty o wielkości do 17 kilobaz (kb) i 12,3-krotne pokrycie nieredundantnych klonów. Genom NB1 sekwencjonowano przy użyciu tej samej platformy, uzyskując dwukrotne pokrycie. Genom ABT został zsekwencjonowany z ponad 30-krotnym pokryciem przy użyciu technologii krótkich odczytów SOLiD 3.0 firmy Applied Biosystems. Ponadto wszystkie pięć genomów uczestników badania zostało zsekwencjonowanych z co najmniej 16-krotnym pokryciem w regionach kodujących białka (egzomy), które zostały wzbogacone przez sekwencjonowanie Nimblegen (2,1 M array), a następnie sekwencjonowane na platformie Roche/454 Titanium (1,5-1,9 gigabajtów (Gb) sekwencji na osobę). Tabela uzupełniająca 2 przedstawia objętość uzyskanych danych, podczas gdy tabela uzupełniająca 3 zawiera statystyki egzomów.

Dane sekwencyjne zostały zweryfikowane za pomocą różnych technik, w tym porównania sekwencji całego genomu i egzomu, sekwencjonowania całego genomu za pomocą innej platformy (Illumina, 23.2-krotnie dla KB1 i 7,2-krotnie dla ABT), genotypowanie o wysokiej gęstości (Illumina 1 Million SNPs), porównanie informacji o głębokości odczytu z danymi porównawczej hybrydyzacji genomowej, a także walidacja wybranych wariantów za pomocą dyskryminacji allelicznej TaqMan i / lub sekwencjonowania Sangera. Szacujemy, że współczynnik fałszywie pozytywnych wywołań polimorfizmu pojedynczego nukleotydu (SNP) dla KB1 wynosi 0,0009, a współczynnik fałszywie negatywnych 0,09 (szczegóły w Informacji Dodatkowej).

Stworzyliśmy asemblację de novo genomu KB1, używając asemblera Phusion9. Całkowita wielkość kontigów wynosi 2,79 Gb, z rozmiarem N50 kontigów 5,5 kb. Całkowity rozmiar rusztowania, włączając w to szacowane luki, wynosi 3,09 Gb, przy rozmiarze N50 rusztowania 156 kb. Największe zmontowane rusztowanie ma rozmiar 3,2 Mb. Często dane sekwencji Roche GS FLX prowadziły do powstania kontigów i rusztowań, które nie są mapowane względem ludzkiego genomu referencyjnego. Wiele z tych rusztowań odpowiadało lukom w aktualnym ludzkim genomie referencyjnym, w tym lukom o długości ponad 200 000 bp (patrz Informacja Dodatkowa).

Różnice pojedynczych nukleotydów z ludzkiego genomu referencyjnego (NCBI Build 36, znany również jako hg18) zostały zidentyfikowane dla pięciu południowoafrykańskich genomów i porównane z tymi z ośmiu dostępnych genomów osobistych4,5,6,7,8. W dalszej części termin „SNP” oznacza różnicę pojedynczego nukleotydu w stosunku do ludzkiego zespołu referencyjnego, bez uwzględnienia insercji/delecji zasady i bez ograniczeń dotyczących częstotliwości alleli w populacji. SNP zostały wywołane przy użyciu oprogramowania Newbler (dla Roche/454), Corona Lite (dla SOLiD) i MAQ10 (dla Illumina).

Zgodnie z poglądem, że południowi Afrykanie należą do najbardziej zróżnicowanych populacji ludzkich, zidentyfikowaliśmy więcej SNP w KB1, a w mniejszym stopniu w ABT, niż zgłoszono w innych indywidualnych genomach ludzkich (ryc. 2 i tabela 1), chociaż część różnic w liczbie SNP może wynikać z różnic w technologii i poziomach pokrycia. Liczba SNP, które są nowe (to znaczy, nie widziane wcześniej u innych osób) jest znacznie wyższa dla KB1 i ABT niż dla innych indywidualnych całych genomów (Tabela 1). KB1 i ABT mają po około 1 milion SNP, które nie są wspólne ze sobą lub z opublikowanymi kompletnymi genomami Jorubów, Azji lub Europy4,5,6,7,8 (Ryc. 2). W 117 megabazach (Mb) sekwencjonowanych interwałów zawierających egzom, średni wskaźnik różnic nukleotydów między parą Buszmenów wynosił 1,2 na kilobazę, w porównaniu ze średnią 1,0 na kilobazę różniącą się między osobnikiem europejskim i azjatyckim. Wyższy wskaźnik SNP u Buszmenów jest odzwierciedlony przez przesunięcie czerwonej i czarnej linii na Rys. 3b. Różnorodność autosomalna uczestników badania jest odzwierciedlona przez różnorodność genomów mitochondrialnych. Podczas gdy Europejczycy wykazują średnio około 20 różnic w stosunku do sekwencji referencyjnej Cambridge (CRS)11, nasi uczestnicy z Afryki Południowej wykazują do 100 mitochondrialnych SNP w stosunku do CRS (tabele uzupełniające 4 i 5 oraz rysunki uzupełniające 1 i 2). Co ważniejsze, mimo że wszystkie sekwencje mitochondrialne należą do tej samej haplogrupy L0, obserwuje się do 84 różnic między parami genomów mitochondrialnych uczestników (Tabela uzupełniająca 4).

Figura 2: Trójstronne zależności między SNPs.
figure2

SNPs z KB1 są porównywane z tymi z Yoruban NA19240 i ABT (lewy panel), oraz z Amerykaninem pochodzenia europejskiego (J. C. Venter) i osobnikiem chińskim (YH) (prawy panel). Liczby podane są w tysiącach. Pozycje wariantów, które pojawiają się we wszystkich ośmiu poprzednich genomach, zostały zignorowane, co doprowadziło do nieco mniejszej liczby całkowitych SNP (na przykład 3 761 019 różnic w stosunku do złożenia referencyjnego dla KB1, w porównaniu do 4 053 781, jeśli są one uwzględnione) i mniejszej liczby SNP w każdym trójstronnym przecięciu. Podobne zależności występują, gdy badane są inne osobniki z grup geograficznych.

Slajd PowerPoint

Tabela 1 Liczba SNP w genomie i zsekwencjonowanych regionach egzomowych.zawierających regiony
Rycina 3: Zróżnicowanie gęstości SNP.
figure3

a, SNP hotspot dla KB1 i J. Watsona na chromosomie 17; obie osoby są heterozygotyczne dla haplotypu 17q21.3 H2. Po obu stronach znajdują się powtarzające się regiony, w których nie można wywołać SNP (kolor szary). Lokalne współczynniki SNP są dzielone przez współczynnik autosomalny danego osobnika, więc oczekiwane współczynniki wynoszą 1,0 (pozioma linia przerywana). KB1 ma prawie 2,5-krotne wzbogacenie SNP na 650 000 zasad. b, Dystrybucja SNP z genomów Buszmenów (czerwona linia) i nie-Buszmenów (czarna linia), porównana z pozycjami nukleosomów (wypełniony szary wykres), wskazując region wolny od nukleosomów (NFR) oraz nukleosomy -1 i +1. TSS, miejsce rozpoczęcia transkrypcji.

Slajd PowerPoint

Aby ustalić, czy nowe SNPs reprezentują allele przodków lub powstały od czasu, gdy Buszmeni oddzielili się od innych populacji, zbadaliśmy homologiczne nukleotydy w genomie szympansa. SNPs, które pasują do genomu szympansa wskazują, że różnica jest przodkiem, podczas gdy różnice od szympansa wskazują na allel pochodny. Spośród 743 714 nowych SNP w KB1, ludzki genom referencyjny pasuje do genomu szympansa dla 87% z nich, podczas gdy genom KB1 pasuje do szympansa tylko dla 6%. Dla pozostałych 7% nie można było określić nukleotydu szympansa (6%) lub różnił się on zarówno od Buszmena, jak i odniesienia (1%). Te frakcje są zasadniczo niezmienione, jeśli uwzględnimy szacowane 3 600 fałszywie pozytywnych wywołań SNP (czyli 0,0009 z 4 milionów), które można założyć, że pojawiają się jako nowe warianty. Tak więc, bardzo niewiele z nowych różnic w genomie KB1 są nukleotydy przodków zachowane w Buszmenów; zamiast tego, zdecydowana większość to zmiany, które nagromadziły się od linii Buszmenów różniących się od innych populacji ludzkich.

Duża liczba nowych SNP budzi obawy co do zdolności obecnych tablic genotypowych do efektywnego uchwycenia prawdziwego zakresu różnorodności genetycznej i struktury haplotypów reprezentowanych w południowej Afryce. Oceniając procent heterozygotyczności dla 1,105,569 autosomalnych SNPs przy użyciu bieżących tablic Illumina, byliśmy zaskoczeni znalezieniem niższej heterozygotyczności w KB1 w porównaniu z dopasowaną do regionu kontrolą europejską (Dane uzupełniające i Dodatkowe ryc. 3a, b), ponieważ dobrze wiadomo, że różnorodność genetyczna jest największa w Afryce. Jednakże, analiza danych sekwencjonowania całego genomu dla KB1 i ABT ujawniła wysoki odsetek heterozygotycznych SNP (odpowiednio 59% i 60%), zgodnie z oczekiwaniami. Ta rozbieżność podkreśla nieadekwatność obecnych tablic SNP do analizy populacji południowoafrykańskich.

Lokalna gęstość SNP zidentyfikowanych w KB1 różni się znacznie w całym genomie (Supplementary Fig. 4), a ta zmienność gęstości jest również widoczna w innych poszczególnych genomach (dane nie pokazane). Niektóre z hotspotów są wspólne dla wszystkich badanych osobników, podczas gdy inne wykazują uderzające lokalne różnice między osobnikami, takie jak statystycznie istotny (P < 10-5; patrz Informacje uzupełniające) hotspot KB1 pokazany na ryc. 3a. Region ten odpowiada inwersji 17q21.312, która zawiera kilka genów, w tym te kodujące CRHR1 (receptor hormonu uwalniającego kortykotropinę) i MAPT (białko tau związane z mikrotubulami). Analiza diagnostycznych wariantów sekwencji, jak również bezpośrednie typowanie 238-bp indelu13 (Supplementary Fig. 5) potwierdzają, że KB1 jest heterozygotą dla haplotypu 17q21.3 H2, co jest zaskakującym odkryciem, ponieważ allel H2 występuje z niską częstotliwością w populacjach pozaeuropejskich12. Głębokość odczytu i array-CGH wskazują, że allel H2 noszony przez KB1 nie zawiera duplikacji 75-kb obecnej we wszystkich analizowanych europejskich allelach H214,15,16 (Dodatkowa ryc. 6a, b). Haplotyp KB1 H2 może reprezentować ancestralną sekwencję i strukturę haplotypu H2, który był obecny w populacjach afrykańskich przed jego zwiększoną częstotliwością w populacjach europejskich i bliskowschodnich12.

Zaobserwowaliśmy również ogólnogenomowy trend dla podwyższonych poziomów SNP w regionach promotorowych (ryc. 3b). Elementy regulacyjne promotorów mają tendencję do wzbogacania się w pobliżu granic nukleosomów, czyli tam, gdzie zaobserwowaliśmy szczytowe poziomy SNP, szczególnie w złożonych genomach Buszmenów. Możliwe jest, że zwiększona częstotliwość SNP w tych regionach genomu może prowadzić do zmian fenotypowych u ludzi.

Zidentyfikowaliśmy 27 641 różnych substytucji aminokwasowych wśród naszych pięciu uczestników, w porównaniu z ludzką sekwencją referencyjną, wiele występujących u więcej niż jednego osobnika. Spośród nich 10 929 pojawia się w jednym lub więcej wcześniej zsekwencjonowanych genomów osobistych rozpatrywanych tutaj, dodatkowe 3 566 znajduje się w publicznych bazach danych (patrz Informacje uzupełniające), a pozostałe 13 146 jest nowe i rozprowadzane wśród 7 720 różnych genów. Poniższe omówienie przypuszczalnych fenotypów dla genotypów znalezionych u Buszmenów ma na celu zilustrowanie, w jaki sposób obecność obserwowanych SNP i ich wcześniejsze skojarzenia z fenotypami mogą prowadzić do testowalnych hipotez. Są to tylko kandydaci do sugerowanych funkcji, a testy eksperymentalne muszą być przeprowadzone, aby zbadać je dalej.

Z 14,495 (to jest 10,929 + 3,566) wcześniej zidentyfikowanych aminokwasowych SNPs, 621 zostało znalezionych w bazach danych dostarczających skojarzeń chorobowych lub innych informacji fenotypowych. Niektóre z nich są łatwo związane ze stylem życia Buszmenów, jak np. brak pochodzącego z Europy allelu trwałości laktazy (funkcjonalny wariant promotora genu LCT) oraz allelu SLC24A5 związanego z jasnym kolorem skóry. W innych przypadkach zgodność z ludzką sekwencją referencyjną jest informatywna, np. brak afrykańskiego specyficznego allelu odporności na malarię Duffy null (DARC)17. Brak alleli odporności na malarię w populacjach Buszmenów może mieć znaczące konsekwencje dla już kurczącej się populacji dobrze przystosowanych zbieraczy, zmuszonych do prowadzenia rolniczego trybu życia, który niesie ze sobą zwiększone obciążenie patogenami17. Dlatego te markery genetyczne mogą pozwolić na prześledzenie tempa adaptacji człowieka w zmieniających się środowiskach18 (patrz Informacje uzupełniające).

Pomimo, że szereg SNPs zaobserwowanych u Buszmenów zostało powiązanych z fenotypami w innych grupach etnicznych w literaturze i internetowych bazach danych, należy pozostać sceptycznym co do ważności niesprawdzonych skojarzeń. W Informacjach uzupełniających ilustrujemy ten punkt wpisem dbSNP rs1051339 dla genu LIPA, który jest przypisany w jednej z publicznych baz danych jako związany z „zespołem Wolmana”, wyniszczającym niepowodzeniem w metabolizmie lipidów (Supplementary Fig. 7).

Zaobserwowaliśmy SNPs zgłoszone jako związane ze wzmocnioną fizjologią (Tabela uzupełniająca 6). KB1, MD8, TK1 i ABT są homozygotyczne dla allelu VDR związanego z wyższą gęstością mineralną kości; KB1 jest homozygotyczny dla allelu UGT1A3 związanego ze zwiększonym metabolizmem endo- i ksenobiotyków; KB1, NB1 i ABT są homozygotyczne dla allelu ACTN3 związanego ze zwiększoną wydajnością sprintu i mocy; KB1 jest heterozygotyczny dla allelu CLCNKB kodującego kanał chlorkowy, który ma większą zdolność do reabsorpcji jonów chlorkowych z kłębuszka nerkowego – właściwość, która prawdopodobnie byłaby korzystna na pustyni. Inne interesujące SNP obejmują jeden, który zachowuje funkcję genu CYP2G (Supplementary Fig. 8a, b), oraz dwa w pozycjach genu receptora smaku TAS2R38 nadającego zdolność do odczuwania smaku gorzkiego związku (fenylotiokarbamidu), co może odzwierciedlać potrzebę myśliwych-zbieraczy do unikania toksycznych roślin (szczegółowa dyskusja w Informacji Dodatkowej).

13 146 nowych aminokwasowych SNP będzie bogatym źródłem dla przyszłych prac, dostarczając wielu nowych miejsc funkcjonalnych, które nie zostały uwzględnione w badaniach asocjacyjnych całego genomu. Około 25% z tych SNP jest przewidywanych jako mające implikacje funkcjonalne przez zestaw metod obliczeniowych (patrz Informacje uzupełniające). Kategorie Gene Ontology, które są wyraźnie reprezentowane w 6,623 genach z jednym lub więcej nowych SNP Buszmenów (to znaczy, wyłączając z 7,720 genów z nowymi SNP te unikalne dla ABT) obejmują wiele funkcji, które są znane z szybkiej ewolucji u ludzi, takich jak odpowiedź immunologiczna, reprodukcja i percepcja sensoryczna (Tabela uzupełniająca 7). Zobacz Informacje uzupełniające dla szczegółowych opisów analiz obliczeniowych genów związanych z metabolizmem lipidów i percepcją sensoryczną.

Jako że wszyscy nasi uczestnicy badania są w podeszłym wieku (∼80 lat) i wydają się być w dobrym zdrowiu, nowe warianty kodujące opisane w tym badaniu mogą być skorelowane ze stanem zdrowia i fenotypami w całym okresie życia człowieka. Uczestnicy z plemienia Buszmenów osiągnęli zaawansowany wiek pomimo życia w trudnych warunkach spowodowanych okresowym głodem i nieleczonymi chorobami. Ponieważ niektóre allele kodujące Buszmenów zostały powiązane w opublikowanej literaturze z chorobami, nasze wyniki mogą pomóc w ponownej ocenie tych wcześniejszych doniesień, a także pomóc w identyfikacji potencjalnych specyficznych dla populacji niezgodności farmakogenetycznych niektórych leków, które są przepisywane na całym świecie.

Segmentalne duplikacje wykryto w 17 601 odrębnych genach autosomalnych w genomie KB1, a numery kopii oszacowano zgodnie z procedurami opisanymi wcześniej19 (Supplementary Fig. 6a, b). Liczby kopii oszacowane na podstawie głębokości odczytu są bardziej wiarygodne dla dłuższych segmentów, więc specjalnie wybraliśmy regiony większe niż 20 kb. W sumie wykryliśmy 886 interwałów (każdy >20 kb) autosomalnej duplikacji segmentalnej (93,5 Mb), co obejmuje 100 interwałów (3,9 Mb), które nie są przewidywane jako duplikowane w próbce NA18507 (próbka HapMap z Yoruba, Nigeria)19. Używając array-CGH, 58 z tych interwałów (2,6 Mb) miało zwiększoną liczbę kopii w KB1 w stosunku do NA18507, jedynego innego opublikowanego genomu afrykańskiego. Zestaw zatwierdzonych duplikacji obejmuje 140-kb interwał na chromosomie 10 obejmujący gen CYP2E1, który koduje białko cytochromu P450, które jest indukowane przez etanol i metabolizuje wiele substratów toksykologicznych20 (Supplementary Fig. 6a).

Następnie specjalnie oszacowaliśmy liczbę kopii dla wszystkich autosomalnych genów RefSeq i zaprojektowaliśmy niestandardową tablicę oligonukleotydów ukierunkowaną na geny, w których KB1 i NA18507 mają się różnić o co najmniej jedną kopię. W ten sposób potwierdzono 193 geny różniące się liczbą kopii między KB1 i NA18507 (53, gdzie NA18507 ma więcej kopii i 140, gdzie KB1 ma więcej kopii; Tabela uzupełniająca 8). W przypadku 26 z tych genów szacuje się, że KB1 ma co najmniej dwie kopie więcej niż NA18507, Han Chinese YH i pochodzący z Europy J. Watson. Ten zestaw genów obejmuje amylazę ślinową (AMY1A, szacunkowa liczba kopii KB1 = 15; może to być zgodne z trybem życia poszukiwacza21), defensyny alfa (DEFA1, szacunkowa liczba kopii KB1 = 12,5) i γ-glutamylotransferazę 1 (GGT1, szacunkowa liczba kopii KB1 = 13,2).

Sekwencjonowanie i rozległe genotypowanie ujawniło związki genetyczne wśród naszych uczestników i innych grup ludzkich. Umieszczenie kompletnych genomów mitochondrialnych (Tabela uzupełniająca 9), w tym dodatkowych samic Tuu (KB2) i Juu (NB8) na drzewie matczynym ref. 1 (Supplementary Fig. 1a-c) umieścił naszych uczestników w obrębie gałęzi podstawowej kladu L0. Zaskakująco, ABT został umieszczony w kladzie L0d, linii mitochondrialnej specyficznej dla Buszmenów. Zidentyfikowaliśmy 75 (z 1220) Buszmenów-informacyjnych SNPs na chromosomie Y (Supplementary Fig. 9). W przeciwieństwie do innych Buszmenów, MD8 wykazał linię chromosomu Y Bantu zgodną z ABT. Analiza kladu A (Tabela uzupełniająca 10), B (Tabela uzupełniająca 11) i E (Tabela uzupełniająca 12) Y-markerów pozwoliła na walidację haplogrup i klasyfikację ABT’s E1b1a8a (http://ycc.biosci.arizona.edu/)22.

Wykonaliśmy analizę głównych składowych (PCA) przy użyciu oprogramowania EIGENSTRAT23 na 174 272 autosomalnych SNP wspólnych dla zestawów danych (wygenerowanych przy użyciu 1M lub 610K Illumina, lub Affymetrix SNP6.0 arrays). Dane dotyczące 10 Buszmenów i 20 Xhosa24 zostały zestawione z 20 Yoruba i 20 Europejczykami z dostępnych danych (HapMap i Coriell) oraz 5 Buszmenami (SAN) z danych Human Genome Diversity Panel (HGDP). Populacyjna PCA definiuje Buszmenów jako odrębnych od populacji Niger-Congo i od Europejczyków (ryc. 4a). Analiza wewnątrzafrykańska oddziela Buszmenów od rozbieżnych populacji zachodniej i południowej Afryki (ryc. 4b), podczas gdy ABT wyraźnie należy do klastra południowego Bantu. Zmienne pokrewieństwo Xhosa z Yoruba może sugerować dawną domieszkę i/lub historyczne zróżnicowanie w obrębie tej szeroko rozumianej populacji24. W obrębie grupy Buszmenów przewidujemy, że Ju/’hoansi i HGDP San są zasadniczo tą samą populacją. Dywergencja KB1 i MD8 może być wyjaśniona przez niedawną domieszkę Bantu (zakładaną dla MD8) lub przez unikalne subpopulacje z niewielkim odsetkiem starożytnej domieszki Bantu. Chociaż ograniczony przez wielkość próbki, test czterech populacji17 sugeruje słabą i/lub niejednoznaczną domieszkę w KB1 i naszych uczestnikach Ju/’hoansi. Inny test (patrz Tabela Uzupełniająca 14) pokazuje przepływ genów pomiędzy przodkami KB1 i ABT, potwierdzając wyniki mitochondrialne, ale bez określenia kierunku przepływu. W przeciwieństwie do KB1, NB1 i TK1, przepływ genów pomiędzy Buszmenami i południowoafrykańskimi Bantu można potwierdzić poprzez mitochondria ABT typu L0 i specyficzne dla Bantu markery chromosomalne Y w MD8. To, czy migracje leżące u podstaw tych przypadków były zgodne z ogólnym wzorcem patriarchalności lub matrylokalności25 będzie musiało poczekać na szczegółową analizę struktury populacji opartą na tablicach o nowej zawartości, które zawierają 1,3 miliona nowych markerów genetycznych z tego badania.

Figura 4: Trójkierunkowa struktura populacji oparta na 174 272 autosomalnych SNP przy użyciu PCA.
figure4

a, b, PCA Europejczyków, Afrykanów (Niger-Congo) i Buszmenów (a) oraz tylko populacji afrykańskich (b) odróżnia Buszmenów od Jorubów i Bantusów. Ułamek wariancji wyjaśnionej w a wynosi 0,09 dla wektora własnego 1 i 0,04 dla wektora własnego 2, natomiast w PCA b wynosi odpowiednio 0,06 i 0,02, przy wartości P Tracy-Widom <10-12. ABT, sekwencjonowane Bantu; CEU, europejska HapMap; JHO, głośniki Juu (w tym NB1 i TK1); MD8, sekwencjonowane !Kung; NOH, głośniki Tuu (w tym KB1); SAE, południowoafrykańska europejska; SAN, HGDP San; XHO, południowoafrykańska Xhosa; YRI, Yoruba HapMap.

Slajd PowerPoint

Jako że łowcy-zbieracze Buszmenów nigdy nie przyjęli praktyk rolniczych w całej swojej historii kulturowej26, warianty sekwencji znalezione w ich genomach mogą odzwierciedlać starożytną adaptację do żerującego stylu życia. W przypadku Buszmenów z Kalahari musiało również dojść do adaptacji do życia w suchym klimacie, ponieważ odnotowano kilka cech fenotypowych, które są nieobecne w innych grupach ludzkich, takich jak zdolność do magazynowania wody i metabolitów lipidowych w tkankach ciała26. Te fizjologiczne i genetyczne różnice mogą kierować przyszłych badań do wielu dyskusyjnych pytanie, czy wymiana populacji, a nie wymiany kulturowej, napędzał ekspansję rolnictwa w południowych regionach Afryki27, jak zaobserwowano dla późnych populacji epoki kamienia w Europie28,29.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *