●英文題目:《Ancient Hybridization with an Unknown Population Facilitated High-Altitude Adaptation of Canids》
●期刊:MOL BIOL EVOL
●影響因子:2022_IF=8.8鲫忍;中科大類: 生物學(xué)1區(qū); 中科小類: 生化與分子生物學(xué)倚舀,進(jìn)化生物學(xué)砸民,遺傳學(xué)1區(qū); JCR分區(qū): Q1
●發(fā)文單位:中國科學(xué)院昆明動物所、加利福尼亞大學(xué)圣戈魯茲分星妈荆霍華德●休斯醫(yī)學(xué)研究所志电,云南大學(xué)彻消、中國農(nóng)業(yè)大學(xué)等等多個機(jī)構(gòu)
●文章作者:中國科學(xué)院昆明動物所、加利福尼亞大學(xué)圣戈魯茲分邢福霍華德●休斯醫(yī)學(xué)研究所王明山笨触、中國科學(xué)院昆明動物所王勝、云南大學(xué)李巖雹舀、等為共同第一作者芦劣;中國科學(xué)院昆明動物所張亞平院士、吳冬冬研究員等说榆,為文章共同通訊作者
●摘要:遺傳漸滲不僅為適應(yīng)性進(jìn)化提供了物質(zhì)基礎(chǔ)虚吟,也給我們對進(jìn)化史的理解帶來了困惑。 犬科動物尤其如此签财,它是一個復(fù)雜的物種稍味,基因組測序和分析揭示了其混合和漸滲的復(fù)雜歷史。 在這里荠卷,我們對來自高海拔地區(qū)的西藏和喜馬拉雅狼和狗的19個新的全基因組進(jìn)行了測序模庐,并將它們組合成一個由166個全犬基因組組成的更大的數(shù)據(jù)集。 利用這些數(shù)據(jù)油宜,我們探索了這些和其他犬科動物的進(jìn)化史和適應(yīng)性掂碱。 我們發(fā)現(xiàn),西藏狼和喜馬拉雅狼的親緣關(guān)系密切慎冤,它們~39%的核基因組來自一個尚未被識別的類狼血統(tǒng)疼燥,與現(xiàn)存的泛北極區(qū)狼和狗有著很大的分歧。 EPAS1 單倍型在西藏犬種和狼中的頻率很高蚁堤,對生活在高海拔地區(qū)的動物具有適應(yīng)性優(yōu)勢醉者,可能來自這一古老的譜系。 我們的研究強(qiáng)調(diào)了犬科動物進(jìn)化的復(fù)雜性,并展示了混合和漸滲如何塑造物種的進(jìn)化軌跡撬即。
●前言:隨著高通量測序的發(fā)展和比較群體基因組學(xué)的進(jìn)步立磁,不同譜系之間的基因流在物種進(jìn)化中扮演著越來越重要的角色。 在一些情況下剥槐,在過去混合后的基因流動事件允許已經(jīng)滅絕的譜系的遺傳片段持續(xù)存在唱歧。 例如,在解剖學(xué)上的現(xiàn)代人離開非洲后粒竖,與古人類混合導(dǎo)致了來自古人類譜系的等位基因的滲入颅崩,今天在一些人類群體中觀察到這種滲入頻率很高,這表明這些等位基因提供了適應(yīng)性優(yōu)勢蕊苗。 這方面的一個典型例子是丹尼索瓦人衍生的 EPAS1 等位基因在當(dāng)代西藏人中的高頻率沿后,這導(dǎo)致西藏人的低氧反應(yīng)減弱,并允許適應(yīng)青藏高原低氧環(huán)境的生活朽砰。
混合和基因組漸滲在犬科中尤其普遍得运,包括狗、狼锅移、郊狼熔掺、豺狼、野狗和許多其他現(xiàn)存以及滅絕的犬科類動物非剃。 由此產(chǎn)生的犬類的網(wǎng)狀進(jìn)化史使解開它們的進(jìn)化關(guān)系和確定狗馴化的時間和地點(diǎn)變得復(fù)雜置逻。 青藏高原(QTP)的高海拔狼(HAWs)是最神秘的犬科動物譜系之一,其起源和進(jìn)化關(guān)系仍懸而未決备绽。 這些HAWs通常分為兩組券坞,西藏灰狼(TW)和喜馬拉雅狼(HW)。 HWs分布在尼泊爾的Transhimalayan地區(qū)肺素、印度北部克什米爾東部拉達(dá)克地區(qū)恨锚、喜馬偕爾邦和鄰近地區(qū),而TWs分布在甘肅倍靡、青海和西藏等省猴伶。 這兩只狼的數(shù)量都非常少,非常脆弱塌西,目前在印度和尼泊爾他挎,狼受到野生動物立法的保護(hù)。
盡管通過形態(tài)學(xué)和遺傳學(xué)研究可以更好地理解它們的進(jìn)化史捡需,但HAWs的起源以及它們與其他灰狼的關(guān)系仍然不清楚办桨。 早期的形態(tài)學(xué)研究發(fā)現(xiàn)HAWs有別于歐亞狼,并認(rèn)為它們是一個獨(dú)特的亞種站辉。 線粒體DNA分析發(fā)現(xiàn)呢撞,HW與TW聚在一支簇损姜,與其他灰狼有顯著不同,并建議這些HAWs可以作為一個單獨(dú)的物種殊霞。 然而摧阅,對整個核基因組的分析發(fā)現(xiàn),TW與來自中國北方的灰狼聚集在一個與歐洲狼是姐妹的分支脓鹃。 這項研究表明TW起源于亞洲狼的一個譜系,并在大約2.5萬年前(KA)與中國北方狼分離后重新定居QTP古沥。 最近瘸右,對核基因組的另一項分析表明,TW的系統(tǒng)發(fā)育位置取決于用于估計一致系統(tǒng)發(fā)育的方法岩齿。 具體地說太颤,使用NJ法估計的一棵樹將TW作為中國北方狼的姐妹群,與之前的分析一樣盹沈,而使用最大似然估計的系統(tǒng)發(fā)育將TW作為狗和所有歐洲和亞洲狼的基礎(chǔ)龄章。 由于HW的核基因組尚未測序,基于核基因組的TW和HW之間的親緣關(guān)系尚不清楚乞封。
TW和HWS都在基因上適應(yīng)了高海拔的惡劣生活條件做裙。 一個基因,EPAS1肃晚,是一個誘導(dǎo)對缺氧的物理反應(yīng)的轉(zhuǎn)錄因子锚贱,估計是在強(qiáng)正選擇下在藏狗(TDs)和TW中進(jìn)化出來的。 已知TW和HW都攜帶一種獨(dú)特的 EPAS1 單倍型关串,這種單倍型被認(rèn)為是在正選擇下進(jìn)化而來的拧廊,但適應(yīng)性 EPAS1 等位基因的起源仍然未知。 以前的研究認(rèn)為晋修,EPAS1 是在狗被引入QTP后從TW流向TD的吧碾,可能是在舊石器時代人類在該地區(qū)定居后。 這一假設(shè)是基于TW和亞洲狼之間的姐妹關(guān)系墓卦,以及TW在引入狗之前就已經(jīng)棲息在QTP的假設(shè)倦春。 然而,這些進(jìn)化關(guān)系仍未解決落剪,替代假設(shè)也是可能的溅漾。 例如,高海拔的 EPAS1 等位基因可能在狗體內(nèi)進(jìn)化著榴,后來又流向狼體內(nèi)添履。 從狗到狼的滲入是眾所周知的; 例如脑又,Klocus(一種犬類β-防御素基因)中的一個三堿基對(BP)突變導(dǎo)致黑色毛色并賦予更高的適應(yīng)性暮胧,通過雜交從狗傳播到美國灰狼锐借。 由于QTP的兩種HAWs、其他狼和狗之間的進(jìn)化關(guān)系仍然不清楚往衷,適應(yīng)性 EPAS1 等位基因的起源也不清楚钞翔。
在這里,我們對HW席舍、TW和狗的完整核基因組進(jìn)行了測序布轿,并與已發(fā)表的中國狼、狗和其他犬科動物的基因組進(jìn)行了分析来颤。通過明確考慮HAWs和其他犬科動物的混合關(guān)系汰扭,我們發(fā)現(xiàn)TW和 HW與歐亞灰狼、家犬和一個現(xiàn)已滅絕或未知的類狼犬科動物的混合關(guān)系密切福铅。 然后我們特別探索 EPAS1 等位基因的進(jìn)化起源萝毛,我們發(fā)現(xiàn)這些生活在QTP上的譜系共享 EPAS1 等位基因,可能來自以前未描述的深度分歧的犬科譜系滑黔。
●結(jié)果:
1笆包、基因組測序和進(jìn)化關(guān)系
我們對19個狼和狗的全基因組進(jìn)行了測序,平均覆蓋度為8.5倍略荡。 這包括兩只TW庵佣,其中一只來自西藏林芝,另一只來自中國青海汛兜,一只HW來自印度長塘拉達(dá)克秧了,以及16只來自QTP的狗(>2000米)。 利用這些和以前發(fā)表的狼和狗的基因組數(shù)據(jù)序无,我們編制了一個166個完整基因組的數(shù)據(jù)集验毡,包括9個TW、1個HW帝嗡、34個TD晶通、11個低地狼(LWs;1個克羅地亞狼哟玷、1個以色列狼狮辽、3個俄羅斯狼、5個蒙古狼和1個中國狼)巢寡、109個低地狗(LDs)喉脖、1個金豺和1個Dhole。 我們將這些數(shù)據(jù)比對到狗的參考基因組(CANFAM3.1)上抑月,并鑒定了超過2640萬個SNPs树叽。接下來入挣,我們使用F4-statistics對青藏高原狼與狗之間的混合進(jìn)行了測試。 F4-以F4(outgroup硝拧,HAW径筏;LW,狗)障陶,發(fā)現(xiàn)HAW與LW的等位基因共享比與狗的多(F4<0)滋恬; 以F4(outgroup, HAW;TD和LD)的形式揭示了HAW和高原犬之間基因流動的證據(jù)(F4<0)抱究。 在F4(outgroup恢氯,狗厘擂;LW特愿,HAW)中,高原和低海拔的狗與LW比與HAW共享更多祖先(F4<0)贡耽。 如果HAW像以前報道的那樣與北亞狼聚類侄刽,并與TD有基因流動指黎,則后一發(fā)現(xiàn)是意想不到的朋凉。 這類似于丹尼索瓦人和尼安德特人基因組研究中觀察到的模式州丹,并提醒我們思考一種情況:HAW可能有混合祖先,衍生出一個更嚴(yán)重分歧的譜系杂彭。 對這一假說的進(jìn)一步支持來自對FST的估計墓毒,該估計表明HAW與狗的遺傳差異幾乎是LW的兩倍(圖2a)。 然而亲怠,這些模式也有可能是LW和狗之間反復(fù)發(fā)生基因流動的結(jié)果所计。 為了進(jìn)一步探索這一點(diǎn),我們使用qpGraph構(gòu)建混合圖团秽,并屏蔽狗和狼種群之間的差異和基因流主胧。 HAW(沒有F4異常值)可以被模擬為一個混合群體,最初是由一個分化譜系(39%)和LW(61%)之間的混合產(chǎn)生的习勤,然后這個群體(混合)后來由一個與TD(圖2B)有關(guān)的譜系產(chǎn)生了18%的祖先踪栋。 這與基于全基因組遺傳片段的三大拓?fù)浣Y(jié)構(gòu)大體一致。然而图毕,假設(shè)HAW和LW是姐妹分支并允許LW和Dog之間的基因流動的混合圖產(chǎn)生了過量的F4異常值夷都,表明擬合不良。 鑒于LDs和歐亞狼之間的差異和種群亞結(jié)構(gòu)的復(fù)雜性予颤,我們進(jìn)行了一系列額外的分析囤官,在這些分析中冬阳,我們識別了包括EUW、CHW党饮、華南犬肝陪、非洲和歐洲犬在內(nèi)的離散類群,并以多個組合對這些類群進(jìn)行了qpGraph刑顺,以檢驗這些類群內(nèi)異質(zhì)性的影響见坑。 盡管這些類群和HAW之間的基因流量略有變化,取決于LD和LW類群的組合所包含的種群捏检,但基于模型的混合圖荞驴,HAW攜帶分歧的遺傳輸入,沒有F4異常值贯城,表明相當(dāng)好的模型擬合熊楼。
上面描述的分析支持了 HAW 有一定數(shù)量的祖先來自不同的犬科動物血統(tǒng)的假設(shè)。 為了進(jìn)一步探索這一點(diǎn)能犯,我們使用隱馬爾可夫模型(HMM)方法尋找 HAW 中具有“發(fā)散”起源特征的基因組區(qū)域鲫骗。 該方法通過將給定個體的基因組序列與未混合的參考群體進(jìn)行比較,來尋找包含出人意料的高密度特異突變的基因組短區(qū)域踩晶。 我們選擇 LD 和 LW 作為假定的未混合參考群體执泰,并衡量沿著每條染色體在1-kb窗口內(nèi)的突變密度。 由于犬和狼種群之間的差異渡蜻、亞結(jié)構(gòu)和混合性术吝,LD和LW可能不是完美的非混合種群。 然而茸苇,以前對LD和LW 與 HAW 混合研究會導(dǎo)致對HAW發(fā)散量的低估排苍。 假設(shè)作者(Skov et al.2018)建議的后驗概率為0.8,我們在 HAW 基因組中發(fā)現(xiàn)了幾個推定高度分歧的區(qū)域学密。 這些結(jié)果表明 HAW 含有狼血統(tǒng)的混合血統(tǒng)淘衙,比LD和LW分化更加深刻。為了進(jìn)一步探索這些高度分歧的基因組區(qū)域的進(jìn)化史腻暮,我們創(chuàng)建了一個僅限于這些基因組區(qū)域的比對彤守,包括北美狼、郊狼哭靖、dhole 和非洲野狗具垫,并構(gòu)建了一個NJ樹。 由此產(chǎn)生的系統(tǒng)發(fā)育關(guān)系表明款青,兩只北美狼是狗和歐亞狼是基礎(chǔ)譜系做修,HAW 是所有極地狼和狗是基礎(chǔ)譜系(圖2c),類似于線粒體系統(tǒng)發(fā)育(圖1C)。 同樣的結(jié)果得到了使用更嚴(yán)格的0.9后驗概率截斷恢復(fù)的發(fā)散片段中推斷出來的NJ樹的支持饰及,(圖S9b)蔗坯。 總的來說,這些分析表明燎含,在QTP上的現(xiàn)代狼的基因組包含一部分與LW共有的祖先宾濒,一部分與家犬共有的祖先,以及至少與另一個尚未描述的擁有更深的分化的血統(tǒng)共有的祖先屏箍。
2绘梦、群體演化歷史
為了進(jìn)一步探索高原狼和 LWs 之間的差異,我們接下來使用兩兩順馬爾可夫聚類(PSMC)和多重順馬爾可夫聚類(MSMC)估計了這些譜系成員的進(jìn)化軌跡赴魁。 以前的一項核基因組分析報告稱卸奉,TW 和 North Chinese wolves 在狗的多樣性之外形成了一個單系分支。 如果這種關(guān)系是正確的颖御,我們會期望 TW 與這些 LW 有一個類似的進(jìn)化軌跡榄棵。 然而,我們發(fā)現(xiàn) TW 和 LW 的進(jìn)化軌跡在100 ka左右發(fā)生了分歧潘拱,此時TW種群規(guī)模開始下降疹鳄,而LW直到后來才下降(圖3a)。
為了估計狗和狼之間的分歧時間芦岂,我們利用 MSMC 對相對交叉融合率(CCR)的估計瘪弓,并使用50%的CCR作為分歧時間的經(jīng)驗法則。 我們發(fā)現(xiàn)狗譜系與 LW 譜系分歧發(fā)生在52.5ka(圖3b)禽最。 如果 TW 和 LW 是沒有差異滲入或混合的單系分支腺怯,我們期望TW和狗的分歧與LW和狗相似。 然而弛随,我們發(fā)現(xiàn)TW與LW和狗的分化分別發(fā)生在 68和81 ka(圖3b)瓢喉。
3宁赤、模擬分析
以前舀透,PSMC 觀察到的 TW 和歐亞狼之間的分化模式被認(rèn)為是由于在最近 TW 種群規(guī)模發(fā)生下降。 為了測試我們的結(jié)果是否是TW最近種群數(shù)量下降的結(jié)果决左,我們接下來進(jìn)行了一系列模擬愕够,假設(shè)兩個不同規(guī)模的種群分開在30 ka左右(以反映狗和狼之間通常假設(shè)的分歧時間),在此之后佛猛,群體會經(jīng)歷不同嚴(yán)重程度的瓶頸(圖S12)惑芭。 然后,我們用 PSMC 和 MSMC 估計了這些模擬種群的進(jìn)化軌跡和發(fā)散時間继找,并將結(jié)果與真實數(shù)據(jù)(圖S13)進(jìn)行了比較遂跟。 這些情況都沒有產(chǎn)生真實數(shù)據(jù)中描述的較早的分歧時間(圖3),這表明 TW 種群的下降并不能解釋其分歧的進(jìn)化軌跡。對于 TW 和狗之間的分歧時間比 LW 和狗之間的分歧時間更早的估計幻锁,另一個潛在的解釋是 TW 基因組包含一些來自更古老譜系的祖先成分凯亮。 為了驗證這一假設(shè),我們進(jìn)行了額外的模擬哄尔,兩個群體的分化為30 ka左右假消,其中一個群體接受了來自更深分化群體的不同水平的基因流(我們假設(shè)他們的差異為90 ka;圖S12)岭接。 我們發(fā)現(xiàn)富拗,來自分化群體的基因流影響了 PSMC 和 MSMC 的估計進(jìn)化軌跡的符合數(shù)量(圖S13),反映了在TW(圖 3)觀察到的模式鸣戴。 這一分析支持了這樣一個假設(shè)啃沪,即 HAW 基因組有一定比例的祖先來自分歧更深的狼譜系。
4窄锅、HAW和狗群體的混合
接下來谅阿,我們使用相對同系(rIBD)和基因座特異性分支長度(LSBL)統(tǒng)計量尋找適應(yīng)性漸滲的證據(jù)。我們鑒定出了在TD和HAW之間表現(xiàn)出最強(qiáng)適應(yīng)性漸滲信號的三個基因:EPAS1酬滤、PRKCE和TMEM 247签餐。這三種基因都出現(xiàn)在10號染色體的同一個區(qū)域。特別是盯串,與鄰近區(qū)域相比氯檐,含有 EPAS1 的區(qū)域顯示出最顯著的漸滲特征(由“ABBA/BABA”、fd統(tǒng)計和RFMix支持)以及TD/HAW和LD/LW之間最顯著的群體分化(FST)体捏」谏悖總之,這些結(jié)果表明選擇可能發(fā)生在這個基因上几缭。
5河泳、現(xiàn)代HAW和狗中 EPAS1 基因來自一個古老的譜系
由于HAW是青藏高原特有的,先前的分析表明年栓,家犬引入高原后拆挥,適應(yīng)性 EPAS1 等位基因的漸滲方向是從 HAW 到 TD。然而某抓,我們觀察到TD中適應(yīng)性等位基因的頻率更高(60/68;88.2%)高于HW和TW(75%;[2 + 13]/[2 + 18])(圖4A)纸兔。
我們接下來通過將跨越 EPAS1 和跨越染色體10的相鄰區(qū)域的序列劃分為100、250否副、500和1汉矿,000 kb的長度來構(gòu)建樹。我們發(fā)現(xiàn)备禀,包括 EPAS1 在內(nèi)的整個區(qū)域的系統(tǒng)發(fā)育具有一種拓?fù)浣Y(jié)構(gòu)洲拇,其中TD和HAW是 LW 和其他犬的基礎(chǔ)譜系(圖S18)奈揍。這與 EPAS1 區(qū)域周圍區(qū)域的拓?fù)浣Y(jié)構(gòu)相反,其中HAW是所有狗和LW的基礎(chǔ)譜系赋续。此外打月,我們通過整合來自郊狼、非洲野狗蚕捉、和北美狼的基因組構(gòu)建了 EPAS1 及其側(cè)翼區(qū)域的單倍型樹奏篙。NJ樹顯示,HW迫淹、TW和TD攜帶的適應(yīng)性 EPAS1 序列聚類為不同進(jìn)化枝泛北極區(qū)LW和狗的(圖4 B)秘通。我們注意到,HAW的 EPAS1 被分配到TD的多樣性范圍內(nèi)敛熬,這可能是由于本研究中HAW的取樣有限或HAW最近的種群下降導(dǎo)致該地區(qū)多樣性大幅下降肺稀。
如圖4b所示,HAW + TD分支的位置隨 EPAS1 鄰近區(qū)域的長度而變化应民。 利用 EPAS1 基因和兩側(cè)50kb區(qū)域產(chǎn)生的數(shù)據(jù)表明HAW和TD攜帶的獨(dú)特適應(yīng)性序列是金豺的基礎(chǔ)譜系话原。 然而,當(dāng)側(cè)翼區(qū)域從兩側(cè)的50 kb增加到100和300 kb時诲锹,這個分支進(jìn)入了金豺狼譜系繁仁。 最后,當(dāng)側(cè)翼區(qū)域增加到400 kb時归园,HAW + TD分支成為狼和狗分支的姐妹支黄虱,類似于使用“發(fā)散”序列(圖2C)構(gòu)建的樹。 這是不足為奇的庸诱,這些拓?fù)浣Y(jié)構(gòu)的差異可能歸因于HAW和狗對 EPAS1 的強(qiáng)烈選擇和通過重組而分解跨越 EPAS1 的片段的綜合效應(yīng)捻浦。 根據(jù)這些數(shù)據(jù),我們假設(shè)高原犬中存在的適應(yīng)性 EPAS1 等位基因既不是從LWs也不是從LDs傳入的桥爽,而是從兩者的祖先血統(tǒng)傳入的朱灿。
由于EPAS1 在很強(qiáng)的正選擇下進(jìn)化,適應(yīng)性突變的出現(xiàn)和蔓延可能會混淆系統(tǒng)發(fā)生推斷钠四。我們在10號染色體含有EPAS1 的區(qū)域(Chr10:48,551,410-48,694,966盗扒;143.5kb)共鑒定了1,242個變異體,其中500個在TD中的頻率>88.2%,在LD中<10%(圖4A)形导。 我們在基因組上沒有發(fā)現(xiàn)其他區(qū)域有如此多的連鎖變異在兩個群體之間的頻率上達(dá)到了類似的極端差異环疼。 為了測試選擇作用于從頭突變(SDN)或常設(shè)變異(SSV)是否會導(dǎo)致這種模式(許多高度分化的位點(diǎn)),我們假設(shè)在不同選擇強(qiáng)度和重組率下的兩種可能情況朵耕,模擬了143.5kb的區(qū)域。 我們發(fā)現(xiàn)EPAS1 區(qū)高度分歧位點(diǎn)的數(shù)量明顯大于模擬數(shù)據(jù)(圖4c)淋叶,表明SDN模型和SSV模型都不能解釋EPAS1 中觀察到的模式阎曹。由于包括EPAS1 在內(nèi)的系統(tǒng)發(fā)育包括青藏高原的狼和狗都是狗和所有其他灰狼基礎(chǔ)譜系(圖4B和圖S18),我們假設(shè)該等位基因產(chǎn)生于一種古老的狼樣犬科動物,它很可能棲息在QTP的高海拔地區(qū)处嫌。