●英文題目:《Pervasive introgression facilitated domestication and adaptation in the Bos species complex》
●期刊:Nature Ecology & Evolution
●影響因子:2022_IF=19.100终息;中科大類: 生物學1區(qū); 中科小類: 生態(tài)學1區(qū)夺巩,進化生物學1區(qū); JCR分區(qū): Q1
●發(fā)文單位:中科院昆動所、中國科學院大學柳譬、中國農(nóng)業(yè)大學美澳、波蘭科學院等多個機構
●文章作者:中科院昆動所吳冬冬制跟、丁向東,中國農(nóng)業(yè)大學王勝等為共同第一作者聊记;中科院昆動所研究員吳冬冬排监,張亞平院士舆床,中國農(nóng)業(yè)大學教授張琴峭弟,為文章共同通訊作者
●摘要: Bos 屬的物種瞒瘸,包括 taurine(普通牛), zebu(瘤牛), gayal(大額牛), gaur(印度野牛), banteng(班騰牛情臭,爪洼野牛), yak(牦牛), wisent (歐洲野牛)和 bison(美洲野牛),已經(jīng)被馴化至少四次竟秫,并且已經(jīng)成為許多人類文化的肉肥败、奶和勞動力的重要來源馒稍。我們對大額牛、印度野牛鼓黔、班騰牛澳化、歐洲野牛和美洲野牛的基因組進行測序,并提供另外98個個體的群體基因組測序數(shù)據(jù)慎陵。我們利用這些數(shù)據(jù)來確定這些物種的系統(tǒng)發(fā)育和進化歷史席纽,并表明瀕危的大額牛是一個獨立的物種或亞種撞蚕。我們的結果表明润梯,這個屬的不同成員之間有明顯的滲入,并且在許多情況下涉及到具有相當大的適應性重要性的基因寇钉。例如,牛的馴化選擇基因(例如 MITF)就是從家牛滲入牦牛的舶赔。此外,缺氧反應通路中的基因(例如 EGLN1竟纳、 EGLN2和 HIF3a)已經(jīng)從牦牛滲入到藏牛撵溃,可能促進了它們對高海拔的適應。我們還驗證了滲入的 EGLN1等位基因與血紅蛋白和紅細胞濃度之間存在相關性缘挑。我們的研究結果說明了滲入作為適應性變異和馴化過程中的重要性桶略,并表明 Bos 屬進化為具有共同進化軌跡的遺傳相互關聯(lián)的復雜物種删性。
●前言:
普通牛 (Bos taurus taurus,以下縮寫為“taurine”) 和瘤牛 (Bos taurus indicus) 是最常見的大型已馴化的有蹄類動物它掂,并且都被視為同一物種 (Bos taurus) 的成員榕茧。 Bos 屬的另外三個物種 gayal (Bos frontalis)、banteng (Bos javanicus) 和 yak (Bos grunniens) 也已被人類獨立馴化客给。印度野牛 (Bos gaurus)用押、美洲野牛 (Bison bison) 和歐洲野牛 (Bison bonasus) 是僅有的三種未被馴化的現(xiàn)存野牛物種。taurine靶剑、zebu蜻拨、gayal、wisen 和 yak 的最新基因組測序數(shù)據(jù)極大地提高了我們對這些大型有蹄類動物進化的理解桩引,并幫助闡明了這些物種馴化和適應的復雜過程缎讼。
然而,這個復雜屬的許多方面仍然是大量猜測的主題坑匠。例如血崭,Bos 屬內(nèi)物種之間的系統(tǒng)發(fā)育關系是有爭議的奠货,不同的研究報告了不同的拓撲結構罪佳。特別是,gayal 的系統(tǒng)發(fā)育位置仍在爭論中。據(jù)稱 gayal 是野牛的獨立物種或家養(yǎng)形式超全,并且有人認為它是野生野牛和家牛雜交的雜交后代。此外娃承,通過人類介導的遷徙虚汛,taurine 和 zebu 現(xiàn)在幾乎占據(jù)了世界所有地區(qū),并且可能通過基因滲入促進了區(qū)域物種(例如跺涤,gayal匈睁、banteng 和yak)的馴化。同樣桶错,區(qū)域物種(例如gaur航唆、gayal、banteng院刁、yak糯钙、wisen 和 bison)可能對家牛和 zebu 的基因庫做出了貢獻,從而幫助它們適應當?shù)丨h(huán)境退腥∪伟叮基因滲入和混合在多大程度上成為該物種復合體馴化和形成的驅(qū)動力仍然是一個懸而未決的問題。
在這里狡刘,我們使用大規(guī)南砬保基因組來確定Bos屬內(nèi)這些物種的系統(tǒng)發(fā)育和進化史,并表明瀕危物種gayal是一個獨立的物種或亞種嗅蔬。我們的結果表明剑按,Bos屬的不同成員之間存在明顯的滲入,并且在許多情況下澜术,它涉及具有重要適應性的基因艺蝴。
●結果和討論:
1、系統(tǒng)發(fā)育分析
我們?yōu)?gayal鸟废、gaur猜敢、banteng、American bison和 wisen 生成了五個高深度(~ 20×)的全基因組盒延,并將這些數(shù)據(jù)與三個先前發(fā)表的來自taurine缩擂、zebu 和 yak 的高深度基因組相結合。首先使用高深度全基因組來估計這些物種有效種群規(guī)模的長期趨勢兰英,使用PSMC撇叁,發(fā)現(xiàn)在~ 20,000–50,000年前所有這些現(xiàn)存物種的種群規(guī)模急劇下降,那時恰逢末次冰河時期和現(xiàn)代人類在歐亞大陸和美洲的傳播畦贸。
接下來陨闹,我們使用 RAxML 程序為常染色體使用NJ和ML法推斷出串聯(lián)的基因組樹楞捂。拓撲((taurine, zebu), (((gaur,gayal), banteng), (bison, yak))),此后標記為Topology A趋厉,NJ法和ML法都得到相同拓撲(圖 1 和 圖 S2a,c)寨闹。
然而繁堡,我們也注意到基因組的許多片段支持其他可變拓撲。例如乡数,X染色體的最佳支持拓撲是 (((taurine椭蹄,zebu),(gaur净赴,gayal))绳矩,banteng),(bison玖翅,yak)) (圖S2b, c和S3b, d )記為Topology B翼馆,此后,我們還僅使用CDS序列來推斷RAxML和MP-EST的系統(tǒng)發(fā)育金度,并根據(jù)MP-EST分析的窗口大小的選擇獲得不同的拓撲 (圖S2和S11)应媚。
為了進一步研究這些模式,我們將基因組分成 100 kb 的非重疊窗口魔吐,分別為常染色體和 X 染色體產(chǎn)生 25,127 和 1,489 個窗口扎筒,并分別估計所有窗口的最大似然樹。最常見的拓撲是拓撲 A酬姆;然而,即使是這種拓撲結構也僅分別存在13.42% 和 13.97% 在常染色體和 X 染色體片段中奥溺。使用 1 Mb 非重疊滑動窗口時也發(fā)現(xiàn)了類似的結果辞色。盡管存在大量系統(tǒng)發(fā)育信號,但大多數(shù)拓撲結構如此罕見的觀察結果表明浮定,不完整的譜系分類或基因滲入正在驅(qū)動這些物種的系統(tǒng)發(fā)育模式相满。
我們發(fā)現(xiàn)Topology A的樹平均長度比Topology B長(圖 S 2e),這一觀察現(xiàn)象與Topology A反映主要的物種樹(圖 1)的假設相符桦卒,但其他拓撲立美,例如Topology B,至少部分是由于漸滲而發(fā)生的方灾。為了進一步闡明漸滲是否有助于解釋觀察到的拓撲不一致建蹄,我們進行了一系列 ABBA-BABA 測試碌更,確實發(fā)現(xiàn)了不同物種之間普遍漸滲的證據(jù)。
我們使用常染色體序列通過 CoalHMM 進一步推斷了分歧時間洞慎,并發(fā)現(xiàn) gayal 和 gaur 在 ~994,000 年前分歧(圖 S13)痛单。
2萎羔、基因滲入分析
接下來,我們從中國碳默、印度和孟加拉國的 22 只 gayal贾陷、來自印度和中國的 59 只 taurine 和 zebu、7 只從 banteng 馴化的bali嘱根、10 只 wisent 中生成了另外 98 個基因組髓废,測序平均 5×,并與之前發(fā)表的來自 6 頭yak和 33 頭歐洲和韓國的 taurine 基因組相結合该抒,以研究基因滲入的潛在模式和后果慌洪。為了估計這些物種基因滲入的歷史和模式,我們使用 TreeMix 來估計混合樹 凑保。從家牛到 bison 和 wisent 推斷出漸滲事件(圖 1 和 圖 S17 )冈爹,證實了以前的工作。此外欧引,還確定了從 zebu 到 gayal频伤,以及從 zebu 到 bali 的基因滲入。 D 統(tǒng)計分析(ABBA-BABA 測試)支持這些基因漸滲信號芝此。基于表達譜的分類還顯示了神經(jīng)系統(tǒng)和免疫系統(tǒng)中的類似富集 (圖S19和S20)攀操。基因富集分析確定了一些參與免疫和神經(jīng)系統(tǒng)的基因秸抚,盡管不同的方法確定了不同的富集類別速和。
我們檢測了每個滲入地區(qū)的gayal和bali牛之間的 FST,以評估是否有任何正向選擇的證據(jù)剥汤。我們確定了一些 FST 升高的滲入?yún)^(qū)域颠放。在顯示從 zebu 到 gayal 的滲入并且具有高水平的 FST 的十個區(qū)域中,我們注意到一個區(qū)域 (chr5: 100300001-100770001) 包含一組基因 (CLEC1A吭敢,CLEC9A碰凶,CLEC1B,CLEC2A鹿驼,KLRF2欲低,CLEC12A, CLEC12B) 編碼C型凝集素/C型凝集素樣結構域 (CTL/CTLD) 超家族的成員 (圖S21)。
含有這些基因的人類直系同源區(qū)域位于12號染色體的短臂上畜晰,包括在自然殺傷細胞砾莱、樹突狀細胞和內(nèi)皮細胞中表達的 CTL/CTLD基因,在免疫系統(tǒng)中起重要作用凄鼻。它可能暗示了疫和防御相關的適應的可能作用恤磷。
zebu 和 gayal 之間的最高滲入峰僅包含一個基因 SYN3(圖 S19a),系統(tǒng)發(fā)育分析支持 SYN3 從 zebu 到 gayal 的基因滲入(圖 S19c)野宜。基因滲入的 SYN3 顯示出高水平的 FST魔策,與 gayal 中的正向選擇信號相一致匈子。 SYN3 是突觸蛋白基因家族的成員,突觸蛋白基因家族是神經(jīng)元特異性突觸小泡相關磷蛋白家族闯袒,與突觸發(fā)生和神經(jīng)遞質(zhì)釋放的調(diào)節(jié)有關虎敦。 Syn3基因敲除小鼠在條件性恐懼中表現(xiàn)出擾亂游岳。這使它成為一個特殊的馴化相關基因,因為馴化動物表現(xiàn)出對人類的恐懼減少其徙。類似地胚迫,區(qū)域(chr17:74800001–74820001)顯示從 zebu 到 bali 的基因滲入以及在具有高水平 FST 的 bali 中的潛在正向選擇,包含 SEPT5 和 GP1BB唾那。 Sept5 基因敲除小鼠表現(xiàn)出焦慮相關行為減少访锻。先前的研究報告指出,許多與神經(jīng)系統(tǒng)有關的基因是在人工選擇下進化而來的闹获,這與家養(yǎng)動物與其野生祖先相比的行為轉變密切相關期犬。zebu 被馴化的時間比 gayal 牛和 bali 長得多,并且神經(jīng)基因從 zebu 向 gayal 牛和 bali 的滲入可能促進了后者的成功馴化避诽。支持這一點的是龟虎,最近的一項研究報告顯示,家養(yǎng)牛和 yak 之間的基因滲入顯著豐富了與大腦發(fā)育和功能有關的基因沙庐。
3鲤妥、yak和藏牛之間的基因滲入
我們接下來使用 rIBD 研究了牦牛和藏牛之間的漸滲模式。每個基因組片段的系統(tǒng)發(fā)育樹與使用 rIBD 做出的推論一致拱雏∶薨玻總共約 30.7 Mb,包含 541 個蛋白質(zhì)編碼基因古涧,表現(xiàn)出藏牛和牦牛之間的基因滲入信號垂券。值得注意的是,18 號和 28 號染色體上有幾個大區(qū)域具有較大的 rIBD 值羡滑,顯示出牦牛和藏牛之間非常強烈的基因滲入信號菇爪。 ABBA-BABA 測試進一步支持了這些區(qū)域中的混合信號。我們還使用了第三種方法 RFMix 進行局部血統(tǒng)推斷柒昏,它為藏牛和牦牛之間的基因滲入提供了額外的支持凳宙。最后,我們使用了參考文獻中的方法以排除這些長區(qū)域(P = ~0)的不完整譜系分類的可能性职祷。這些地區(qū)顯示藏牛和zebu之間的種群分化水平較高氏涩,但牦牛和藏牛之間的種群分化水平較低,證實了從牦牛到藏牛的基因滲入有梆。
我們將 28 號染色體上的兩個區(qū)域分成不同的窗口是尖,并計算每個區(qū)域的 rIBD 峰值和 RFMix 值。系統(tǒng)發(fā)育分析強烈支持從牦牛到藏牛的漸滲方向泥耀。特別是饺汹,第二個窗口包含 EGLN1,它是缺氧誘導因子 (HIF) 通路中的一個基因痰催,也是西藏人類適應缺氧的兩個關鍵基因之一兜辞。 EGLN1 單倍型的網(wǎng)絡構建支持從牦牛到藏牛的漸滲(圖 3a)迎瞧。我們進一步檢查了 EGLN1 基因滲入的表型結果,發(fā)現(xiàn)攜帶類似牦牛的 EGLN1 單倍型的藏牛平均表現(xiàn)出比其他藏牛低得多的血紅蛋白濃度和紅細胞計數(shù)(圖 3b)逸吵。這種模式與在西藏人中觀察到的 EPAS1 模式一致凶硅,這有利于減弱對缺氧而誘導的適應不良表型變化的反應,例如血紅蛋白濃度升高(紅細胞增多癥)扫皱。
另一個強候選區(qū)域長約 10 Mb足绅,位于 18 號染色體 (46125199–56073102)。它具有顯著升高的 D 值和使用 RFMix 的基因滲入信號啸罢,并在藏牛和 zebu 之間表現(xiàn)出高水平的FST编检,但在牦牛和藏牛之間表現(xiàn)出較低水平的FST。單倍型的系統(tǒng)發(fā)育分析也強烈支持基因滲入的方向是從牦牛到藏牛(圖S 27)扰才。
我們還調(diào)查了家養(yǎng)牦牛是否在馴化過程中接受了家養(yǎng)牛的等位基因。我們確定了 5.54 Mb蜒程,其中包含 89 個從家牛滲入到牦牛的蛋白質(zhì)編碼基因绅你,其中包括以前報道的兩個區(qū)域。在牦牛參考基因組中以純合狀態(tài)滲入昭躺。有趣的是忌锯,我們還發(fā)現(xiàn)了MITF中等位基因的基因滲入。 MITF 是黑素細胞的主要調(diào)節(jié)因子领炫,在它們的發(fā)育汉规、分化、功能和存活以及色素合成中發(fā)揮關鍵作用。 MITF 靶向許多色素基因针史,例如酪氨酸酶 (TYR)、多巴色素互變異構酶(DCT碟狞,也稱為酪氨酸酶相關蛋白 2 或 TYRP2)和酪氨酸酶相關蛋白 1 (TYRP1)啄枕。先前的研究表明,牛在馴化過程中受到最強選擇的基因是與毛色相關的基因族沃,而馴化選擇最強烈靶向的基因之一是 MITF频祝。據(jù)推測,牦牛與涉及毛色的牛進行了類似的馴化選擇脆淹,促進了 MITF 等位基因的適應性基因滲入常空。