文獻(xiàn)
2023
Nature Genetics
Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet
課題背景
(1)氣候變化對(duì)全球糧食安全造成了嚴(yán)重威脅防嗡。盡管已經(jīng)培育出高產(chǎn)的主糧作物惹苗,但孤兒作物為實(shí)現(xiàn)氣候適應(yīng)型農(nóng)業(yè)和增加食品供應(yīng)提供了機(jī)會(huì)。然而,盡管在低投入條件下呈現(xiàn)出豐富的營養(yǎng)多樣性徘熔,孤兒作物僅由小農(nóng)和邊緣農(nóng)民在本地種植。因此斋竞,研究這些作物可能有助于改善主糧作物的營養(yǎng)多樣性和環(huán)境適應(yīng)力章姓。?
(2)黍稷(Panicum miliaceum L.)是一種主要在亞洲和歐洲半干旱地區(qū)種植和消費(fèi)的孤兒作物。它在10000年前的中國北方被馴化煤搜,在稻米和小麥興起之前免绿,是當(dāng)?shù)氐闹骷Z作物。黍稷在大約3600至4000年前傳播到歐洲擦盾。由于其無麩質(zhì)嘲驾、高蛋白含量、生長迅速和抗旱特性厌衙,黍稷成為主要谷物的替代品距淫。然而,盡管需求和收獲面積逐漸增加婶希,但只有少數(shù)品種被推向市場榕暇。此外,黍稷的基因組多樣性尚未得到廣泛研究喻杈,其馴化的遺傳基礎(chǔ)仍有待探索彤枢。
亮點(diǎn)
本研究旨在分析群體水平黍稷的基因組,以確定其起源并探索與馴化相關(guān)的農(nóng)藝性狀的遺傳基礎(chǔ)筒饰。作者利用PacBio數(shù)據(jù)生成了32個(gè)代表性樣本的基因組缴啡,并構(gòu)建了圖形泛基因組,以揭示黍稷群體中的基因組變異瓷们。
結(jié)論1?基因組組裝及群體結(jié)構(gòu)分析
Fig 1
為了探索黍稷的遺傳多樣性和群體結(jié)構(gòu)业栅,作者對(duì)516份材料(包括415份地方種秒咐、38份栽培種和63份野生種)進(jìn)行了基因組測(cè)序(Fig 1a)。比對(duì)到參考基因組后碘裕,鑒定出1,890,542個(gè)高質(zhì)量SNP和168,878個(gè)InDel携取。
為了確定群體結(jié)構(gòu),作者利用四重簡并位點(diǎn)進(jìn)行了PCA(Fig 1b-c)和STRUCTURE分析(Fig 1d)帮孔。結(jié)果表明雷滋,516份材料可以分為四簇:一個(gè)野生簇W1和三個(gè)栽培簇,即C1文兢、C2和C3晤斩。最大的簇C3包含了來自中國西北的栽培種,這是黍稷種植的主要地區(qū)姆坚。C1簇由來自中國東北和東部的栽培種組成澳泵,而C2簇包括來自歐洲和中亞國家的栽培種(Fig 1a)。這些發(fā)現(xiàn)表明旷偿,黍稷的群體結(jié)構(gòu)與地理位置高度相關(guān)烹俗。
進(jìn)一步分析發(fā)現(xiàn),黍稷的栽培種和野生種的核苷酸多樣性低于水稻和大豆(Fig 1e)萍程,栽培種保留了其野生親屬中62.6%的核苷酸多樣性幢妄。在系統(tǒng)發(fā)育樹中,野生群體形成了一個(gè)與三個(gè)栽培群體不同的簇(Fig 1f)茫负。C3簇表現(xiàn)出較高的復(fù)雜性蕉鸳,并與野生群體密切相關(guān),暗示C3簇代表了從野生種中馴化出的基因庫忍法。此外潮尝,來自新疆和甘肅的一些材料在C3簇內(nèi)構(gòu)成了基部譜系或位于C2分支內(nèi),表明歐洲和中亞的標(biāo)本可能起源于中國西北的材料饿序。此外勉失,作者還發(fā)現(xiàn)了栽培種與野生群體之間的基因流。這些結(jié)果表明原探,黍稷在中國北方被馴化乱凿,隨后從中國西北向西傳播。
結(jié)論2?黍稷的泛基因組分析
Fig 2a
作者選擇了32份材料咽弦,包括24份栽培種和8份野生種徒蟆,用來構(gòu)建黍稷的圖形泛基因組(Fig 2a)。作者使用PacBio HiFi數(shù)據(jù)通過hifiasm進(jìn)行組裝型型,得到的contigs的N50范圍為5.16至27.25 Mb段审。QV、LAI和BUSCO評(píng)估表明組裝的參考基因組具有高質(zhì)量且高度連續(xù)闹蒜。
Fig 2b-d
作者進(jìn)一步發(fā)現(xiàn)每個(gè)基因組平均含有58.1%的重復(fù)序列寺枉,較大的基因組含有更多的轉(zhuǎn)座子抑淫。在32個(gè)基因組中,共鑒定出27727個(gè)核心基因型凳,8288個(gè)軟核心基因丈冬,24494個(gè)可有可無的基因和5533個(gè)特色基因家族(Fig 2b-d)。
Fig 2e-h
結(jié)論3?黍稷的結(jié)構(gòu)變異
Fig 3a-c
為了進(jìn)一步探索黍稷的基因組多樣性甘畅,作者采用基于組裝的方法來識(shí)別基因組中的結(jié)構(gòu)變異,共鑒定了207,033個(gè)SVs(Fig 3a)往弓,合并非冗余SVs后用于后續(xù)分析(Fig 3b-c)疏唾。
50515個(gè)PAVs中有59.4%僅出現(xiàn)在一個(gè)或兩個(gè)樣本中,這與水稻和大豆中低頻率PAVs的情況一致函似,表明它們可能代表新出現(xiàn)的或有害突變槐脏。基于50515個(gè)PAVs,作者構(gòu)建了圖形泛基因組撇寞。
Fig 3d-l
作者將與TEs有90%以上重疊的PAVs分類為TE-PAVs顿天,其余的PAVs被分類為非TE-PAVs,TE-PAVs占據(jù)了所有PAVs的大多數(shù)(68.3%)(Fig 3d)蔑担。
作者進(jìn)一步根據(jù)PAVs相對(duì)于蛋白編碼基因的位置進(jìn)行了注釋牌废,發(fā)現(xiàn)32.9%與基因區(qū)域重疊(Fig 3e)。在所有非TE-PAVs中啤握,51.7%位于基因區(qū)域鸟缕,而只有13.2%的TE-PAVs與基因區(qū)域相關(guān)聯(lián)。此外排抬,DNA-TE PAVs比LTR-TE PAVs更靠近基因區(qū)域(Fig 3f)懂从。為了了解PAVs如何影響基因功能,作者比較了PAV基因和非PAV基因的表達(dá)水平蹲蒲,發(fā)現(xiàn)PAV基因的表達(dá)水平顯著低于非PAV基因番甩。此外,PAV基因中有更多的沉默基因(Fig 3g)届搁,表明PAVs與葉片和根中的基因表達(dá)降低相關(guān)缘薛。此外,在基因編碼區(qū)域和基因上游位置的TE-PAVs更有可能影響基因表達(dá)咖祭,而在基因內(nèi)含子和基因下游位置的TE-PAVs較少影響基因表達(dá)(Fig 3h)掩宜。綜上,這些發(fā)現(xiàn)表明PAVs通過改變編碼和順式調(diào)控區(qū)域來影響基因表達(dá)么翰。
此外牺汤,作者鑒定了在葉片和根中表達(dá)水平顯著改變的648個(gè)PAV基因。這些差異表達(dá)的PAV基因富集了與抗性相關(guān)的結(jié)構(gòu)域浩嫌,如NB-ARC和Rx N-末端結(jié)構(gòu)域檐迟,這也是PAV基因富集的Pfam結(jié)構(gòu)域(Fig 3i)补胚。作者發(fā)現(xiàn)抗性基因位于重復(fù)富集區(qū)域,周圍PAVs的頻率高于基因組平均水平追迟,表明PAVs與黍稷中抗性基因的演化有關(guān)溶其。例如,在BC027中敦间,作者發(fā)現(xiàn)兩個(gè)抗性基因之間存在一個(gè)4.6 kb的插入瓶逃,其中l(wèi)ongmi055791編碼ENHANCED DISEASE RESISTANCE 2的同源蛋白,而longmi055792編碼一個(gè)NBS-LRR基因(Fig 3j)廓块。這個(gè)插入與兩個(gè)基因的表達(dá)下降相關(guān)(Fig 3k)厢绝,其等位基因頻率在C2(73.3%)和C3(66.0%)群體中高于W1(17.8%)(Fig 3l)。這些結(jié)果表明這個(gè)突變可能促使了黍稷對(duì)中國西北(C3)和歐洲(C2)的適應(yīng)带猴。
結(jié)論4?黍稷馴化過程的人工選擇
Fig 4a
作者整合了XP-CLR昔汉、π比值和群體分化指數(shù)來檢測(cè)人工選擇的信號(hào),共識(shí)別出524個(gè)基因組區(qū)域作為人工選擇的靶點(diǎn)拴清,涵蓋30.2 Mb的序列和3910個(gè)蛋白質(zhì)編碼基因(Fig 4a)靶病。這些區(qū)域與一些已知的與馴化和適應(yīng)性狀相關(guān)的基因重疊,如谷物產(chǎn)量(GL3.1口予、SG1和GS1)和開花時(shí)間(Ghd2娄周、Ehd1和Hd5)(Fig 4a)。
Fig 4b-h
黍稷是一種含有兩個(gè)亞基因組的異源多倍體物種苹威。作者發(fā)現(xiàn)昆咽,在A亞基因組中,受選擇區(qū)域更為豐富牙甫,包含更多的蛋白編碼基因掷酗。作者還觀察到,B亞基因組中的蛋白編碼基因比A亞基因組中的基因具有更多的PAVs(Fig 4b)窟哺。
此外泻轰,作者分析了與PAVs相關(guān)的基因丟失和擬基因化事件,以了解PAVs如何影響異源多倍體基因組中的基因丟失且轨。作者鑒定了由PAVs刪除或擬基因化的1,321個(gè)基因浮声,發(fā)現(xiàn)B亞基因組經(jīng)歷了比A亞基因組更多的基因丟失,表明PAVs促進(jìn)了基因丟失旋奢。作者還鑒定了242個(gè)基因丟失事件泳挥,這些事件在野生群體中的頻率低于栽培群體。這些結(jié)果表明至朗,黍稷基因組正在進(jìn)行的二倍體化可能已經(jīng)影響了基因功能屉符,從而促成了它的馴化。
為了更好地了解基因組變異在馴化過程中如何影響基因功能,作者在225個(gè)受選擇區(qū)域中鑒定了1,099個(gè)PAVs矗钟,其中包括39.9%的TE-PAVs唆香。其中,503個(gè)PAVs與基因區(qū)域重疊吨艇。作者還發(fā)現(xiàn)在馴化過程中躬它,野生和栽培群體之間有5,663個(gè)PAVs的等位基因頻率發(fā)生顯著變化。整合上述分析中受PAVs影響的基因东涡,作者鑒定出4,930個(gè)可能與黍稷馴化相關(guān)的基因冯吓。在longmi031198的上游區(qū)域中發(fā)現(xiàn)了一個(gè)6.4 kb的TE插入(Fig 4c)惩嘉,它是水稻花素基因Hd3a的同源基因丧枪。這個(gè)突變(Alt)與開花表型沒有顯著關(guān)聯(lián)(Fig 4d);然而洗显,栽培群體顯示出不含插入的單體型(Ref)的等位基因頻率增加(Fig 4c, e)祸挪。作者還鑒定到longmi040672附近的三個(gè)緊鄰的缺失變異(Fig 4f)。具有缺失變異單體型與穗和主莖之間的夾角較大相關(guān)(Fig 4g)贞间,并在馴化過程中受到負(fù)選擇(Fig 4h)贿条。這些結(jié)果表明,PAVs(尤其是TE-PAVs)在黍稷馴化過程中可能起到了重要的作用增热。
結(jié)論5?黍稷馴化過程的基因組變異
Fig 5a-b
此外整以,為了將黍稷的基因組變異與表型變異聯(lián)系起來,作者對(duì)兩年七點(diǎn)的516份材料進(jìn)行了43個(gè)性狀的測(cè)定(Fig 5a)峻仇,并基于1,890,542個(gè)SNPs和19,492個(gè)PAVs進(jìn)行了GWAS公黑。SNP-GWAS識(shí)別出與31個(gè)性狀相關(guān)的139個(gè)位點(diǎn),包括許多農(nóng)學(xué)重要性狀摄咆,如種子尺寸和植株結(jié)構(gòu)凡蚜,以及與馴化相關(guān)的農(nóng)藝性狀,如落種性(SHT)和總狀花序結(jié)構(gòu)(PNT)吭从。此外朝蜘,PAV-GWAS揭示了與17個(gè)性狀相關(guān)的70個(gè)PAVs。作者重點(diǎn)分析了種子脫落性涩金、花序和種子顏色以及總狀花序結(jié)構(gòu)(Fig 5b)谱醇。
5.1?種子脫落性
Fig 5c-h
種子脫落性的減弱是谷物馴化的關(guān)鍵步驟。作者發(fā)現(xiàn)栽培群體的脫落性水平低于野生群體(Fig 5b)步做,表明在馴化過程中對(duì)非脫落性性狀進(jìn)行了強(qiáng)烈的選擇副渴。
為了揭示與栽培群體中非脫落性性狀相關(guān)的遺傳變異,作者檢查了15個(gè)已知與谷物脫落性相關(guān)的基因全度,發(fā)現(xiàn)longmi009317煮剧,是水稻和高粱中控制種子脫落性的OsSh1的同源基因,以及一個(gè)相關(guān)同源基因longmi003952,在黍稷中經(jīng)歷了基因丟失或擬基因化轿秧。類似地中跌,longmi003952的一個(gè)3.2 kb的缺失導(dǎo)致了六個(gè)外顯子的喪失。作者還在受選擇區(qū)域中鑒定了SSH1/OsSNB的同源基因longmi012879, 其Hap 4與野生材料中的種子脫落性顯著相關(guān)菇篡。這些觀察結(jié)果表明漩符,在黍稷的馴化過程中可能已經(jīng)選擇了與非脫落性性狀相關(guān)的多個(gè)位置的基因組變異。
為了進(jìn)一步識(shí)別控制黍稷種子脫落性的基因組變異驱还,作者利用GWAS鑒定到58個(gè)SNP與脫落性顯著相關(guān)嗜暴。作者發(fā)現(xiàn)兩個(gè)基因,longmi020192(編碼果膠酯酶议蟆,PE)和longmi028230(編碼果膠酯酶抑制劑闷沥,PEI),位于受選擇區(qū)域(Fig 5c)咐容。PE負(fù)責(zé)中層板中果膠的降解舆逃,而PEIs可以抑制果膠甲酯酶的脫酯化。作者在longmi020192和longmi028230的編碼區(qū)域中發(fā)現(xiàn)了兩個(gè)非同義SNP戳粒。此外路狮,攜帶這些非同義突變的單倍型與野生群體中的種子脫落性高度相關(guān)(Fig 5d-e)。
5.2?花序和種子顏色
Fig 5i-o
花序和種子的顏色是與植物適應(yīng)性蔚约、應(yīng)激響應(yīng)和營養(yǎng)代謝相關(guān)的性狀奄妨。形態(tài)學(xué)調(diào)查表明,在黍稷的栽培種群中苹祟,綠色花序和深色種子占主導(dǎo)(Fig 5b)砸抛,表明在栽培群體中對(duì)這些特征進(jìn)行了選擇。作者通過GWAS鑒定了與花序顏色(IFC)相關(guān)的1211個(gè)顯著的SNP(Fig 5f)树枫。在longmi008332的調(diào)控區(qū)域發(fā)現(xiàn)了兩個(gè)SNP直焙,編碼谷胱甘肽S-轉(zhuǎn)移酶(Fig 5f),與植物中花青素積累相關(guān)团赏。這兩個(gè)SNP形成了兩個(gè)主要的單倍型箕般,大多數(shù)具有Hap2的品種具有紫色花序,而大多數(shù)Hap1的品種表現(xiàn)為綠色花序舔清。此外丝里,PAV-GWAS鑒定到與紫色花序相關(guān)的longmi008332中的一個(gè)72bp插入(Fig 5g-h)。所有沒有這個(gè)插入的品種都具有Hap1体谒,而帶有這個(gè)插入的品種中有76.6%表現(xiàn)為Hap2杯聚,表明這段72bp的插入是引起黍稷紫色花序的變異。
在SNP-GWAS中檢測(cè)到與種子顏色(SDC)相關(guān)的多個(gè)基因座抒痒,分布在chr 5-6-9-11和14上幌绍。其中,在chr 9上發(fā)現(xiàn)了483個(gè)相關(guān)的SNP,主要集中在色氨酸脫羧酶(TDC)基因簇周圍(longmi004409傀广、longmi004412和longmi004413)颁独。TDC是與5-羥色胺生物合成相關(guān)的基因,其上調(diào)導(dǎo)致種子或葉子呈深褐色伪冰。單倍型分析表明誓酒,與深色種子相關(guān)的Hap 3、4和5主要存在于栽培品種中贮聂。此外靠柑,一個(gè)SNP導(dǎo)致了longmi057520中的提前終止,并與深色種子高度相關(guān)吓懈。Longmi057520與水稻中合成硫酸雪松醇和丁香醇前體的GH2同源歼冰。GH2突變體的種子呈金黃色,而野生型的種子呈淺黃色耻警。因此隔嫡,longmi057520中的提前終止可能導(dǎo)致黍稷栽培群體的深色種子。此外甘穿,longmi057520位于一個(gè)選擇清除區(qū)域畔勤。這些觀察結(jié)果表明,SDC是一個(gè)由多個(gè)遺傳因子控制的復(fù)雜性狀扒磁,在黍稷馴化過程中經(jīng)歷了選擇。
5.3 花序構(gòu)造
花序構(gòu)造是影響谷物產(chǎn)量的關(guān)鍵因素式曲,也是作物馴化和改良的焦點(diǎn)妨托。在黍稷中,野生品種具有敞開的花序吝羞,而栽培品種具有閉合的花序(Fig 5b, i)兰伤。作者對(duì)八個(gè)與花序形狀相關(guān)的性狀進(jìn)行了SNP-GWAS分析(Fig 5b),在chr 14上鑒定出與四個(gè)與花序相關(guān)的性狀相關(guān)的55個(gè)基因(Fig 5j)钧排。其中敦腔,longmi038370編碼一個(gè)SBP結(jié)構(gòu)域蛋白,是玉米中控制葉片角度恨溜、穗支數(shù)和穗支角度的LG1的同源基因符衔。單倍型分析表明,Hap 1和5與較低的花序密度(DOI)以及谷穗和主莖的較大分支強(qiáng)烈相關(guān)糟袁。此外判族,longmi038370位于一個(gè)受選擇區(qū)域中,表明它在黍稷的馴化過程中受到了強(qiáng)烈的選擇项戴。為了驗(yàn)證longmi038370的功能形帮,作者構(gòu)造了三個(gè)Seita.3G022100.1(SiLG1)的CRISPR–Cas9突變體,該基因是黍稷在早熟禾中的同源基因。Silg1-1突變體顯示失去了籜舌(Fig 5k, l)辩撑,花序支與主莖之間的角度較薪缧薄(Fig 5m, n),花序較為緊湊(Fig 5o)合冀。因此各薇,作者認(rèn)為longmi038370控制了黍稷的花序形狀。
此外水慨,作者還鑒定了與谷穗主軸方向(MED)相關(guān)的chr 1和chr2上的基因座(Fig 5j)得糜,其中包含一個(gè)候選基因,即longmi054645晰洒,編碼一個(gè)無頂端分生組織蛋白朝抖。單倍型分析表明,Hap 3與野生品種中的低MED強(qiáng)烈相關(guān)谍珊。另一個(gè)候選基因 (longmi011403)編碼一個(gè)依賴鈣的磷三酯酶蛋白治宣,也在chr1上被鑒定出來。Longmi011403的Hap 2僅存在于野生品種中砌滞,它與較低的DOI和敞開的花序強(qiáng)烈相關(guān)侮邀,表明它是多功能的,控制了黍稷中多個(gè)花序性狀贝润。