導讀
野生植物被成功地馴化為農作物是人類文明的大事件降盹。該過程的成功很大程度上要歸功于持續(xù)的人工選擇。本文總結了過去十年在作物馴化和育種研究中的新發(fā)現躲叼。作物基因組圖譜的構建和眾多性狀控制基因的功能解析為科研提供了基礎信息芦缰。在許多植物的研究中都正在應用讀取、解讀和改造復雜遺傳信息的方法來高效地從頭設計物種或對野生種進行重新馴化枫慷。了解作物微觀進化的潛在機制让蕾,將其應用于農業(yè)生產,或將為未來應對糧食安全方面的挑戰(zhàn)提供行之有效的解決方案或听。
原名:The integrated genomics of crop domestication and breeding
譯名:作物馴化與育種中的整合基因組學
期刊:Cell
IF:66.85
發(fā)表時間:2022年5月
通訊作者:黃學輝探孝,黃三文和李家洋
通訊作者單位:上海師范大學,中國農科院深圳基因組所和中科院種子創(chuàng)新研究院
DOI號: 10.1016/j.cell.2022.04.036
研究進展
1 引言
自從大約一萬年前出現農業(yè)文明以來誉裆,人類一直對農產品有強烈的依賴顿颅。幾十種植物的成功馴化為作物是農業(yè)文明的大事件,因為豐富的糧食資源是人類繁榮的重要基礎足丢。最典型的例子是:三大主糧作物水稻粱腻、小麥和玉米,目前養(yǎng)活了數十億人斩跌。這些谷物分別獨立起源于東亞绍些、中東和中美洲,然后傳播到世界各地耀鸦,表明這些作物對人類社會具有廣泛的價值柬批。
馴化的作物與其野生祖先存在遺傳差異。人類在尋求食物的生產活動中袖订,有意識地馴化植物氮帐。植物與易于種植(如,直立的植物結構)洛姑、收獲效率(如揪漩,在成熟時減少落粒)和吸引人的味道等特征相關的等位基因變異被特異地進行選擇。在人類將這些馴化或半馴化的植物傳播到更廣泛的地理區(qū)域范圍的過程中吏口,那些具有適合不同環(huán)境(如光照時間奄容、溫度、水产徊、土壤和微生物)的等位基因變異的植物種群在農民的有意種植下規(guī)模逐漸擴大昂勒。過去的馴化事件是對有利的自然變異進行固定化,這在栽培物種形成中是一個緩慢的過程舟铜。例如戈盈,根據考古觀察,水稻、小麥和大麥中僅“減少落撂寥ⅲ”這個表型的固定就經歷了千年甚至數千年归斤。相比之下,現代育種中的人工選擇更加高效刁岸,水稻和小麥中半矮化等位基因的固定化僅用了幾十年時間脏里。植物遺傳學和育種者需要追蹤作物馴化和育種過程中的關鍵分子變化,以便指導作物的進一步改良或以更快捷的方式從頭馴化野生植物虹曙,因為遺傳育種遵循相同的原則——尋找或創(chuàng)制多樣化的等位基因迫横,之后進行自然或人工選擇。
人類在確保充足的糧食供應方面酝碳,仍面臨多重挑戰(zhàn)矾踱。其中包括人口增長、耕地和清潔水的不足疏哗、氣候變化呛讲、環(huán)境污染以及不可預測的其他危機,如當前的COVID-19大流行返奉。保障全球糧食安全需要不斷改進植物育種科技贝搁。基因組學技術的發(fā)展極大地促進了作物馴化分子基礎的研究衡瓶。在過去的幾年里徘公,基于解析和操縱植物基因組方面的科技的飛速進展牲证,包括讀认搿(各種組學技術)、解讀(大數據的深度學習)和編輯改造(CRISPR-Cas9)等坦袍,在作物馴化和育種領域促成了諸多新的概念和發(fā)現十厢。新概念和新發(fā)現在作物設計中的應用,包括新等位基因甚至新基因的基因工程捂齐,將加快未來育種的速度蛮放。本文總結了基因組學、群體遺傳學奠宜、遺傳圖譜和功能基因組學在該領域取得的最新進展包颁,并展望****未來****。
圖1 | 作物馴化和改良的遺傳方法压真。在解析基因組過程中娩嚼,高通量技術的出現生成了大量組學數據。通過整合組學數據和各種遺傳分析方法滴肿,可以揭示潛在的機制岳悟,包括識別馴化和改良相關基因及其調控途徑。用于基因編輯的工具,如CRISPR-Cas9和合成生物學贵少,將以高效的方式用于作物重新馴化和育種呵俏。
2 作物參考基因組測序
作物馴化和改良的遺傳研究在很大程度上非常依賴相關植物物種的高質量參考基因組序列。在過去20年里滔灶,已經有數百種植物完成了測序普碎、參考基因組組裝,其中大部分已經達到染色體水平宽气。作物基因組的爆炸式發(fā)展很大程度上歸功于基因組分析中測序技術和相關算法的快速發(fā)展随常。目前,能夠測到較長的序列(通常>10kb)的第三代測序(TGS)在生成作物參考基因組方面幾乎完全取代NGS(短序列的大規(guī)模測序萄涯,讀長通常為150-800bp)绪氛。具體來說,PacBio高保真測序所使用的CCS(circular consensus sequencing)測序技術能夠讀取準確讀高達99.8%涝影、平均長度為13.5kb的序列信息枣察。此外,盡管納米孔(Nanopore)測序技術的堿基準確度較低(約90%)存在缺陷燃逻,但其讀取長度的優(yōu)勢(平均>20kb序目,最大長度超過2Mb)使該技術頗具吸引力。雖然簡單地使用Pacbio高保真測序或納米孔長片段測序即可實現高連續(xù)性的基因組組裝伯襟,但結合“合成長讀取技術”(例如猿涨,10xGenomics、Hi-C和Bionano光學圖譜分析系統(tǒng))可以減少組裝錯誤姆怪、能更好地將序列定位到motif叛赚、組裝到染色體上。除了測序技術的進步稽揭,研究人員還開發(fā)了許多算法和工具包俺附,用于從頭組裝基因組,包括Canu溪掀、FALCON事镣、Wtdbg2、NECAT和Hifiasm等揪胃,這些工具提高了序列組裝的準確性并使獲得的參考基因組的缺口更少璃哟。
最近,在應用這些工具的基礎上喊递,許多作物的基因組組裝得到了更新升級随闪。例如,玉米册舞、小麥蕴掏、馬鈴薯、棉花和花生。此外盛杰,最近挽荡,已經有研究者著力構建無缺口的端粒到端粒(T2T)參考基因組,這為被稱為“暗物質”的染色體區(qū)域(例如即供,著絲粒和大型重復區(qū)域)的解析提供了新的見解定拟。例如song等人組裝了兩個水稻品種的無缺口基因組,是作物(玉米)中組裝的第一個無缺口基因組逗嫡;在玉米中青自,Liu等人組裝了兩個染色體水平的無缺口基因組,揭示了旋鈕狀重復(knob repeats)的內部結構驱证。
同源多倍體作物基因組由于亞基因組的極高相似性延窜,解析難度較高。為了解決重建同源多倍體基因組的問題抹锄,Zhang等人開發(fā)了一種基于Hi-C的支架算法(All-HiC)逆瑞,該算法能夠為多倍體基因組構建等位基因的識別、染色體規(guī)模的組裝提供便利伙单。該方法成功地應用于組裝復雜的基因組获高,如同源四倍體甘蔗和同源四倍體紫花苜蓿。此外吻育,已經設計了幾種遺傳方法用于構建染色體單倍型念秧,例如三重組合、配子組合和重組后代的分離群體的基因分型布疼。值得注意的是摊趾,基因組同線性分析表明,在同源多倍體物種的同源染色體之間可以檢測到大量結構變異(SV)缎除,如大片段倒位等严就。
在“白金級”的作物基因組解析后总寻,研究者不僅可以發(fā)現功能基因器罐,還可以發(fā)現基因組變異。值得注意的是渐行,通過機器學習簡單地基于基因組序列即可預測到開放染色質轰坊、組蛋白標記和轉錄豐度等許多組學特征,暗示基因組中仍有大量信息有待探索祟印、解析肴沫。例如,在玉米中蕴忆,Zhou等人構建了一個模型颤芬,僅根據基因轉錄起始位點附近確定的基序即可預測基因在響應熱應激時的表達趨勢。對25個玉米組裝基因組中具有順式調節(jié)變異的基因的進一步分析表明,SV可能引起轉錄因子結合位點的存在或缺失站蝠,從而引起其應激反應發(fā)生改變汰具。
3 從單一參考基因組到泛基因組
隨著測序和生物信息學的升級,作物群體基因組學正在從單一參考重測序方法轉變?yōu)榫€性泛基因組方法菱魔。最近又出現了圖形泛基因組新方法留荔。對于單一參考基因組的重測序方法,變異的識別高度依賴于序列相似性澜倦,從而將NGS短片段定位到參考基因組上聚蝶,故而難以避免來自高度多態(tài)性區(qū)域的遺傳變異的丟失。泛基因組是指存在于一個研究物種中的基因組序列的總和藻治。早期的線性泛基因組由多個基因組組裝或參考基因組與未能比對上的序列數據的附加序列的合并碘勉、組裝組成。與線性泛基因組相比桩卵,基于圖的基因組可以在將來自目標物種的多個基因組的復雜信息整合到同一個圖中恰聘,并且可以用于后續(xù)的種群遺傳分析。
泛基因組減少了參考偏差并涵蓋了更多的變異信息吸占,有利于下游遺傳分析晴叨。特別是,SV通常富集在復雜的基因組區(qū)域矾屯,因此可以使用基于組裝的變體調用策略以準確識別兼蕊。相對而言,基于單一參考基因組件蚕、重測序獲得的結果因為未比對成功的短序列及其組裝通常準確度較低孙技。
許多作物中均已構建泛基因組(圖2A)∨抛鳎基于20個品種的染色體水平基因組組裝構建的大麥泛基因組牵啦,極大地促進了大麥遺傳學研究和育種。泛基因組中發(fā)現了大量的Mb堿基的倒位妄痪,其中一些被發(fā)現與最近的突變育種和適應性相關哈雏。在番茄中,Gao等人利用構建的泛基因組在風味相關基因TomloxC的啟動子中發(fā)現了一種罕見的調節(jié)因子變異衫生。Alonge等人在不同的番茄品系中捕獲了238,490個SV裳瘪,其中大量與基因劑量和表達水平的改變相關。在大豆研究中罪针,構建了基于圖的高質量泛基因組彭羹,用作對整個大豆種群的SV進行基因分型的參考±峤矗基于這些SV的全基因組關聯研究(GWAS)解析了一個10-kb的SV派殷,它可能與種子是否具有光澤相關的基因相關还最。在玉米中,Hufford等人從頭組裝了26個不同系的基因組毡惜,用于嵌套關聯(NAM)作圖憋活,提高了NAM中遺傳作圖的能力。在水稻中虱黄,Qin等人使用基于圖形的SNP和SV基因分型預估出17.5%的SV與相鄰SNP的連鎖程度較低悦即,表明有很大比例的隱藏遺傳變異尚待探索。在番茄中也觀察到類似的現象橱乱,即SV與相鄰SNP的連鎖程度低辜梳。當將由番茄泛基因組圖譜中鑒定的SV納入考慮時,估計的遺傳力增加了24%泳叠。盡管泛基因組正在成為作物基因組學研究的新參考信息作瞄,但它們相關的基因組注釋情況(例如基因和轉座因子注釋)和基因組實用性(例如泛基因組瀏覽器和數據庫)仍有待開發(fā),以更好地支持作物遺傳研究和育種危纫。
4 作物群體基因組學
除了側重于盡可能全面地解析基因組變異的泛基因組學宗挥,群體基因組學更關注解釋這些變異的進化因素。在植物馴化過程中种蝶,基因漂移和人工選擇等進化力量驅動了顯著的基因組變化契耿。根據基因組特征(包括多樣性減少、頻譜的偏移螃征、單倍型純合性擴展和顯著的等位基因頻率分化)已經開發(fā)了用于檢測人工選擇的方法搪桂。該方法是基于從基因組區(qū)域的中性變異部分識別多態(tài)性模式特征發(fā)生的變化。同時盯滚,研究者也越來越多的注意到許多農作物起源復雜踢械,需要考古基因組學的更多證據。深入研究野生種群亞結構的多樣性魄藕、不同野生亞種群對栽培群體的相對遺傳貢獻率内列、多樣性下降的時間等因素,有助于更好地解析馴化過程和人類選擇所針對的基因背率。
圖2 | 過去十年中作物群體基因組學的進展话瞧。A|顯示了每種作物在重新測序(主要通過短讀測序技術)或泛基因組構建方法測序(主要通過長讀測序)中的基因組覆蓋率。B|通過對栽培植物及其野生祖先的全基因組重測序檢測到的馴化Sweep區(qū)通常與遺傳作圖信號或克隆的馴化基因重疊(提供了作物中馴化基因的典型示例)退渗。泛基因組有助于確定導致馴化變異的原因(以玉米tb1基因為示意圖)移稳,并追蹤群體的進化過程蕴纳。整合多組學技術的方法將進一步促進相關分子調控網絡的研究会油。
深度學習也已應用于進化基因組學,并且已經開發(fā)了一些方法用于檢測選擇特征古毛。例如翻翩,開發(fā)了使用祖先重組圖(SIA)的選擇推理都许,來研究祖先重組圖的特征,并推斷有益變異的選擇系數和等位基因頻率變化過程嫂冻。值得注意的是胶征,這種基于深度學習的方法不僅可以檢測和量化硬清掃(一個有益等位基因迅速增加其在整群體中的頻率,其關聯位點的變異急劇減少)桨仿,還可以檢測和量化軟清掃(多個有益等位基因同時被選擇并掃描群體)具有良好的表現睛低。
當與“自上而下”實驗(例如數量性狀基因座定位作圖QTL)相結合時,這些“自下而上”的方法變得更加強大服傍,能確定負責馴化相關性狀的基因钱雷,水稻、玉米吹零、大豆和番茄等研究就是很好的例證罩抗。然而,值得注意的是灿椅,有許多基因座具有很強的人工選擇信號套蒂,但與任何已克隆的馴化基因或遺傳作圖信號無重疊。這些選擇信號可能是地理遺傳特征茫蛹,也可能是在栽培實踐開始之前的很長一段時間內由未知的選擇壓力驅動的操刀。此外,許多可能與人類的無意識選擇有關的基因或功能元素仍有待探索婴洼。
群體遺傳學除了研究二倍體作物外馍刮,還研究了大量多倍體作物,因為30%的栽培作物都屬于多倍體窃蹋。多倍體的遺傳后果包括遺傳多樣性和雜合程度的提高卡啰,以及對新環(huán)境的適應性、可塑性的提高警没。Salman-Minkov等于2016年注意到與野生近緣種相比谦去,作物物種中多倍體比例過高滋迈,并提出了“馴化后多倍化”的概念作為一個合理的假設:作物多倍化的遺傳結果促進了它的成功馴化。與二倍體作物相比,在棉花畅涂、油菜和小麥等多種多倍體作物中,觀察到了一些新的遺傳模式择镇,包括不對稱的亞基因組選擇等鸟廓。對于無性繁殖的作物,如葡萄续语、木薯和馬鈴薯垂谢,盡管馴化已經改變了重要的農藝相關途徑,但在馴化過程中疮茄,遺傳漂變和育種系統(tǒng)的轉變導致了有害突變的積累滥朱。值得注意的是根暑,在雜合狀態(tài)下,越來越多的有害等位基因被掩蓋徙邻,因此需要在未來的育種計劃中清除這些突變排嫌。
廣泛的作物群體比較基因組學的進展正在促使研究人員分析作物適應人類選擇的進化限制。盡管通常發(fā)現相似性狀受不同基因控制缰犁,但不同作物品種在馴化過程中仍存在許多趨同進化的案例淳地。Oryza glaberrima(非洲栽培稻)和O. sativa(亞洲栽培稻)分別由非洲和亞洲古代農民獨立馴化,它們具有一些類似的“馴化綜合癥”帅容,例如減少落粒性和的植物結構更直立化薇芝。Wang等人(2014年)和Wu等人(2017年)確定了亞洲栽培稻中已知的控制種子落粒性和植物結構等馴化相關性狀的調控基因,這也是非洲水稻的人工選擇目標丰嘉。此外夯到,選擇還作用于亞洲和非洲水稻中的PROG1基因。葫蘆中的非苦味是人類偏好的饮亏,在不同的葫蘆品種培養(yǎng)中同步選擇了該性狀耍贾。Zhou等人(2016年)發(fā)現了一組調節(jié)苦味化合物(葫蘆素)生物合成的轉錄因子,并發(fā)現在不同的野生葫蘆品種馴化過程中路幸,可能針對這些調節(jié)因子做出了趨同選擇荐开。種子休眠的喪失也是跨多種作物的共同馴化性狀。在大豆中克隆了控制種子休眠的stay-green G基因简肴,并在水稻中發(fā)現了其具有保守功能的同源基因晃听。控制大麥芒光滑度的遺傳基礎被確定為與水稻LABA1基因同源砰识,這兩種基因都被人工選擇之下能扒、消除芒倒刺形成。鑒于禾本科中的許多物種是被人類馴化以提供碳水化合物的辫狼,Zhou等(2020年)收集分析了水稻初斑、玉米和大麥中鑒定的選擇相關的掃描區(qū)域的基因,發(fā)現它們與小麥同源的基因區(qū)域也富含馴化相關特征膨处,這表明人類的選擇導致谷類作物具備趨同選擇的特征见秤。
5 選擇相關的重要基因
在過去的二十年里,植物遺傳學和進化研究在識別人類選擇相關基因方面已經做出了巨大的努力(圖2B)真椿。在馴化和現代育種過程中被選擇的基因分別稱為馴化和改良基因鹃答。一般來說,相關性狀表現出連續(xù)的表型變異突硝,并由多個數量性狀基因(QTG)控制测摔,這些基因可以通過基于圖譜的克隆或GWAS來識別。此外狞换,通過整合群體遺傳學和多組學數據避咆,可以通過探索研究有關這些基因的選擇過程和功能的更多細節(jié)舟肉。
馴化是人類對植物進行選擇的初始階段修噪。一些影響較大的QTG在馴化過程中被強烈選擇并在作物基因組中固定下來查库。例如,種子落粒性黄琼、植物結構和花序結構是作物最重要的馴化目標樊销。在幾種主要谷物中,已經鑒定到控制這些性狀的QTGs脏款,例如tb1围苫、PROG1/RPAD、SHAT1-5和Brt等撤师。除了這些QTGs剂府,其他與種子相關性狀有關的QTGs(包括種子休眠、芒剃盾、種殼顏色腺占、種皮顏色、裸粒和味道等)也是馴化的主要目標痒谴。在水果和蔬菜作物中衰伯,味道和風味是重要的馴化目標。例如积蔚,黃瓜中Bt基因的選擇產生了不苦的葫蘆科瓜果意鲸,而西瓜中ClAGA2的選擇產生了甜果肉。
在少數特定地區(qū)發(fā)生的馴化后尽爆,作物不斷得到改良并在全球范圍內廣泛傳播怎顾。在擴散期間,在不同地區(qū)農民繼續(xù)進行人工選擇漱贱,以使作物適應當地環(huán)境杆勇。在光周期敏感作物中,光周期相關基因是主要選擇目標饱亿,幾乎所有主要的開花相關QTG都經歷了適度程度的人工選擇蚜退。在水稻中,選擇了Ghd7彪笼、DTH8钻注、Ghd7.1和Hd1,使得原始的短日照植物也能在高緯度地區(qū)長日照條件下開花配猫。同樣在玉米中對ZCN8幅恋、ZmCCT和ZmCCT9進行選擇;在大豆中J泵肄、Tof11和Tof12被選擇捆交,促進了它們在熱帶或溫帶地區(qū)的傳播淑翼、分布。對光周期相關QTG的選擇促進了水稻品追、玉米和大豆的種植范圍擴展到全球玄括。
在現代育種中,作物產量通常是最重要的目標之一肉瓦。對fw2.2遭京、lcn2.1、fw3.2和其他QTGs的選擇促使現代番茄果實的大小比櫻桃番茄增加了10倍以上泞莉。雜交育種已被廣泛用于許多作物哪雕,利用雜種優(yōu)勢提高產量。在雜交育種過程中涉及和選擇了許多雜種優(yōu)勢基因和雜交不育基因鲫趁。數量遺傳學和群體遺傳學分析表明斯嚎,在雜交水稻中集中選擇了幾個與開花時間和植株結構相關的基因,促成了產量雜種優(yōu)勢挨厚。特別是堡僻,基于開花時間的SFT和基于植物結構的IPA1可能分別是番茄和水稻中重要的雜種優(yōu)勢相關基因。鑒定水稻中的S5和qHMS7等雜種不育基因有助于打破生殖障礙幽崩,并有助于利用遠緣雜交獲得雜種優(yōu)勢苦始。
總體而言,QTGs的馴化和改良為雜交育種提供了有價值的信息慌申,也促進人們對作物微進化的一般機制的理解陌选,以及對未來育種的實質性目標的理解。QTG相關信息和潛在的分子機制也為新作物的從頭馴化鋪平了道路蹄溉。
6 連鎖拖累和上位性
在作物育種中咨油,種質資源的收集經常被用作寶貴的資源,但連鎖累贅是一個常見的障礙柒爵。連鎖累贅(也稱為遺傳累贅)是指與育種者試圖滲入的基因緊密相連的不良基因役电。基于水稻數量性狀圖譜棉胀,在約25%的水稻基因組中都檢測到潛在的連鎖累贅法瑟。水稻有兩種主要的連鎖累贅:一種是與稀有而有價值的基因緊密連鎖的劣等基因,另一種是在兩個亞種中出現高度分化的相鄰基因唁奢。在番茄抗病育種中霎挟,使用了許多野生等位基因,如 Mi-1麻掸、Ty-1和Sw-5酥夭,大量外來片段隨著這些野生基因滲入到這些抗病品種中。野生等位基因的連鎖累贅是固定的,難以打破熬北,可能是染色體倒位造成的疙描。水稻和番茄的研究結果表明連鎖累贅可能是野生種質資源利用中的一個常見障礙,因為野生植物基因組可能包含許多與未馴化基因相關的所需抗性基因讶隐。因此起胰,需要特意打破這種聯系:滲入理想的基因,避免緊密連鎖的不良基因整份。為了實現這一目標待错,連鎖累贅的基因組格局籽孙、高密度基因分型的使用以及智能育種系統(tǒng)的開發(fā)都需要在育種群體中追蹤重組事件烈评,以排除高度連鎖和劣等基因,如基于不同二倍體馬鈴薯基因組組裝的大型倒位圖的構建犯建,為排除潛在的連鎖拖拽提供了重要參考信息讲冠。特別是,CRISPR-Cas9技術可用于重組植物染色體适瓦,包括介導目標區(qū)域的大規(guī)模倒位或誘導異源染色體間染色體易位等竿开,都有可能打破或修復植物育種中的遺傳連鎖。
過去馴化導致的一些作物存在一種特殊類型的連鎖累贅玻熙,位于Sweep區(qū)否彩。基于表型的馴化在基因組空間分析方面存在一些缺陷嗦随。馴化選擇了優(yōu)選的等位基因時列荔,不可避免地會選擇一些額外的、與目標等位基因高度連鎖的基因組片段枚尼,這個過程被稱為“搭便車”贴浙。在西紅柿中,Sweep區(qū)可達111Mb署恍,占基因組的14.2%崎溃,有時會導致意想不到的結果。例如盯质,fw11.3的基于果實質量的選擇導致數十種代謝物發(fā)生變化袁串,這在很大程度上是由sweep區(qū)域內的連鎖基因引起的。這些sweep顯著縮小了進一步改進的空間呼巷。如今囱修,基于基因的選擇和基因組編輯可以提供新的策略來釋放這些在馴化中產生的基因組空間。
除了連鎖累贅外朵逝,上位性也存在類似的情況蔚袍。將兩個靶基因放在一起對表型的影響效果并不總是像做加法那樣簡單。在番茄研究中,由于兩個轉錄因子之間的遺傳相互作用啤咽,將兩個獨立選擇中表現有益的基因疊加在一起晋辆,會導致分枝和不育等不良表型,這表明育種中還需要繞過負上位性基因宇整。不幸的是瓶佳,在大多數作物中,目前關于上位性相互作用的信息非常有限鳞青。更多全面檢測和定量評估作物基因組中這些上位性相互作用的遺傳學研究對于指導作物育種將是大有裨益的霸饲。
7 創(chuàng)制新等位基因
過去的馴化依賴于人類長期艱苦的選擇、適合作物種植中自然發(fā)生的突變”弁兀現在基因組學技術的進步和重要作物基因的發(fā)現加速了育種選擇并促進研究者設計理想的作物厚脉。基因組編輯胶惰,主要使用CRISPR-Cas9技術這個強大的工具傻工,有效地為作物育種目標操縱各種等位基因,包括劣質基因的敲除和調控基因的微調孵滞。在感興趣基因的編碼區(qū)內進行移碼插入缺失突變中捆,是基因組編輯中最常見的操作。這種敲除突變體可能會出現極端的表型變化坊饶,這在基因功能驗證中很有價值泄伪。但是,對于遺傳改良匿级,重要基因的功能喪失等位基因常常不能產生理想的表型蟋滴。許多馴化突變屬于“弱等位基因”或“數量等位基因”類型。例如根蟹,幾乎所有栽培稻種都含有sh4這種減少種子落粒性的缺陷的等位基因——馴化過程中脓杉,第一個外顯子中發(fā)生G到T突變并被固定下來,sh4的基因功能在栽培水稻中并未完全喪失简逮,而sh4的移碼突變體則完全消除了落粒性相關的發(fā)育球散,導致產生完全不落粒表型。
在蛋白質編碼區(qū)進行堿基編輯是一種創(chuàng)建新等位基因的方法散庶。例如蕉堰,編碼顆粒結合淀粉合酶I的Waxy(Wx)是影響谷物食用和烹飪質量的主要水稻基因。通過對編碼區(qū)進行精確的堿基編輯悲龟、產生多個新Wx等位基因屋讶,達到了微調稻谷中的直鏈淀粉含量的目的。類似的方法已應用于OsACC1和OsALS1的人工進化须教,以提高植物對除草劑的抗性皿渗。在CRISPR-Cas9基因編輯中使用多個目標引物斩芭、在啟動子區(qū)域內進行刪除編輯(Indel),是另一種生成多種等位基因的方法乐疆,可以通過編輯順式元件來改變基因表達水平或模式划乖。這種方法首先在西紅柿中進行了嘗試,產生了許多啟動子變體挤土,用于果實大小琴庵、花序分枝和植物結構的遺傳改良。后續(xù)在其他作物上的成功應用表明它是促進農藝性狀改良的有效方法仰美。
基因組編輯也能夠產生大的缺失迷殿。在小麥中,TaMLO1基因敲除品系表現出對白粉病的廣譜抗性咖杂,但存在生長缺陷庆寺。而一個304-kb的缺失則可導致TaTMT3B激活、保持植物生長和產量翰苫,同時賦予強大的抗性止邮。因此这橙,同時編輯TaMLO1基因和所需的大缺失可以在沒有影響生長的情況下實現抗病性奏窑。這些發(fā)現強調了基因組編輯是植物育種中實現快速創(chuàng)新的有力策略。
8 從頭馴化和基因組設計
栽培作物是從生長在人類文明起源附近的野生植物中馴化而來的屈扎,而在未來埃唯,有可能使用現代工具對更多的野生物種進行馴化。由于許多馴化基因的鑒定和新工具的開發(fā)鹰晨,基因組規(guī)模的從頭馴化在技術上變得可行墨叛。以基因組工程為目標,通過同時操縱多個基因模蜡、從頭馴化野生植物或重新馴化現有作物的野生祖先漠趁,正在使用基因組編輯、基因組設計或合成生物學等方法實施(圖3)忍疾。CRISPR-Cas9技術在從頭馴化中非常強大闯传。近年來,基于圖位克隆和GWAS卤妒,馴化相關基因的知識得到了極大的擴展甥绿。此外,如上所述则披,已經確定了幾個重要的基因共缕、揭示了作物馴化中的趨同進化模式。因此士复,隨著發(fā)現不同植物中的同源基因通惩脊龋控制相同的性狀,編輯關鍵節(jié)點中的基因可能會在重新馴化中發(fā)揮很好的作用。事實上便贵,通過在野生植物中進行基因組篩選隅茎、編輯多個馴化基因的同源基因,已經證明了這種策略的有效性(圖3A)嫉沽。例如孤生作物辟犀、地櫻桃和野生番茄等,因為它們在抗病性和耐鹽性方面的優(yōu)勢而被選中用于人工馴化绸硕。
圖3 | 通過同時操縱多個基因進行作物再馴化和育種的基因組工程方法堂竟。A|對馴化基因進行基因組編輯,以快速馴化四倍體野生稻玻佩、野生番茄圖中顯示了基因組編輯中使用的基因出嘹。B|基因組設計策略用于創(chuàng)制二倍體馬鈴薯F1雜種。圓圈內的標簽“3”和無圓圈的“3”分別表示自交和雜交咬崔。SI和DM分別是自交不親和和有害突變的縮寫税稼。C|作為對未來的展望,C4植物玉米光合作用的模塊通過合成生物學途徑提高大豆的產量垮斯。
一個單子葉植物的例子是四倍體野生稻郎仆,它被設計用于創(chuàng)造新的谷類作物,以獲得更大的生物量兜蠕、對氣候變化適應性更強扰肌。異源四倍體野生稻(Oryza alta)是一種來自南美洲的野生稻種,含有許多可用于農業(yè)的表型熊杨。為便于野生植物的從頭馴化曙旭,已經建立了高效的組織培養(yǎng)和轉化系統(tǒng)、組裝成了具有高質量基因注釋的染色體級基因組晶府。在栽培稻中桂躏,已鑒定出許多馴化或改良相關基因。從野生稻基因組中搜索了六種重要農藝性狀基因的同源基因川陆,并選擇基于CRISPR-Cas9的誘變剂习。研究發(fā)現大多數用于基因組編輯的基因在栽培稻和野生稻之間相當保守,和預期一致书劝,這些性狀在可以被迅速馴化进倍。這些研究表明,野生植物可以被高效地成功轉化為類作物物種购对,這為利用野生近緣種和未馴化植物中的無數基因打開了大門猾昆,也為未來的植物育種計劃賦予了重要的特征。雜交馬鈴薯育種骡苞,將其從無性繁殖的四倍體作物改造成二倍體種子作物垂蜗,將徹底改變馬鈴薯產業(yè)楷扬。自交不親和和近交衰退是阻礙雜交馬鈴薯育種的兩個主要障礙。自交不親和的障礙是通過鑒定馬鈴薯中的自交親和基因來解決的贴见。由有害的隱性突變引起的近交衰退則是馬鈴薯育種的第二大障礙烘苹,是更大的挑戰(zhàn),但其中的遺傳基礎已被破譯片部。這些有害突變在馬鈴薯不同品系中具有品系特異性镣衡,表明具有不同遺傳背景的自交系之間的雜交將掩蓋大多數有害等位基因突變的不良影響。最近的一項研究中档悠,通過基因組編輯產生了二倍體馬鈴薯的自交系廊鸥,并使用基因組輔助選擇來識別和清除這些主效應有害突變(圖3B)。這種策略通過基因組設計辖所,可以將馬鈴薯育種從緩慢的惰说、非累積的模式轉變?yōu)榭焖俚哪J剑瑥亩箲肍1代雜交種進行馬鈴薯育種成為可能缘回。對水稻的研究方向則與馬鈴薯的策略完全相反——使雜交水稻變成為克隆繁殖的作物吆视。水稻中同時針對幾個減數分裂和受精基因進行遺傳工程操作可以導致通過孤雌生殖途徑進行無性繁殖,這可能使水稻雜交系能夠產生具備雜種優(yōu)勢的種子酥宴。這種策略可以改進并擴展到其他作物啦吧,在后代中,繼續(xù)保持雜交F1代中的高產量特征幅虑。合成生物學的最新進展也為植物基因組設計新的生物學功能提供了強大的工具(圖3C)丰滑。例如,將新的光呼吸旁路引入水稻葉綠體倒庵,或在玉米中過表達Rubisco大小亞基及其組裝伴侶RUBISCO裝配因子(RAF1)作為完整結構,均極大地提高了作物的光合效率和糧食產量炫刷。這一策略也已應用于提高作物的營養(yǎng)質量擎宝。例如,通過對類胡蘿卜素途徑進行復雜的工程改造浑玛,在番茄果實中產生了一種可再生的高價值色素“酮類胡蘿卜素”绍申。在另一項研究中,設計了一種新的代謝途徑并將其添加到水稻基因組中顾彰,使用包含8個花青素相關基因的重組載體极阅,最終,創(chuàng)制了具有花青素含量高并具有抗氧化活性的胚乳的水稻新種質涨享。合成生物學在作物害蟲防治方面也非常有效筋搏。在最近的一項工作中,通過利用煙草中的遺傳種群和多組學方法厕隧,從葉片中鑒定出一種對葉蟬害蟲具有抗性的揮發(fā)性化合物奔脐。解析這種化合物的生物合成途徑后俄周,設計了合成生物學方法來重建番茄和蠶豆中的化學物質以進行作物植保。此外髓迎,隨著對天然橡膠生物合成機制的了解峦朗,合成生物學可能會在改進或創(chuàng)造產橡膠植物方面發(fā)揮重要作用。這些展示了合成生物學在作物設計育種中創(chuàng)制特異模塊方面的潛在應用排龄。
展望
廣泛收集不同遺傳資源對作物遺傳改良具有重要意義波势。遺傳學研究表明,馴化相關等位基因也存在于野生種群中橄维,但頻率較低且分散在不同的種質中艰亮。馴化和現代育種都是通過尋找有益等位基因、富集多個目標等位基因加速進化的過程挣郭。野生資源以及適應當地環(huán)境的地方品種均具有豐富的遺傳多樣性迄埃,并且包含許多天然的、對作物栽培有益的等位基因兑障。目前侄非,世界各地的種質資源庫(通常稱為基因庫)中保存著數百萬種植物種質。正如大麥研究中證明的流译,基因庫基因組學勾勒出了未來利用這些種質的方向逞怨。隨著測序成本的不斷降低,幾乎可以對基因庫中的所有種質進行全基因組低覆蓋測序福澡,并對所有核心種質進行高質量的基因組測序叠赦。通過對植物遺傳資源進行系統(tǒng)的基因組數據分析、結合表型數據分析革砸,研究人員將能夠解析出適應氣候變化和環(huán)境挑戰(zhàn)的關鍵等位基因除秀。此外,由此產生的基因組-表型數據庫算利,以及數據和種子册踩,可以通過共享使用協議,在全球范圍內用于基因組設計育種效拭,共同解決全球糧食安全問題暂吉。植物馴化和育種有賴于通過染色體重組將來自不同種質的多個有利等位基因進行整合或者創(chuàng)制一個全新的基因組。盡管一般來說缎患,重組事件并不受控制慕的,但一些調節(jié)減數分裂交叉的基因可能具有提高交換數量的潛力。此外挤渔,表觀遺傳修飾有可能改變減數分裂交換的分布肮街。這些對于育種者來說是重要的發(fā)現,因為由于重組率低蚂蕴,著絲粒附近的有害突變很難去除低散。因此俯邓,控制重組的工具(增加重組數量、微調重組模式)以及其他廣泛使用的育種技術(例如基因組選擇熔号、單倍體誘導和快速育種)稽鞭,都將有助于提高作物改良的效率。人工智能(AI)正在成為作物遺傳研究和育種的強大工具引镊,用于精確表型分析和組學數據挖掘朦蕴。通過基因組設計或基因組編輯定制的新植物需要通過高通量方法進行篩選,以對目標性狀進行表型分析弟头。人工智能可用于在特定條件下有效選擇復雜吩抓、多變環(huán)境中數量巨大的育種群體。育種者使用無人機(UAV)和各種傳感器來捕捉田間作物的圖像赴恨,可以獲得海量的表型數據疹娶,以進行高效和全面的分類。除了用于表型分析伦连,隨著測序成本的不斷降低和大規(guī)模組學數據的爆炸式增長雨饺,現在可以使用深度學習來挖掘生物信息。現有深度學習模型的擴展為探索生物調控和DNA中解析生物遺傳密碼提供了一個平臺惑淳。未來额港,隨著人工智能的進一步發(fā)展,各種植物的組學數據將用于解析基因調控網絡歧焦,指導基因編輯移斩,加快植物育種步伐。長遠來看绢馍,要點就在于解決物種間基因資源互相隔離的局限性向瓷,并將不斷增加的新型分子模塊譜添加到目標作物中。例如痕貌,隨著對C4光合作用潛在分子機制的深入了解风罩,可以通過發(fā)現和重塑控制Kranz發(fā)育、形成及CO2濃縮相關的關鍵基因舵稠,使C3水稻或C3大豆重新馴化為C4植物(圖3C)。結合作物的另一個關鍵生物過程固氮模塊入宦,擁有超級作物的新時代可能從夢想變成現實哺徊。