Liu, J.; Wang, H.; Fan, X.; Zhang, Y.; Sun, L.; Liu, C.; Fang, Z.; Zhou, J.; Peng, H.; Jiang, J. Establishment and application of a Multiple nucleotide polymorphism molecular identification system for grape cultivars. Sci. Hortic. (Amsterdam). 2024, 325, 112642, doi:10.1016/j.scienta.2023.112642.
摘要
葡萄(Vitis L)是中國(guó)最重要和最受歡迎的水果之一崖堤。然而,葡萄的有效鑒定對(duì)國(guó)產(chǎn)葡萄的保護(hù)和育種者的權(quán)利非常重要。在此窿冯,我們開發(fā)了一種稱為多核苷酸多態(tài)性(MNP)的新方法示血,它結(jié)合了多重 PCR 擴(kuò)增和高通量測(cè)序的優(yōu)點(diǎn)间学,提高了葡萄品種鑒定的效率囱皿。我們根據(jù) 31 個(gè)代表性栽培品種的全基因組測(cè)序數(shù)據(jù)荆姆,確定了 582 個(gè)通用 MNP 標(biāo)記并對(duì)其進(jìn)行了篩選蔼囊。隨后焚志,利用多重 PCR 擴(kuò)增和測(cè)序技術(shù)構(gòu)建了 60 個(gè)常見栽培品種的 MNP 文庫(kù)衣迷。對(duì) 60 種葡萄材料進(jìn)行配對(duì)比較后發(fā)現(xiàn),MNP 標(biāo)記的識(shí)別率很高(大于 99%)酱酬。此外壶谒,MNP 還能準(zhǔn)確區(qū)分二倍體和多倍體,有助于葡萄的分子鑒定膳沽『共耍總之,MNP 分子鑒定技術(shù)為葡萄品種鑒定提供了一條新途徑挑社。與 SNP 相比陨界,MNP 無(wú)需制作昂貴的基因芯片,從而降低了鑒定成本痛阻。此外普碎,MNP 可以在一個(gè)試管中完成數(shù)千個(gè)引物的擴(kuò)增,并用測(cè)序代替聚丙烯酰胺凝膠電泳录平,與 SSR 相比大大節(jié)省了實(shí)驗(yàn)耗材和人力麻车。綜合來(lái)看,所開發(fā)的技術(shù)具有成本低斗这、效率高的優(yōu)點(diǎn)动猬,與目前其他鑒定方法相比更具競(jìng)爭(zhēng)力。該技術(shù)有助于資源研究表箭,促進(jìn)植物育種赁咙。
1. 1. 引言
葡萄(Vitis vinifera L,葡萄科)是一種多年生藤本植物免钻,原產(chǎn)于西亞和高加索地區(qū)的馴化中心(Dong 等彼水,2023 年)。葡萄于公元前 2 世紀(jì)晚期傳入中國(guó)极舔,至今已有兩千多年的栽培歷史凤覆。由于自然雜交、常規(guī)雜交拆魏、種苗選擇盯桦、芽變選擇等原因,葡萄的遺傳多樣性不斷豐富渤刃,在長(zhǎng)期的繁殖和栽培過(guò)程中積累了多種變異資源(Wang 等拥峦,2023 年)。隨著葡萄品種的多樣化卖子、栽培面積的擴(kuò)大以及葡萄入選品種間的頻繁交流(Emanuelli et al略号,2013),葡萄品種的鑒定、分類和命名已成為葡萄產(chǎn)業(yè)中的一個(gè)重要問(wèn)題玄柠。這也給葡萄種質(zhì)資源的收集氛琢、保存和創(chuàng)新帶來(lái)了不便。此外随闪,市場(chǎng)混亂等情況也會(huì)對(duì)育種者的權(quán)益造成負(fù)面影響阳似。在研究的早期階段,人們通過(guò)形態(tài)特征來(lái)評(píng)估葡萄種質(zhì)資源的遺傳多樣性铐伴。然而撮奏,這種方法耗時(shí)長(zhǎng)、難度大当宴,而且其效率受到環(huán)境條件和人為因素的影響畜吊。然而,隨著高通量測(cè)序和分子生物學(xué)技術(shù)的快速發(fā)展以及全基因組序列數(shù)據(jù)的可用性(Jaillon 等人户矢,2007 年玲献;Velasco 等人,2007 年)梯浪,人們發(fā)現(xiàn)了多種基于 DNA 的分子標(biāo)記技術(shù)用于葡萄品種鑒定捌年。DNA 分子標(biāo)記技術(shù),尤其是簡(jiǎn)單序列重復(fù)(SSR)和單核苷酸多態(tài)性(SNP)標(biāo)記挂洛,具有周期短礼预、對(duì)環(huán)境影響小等優(yōu)點(diǎn),為葡萄品種鑒定提供了一種有效的方法虏劲。例如托酸,由于 SSR 標(biāo)記具有共顯性和高多態(tài)性的優(yōu)點(diǎn),被廣泛應(yīng)用于葡萄種質(zhì)資源的遺傳多樣性分析柒巫。1996 年励堡,研究人員利用 4 個(gè) SSR 標(biāo)記區(qū)分了 77 個(gè)葡萄品種(Bowers 等人,1996 年)堡掏。目前应结,已開發(fā)出一套 30 個(gè) SSR 標(biāo)記系統(tǒng),用于識(shí)別葡萄品種布疼,構(gòu)建 DNA 指紋數(shù)據(jù)庫(kù)摊趾,分析 314 個(gè)葡萄品種的遺傳多樣性(Wang 等币狠,2020 年)游两。然而,由于 SSR 標(biāo)記數(shù)量有限漩绵、檢測(cè)通量小贱案、數(shù)據(jù)讀取困難等原因,在更大范圍內(nèi)對(duì)葡萄品種的鑒定受到限制。Dong等(2010)發(fā)現(xiàn)了9對(duì)SNP引物宝踪,成功區(qū)分了16個(gè)葡萄品種侨糟,表明SNP標(biāo)記在葡萄品種鑒定和遺傳多樣性分析中的高效性。最近瘩燥,Wang 等(2022 年)鑒定了 22 個(gè)高質(zhì)量的等位基因特異性 PCR(KASP)標(biāo)記秕重,識(shí)別了 60 個(gè)葡萄 SNP 位點(diǎn),構(gòu)建了中國(guó) 76 個(gè)主要栽培葡萄品種的 SNP 指紋厉膀。然而溶耘,SNP 標(biāo)記使用的基因芯片復(fù)雜且成本高昂。
然而服鹅,葡萄基因組測(cè)序技術(shù)的出現(xiàn)為葡萄分子育種研究帶來(lái)了革命性的變化凳兵,包括探索葡萄種群的遺傳變異、鑒定重要性狀位點(diǎn)企软、研究遺傳關(guān)系和進(jìn)化(Myles et al, 2011)庐扫。植物品種鑒定--MNP 標(biāo)記法(GB/T 38,551-2020)是 2020 年 10 月 1 日實(shí)施的中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn),隸屬于中國(guó)標(biāo)準(zhǔn)化研究院仗哨。多核苷酸多態(tài)性(MNP)是由基因組 300 bp 范圍內(nèi)的多個(gè)核苷酸組成的標(biāo)記形庭。MNP 利用多重 PCR 和新一代測(cè)序技術(shù)擴(kuò)增和檢測(cè)樣品基因組上的 MNP 標(biāo)記位點(diǎn),分析檢測(cè)數(shù)據(jù)厌漂,確定標(biāo)記位點(diǎn)碘勉。與 KASP 技術(shù)相比,MNP 的開發(fā)過(guò)程大大簡(jiǎn)化桩卵,不需要兩輪標(biāo)記檢測(cè)验靡。同時(shí),聚合酶鏈反應(yīng)(PCR)和樣品多重分析的通量也大大提高雏节。使用 MNP 技術(shù)的單管 PCR 反應(yīng)系統(tǒng)可實(shí)現(xiàn)數(shù)千次高度均勻的 PCR 反應(yīng)胜嗓。MNP 分析可從 5 到 2000 個(gè)擴(kuò)增子中鑒定出 5 到 10,000 個(gè)標(biāo)記,大大降低了單個(gè)標(biāo)記的分析成本(Xu 等钩乍,2020 年)辞州。這種高度復(fù)用的 PCR 提高了標(biāo)記檢測(cè)的效率,降低了檢測(cè)成本寥粹。目前变过,MNP 技術(shù)已被開發(fā)并應(yīng)用于多種作物,如玉米(Guo 等涝涤,2019 年)媚狰、西蘭花(Shen 等,2021 年)和黃瓜(Zhang 等阔拳,2020 年)崭孤。此外,利用 179 個(gè) MNP 作為通用標(biāo)記,構(gòu)建了一個(gè) MNP 鑒定系統(tǒng)辨宠,用于鑒定金針菇品種遗锣,并建立了 232 個(gè)栽培和野生菌株的鄰接系統(tǒng)發(fā)育樹(Liu 等,2023 年)嗤形。此外精偿,MNP 技術(shù)不僅可用于品種鑒定,還可廣泛應(yīng)用于多年生作物育種項(xiàng)目赋兵,以加速品種開發(fā)(Yang 等还最,2016 年)。
盡管 MNP 的適用性取得了進(jìn)展毡惜,但尚未有關(guān)于葡萄的研究報(bào)道拓轻。本研究基于31個(gè)代表性品種的全基因組重測(cè)序數(shù)據(jù),開發(fā)了一套葡萄通用MNP標(biāo)記经伙,構(gòu)建了主要葡萄品種的MNP指紋圖譜扶叉,為鑒定葡萄品種提供技術(shù)支持。
2. 材料與方法
2.1. 植物材料
試驗(yàn)材料于 2022 年 6 月采集于中國(guó)農(nóng)業(yè)科學(xué)院鄭州果樹研究所國(guó)家果樹良種鄭州葡萄園帕膜。為進(jìn)行 MNP 標(biāo)記初篩枣氧,采用了 31 個(gè)不同品種、不同倍性垮刹、不同用途的代表性葡萄栽培品種(補(bǔ)充表 1达吞;代碼 1-31)。
2.2.DNA提取和全基因組測(cè)序
使用CTAB法從新鮮葡萄葉中提取基因組DNA(Doyle荒典,1987)酪劫。使用納米液滴對(duì)提取的DNA進(jìn)行定量,并使用1.0%瓊脂糖凝膠電泳驗(yàn)證其完整性寺董。使用NexteraXT試劑(Illumina)制備全基因組測(cè)序文庫(kù)覆糟。然后使用Novogene的Illumina Novoseq平臺(tái)按照制造商的說(shuō)明對(duì)DNA樣品進(jìn)行測(cè)序。
2.3.測(cè)序數(shù)據(jù)的處理
Soapnuke軟件用于去除具有測(cè)序接頭遮咖、低質(zhì)量和N堿基比率>1%的讀數(shù)滩字;獲得了高質(zhì)量的干凈數(shù)據(jù),用于后續(xù)的比對(duì)分析(Chen等人御吞,2018)麦箍。短序列比對(duì)軟件BWA(0.7.15)的“mem”算法和比對(duì)參數(shù)“-t5-k 30-M-R”用于將過(guò)濾的干凈數(shù)據(jù)與葡萄參考基因組進(jìn)行比對(duì)(GCA_000003745.2_12X;Li和Durbin陶珠,2010)挟裂。生成比較結(jié)果文件(BAM文件),然后使用Picard(1.54)軟件的SortSam.jar工具將BAM文件轉(zhuǎn)換為sortbam文件(Danecek等人背率,2021)话瞧。通過(guò)SAMtools軟件將比較結(jié)果轉(zhuǎn)換為SAM格式嫩与。Picard(1.54)軟件的MergeSamFiles.jar工具用于合并同一樣本的不同庫(kù)/通道的比較文件寝姿。使用Picard(1.54)軟件的MarkDuplicates.jar工具標(biāo)記文庫(kù)制備過(guò)程中PCR擴(kuò)增產(chǎn)生的重復(fù)品交排。隨后,使用GATK(3.7)軟件的RealignerTargetCreator和IndelRealigner工具(De Summa等人饵筑,2017)對(duì)Indel附近的序列進(jìn)行重新比較和校正埃篓,以提高Indel周圍SNP基因座的準(zhǔn)確性。對(duì)處理后的BAM文件進(jìn)一步進(jìn)行突變檢測(cè)根资。
2.4.葡萄球菌MNP標(biāo)記物的篩選和引物設(shè)計(jì)
基于前期收集的SNP信息(Wang et al.架专,2022),在全基因組中篩選MNP標(biāo)記位點(diǎn)玄帕。首先部脚,使用Bowite 2,使用默認(rèn)比較參數(shù)裤纹,將31個(gè)代表性葡萄菌株的全基因組數(shù)據(jù)與葡萄的參考基因組進(jìn)行比較:GCA_00000374.5.2_12X_genomic.fna.gz委刘。之后,使用SAMtools對(duì)結(jié)果進(jìn)行排序鹰椒,并以BAM格式保存——“-@6-m 2G”參數(shù)用于設(shè)置六個(gè)線程進(jìn)行排序锡移,以及2GB的內(nèi)存。使用帶有默認(rèn)參數(shù)的samtools-mpile軟件來(lái)識(shí)別所有SNP位點(diǎn)漆际。隨后淆珊,使用滑動(dòng)窗口法在整個(gè)基因組中搜索候選標(biāo)記位點(diǎn)——選擇125bp的基因組區(qū)域,對(duì)該區(qū)域中的SNPs進(jìn)行計(jì)數(shù)奸汇,并使用以下方程確定該區(qū)域中31個(gè)葡萄的判別力(DP)施符;
DP = n/N
其中,"n "是成對(duì)比較所有材料時(shí)可區(qū)分的樣本對(duì)數(shù)擂找,"N "是比較的樣本對(duì)總數(shù)操刀。
如果該區(qū)域包含 3 個(gè)以上 SNP 位點(diǎn),且區(qū)分度大于 0.2婴洼,則該區(qū)域被視為候選 MNP 標(biāo)記位點(diǎn)骨坑。然后,向前滑動(dòng) 20 bp柬采,重新計(jì)算上述指標(biāo)欢唾。對(duì)得到的所有候選 MNP 標(biāo)記位點(diǎn)進(jìn)行物種特異性檢驗(yàn),保留物種特異性最好的位點(diǎn)作為最終的葡萄 MNP 標(biāo)記位點(diǎn)粉捻。
2.5. 統(tǒng)計(jì)數(shù)據(jù)分析
2.5.1. MNP 遺傳多樣性分析 根據(jù) MNP 基因型數(shù)據(jù)計(jì)算各種遺傳多樣性參數(shù)礁遣,如
MNP 基因型數(shù)據(jù)計(jì)算出各種遺傳多樣性參數(shù),如小等位基因頻率 (MAF)肩刃、觀察到的雜合度 (Ho) 和多態(tài)信息含量 (PIC)祟霍。所有這些計(jì)算均在 Excel 2016 中使用以下公式進(jìn)行:
其中杏头,Pi 和 Pj 分別為第 i 和第 j 個(gè)等位基因的群體頻率。
基因型之間的遺傳距離用 TASSEL 5.0(Bradbury et al, 2007)中基因型的平均核苷酸差值來(lái)評(píng)估沸呐。
2.5.2. 全基因組重測(cè)序數(shù)據(jù)分析方法
根據(jù)全基因組重測(cè)序數(shù)據(jù)醇王,將獲得的數(shù)據(jù)與參考基因組進(jìn)行比較。使用 RectChr 軟件將獲得的 vcf 文件與測(cè)序樣本進(jìn)行比較崭添,分析 31 個(gè)代表性登錄樣本之間的遺傳差異寓娩。使用 vcftools-vcf 命令對(duì) vcf 文件進(jìn)行合并和過(guò)濾,以便進(jìn)行后續(xù)分析呼渣。使用 gcta_1.93.2beta 軟件(Yang et al, 2011)進(jìn)行主成分分析(PCA)棘伴。結(jié)構(gòu)分析使用 admixture_linux-1.3.0 軟件(Alexander 等,2009 年)進(jìn)行屁置。系統(tǒng)發(fā)生樹使用 FastTree(2.1.11焊夸,-gtr)軟件進(jìn)行分析。為了實(shí)現(xiàn)循環(huán)可視化蓝角,使用了 R 軟件(R 版本 4.1.1)中的 "circlize "軟件包(circlize 版本 0.4.15)阱穗。根據(jù)重測(cè)序數(shù)據(jù)以及樣本倍性和物種,使用 PowerMarker V3.25 和 Figtree v1.4.4 軟件繪制了 31 個(gè)代表性葡萄品種的聚類圖帅容。
3. 結(jié)果
3.1. 582 個(gè) MNP 標(biāo)記的遺傳信息
選擇 MNP 位點(diǎn)的目的是實(shí)現(xiàn)每個(gè)位點(diǎn)的高變異性颇象,以便從每個(gè) MNP 擴(kuò)增出多個(gè) SNP。所設(shè)計(jì)的 MNP 面板中實(shí)際可實(shí)現(xiàn)的 MNP 數(shù)量取決于測(cè)序深度并徘,該深度可覆蓋一定數(shù)量的設(shè)計(jì) MNP(Guo 等遣钳,2021 年)。本研究利用 MNP 技術(shù)對(duì) 31 個(gè)葡萄品種進(jìn)行了基因分型麦乞,共成功分型 582 個(gè) MNP 標(biāo)記蕴茴,包括 6078 bp 突變位點(diǎn)(圖 1A)。分析表明姐直,葡萄是雜合性很高的品種倦淀,夏黑及其早芽突變品種的遺傳背景相似。篩選出的 582 個(gè) MNP 標(biāo)記覆蓋了整個(gè)基因組声畏,發(fā)現(xiàn)它們均勻地分布在 19 條染色體上(圖 1B撞叽;補(bǔ)充表 2)。每個(gè) MNP 標(biāo)記包含 2-10 個(gè) SNP 位點(diǎn)插龄。
每個(gè) MNP 標(biāo)記的等位基因數(shù)從 1 到 20 不等愿棋。在 582 個(gè) MNP 標(biāo)記中,494 個(gè)標(biāo)記的區(qū)分度超過(guò) 80%均牢。此外糠雨,利用這 582 個(gè) MNP 標(biāo)記對(duì)同一品種的不同分生株上提取的 31 個(gè)代表性品種進(jìn)行 DNA 擴(kuò)增,結(jié)果一致徘跪,表明所鑒定的 MNP 標(biāo)記具有較高的重復(fù)性和穩(wěn)定性甘邀。