原文來源:Arikit S , Xia R , Kakrana A , et al. An Atlas of Soybean Small RNAs Identifies Phased siRNAs from Hundreds of Coding Genes[J]. The Plant Cell Online, 2014, 26(12):4584-4601.
理解為產(chǎn)生phasiRNA的PHAS位點與編碼蛋白的基因區(qū)有重疊可能更準確铺韧。
侵刪
??小RNA是一類普遍存在的,多功能的抑制物,包括(1)microRNA(miRNA)石咬,由mRNA形成的莖環(huán)結(jié)構(gòu)加工而成; (2)小干擾RNA(siRNA)背捌,在植物中通常由需要依賴RNA的 RNA聚合酶的過程衍生豺型。我們構(gòu)建并分析了大豆小RNA的表達圖譜奋蔚,鑒定了超過500個產(chǎn)生21個核苷酸的phased siRNAs(phasiRNA;來自PHAS位點)的位點娘汞,其中483個與注釋的蛋白質(zhì)編碼基因有重疊。通過整合miRNA與RNA end(PARE)數(shù)據(jù)的分析先匪,檢測到127個PHAS位點上的20個miRNA靶標种吸。 PHAS位點的主要類別(208,占41%)與NB-LRR基因相對應呀非;這些小RNA中的一部分優(yōu)先在根瘤中積累坚俗。在PHAS位點中,還觀察到TAS3的新代表和非經(jīng)典相位模式岸裙。由miR4392觸發(fā)的非編碼PHAS位點優(yōu)先在花藥中積累猖败;預測phasiRNA靶向轉(zhuǎn)座因子,在大豆生殖發(fā)育中具有峰值豐度哥桥。因此辙浑,phasiRNA在雙子葉植物中顯示出巨大的多樣性。我們鑒定了新的miRNA并評估了miRBase中記錄的大豆miRNA的準確性拟糕,顯著改善了大豆miRNA注釋判呕,促進了miRBase注釋的改進并鑒定了高嚴謹性的新miRNA及其靶標。
文章做了些什么:
- 鑒定產(chǎn)生phasiRNA的位點送滞,并注釋(提供位置信息)
- 能識別PHAS區(qū)域的miRNA觸發(fā)物
- phasiRNA的靶基因
- 鑒定miRNA侠草,與已知數(shù)據(jù)庫比較看數(shù)據(jù)庫里的準不準,看能不能改正或是添加
- miRNA的靶基因
- 結(jié)合具體的生物學問題看看小RNA在什么條件下在哪些組織中高表達
介紹
??小非編碼RNA在發(fā)育犁嗅,細胞分化边涕,適應生物和非生物脅迫以及基因組穩(wěn)定性方面具有重要作用。小RNA的主要活性是通過靶標降解褂微,翻譯抑制或通過指導染色質(zhì)修飾來對特定mRNA或基因表達模式進行負調(diào)控功蜓。迄今已鑒定出幾種不同類型的小RNA。在植物中宠蚂,研究最多的小RNA是microRNA(miRNA)和小干擾RNA(siRNA);這些是由不同的前體和不同的途徑產(chǎn)生的式撼。通常長度為21至22個核苷酸的miRNA衍生自通過RNA聚合酶II從MIRNA基因轉(zhuǎn)錄的長非編碼RNA前體。miRNA前體形成由DICER-LIKE1(DCL1)或其他DCL酶(極少數(shù))加工的莖環(huán)結(jié)構(gòu)求厕,產(chǎn)生3’具有兩個核苷酸突出的單個小RNA雙鏈體(miRNA / miRNA *)著隆。小RNA雙鏈體的一條鏈是成熟miRNA扰楼,被稱為引導鏈,它會結(jié)合到Argonaute(AGO)蛋白上以形成效應復合物(所謂的用于RNA誘導的沉默復合物——RISC)美浦,其指導miRNA靶標降解或翻譯抑制弦赖。雙鏈體的另一條鏈,即miRNA *或passenger strand浦辨,迅速降解蹬竖,通常不會積累。 siRNA通常來自完全互補的長雙鏈RNA(dsRNA)前體流酬,這些前體一般由RNA依賴性的RNA聚合酶(RDR)形成案腺,也可能由退火了的正義/反義轉(zhuǎn)錄物形成。已經(jīng)在植物中定義了幾類siRNA康吵,主要類別是異染色質(zhì)siRNA,它在胞嘧啶甲基化和抑制性組蛋白修飾的建立和維持中起關(guān)鍵作用访递。 siRNA還能夠作為移動信號起作用晦嵌,通過siRNA的運動使沉默效應從細胞擴散到其它細胞或更長距離。
??科學家已經(jīng)鑒定了一類相當有趣的siRNA拷姿,它們是長雙鏈RNA前體以21個核苷酸為增量來逐步裂解的產(chǎn)物惭载,產(chǎn)生定相的或完全間隔排列的小RNA。這些siRNA响巢,即所謂的相位排列siRNA(phasiRNA)描滔,由特定的引導miRNA切割而產(chǎn)生,遵循單擊或雙擊模式踪古,分別對應一個22nt或兩個21nt的miRNA的靶位點含长。切割的未加帽的mRNA產(chǎn)物用作RDR6的底物,產(chǎn)生dsRNA前體伏穆,然后被DCL4切割以產(chǎn)生21-核苷酸的定相siRNA拘泞。一些定相siRNA已經(jīng)顯示在靶基因的反式調(diào)節(jié)中起作用;因此,這類siRNA最初被稱為tasiRNA枕扫,但是更多的基因位點產(chǎn)生具有未知反式作用的相同相位模式(PHAS基因座)的siRNA陪腌,因此一般用“phasiRNA”進行描述。tasiRNA通過對互補靶位點進行切割來調(diào)節(jié)mRNA烟瞧,這如同許多植物miRNA一樣诗鸭。最著名的tasiRNA是由TRANS-ACTING SIRNA GENE3(TAS3)產(chǎn)生的反式小干擾RNA-生長素響應因子(tasiARF)的集合。tasiARF在抑制生長素響應因子基因(ARF2参滴,ARF3 / ETTIN和ARF4)中起作用强岸。已經(jīng)在許多植物物種中鑒定出許多phasiRNA,包括擬南芥卵洗,水稻(Oryza sativa)和葡萄(Vitis vinifera)请唱。已知PHAS基因座的數(shù)量在物種之間差異很大弥咪,從野生稻(Oryza rufipogon)中的800多個到擬南芥中的不到30個。在豆科植物中十绑,分別在Medicago truncatula和大豆(Glycine max)中鑒定出114和41個PHAS基因座聚至。
??大豆在經(jīng)濟上是世界上最重要的豆類,它是蛋白質(zhì)和食用油的主要來源之一本橙。大豆的基因組序列現(xiàn)在可公開獲得扳躬。基因組序列與下一代測序技術(shù)產(chǎn)生的數(shù)據(jù)一起甚亭,使得能夠在全基因組范圍內(nèi)鑒定和定量小RNA贷币。迄今為止,已在大豆中鑒定出數(shù)百種miRNA亏狰。然而役纹,許多新注釋的miRNA及其靶標尚未得到很好的驗證,甚至注釋的miRNA也經(jīng)常在更強大的實驗數(shù)據(jù)后進行校正暇唾。PHAS基因座比miRNA的注釋更差促脉。與Medicago truncatula相比,在大豆中鑒定出的PHAS位點要少得多策州。憑借廣泛的小RNA數(shù)據(jù)和更高的測序深度瘸味,可以發(fā)現(xiàn)更多的PHAS。在這項研究中够挂,我們分析了從不同組織中創(chuàng)建的大量小RNA文庫旁仿,以構(gòu)建小RNA的表達圖譜并全面鑒定大豆中的PHAS基因座。我們證明大豆中的許多蛋白質(zhì)編碼基因是PHAS基因座孽糖。除了先前被鑒定為豆科植物PHAS基因座的NB-LRR之外枯冈,我們發(fā)現(xiàn)了數(shù)百種其他產(chǎn)生phasiRNA的蛋白質(zhì)編碼基因。我們整合了RNA末端(PARE)數(shù)據(jù)的并行分析梭姓,以確定這些PHAS基因座的miRNA觸發(fā)因子霜幼。從這些數(shù)據(jù)中,我們驗證了在miRBase(版本20)中記錄的大豆miRNA并且鑒定了新的miRNA誉尖,證明了許多先前報道的miRNA具有siRNA的特征罪既。基于表達分析铡恕,我們證明了phasiRNA以及已知和新發(fā)現(xiàn)的miRNA在不同組織和不同處理下的特異性表達琢感。
總結(jié)
- 第一段
- 小RNA的重要性及作用方式(降解,抑制探熔;根據(jù)和靶位點的結(jié)合緊密程度來分驹针,結(jié)合緊密直接降解,不太緊密就抑制/干擾/微調(diào))
- 植物中小RNA的分類诀艰,miRNA的發(fā)生和作用過程柬甥,異染色質(zhì)siRNA作用
- 第二段
- phasiRNA的形成過程饮六,命名原因,在物種中的含量
- 第三段
- 全基因組范圍內(nèi)搜索鑒定小RNA已成為可能
- 大豆中小RNA的研究現(xiàn)狀:沒有很好的驗證苛蒲,以及注釋差
- 這篇文章做了些什么卤橄,在上一個總結(jié)的基礎(chǔ)上,加上整合PARE數(shù)據(jù)確定PHAS基因的miRNA觸發(fā)位點臂外,差異表達分析
結(jié)果
大豆小RNA和PARE文庫的構(gòu)建和測序
我們從大豆的營養(yǎng)和生殖組織構(gòu)建并分析了
69
個小RNA文庫窟扑,包括花
,葉
和發(fā)育中的根瘤
漏健;此外嚎货,我們整合了種子和種皮
組織的公共數(shù)據(jù)。葉組織來源于充分澆水或干旱脅迫下的植物蔫浆,或使用模擬生物脅迫的處理(即鞭毛蛋白和幾丁質(zhì)處理)殖属。花組織的小RNA文庫由未開放的花瓦盛,開放的花忱辅,子房和花藥制備。在接種后10,15,20,25和30天從發(fā)育中的根瘤取樣制備根瘤的小RNA文庫谭溉。我們構(gòu)建的文庫(即,除了來自公開數(shù)據(jù)庫的種子相關(guān)數(shù)據(jù)之外的所有文庫)包括每個樣品的兩到三個生物學重復橡卤。
- 充分利用公共數(shù)據(jù)庫扮念,構(gòu)建文庫時明確什么實驗條件什么組織
保留了
18至34
個核苷酸范圍內(nèi)的小RNA reads,從所有文庫中總共得到1,967,153,698個reads碧库。去除與結(jié)構(gòu)RNA(主要是rRNA或tRNA一類的)相匹配的序列后柜与,保留了1,158,661,201個基因組匹配的reads(占總數(shù)的58.9%),相應的有138,436,684個獨特的序列(能匹配到基因組的reads的11.9%嵌灰,總reads數(shù)的7.0%)(我的理解是reads的種類)弄匕。將每個文庫中的序列豐度標準化為TP5M。在根瘤文庫中發(fā)現(xiàn)有最高比例的獨特序列(27.5%)沽瞭,而在葉片文庫中發(fā)現(xiàn)有最低比例(6.6%)迁匠,可能反映了葉片中sRNA復雜性的飽和度(也就是沒那么復雜,種類少)驹溃,因而其具有最高的reads豐度城丧。對reads長度分布的分析表明,不同長度的小RNA在不同組織中的比例不同(補充圖1)豌鹤。在幾乎所有組織中亡哄,21和24個核苷酸的總reads豐度比例高于其他長度的小RNA,并且在組內(nèi)重復和不同組織中一致布疙;一個例外是在葉組織中蚊惯,其中24核苷酸的reads的總豐度的比例大大降低(補充圖1A愿卸,1C,1E和1G)截型。后一種情況與擬南芥葉片不同趴荸,其中24核苷酸reads的豐度很高(補充圖2)。 在所有組織中24個核苷酸類reads中獨特reads的比例大于21個核苷酸類reads菠劝,可能反映出赊舶,這些通常是來自一系列基因組重復序列的異染色質(zhì)siRNA(補充圖1B,1E赶诊,1F和1H)笼平。如上所述,葉片文庫具有相對較少的獨特reads舔痪,其中最突出的類型(68%)是miRNA(補充圖2)寓调。在葉片文庫中,miRNA主要僅包含三種:miR398c锄码,miR3522變體和miR166a夺英,并且在這些序列中,miR398c占21個核苷酸小RNA的22.5%滋捶。葉片中相當多的21個核苷酸小RNA來自基因間區(qū)(19%)痛悯。這些基因間區(qū)內(nèi)的相關(guān)序列是最多樣化的,占獨特reads的69%重窟。在生殖組織中载萌,22個核苷酸的獨特reads的比例很高,并且與21個核苷酸的小RNA相當(補充圖1B)巡扇,而在根瘤和種子組織中扭仁,22個核苷酸獨特reads的占比高于21個核苷酸(補充圖1F)。所有匹配基因組的reads用于miRNA評估和定相基因座鑒定(見下文)厅翔。
- 這一段給了很多比例乖坠,每一個的意思,是怎么算的要清楚
- 在葉片文庫中刀闷,miRNA主要僅包含三種:miR398c熊泵,miR3522變體和miR166a —— 后面多注意一下這里的鑒定是怎么做到的
重新評估已注釋的miRNA
miRBase版本20(http://www.mirbase.org)可追溯至2013年11月,包含來自70多種植物的超過6000個MIRNA基因甸昏。在大豆中戈次,來自505種前體的554種成熟miRNA已經(jīng)被記錄。在miRBase中記錄的許多miRNA基于與其他物種中保守miRNA的相似性進行計算鑒定(基于序列保守性的預測鑒定)筒扒,一些通過小RNA文庫深度測序驗證了怯邪,很少一部分通過PARE數(shù)據(jù)(也稱為降解組數(shù)據(jù))驗證其功能。在沒有實驗驗證的情況下花墩,如PARE數(shù)據(jù)或cDNA末端的5’快速擴增(PARE data or 5’-rapid amplification of cDNA ends)悬秉,miRNA功能的預測結(jié)果可能比較模糊澄步。對水稻miRNA的分析表明,許多預測的miRNA是不典型的和泌,缺乏常規(guī)miRNA特征村缸,或者它們是像siRNA的miRNA(siRNA-like)而不是典型的miRNA。siRNA-like miRNA的特性包括小RNA是多樣的武氓,分布式的梯皿,低豐度的并且在生成它們的基因位點的兩條鏈上都能發(fā)現(xiàn)。使用小RNA深度測序數(shù)據(jù)結(jié)合PARE文庫對miRBase中注釋的水稻miRNA進行的分析極大地改善了典型miRNA的表征結(jié)果县恕。在我們的研究中东羹,使用迄今為止產(chǎn)生的最大的大豆小RNA數(shù)據(jù)集以及PARE數(shù)據(jù),使我們能夠評估m(xù)iRBase注釋的大豆miRNA(version 20)并發(fā)現(xiàn)新的miRNA忠烛。表征典型植物miRNA的標準基于Meyers等人属提,并且評估m(xù)iRNA的過程基本上如Jeong等人所述。在除去與大豆1.1版基因組無法比較的注釋miRNA后美尸,530個先前報道的miRNA被重新評估以將每個miRNA表征為(A)弱表達的miRNA冤议,其難以評估,但類似于異染色質(zhì)siRNA;(B)與siRNA高度相似且可能是siRNA;(C)一種略微符合(原文:marginally meets)嚴格定義的miRNA(可能包括新進化的miRNA);(D)符合明確定義的miRNA所有標準的典型miRNA(參見方法师坎;每個類的實例顯示在補充圖3中)恕酸。基于Meyers等人的miRNA家族標準,我們還通過與擬南芥的比較來評估大豆miRNA的保守性胯陋。在大豆和擬南芥之間產(chǎn)生231個保守的miRNA尸疆,在miRNA列表中相應地分配了名稱(補充數(shù)據(jù)集1B);這些miRNA明顯適合D類惶岭,即明確定義的miRNA。
- 可以基于序列保守性來預測鑒定miRNA
- 降解組數(shù)據(jù)驗證miRNA的功能犯眠,降解組測序是對什么進行測序按灶,mRNA嗎?
- 降解組測序(Degradome Sequencing)正是利用高通量測序技術(shù)結(jié)合生物信息學手段對這些mRNA降解片段進行大規(guī)模鑒定筐咧,進而鑒定miRNA調(diào)控靶基因的技術(shù)——miRNA的功能研究手段鸯旁。降解組測序原理
- siRNA-like miRNA的特點,也反映了siRNA的特點
- 530個先前報道的miRNA
- (A)弱表達的miRNA
- (B)與siRNA高度相似且可能是siRNA
- (C) 略微符合嚴格定義的miRNA(可能包括新進化的miRNA)
- (D)典型miRNA
- 基于Meyers等人的miRNA家族標準量蕊,通過與擬南芥的比較來評估大豆miRNA的保守性铺罢。具體怎么做的?
評估m(xù)iRNA并將基因座分類為上述類別的過程主要涉及三個標準残炮,包括它們的豐度韭赘,豐度比和鏈比。通過檢查與每個miRNA基因座匹配的兩個最豐富的小RNA(“top1 + top2”)的reads計數(shù)來計算豐度势就,對于真實的miRNA泉瞻,其通常代表miRNA雙鏈體的兩條鏈脉漏。總共530個miRNA的總豐度范圍從低至1 TP5M到最高豐度4410萬TP5M(miR166的兩個最豐富的序列變體)和3690萬TP5M(miR1507)袖牙。我們將191個miRNA前體指定為“弱表達”基因座侧巨;這些位點匹配reads的豐度<924 TP5M,低于保守miRNA基因座的95%(補充數(shù)據(jù)集1B)鞭达。對于第二個標準司忱,豐度比,我們檢查了兩個最豐富的小RNA(top1 + top2)和所有與每個miRNA基因座匹配的小RNA之間的豐度比畴蹭,而對于第三個標準坦仍,鏈的偏向性,每一個莖環(huán)結(jié)構(gòu)是這樣算的:有義鏈的小RNA序列的總豐度除以兩條鏈的總豐度撮胧。在保守的miRNA中桨踪,95%的豐度比為0.565或更高,而在非保守miRNA只有17.5%的豐度比為0.565或更高(補充數(shù)據(jù)集1B)芹啥。按照Jeong等人的做法锻离,我們將豐度比小于0.4的miRNA基因座定義為“siRNA-like”miRNA基因座,將比率在0.4和0.5之間的miRNA基因座指定為“marginal”miRNA基因座墓怀,與補充圖3中顯示的例子一致汽纠。95%的保守miRNA前體具有0.978或更高的鏈比,而只有23%(71/299)的非保守miRNA符合該值傀履。我們認為具有小于0.8鏈比的miRNA前體作為“siRNA-like”miRNA虱朵,具有0.8到0.9鏈比的miRNA前體作為“marginal miRNA”。綜合第二和第三標準钓账,我們能夠?qū)?12個miRNA分類為典型的miRNA碴犬,203個miRNA作為siRNA-like miRNA,15個miRNA作為marginal miRNA梆暮;312個miRNA包括從第一個標準(補充數(shù)據(jù)集1B)定義的191個弱表達的miRNA服协。“典型miRNA”類中的大多數(shù)miRNA長度為21和22個核苷酸啦粹,而“siRNA-like”類miRNA主要在已注釋的miRNA中偿荷,它們具有24個核苷酸大小(補充數(shù)據(jù)集1B)唠椭。后一組miRBase中有的 siRNA-like 跳纳,24核苷酸的miRNA可能被錯誤地注釋。
- 豐度:利用與每個miRNA基因座匹配的兩個最豐富的小RNA(“top1 + top2”)的reads計數(shù)來計算豐度
- 豐度比:兩個最豐富的小RNA(top1 + top2)和所有與每個miRNA基因座匹配的小RNA之間的豐度比
- 鏈的偏向性:每一個莖環(huán)結(jié)構(gòu)是這樣算的贪嫂,有義鏈的小RNA序列的總豐度除以兩條鏈的總豐度
- 191個miRNA前體被定義為“弱表達”基因座寺庄,因為豐度小
- 豐度比小于0.4的miRNA基因座定義為“siRNA-like”miRNA基因座,在0.4和0.5之間的miRNA基因座指定為“marginal”miRNA基因座
- 鏈比小于0.8的miRNA前體作為“siRNA-like”miRNA,鏈比在0.8到0.9之間的miRNA前體作為“marginal miRNA”
- 將312個miRNA分類為典型的miRNA(包括了191個弱表達的miRNA)铣揉,203個miRNA作為siRNA-like miRNA饶深,15個miRNA作為marginal miRNA
大豆中新miRNA和miRNA變體的鑒定
除了對先前報道的miRNA重新評估之外,我們還使用小RNA數(shù)據(jù)來鑒定新的miRNA并注釋miRNA變體逛拱。用于鑒定新miRNA的流程改編自Jeong等人(補充圖4)敌厘。在排除t / r / sn / snoRNA后使用124,526,477個不同的reads,對18至26個核苷酸之間的所有基因組匹配的reads進行過濾以獲得reads豐度朽合,包括那些至少在一個文庫中 >= 50 TP5M俱两。比對到大豆染色體中超過20個位置的reads也被丟棄,因為它們過于重復而不能成為miRNA曹步。在124,526,447個reads中宪彩,有29,133個序列通過第一個過濾條件,包括198個與已知miRNA匹配的序列讲婚。如Jeong等人所述尿孔,通過miREAP(https://sourceforge.net/projects / mireap)分析通過第一組過濾條件的候選前體〕雉铮總計獲得了對應4047個前體的2523個序列活合。在198個已報告的miRNA中,只有120個通過了第二個過濾條件物赶。然后使用第三個過濾條件來評估單鏈bias(有義/總的 >= 0.9)和豐度bias([top1 + top2] /總的>= 0.7)白指,為了保證一個前體僅產(chǎn)生一個或兩個最主要的miRNA〗妥希總共對應361個前體的180個小RNA序列通過該過濾條件告嘲,包括71個已知的miRNA。應用第四個過濾條件以鑒定高質(zhì)量的莖環(huán)結(jié)構(gòu)奖地,使用CentroidFold進行分析嘁酿。來自332個前體的共151個候選序列通過了此過濾條件肢专;來自上一步的所有71種已知miRNA也都通過了难审。在71種已知的miRNA中椒惨,與miRBase中記錄的miRNA相比盹憎,我們發(fā)現(xiàn)44種變體(補充圖4)二庵。在排除已知的miRNA后钳幅,將22個高可信度候選序列指定為新的miRNA(補充數(shù)據(jù)集1C)秉剑。還通過比較小RNA reads和miRBase(補充數(shù)據(jù)集1D)中記錄的那些來鑒定miRNA變體蜜氨。發(fā)現(xiàn)大約20個長度不等的序列械筛,和miRBase中記錄的miRNA相比較,包含不同的核苷酸替換飒炎。這些miRNA變體的長度在19至24個核苷酸之間變化埋哟,包括1至4個核苷酸的替換。還在先前報道的miRNA(補充數(shù)據(jù)集1D)的相同前體上從不同位置鑒定了10種新miRNA。因此赤赊,能夠從我們的數(shù)據(jù)集中鑒定出大量新的和已知的大豆miRNA闯狱。
重點是流程圖和過濾條件
大豆不同組織和不同處理中miRNA的豐度差異
對所有69個小RNA文庫中的新的和已知的miRNA及其變體進行豐度計數(shù)的差異評估。我們的數(shù)據(jù)的層次聚類揭示了許多miRNA表現(xiàn)出組織優(yōu)先積累抛计。我們選擇了三組miRNA進行更詳細的分析哄孤。第一組是顯示組織優(yōu)先水平的所有新型miRNA(圖1A)。在22種新型miRNA中吹截,6種僅在種子組織中觀察到瘦陈,包括gma-miR10196,gma-miR10195波俄,gma-miR10191晨逝,gma-miR10188,gma-miR10194和gma-miR9756(圖1A)懦铺。類似地捉貌,gma-miR10200富含于根瘤,gma-miR5030b富含于葉片冬念。這些新型miRNA中的一些富含于一種以上的組織中趁窃;即,gma-miR10201刘急,gma-miR10186棚菊,gma-miR10198,gma-miR10193和gma-miR9749在生殖組織和根瘤中富集(圖1A)叔汁。第二組是在生殖組織中高度富集的miRNA统求。該組包括gma-miR395c,gma-miR395d据块,gma-miR395g码邻,gma-miR169s,gma-miR156f和gma-miR4392(圖1B)另假。在花組織中優(yōu)先觀察到的miRNA中像屋,其中一些在花藥中顯示出高度富集,即gma-miR4392边篮,gma-miR393和gma-miR167e己莺。有趣的是,gma-miR4392在生殖組織中高度豐富戈轿,特別是在花藥中凌受,但在其他組織中幾乎不存在(圖1B,并在下面更詳細地分析)思杯。還存在優(yōu)先存在于生殖組織以及根瘤中的miRNA胜蛉,即miR172c,miR159b和miR395g(圖1B)。以組織優(yōu)先方式觀察到的最后一組miRNA包括在發(fā)育中的根瘤中強烈存在但在其他組織中少量存在的miRNA誊册。這些包括miR171b领突,miR171r,miR159f案怯,miR172d和miR43945p(圖1B)君旦。不適合我們的三組中的任何一組的是許多富含種子組織的miRNA,即gma-miR176e / f和gma-miR1512c殴泰。這些種子特異性miRNA在其原始研究中得到了很好的描述于宙。
探究了不同組織(或組織組合)中的miRNA富集差異。
一個家族中的miRNA在組織中差異累積悍汛;例如捞魁,包含22個成員的大型miR171家族顯示出多樣的富集模式(補充圖5)。一些在根瘤富集离咐,即gma-miR171s谱俭,gma-miR171r和gma-miR171b-3p,而其他的是富含于花和葉的宵蛀。來自單個前體的miRNA的加工變體也以不同方式累積昆著;變體gma-miR156c.2在子葉中高度富集,而gma-miR156c.1不存在(補充數(shù)據(jù)集1D)术陶。gma-miR156c在大多數(shù)或所有組織中凑懂,但優(yōu)先在種皮組織中表達。類似地梧宫,gma-miR3522.1優(yōu)先在種子組織和葉組織中鑒定接谨,而gma-miR3522僅在種子組織中以低水平存在(補充數(shù)據(jù)集1D)。
- 什么叫基因家族塘匣?如何定義一個基因家族脓豪?什么樣的序列才能被算作一個基因家族中的一個成員?
我們接下來發(fā)現(xiàn)了在應激處理中差異表達的miRNA忌卤。這是使用R軟件包baySeq完成的扫夜,條件需滿足似然值>=0.95,錯誤發(fā)現(xiàn)率<0.01驰徊。通過這些閾值笤闯,在兩種基因型(IA3023和LD003309)的水脅迫葉中沒有miRNA差異表達;然而棍厂,最接近的是gma-miR1446颗味,富含于干旱脅迫的葉子(補充數(shù)據(jù)集1E;圖1A)。我們發(fā)現(xiàn)9種miRNA在鞭毛處理的Dassel基因型中上調(diào)勋桶,可能模仿生物應激(補充數(shù)據(jù)集1E)脱衙,而我們無法鑒定由幾丁質(zhì)處理產(chǎn)生的任何差異表達的miRNA。在我們的文庫中例驹,比起不同的處理捐韩,在不同的組織中,差異miRNA富集的現(xiàn)象更明顯鹃锈。
圖1.新的和組織優(yōu)先miRNA的表達譜荤胁。
(A)在該研究中鑒定的新miRNA包括許多在特定組織或器官中差異富集的miRNA。
(B)對先前描述的大豆miRNA的分析還揭示了花屎债,葉和根瘤中一系列的組織bias仅政。
使用PARE文庫進行miRNA靶標驗證
使用PARE數(shù)據(jù)能夠快速且精確地進行miRNA指導的靶標降解的實驗驗證。我們從花盆驹,葉和根瘤組織構(gòu)建了PARE文庫圆丹,并利用種子的公共PARE數(shù)據(jù),包括超過6500萬個不同的reads(補充數(shù)據(jù)集1F)躯喇。在PARE驗證的miRBase注釋的大豆miRNA靶標中辫封,我們驗證了262個miRNA的392個靶標,其中大多數(shù)是典型的miRNA廉丽。其中倦微,261個與注釋為蛋白質(zhì)編碼基因重疊,其余在基因間區(qū)或未注釋的基因(補充數(shù)據(jù)集1G)正压。每個miRNA的靶標數(shù)量范圍從1到23欣福。在新miRNA和變體中,鑒定了8個新miRNA的9個靶標焦履,并鑒定了33個新miRNA變體的129個靶標拓劝。其中,新miRNA和新miRNA變體的8和86個靶標分別與注釋基因重疊裁良,其余定位于基因間區(qū)(補充數(shù)據(jù)集1H)凿将,其可以是未注釋的基因或非編碼轉(zhuǎn)錄物如TAS基因座。
- 降解組數(shù)據(jù)從生信角度如何分析价脾?
- 找出靶標之后牧抵,如何注釋(定位于基因區(qū),基因間區(qū))侨把?可以用Annovar嗎犀变?
全基因組范圍內(nèi)鑒定生成Phased siRNA的位點及其觸發(fā)物
產(chǎn)生相位排列siRNA的植物基因座,即所謂的PHAS基因座秋柄,包括蛋白質(zhì)編碼和非編碼轉(zhuǎn)錄物获枝;豆科植物M. truncatula富含這種基因座,在其他植物物種中這種基因座的數(shù)量不定骇笔。我們將所有69個小RNA文庫結(jié)合起來鑒定大豆PHAS基因座省店,隨后通過逆向計算評估其miRNA觸發(fā)物嚣崭。以phasing P value <= 0.001(嚴格閾值)(圖2A)為條件,鑒定了504個基因組上的PHAS基因座懦傍。其中雹舀,483(95.8%)與注釋的蛋白質(zhì)編碼基因有重疊。這些PHAS基因座的主要類別(208個粗俱,占41.0%)對應NB-LRR類基因说榆,其編碼79個Toll白細胞介素1受體(TIR)-NB-LRR,5個coiled-coil (CC)-NB-LRR寸认,和89個其他NB-LRR(圖2A)签财。這些phasi-NB-LRR(pNL)占大豆基因組中鑒定的所有NB-LRR的65%(208/319),包括Kang等人鑒定的那些偏塞,加上使用Greenphyl DB鑒定的另外35個phasi-NBLRR基因(補充數(shù)據(jù)集1I)唱蒸。大多數(shù)pNL基因座聚集在染色體3,6,13,15和16上,其含有30,21,15,14和40個pNL(圖2C)灸叼。 在不同pNL之間phasiRNA的水平不同油宜,一些在所有分析組織中顯示高水平的siRNA,但是其他phasiRNA在特定組織中累積怜姿,如根瘤(圖2B)慎冤。許多receptor-like kinase-encoding基因也產(chǎn)生phasiRNA,但這些只是大豆中已知的600個receptor-like kinase-encoding基因的一小部分(25個基因座)沧卢。在擬南芥中蚁堤,大多數(shù)編碼蛋白質(zhì)的PHAS基因是含有三角狀五肽重復區(qū)(PPR)的蛋白區(qū)域,但在大豆中我們發(fā)現(xiàn)僅有15個PPR編碼PHAS基因座但狭。幾種不同的轉(zhuǎn)錄因子家族占PHAS基因座的15%(圖2A)披诗,包括來自Aux / IAA和生長素響應因子家族的18個PHAS基因座(AUX-IAA-ARF),APETALA2中的10個PHAS基因座和乙烯 - 響應元件結(jié)合蛋白(AP2-EREBPs)基因家族立磁,以及來自編碼MYB / HD樣蛋白的基因的另外10個PHAS基因座(圖2A)呈队。參與小RNA生物發(fā)生的基因,即DCL(5個基因座)唱歧,SUPPRESSOR OF GENE SILENCING3(3個基因座)和AGO2(1個基因座)也是大豆PHAS基因座之一宪摧,表明可能發(fā)生反饋調(diào)節(jié)。最后颅崩,大量(126)的PHAS基因座與功能未知的基因重疊几于,其中許多是基因組中的單拷貝,表明順式而非反式活性(圖2A;補充數(shù)據(jù)集1I)沿后。由于我們這次的數(shù)據(jù)集更廣泛沿彭、更深入,504大豆PHAS基因座顯著大于且包括我們之前在大豆中鑒定的41個基因座尖滚。
與蛋白質(zhì)編碼基因不同喉刘,一組21個PHAS基因座預測是非編碼基因瞧柔。這包括6個TAS3-like的基因座和先前報道的未命名的TAS-like基因座。兩個TAS3基因座(TAS3a和TAS3b)高度富集(這里應該是指它們產(chǎn)生的phasiRNA吧)睦裳,并且與擬南芥非常相似非剃,而另外四個TAS3旁系同源物(TAS3c-f)在phasiRNA豐度,序列保守性或觸發(fā)物排列方面不同(圖3)推沸。除花組織外,TAS3c和TAS3d產(chǎn)生的phasiRNA很少(圖3A)券坞;TAS3a和TAS3b在大多數(shù)組織中穩(wěn)定積累鬓催,在根瘤發(fā)育的過程中具有豐富的含量(圖3A)。 TAS3e-和TAS3f-衍生的phasiRNA在根瘤中檢測不到(圖3A)恨锚。此外宇驾,我們還發(fā)現(xiàn)了非編碼PHAS基因座,其僅在花藥中產(chǎn)生phasiRNA猴伶,見下文课舍。
借助(結(jié)合了AGO蛋白的miRNA)的觸發(fā)物切割雙鏈靶標而產(chǎn)生phasiRNA,在這個過程中RDR6酶負責合成dsRNA他挎,這是DCL4酶加工成定相的21個核苷酸的sRNA的底物筝尾。為了鑒定PHAS基因座的miRNA觸發(fā)物,我們整合了大豆miRNA和PARE數(shù)據(jù)办桨。確定了127個PHAS基因座的20個miRNA觸發(fā)物筹淫,每個觸發(fā)物靶向1至20個基因座(補充數(shù)據(jù)集1I)。 3個miRNA觸發(fā)超過10個PHAS基因座呢撞,包括gma-miR167e(觸發(fā)10個PHAS基因座)损姜,gma-miR2109(11個基因座)和gma-miR1510b-3p(20個基因座);前者靶向ARF6和ARF8轉(zhuǎn)錄因子殊霞,后兩者主要觸發(fā)pNL摧阅。最后,我們觀察到:在擬南芥觸發(fā)phasiRNA發(fā)生的miRNA中觀察到的特征——前體具有不對稱凸起的莖環(huán)結(jié)構(gòu)绷蹲,在我們發(fā)現(xiàn)的許多miRNA觸發(fā)物中都沒有棒卷。
圖2.編碼蛋白質(zhì)的PHAS基因。
比起其他研究過的植物基因組祝钢,大豆基因組含有更多的編碼蛋白質(zhì)的產(chǎn)生phasiRNA的基因座娇跟。
(A)編碼PHAS基因座的類別和數(shù)量。
(B)NB-LRR家族中PHAS基因的表達譜和層次聚類太颤。
(C)大豆基因組中phasi-NB-LRR基因的分布和聚類苞俘。
TAS3的新基因座和相位模式
在植物中,許多定相基因座由one-hit的22個核苷酸的miRNA觸發(fā)龄章,在切割位點下游產(chǎn)生phasiRNA吃谣;對于我們鑒定的大豆中的定相基因座也是如此(補充數(shù)據(jù)集1I)乞封。TAS3基因座通常由miR390通過two-hit途徑在兩個位點結(jié)合觸發(fā),引發(fā)tasiARF產(chǎn)生岗憋。從所有六個大豆TAS3基因座產(chǎn)生保守的tasiARF:兩個由TAS3a / b [597D(+)和598D(+)]產(chǎn)生肃晚,并且僅一個(597D(+))來自TAS3c / d / e / f(圖3B)。在tasiARF GmTAS3c-597D(+)和GmTAS3d-597D(+)的第9和10位發(fā)現(xiàn)了單核苷酸變體(C-to-U)(圖3B)仔戈。6個大豆TAS3基因座中的4個关串,TAS3a / b / c / d,其靶位點與經(jīng)典的雙擊模型一致(圖3C)监徘;另外兩個晋修,TAS3e和f,都是非典型的凰盔。 TAS3e具有三個gma-miR390結(jié)合位點墓卦,基本上是three-hit基因座,中間位點被切割以啟動下游加工和598D(+)產(chǎn)生(圖3C)户敬。相對于擬南芥TAS3落剪,大豆TAS3e具有非經(jīng)典的定相方向,在21-核苷酸gma-miR390切割的位點的下游而不是上游尿庐。類似地忠怖,TAS3f中的定相是5’ miR390靶位點的下游,但gma-miR390結(jié)合位點的位置和數(shù)目是TAS3基因座的典型位點(圖3C)抄瑟。
我們的數(shù)據(jù)還表明tasiRNA可以在two-hit生物發(fā)生中起作用以觸發(fā)額外的secondary siRNA脑又。來自TAS3的tasiARF靶向并切割來自ARF3 / ETT和ARF4基因的轉(zhuǎn)錄物。在大豆中锐借,ARF3 / ETT(Glyma13g24240)和ARF4(Glyma12g07560)的轉(zhuǎn)錄本不僅被tasiARFs GmTAS3a,b 597D(+)和GmTAS3a,b 598D(+)切割问麸,而且ARF靶標也產(chǎn)生了phasiRNA(圖4A;補充圖7)。因此钞翔,兩種tasiARF都是phasiRNA觸發(fā)物严卖,如使用two-hit途徑從切割位點下游處理所證明的。更重要的是布轿,這表明siRNA還可以通過生物發(fā)生的two-hit機制起到phasiRNA觸發(fā)的作用(圖4B)哮笆。
圖3.大豆TAS3 TasiRNA的觸發(fā)物和加工機制。
(A)來自大豆基因組中存在的六個TAS3基因座中的tasiRNA的總和在花汰扭,葉稠肘,根瘤和種子組織中的富集模式。 TAS3a和TAS3b是相同的萝毛,因此不能單獨測量项阴。
(B)源自TAS3a / b / c / d / e / f的TasiARF。所有TAS3 598D(+)和597D(+)siRNA的驗證目標均在生長素響應因子(ARF)家族中笆包,與其相對良好的保守序列一致(數(shù)據(jù)未顯示)环揽。
(C)在大豆TAS3基因座處存在兩個或三個miR390靶位點略荡,并且相對于這些靶位點的定相方向表明在TAS3e和TAS3f處由21個核苷酸的miRNA觸發(fā)的siRNA的非典型加工方向。
圖4.由TasiARF觸發(fā)的ARF3 PHAS-Locus歉胶。
(A)大豆TAS3衍生的tasiARF在兩個相同的位點靶向ARF3汛兜,通過PARE驗證切割的59位點(下圖)和未觀察到切割的39位點。這種雙擊的tasiARF活性產(chǎn)生了定相siRNA(中圖)通今。 y軸是phasing “score”粥谬,其是定相顯著性的估計P值(參見方法)。較低的兩個圖像是我們的Web瀏覽器辫塌,顯示小RNA(中間)或PARE數(shù)據(jù)(下部)漏策,橙色虛線表示tasiARF切割位點。有色斑點是在y軸上顯示豐度的小RNA璃氢;淺藍色斑點表示21個核苷酸的sRNA,綠色表示22個核苷酸的sRNA狮辽,橙色表示24個核苷酸的sRNA一也,其他顏色對應其他sRNA大小。紅色框是帶注釋的外顯子(粉紅色是非翻譯區(qū)域)喉脖。紫色線表示重復區(qū)的k-mer頻數(shù)椰苟。
(B)來自圖A的數(shù)據(jù)表明two-hit的phasiRNA生物發(fā)生的級聯(lián)反應,其中21個核苷酸(nt)miR390觸發(fā)21個核苷酸的tasiARF生物發(fā)生树叽,并且通過two-hit機制舆蝴,tasiARF觸發(fā)來自ARF3和ARF4的額外二級siRNA的生成(參見補充圖7在線)。 ARF siRNA可以順式或反式起作用题诵。
圖5.源自Arogenate脫氫酶基因座的花藥中高度富集的PhasiRNA洁仗。
(A)涉及雄激素脫氫酶的生化途徑。
(B)來自雄激素脫氫酶相關(guān)基因座的phasiRNA產(chǎn)生的示意過程性锭。在左側(cè)赠潦,將形成發(fā)夾的基因片段加工成phasiRNA。
(C)來自不同組織中的兩種arogenate dehydrogenase PHAS基因的miRNA觸發(fā)物和phasiRNA的reads豐度水平(紅色條)和基因表達水平(綠色條)草冈,其被標準化為RP5M和RP25M她奥。
PhasiRNAs在不同組織和不同處理中的差異表達
方法
植物材料
為了獲得生殖組織,大豆(Glycine max)栽培品種Williams 82在16小時光照/ 8小時黑暗怎棱,25℃的溫室中培養(yǎng)哩俭。分別收集未開花、開花一天的花組織拳恋。從未開的花中解剖出花藥和子房組織凡资。為了獲得根瘤組織,在接種大豆根瘤菌USDA110菌株后10,15,20,25和30天收集發(fā)育中的根瘤谬运。為了獲得水脅迫下的樣品讳苦,將??近交系IA3023和LD00-3309播種于兩個盆中带膜,??一個作為對照,另一個脅迫處理鸳谜。植物生長至V1階段膝藕,并且所有盆2天灌溉一次至田間容量(1600mL水)。在V1階段咐扭,脅迫組不予以灌溉芭挽,并且對照盆被灌溉直到實驗結(jié)束。一旦處于脅迫下的植物的50%達到永久枯萎點(葉片水勢為-8 至 -10 bars)蝗肪,從對照和脅迫組中收集葉樣品袜爪。對于病原菌模擬處理,來自三個大豆品種Williams 82薛闪,Dassel和Vinton 81的葉樣??品用幾丁質(zhì)八聚體和水對照處理30分鐘辛馆。來自相同品種的葉樣品也用從細菌鞭毛蛋白22中保守22個氨基酸的肽和水處理30分鐘。在RNA提取之前豁延,立即將從所有組織收集的樣品在液氮中冷凍昙篙。
sRNA和PARE的RNA提取和測序
使用Concert Plant RNA Reagent(Invitrogen / Life Technologies)從植物材料中分離總RNA。使用TruSeq Small RNA樣品制備試劑盒(Illumina)構(gòu)建小RNA文庫诱咏。如前所述構(gòu)建PARE文庫(Zhai等苔可,2014)。文庫在Delaware Biotechnology Institute(Newark袋狞,DE)的Illumina HiSequation 2000上測序焚辅。
測序數(shù)據(jù)的計算分析
去除原始測序數(shù)據(jù)的接頭序列,然后使用Bowtie(Langmead等人苟鸯,2009)將其定位到大豆基因組(DOE-JGI Community Sequencing Program v1.1)同蜻。與大豆基因組完全匹配的reads(不包括那些匹配的tRNA,rRNA早处,snRNA和snoRNA)用于進一步研究埃仪。從miRBase(版本20; http://www.mirbase.org/)檢索大豆成熟miRNA及其前體。
如何確定有沒有匹配到tRNA陕赃,rRNA卵蛉,snRNA和snoRNA?
miRNA預測流程
miRNA預測流程在補充圖4中概述么库。該過程中的各個步驟使用Perl腳本(Jeong等傻丝,2011)與miREAP結(jié)合進行(https://sourceforge.net/projects/mireap/)和CentroidFold (Sato et al., 2009)。miREAP用于評估m(xù)iRNA和miRNA *的配對诉儒,其參數(shù)設(shè)置為允許miRNA和miRNA *(-d 400)之間的最大距離為400個核苷酸葡缰,在前體末端延伸25個核苷酸(-f 25),關(guān)閉針對動物miRNA優(yōu)化的過濾設(shè)置,包括對植物miRNA特征的微調(diào)(我們的miREAP修改版可根據(jù)要求使用)泛释。此外滤愕,還要求兩個miRNA特征:基于保守miRNA的特征,單鏈偏向性>=0.9怜校,豐度偏向性>=0.7间影。
CentroidFold
按照默認設(shè)置使用,來顯示整個miRNA前體結(jié)構(gòu)茄茁,以進行手動評估魂贬。
miRNA靶基因預測和PARE驗證
394個microRNA的全基因組靶基因被鑒定和驗證;這涵蓋了312個典型的miRNA,15個marginal miRNA裙顽,44個新的miRNA變體和23個新的miRNA付燥。使用
sPARTA
包進行驗證(Kakrana等,2015)愈犹。使用sPARTA的內(nèi)置目標預測模塊miRferno進行目標預測键科,其具有標準評分方案,分數(shù)閾值為<=7漩怎,隨后是基于PARE的預測目標驗證勋颖。以校正P值<=0.05并且在切割位點具有PARE reads豐度>=5為過濾條件,經(jīng)驗證的miRNA-靶基因相互作用被用于進一步解釋扬卷。
定相分析
將sRNA reads比對到大豆基因組后牙言,用匹配的坐標表示單個sRNA酸钦。由于在sRNA雙鏈的3’端存在兩個核苷酸的突出怪得,因此與反義鏈匹配的sRNA添加了兩個核苷酸的正偏移。使用9個循環(huán)的滑動窗口(189 bp)進行全基因組搜索卑硫,每次切換為3個循環(huán)(63 bp)徒恋,當至少10個不同的reads落入9循環(huán)的窗口,至少50%匹配的特異reads長度為21個核苷酸欢伏,并且至少3個特異reads落入某個寄存器入挣,此時報告窗口。接下來報告的具有重疊區(qū)域的窗口被組合成單個較長窗口硝拧。然后径筏,使用Xia等人的算法,基于比對結(jié)果計算每個窗口的P值障陶。對于相位P值<=0.001的基因座還需最終檢查滋恬。繪制來自每個基因座的小RNA的P值和豐度并且肉眼檢查以去除假陽性,例如具有許多低豐度峰的miRNA基因座可能錯誤地通過我們的過濾器抱究。手動除去未注釋的tRNA和類似rRNA的基因座恢氯。
miRNA的差異豐度分析
基于reads的豐度數(shù)據(jù),使用Bioconductor的R軟件包“
baySeq
”( Hardcastle and Kelly, 2010 ),對水脅迫和病原體模擬處理的樣品進行成對(即對照與脅迫處理)的差異表達分析勋拟。>=0.95估計后驗似然概率的聚集至顯著不同水平的miRNA被鑒定出來勋磕。
數(shù)據(jù)獲取
將大豆小RNA和PARE測序數(shù)據(jù)提交給NCBI Gene Expression Omnibus,編號GSE58779敢靡。
參考
降解組測序:http://www.ebiotrade.com/custom/LC_BIO/100427/index.htm