批量測(cè)序?qū)嶒?yàn)(單組學(xué)和多組學(xué))對(duì)于探索廣泛的生物學(xué)問題至關(guān)重要赘方。為了促進(jìn)交互式、探索性任務(wù)以及共享易于訪問的信息,《Briefings in Bioinformatics》發(fā)表了一個(gè)集成了最先進(jìn)方法的工具包:bulkAnalyseR,可以處理不同的模式數(shù)據(jù)(轉(zhuǎn)錄、表觀则果、時(shí)空等),促進(jìn)順式漩氨,反式和定制調(diào)控網(wǎng)絡(luò)的強(qiáng)大集成和比較西壮。
bulkAnalyseR是什么?
bulkAnalyseR 提供了一個(gè)可訪問叫惊、靈活的端到端框架茸时,用于分析批量測(cè)序數(shù)據(jù)集,而無需依賴先前的編程專業(yè)知識(shí)赋访。它用兩行代碼生成一個(gè)可共享的 Shiny 應(yīng)用程序可都;所有生成的圖表和表格都可以單獨(dú)下載,并且可以輕松復(fù)制用于生成輸出的底層代碼蚓耽。
與其他公開工具相比渠牲,bulkAnalyseR是唯一一款提供多種分析的產(chǎn)品,同時(shí)還允許通過交互式參數(shù)調(diào)整對(duì)每個(gè)組件進(jìn)行靈活定制步悠。
bulkAnalyseR的功能及應(yīng)用示例
bulkAnalyseR使用表達(dá)式矩陣作為起點(diǎn)签杈,交互式panels分析并展示了質(zhì)量檢查、差異表達(dá)分析(帶有噪聲檢測(cè))和生物學(xué)解釋(富集分析、表達(dá)模式的識(shí)別答姥,然后是調(diào)節(jié)相互作用的推理和比較)铣除。
1)輸入和預(yù)處理:bulkAnalyseR的輸入是表達(dá)式矩陣和元數(shù)據(jù)表。接下來鹦付,generateHinyApp檢查輸入和表達(dá)式矩陣的兼容性(默認(rèn)情況下為去噪尚粘、標(biāo)準(zhǔn)化),并創(chuàng)建一個(gè)Shiny應(yīng)用程序敲长。
2)DE的交互式可視化:單組學(xué)實(shí)例包含幾個(gè)選項(xiàng)卡郎嫁,包括QC選項(xiàng)卡、DE選項(xiàng)卡和富集選項(xiàng)卡等祈噪。
3)基因調(diào)控網(wǎng)絡(luò)的可視化:通過使用GENIE3推斷調(diào)控互動(dòng)網(wǎng)絡(luò)(GRN選項(xiàng)卡)泽铛,數(shù)據(jù)探索繼續(xù)進(jìn)行。
bulkAnalyseR在數(shù)據(jù)輸入方面是通用的辑鲤。該流程可以涵蓋各種治療組盔腔、組織類型、時(shí)間點(diǎn)和空間信息等多種情況月褥。上圖用時(shí)空組數(shù)據(jù)集展示了其靈活性:圖 A-F 中弛随,開發(fā)團(tuán)隊(duì)對(duì)比了在可變數(shù)量的時(shí)間點(diǎn)上獲得的輸出的解釋,并說明了 bulkAnalyseR 管道總結(jié)模式的能力吓坚;圖G-I將 bulkAnalyseR 管道應(yīng)用于來自 10x Visium 數(shù)據(jù)集的五個(gè)不同皮質(zhì)層的幾個(gè)點(diǎn)。與之前的案例研究類似灯荧,通過空間捕獲轉(zhuǎn)錄組變化和模式礁击,使用戶能夠查詢感興趣的基因并通過層和區(qū)域可視化表達(dá)。?
還可以使用bulkAnalyseR處理其他可以在表達(dá)矩陣中匯總的測(cè)序數(shù)據(jù)集逗载,開發(fā)團(tuán)隊(duì)還在表觀哆窿、microRNA數(shù)據(jù)集上進(jìn)行了測(cè)試。
bulkAnalyseR還允許集成多種模式來推斷調(diào)節(jié)相互作用(即順式厉斟、反式和用戶定義)挚躯。“順式相互作用”需要兩個(gè)輸入,包括位于基因組學(xué)附近元素的焦點(diǎn)和非焦點(diǎn)模式用于增強(qiáng)焦點(diǎn)GRN?擦秽。對(duì)于“反式交互”码荔,兩個(gè)輸入進(jìn)行完整/早期集成,即具有相同列/條件的兩個(gè)表達(dá)式矩陣被連接起來感挥。GRN是在組合表達(dá)式矩陣上推斷出來的缩搅;節(jié)點(diǎn)根據(jù)元素的原始來源進(jìn)行著色。用戶還可以嵌入自己的定制交互触幼,以表格形式提供硼瓣。
bulkAnalyseR 的目的是增強(qiáng)單組學(xué)和多組學(xué)數(shù)據(jù)的交互式訪問;此外置谦,與社區(qū)共享穩(wěn)定的分析實(shí)例的能力可能簡(jiǎn)化研究小組之間的溝通堂鲤,并產(chǎn)生超出數(shù)據(jù)集最初目的的新假設(shè)亿傅。此外,端到端方法中所有步驟的無縫集成瘟栖,從早期的質(zhì)量控制檢查到可發(fā)布的數(shù)據(jù)葵擎,有助于在分析的整個(gè)生命周期中進(jìn)行數(shù)據(jù)挖掘。
更重要的是慢宗,bulkAnalyseR提供了集成多種模式和數(shù)據(jù)集的靈活性坪蚁,并通過標(biāo)準(zhǔn)富集分析、多組學(xué)集成和更多可定制的流程整合外部數(shù)據(jù)庫镜沽。這為更復(fù)雜的問題提供了一個(gè)有價(jià)值/可靠的起點(diǎn)敏晤,為更好地理解觀察到的表達(dá)差異背后的原因鋪平了道路。
bulkAnalyseR算法可在CRAN和GitHub上開放訪問:?
?? https://github.com/Core-Bioinformatics/bulkAnalyseR
或
?? https://cran.r-project.org/web/packages/bulkAnalyseR/
首發(fā)公號(hào)國家基因庫大數(shù)據(jù)平臺(tái)
參考文獻(xiàn)
Ilias Moutsopoulos, Eleanor C Williams, Irina I Mohorianu, bulkAnalyseR: an accessible, interactive pipeline for analysing and sharing bulk multi-modal sequencing data,?Briefings in Bioinformatics, 2022;, bbac591,?https://doi.org/10.1093/bib/bbac591