1.?背景介紹
edgeR是一個R軟件包,也轉(zhuǎn)錄組差異表達分析中常用的工具藐俺,主要關注的是差異表達基因炊甲,甚至可以進行無重復的差異表達分析。它的作用對象是readcount文件欲芹,行代表基因卿啡,列代表樣本,數(shù)值代表的是比對到每個基因的reads數(shù)目菱父,不能使用rpkm/fpkm/tpm等表達量統(tǒng)計文件進行分析颈娜。除了生成差異表達結(jié)果文件外,edgeR工具還可以直接繪制火山圖浙宜,使用更方便官辽。
工具鏈接:http://www.cloud.biomicroclass.com/CloudPlatform/SoftPage/EDR
2.?操作方法
2.1.?上傳文件
需要輸入的文件包括基因數(shù)據(jù)表和分組文件,文件必須為tab-delimited保存的txt格式粟瞬,基因數(shù)據(jù)表必須是整數(shù)
可以使用凌恩生物轉(zhuǎn)錄組結(jié)題報告中的readcount數(shù)據(jù)表同仆,位于結(jié)果文件夾中,名為genes.read.txt裙品,每一行代表基因俗批,列代表樣本俗或,值代表比對到每個基因的reads數(shù),示例文件如下扶镀。
分組文件同樣為制表符分隔的txt文本文件蕴侣,第一列為樣本名,第二列為分組名臭觉,示例文件如下:
在wps昆雀、word等軟件中,使用excel輸入數(shù)據(jù)蝠筑,保存數(shù)據(jù)時有制表符分隔的txt文本文件和Unicode文本txt兩種格式狞膘,請選擇制表符分隔的txt文本文件
注意:從上至下首先出現(xiàn)的分組為處理組,示例文件中為AvsB(A為處理組什乙,B為對照組)?
2.2.?設置參數(shù)
同時還需要設置分析的FDR值和FC值閾值挽封,默認以FDR<0.05&|FC|值≥1定義顯著差異基因,其中當FC=1時臣镣,相當于2倍差異倍數(shù)辅愿,F(xiàn)C=2時,相當于4倍差異倍數(shù)
上傳文件并設置閾值后忆某,點擊“提交”按鍵点待,開始分析
2.3.?查看任務
提交任務后,點擊界面右側(cè)的“歷史任務”模塊弃舒,或者點擊界面“我的任務”癞埠,都可以查看任務編號、軟件名稱和狀態(tài)等信息聋呢,點擊任務編號苗踪,即可查看分析結(jié)果。
在任務詳情界面削锰,展示的是任務參數(shù)通铲、結(jié)果文件列表和在線調(diào)整圖片3個區(qū)域,提供結(jié)果文件下載和在線調(diào)整圖片功能器贩。
3.?結(jié)果文件
結(jié)果文件包括差異表達倍數(shù)表测暗、差異基因總表、上調(diào)基因表磨澡、下調(diào)基因表和根據(jù)差異基因總表繪制的火山圖碗啄,點擊下載列的眼睛圖標即可在線查看文件內(nèi)容。
edger.xls差異表達倍數(shù)表(sig列除down和up外稳摄,還顯示none):
edgeR.select.xls差異基因總表(sig列僅顯示up和down的基因):
edgeR.up.xls上調(diào)基因表(僅up的基因,sig列只顯示up):
edgeR.down.xls下調(diào)基因表(僅down的基因稚字,sig列只顯示down):
火山圖:每個點代表一個基因,其中藍色的點代表顯著下調(diào)基因(down),紅色的點代表顯著上調(diào)基因(up)胆描,灰色點代表無顯著差異基因(none)
4.?在線調(diào)整圖片
通過數(shù)據(jù)布局參數(shù)瘫想、顏色參數(shù)和字體參數(shù)三個模塊在線調(diào)整圖片。
數(shù)據(jù)布局參數(shù):重新設置FDR值和FC值閾值昌讲、XY軸范圍国夜、是否繪制分界線、圖片清晰度和尺寸
顏色參數(shù):自定義分界線和數(shù)據(jù)點顏色(一般文獻默認藍色為下調(diào)紅色為上調(diào)灰色為無顯著差異基因短绸,也可以自行調(diào)整上下調(diào)基因配色)
字體參數(shù):XY軸字體大小车吹、主標題大小、自定義XY軸標題和主標題
注意事項:
在線調(diào)整區(qū)域參數(shù)只能對圖片展示效果進行調(diào)整醋闭,不能調(diào)整表格文件