GSEA文件有8類基因集钥平,基本上可以解決80%-90%用到的問題糠惫,當然疫剃,我們都還有個性化需求,這個時候就需要我們自己動手啦硼讽。
先來觀察下GSEA需要的gmt文件格式(h.all.v7.0.symbols.gmt
):
image
共有3列信息:
第1列:基因集名稱(geneset names)
第2列:基因集的URL巢价,(備注:沒有URL,直接寫“NA”)
第3列:基因集包含的基因
制作gmt文件
假如有這么一列基因
image
rt <- read.table("gene.txt")
gset <- c("Hallmark_my_geneset","NA",rt$V1)
gset <- gset%>%
as.data.frame() %>%
t()
write.table(gset,file = "Hallmark_my_geneset.gmt",sep = "\t",row.names = F,col.names = F,quote = F)
這樣自定義的gmt文件就做好了,下一步就可以愉快的進行GSEA/GSVA/ssGSEA分析嘍壤躲。
image
參考鏈接:
制作自己的gene set文件給gsea軟件