ChAMP包學習(4)

9. Gene Set Enrichment Analysis

基因集富集分析是生物信息學研究的重要環(huán)節(jié)甚疟。
在前面的步驟之后，已經(jīng)獲得了一些重要的DMPs或DMRs，因此我們可能想知道這些重要DMPs或dmr中涉及的基因是否因特定的生物學術語或通路而被富集揽祥。
要實現(xiàn)此分析，可以使用champ.GSEA()來進行GSEA分析府树。

champ.GSEA()將自動提取myDMP和myDMR中的基因(無論您使用什么方法生成DMR)。此外奄侠，如果您有自己的重要的CpG列表或基因列表計算從相同的甲基化陣列(450K或EPIC)其他方法不包括在ChAMP载矿。您還可以將它們格式化為list垄潮，并輸入要執(zhí)行GSEA的函數(shù)(請為您自己的CpG list或gene list中的每個元素指定一個名稱闷盔，否則可能會觸發(fā)錯誤)。champ.GSEA()會自動提取基因信息牡整，將CpG信息轉換為基因信息，然后對每個列表進行GSEA逃贝。在CpGs到基因的映射過程中，如果有多個CpGs映射到一個基因沐扳，則該基因只會被計數(shù)一次，以防計數(shù)過多歉闰。

做GSEA有三種方法。
在以前的版本中和敬，ChAMP使用了從MSigDB下載的通路信息戏阅。
然后利用Fisher精確試驗計算各通路的富集狀態(tài)昼弟。
經(jīng)過基因富集分析奕筐，champ.GSEA()函數(shù)會自動返回p值小于adjPval的通路。

myGSEA <- champ.GSEA(beta=myNorm,DMP=myDMP[[1]], DMR=myDMR, arraytype="450K",adjPval=0.05, method="fisher")
# myDMP and myDMR could (not must) be used directly.
myGSEA2 <- champ.GSEA(beta=myNorm,DMP=myDMP[[1]], DMR=myDMR, arraytype="450K",adjPval=0.05, method="ebayes")
# myDMP and myDMR could (not must) be used directly.

注:如果要修正CpG基因數(shù)量不等的偏差芭逝，同時考慮到CpGs的顯著水平渊胸，可以將方法參數(shù)設置為ebayes旬盯，采用經(jīng)驗bayes方法翎猛。否則，你也可以用“gometh” method or “fisher” method 來做GSEA萨咳。

image.png

10. Empirical Bayes GSEA method

正如我們之前介紹的疫稿，ChAMP現(xiàn)在在ChAMP .GSEA()中加入了一種叫做ebayes的新方法培他，這種方法與大多數(shù)其他GSEA方法不同而克，因為它不需要DMP或DMR信息。
因此员萍，實際上用戶可以獨立于champ.GSEA()運行此方法。
我們在ChAMP中提供了ChAMP . ebaygsea()函數(shù)螃壤，用于那些希望直接從標準化的beta矩陣和表型進行GSEA的用戶。
像下面的

myebayGSEA <- champ.ebayGSEA(beta=myNorm,pheno=myLoad$pd$Sample_Group,arraytype="450K")

這是一種很有前途的GSEA方法奸晴，不受基因富集的CpGs數(shù)量或CpGs顯著水平的影響。

image.png

11.尋找作用通路網(wǎng)絡中的疾病關聯(lián)小網(wǎng)絡

這貨根本就沒有中文譯名逮光，上邊是我自己翻譯的墩划。簡而言之就是涕刚，人體內的作用網(wǎng)絡實在是太多了乙帮，幾百幾千吧，每一個都涉及了一系列基因察净。這就是過往的科學家研究出來的，比如某個通路會導致頭疼锈至，然后有幾百個蛋白（及其背后的基因）都是通過共同作用導致了這一場頭疼的。但是如果你頭疼裹赴，不見得是所有這些基因都出了問題诀浪，而是可能其中的某一部分延都，甚至于只有一兩個出了問題雷猪。所以你就可以基于已經(jīng)存在的那個網(wǎng)絡晰房，再集合數(shù)據(jù)，找出哪些網(wǎng)絡可能出問題了殊者？或者是這些大網(wǎng)絡中的哪些基因具體除了問題。

這個功能很重要摔刁，否則做完上邊幾步，用戶只會知道那些基因有問題共屈，至于他們之間有沒有關系，是不是會同時作用于某些網(wǎng)絡拗引，就沒法知道的了。但其實也不復雜矾削，只需要自己寫個程序，匹配一樣基因和網(wǎng)絡就完了欲间，只不過數(shù)據(jù)的準備啊挡逼，洗啊括改，匹配啊家坎，也是夠煩的，所以這個函數(shù)就提供了全套的分析虱疏。

myEpiMod <- champ.EpiMod(beta=myNorm,pheno=myLoad$pd$Sample_Group)

image.png


library("ChAMP")
testDir=system.file("extdata",package="ChAMPdata")

myLoad <- champ.load(testDir,arraytype="450K",method ="ChAMP")
str(myLoad)

myLoad2=champ.load(testDir,arraytype="450K",method ="minfi")
str(myLoad2)


mydata=champ.import(testDir)
beta=mydata$beta
myfilter <- champ.filter(mydata$beta,pd=NULL,au)
# Or you may separate about code as champ.import(testDir) + champ.filter()


myLoad$pd

myLoad2$pd

myfilter$pd

CpG.GUI(CpG=rownames(myLoad$beta),arraytype="450K")


champ.QC()

CpG.GUI()

champ.QC(Feature.sel = "SVD") # Alternatively: QC.GUI()
QC.GUI()

myNorm <- champ.norm(beta=myLoad$beta,arraytype="450K",cores=5)

QC.GUI(beta=myNorm)
kk=myLoad$pd[,c(1,3)]
str(myLoad$pd)
champ.SVD(beta=myNorm,pd=kk)


myLoad$pd=myLoad$pd[,c(1,3)]

champ.SVD(beta=myNorm,pd=myLoad$pd)


champ.SVD()
myDMP <- champ.DMP(beta = myNorm,pheno=myLoad$pd$Sample_Group)
head(myDMP[[1]])

myNorm[rownames(myNorm)=="cg06822689",]


DMP.GUI(DMP=myDMP[[1]],beta=myNorm,pheno=myLoad$pd$Sample_Group)
# myDMP is a list now, each data frame is stored as myDMP[[1]], myDMP[[2]], myDMP[[3]]...



myDMR <- champ.DMR(beta=myNorm,pheno=myLoad$pd$Sample_Group,method="Bumphunter")

DMR.GUI()

myBlock <- champ.Block()

Block.GUI()

myGSEA <- champ.GSEA(beta=myNorm,DMP=myDMP[[1]], DMR=myDMR, arraytype="450K",adjPval=0.05, method="fisher")


myGSEA2 <- champ.GSEA(beta=myNorm,DMP=myDMP[[1]], DMR=myDMR, arraytype="450K",adjPval=0.05, method="ebayes")

# myDMP and myDMR could (not must) be used directly.

myGSEA_DMP<-champ.GSEA(beta=myNorm,DMP=myDMP[[1]],  arraytype="450K",adjPval=0.05, method="fisher")




myebayGSEA <- champ.ebayGSEA(beta=myNorm,pheno=myLoad$pd$Sample_Group,arraytype="450K")

kk=myGSEA_DMP$DMP

myEpiMod <- champ.EpiMod(beta=myNorm,pheno=myLoad$pd$Sample_Group)



myebayGSEA <- champ.ebayGSEA(beta=myNorm,pheno=myLoad$pd$Sample_Group,arraytype="450K")

myEpiMod <- champ.EpiMod()

TCGA

Medat=data.table::fread("G:/小張聊科研項目/甲基化/HumanMethylation450 (1)/HumanMethylation450")

head(Medat)[,1:10]

Medat=data.frame(Medat)
row.names(Medat)=Medat[,1]
Medat2=Medat[,-1]
myLoad=Medat2
head(Medat2)
names(pd)

grou=data.frame("Sample_Name"=names(Medat2),"Sample_Group"=c(rep("C",100),rep("T",55)))

myfilter <- champ.filter(as.matrix(Medat2) ,pd=grou)
data=as.data.frame(myfilter$beta)
myfilter$beta=na.omit(myfilter$beta)
# Or you may separate about code as champ.import(testDir) + champ.filter()

CpG.GUI(CpG=rownames(myfilter$beta),arraytype="450K")

myNorm <- champ.norm(beta=myfilter$beta,arraytype="450K",cores=5)

QC.GUI(beta=myNorm)

myDMP <- champ.DMP(beta = myNorm,pheno=myfilter$pd$Sample_Group)

head(myDMP[[1]])

參考：https://bioconductor.org/packages/release/bioc/vignettes/ChAMP/inst/doc/ChAMP.html#section-gene-set-enrichment-analysis

https://blog.csdn.net/joshua_hit/article/details/54982018

最后編輯于：2018.12.11 21:34:33

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末对粪，一起剝皮案震驚了整個濱河市装蓬，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌牍帚，老刑警劉巖，帶你破解...
沈念sama閱讀 219,039評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件鄙币，死亡現(xiàn)場離奇詭異，居然都是意外死亡十嘿，警方通過查閱死者的電腦和手機岳锁，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,426評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人唇聘，你說我怎么就攤上這事“眨” “怎么了？”我有些...
開封第一講書人閱讀 165,417評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵表制，是天一觀的道長控乾。經(jīng)常有香客問我，道長蜕衡，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,868評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任久脯，我火速辦了婚禮，結果婚禮上帘撰，老公的妹妹穿的比我還像新娘。我一直安慰自己摧找，他們只是感情好牢硅，可當我...
茶點故事閱讀 67,892評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著减余，像睡著了一般。火紅的嫁衣襯著肌膚如雪佳励。梳的紋絲不亂的頭發(fā)上蛆挫，一...
開封第一講書人閱讀 51,692評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音悴侵，去河邊找鬼。笑死抓于，一個胖子當著我的面吹牛做粤，可吹牛的內容都是我干的捉撮。我是一名探鬼主播，決...
沈念sama閱讀 40,416評論 3贊 419
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼巾遭，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了吼和？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,326評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤炫乓，失蹤者是張志新（化名）和其女友劉穎献丑，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體阳距，經(jīng)...
沈念sama閱讀 45,782評論 1贊 316
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,957評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年卒茬，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片圃酵。...
茶點故事閱讀 40,102評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡馍管，死狀恐怖，靈堂內的尸體忽然破棺而出确沸，到底是詐尸還是另有隱情，我是刑警寧澤罗捎，帶...
沈念sama閱讀 35,790評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站桨菜，受9級特大地震影響捉偏，放射性物質發(fā)生泄漏泻红。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,442評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一谊路、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧凶异，春花似錦、人聲如沸剩彬。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,996評論 0贊 22
一樁弒父案沃饶，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至糊肤，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間馆揉，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,113評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工升酣，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留态罪，地道東北人。一個月前我還...
沈念sama閱讀 48,332評論 3贊 373
代替公主和親
正文我出身青樓复颈，卻偏偏與公主長得像，于是被迫代替她去往敵國和親耗啦。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,044評論 2贊 355

ChAMP包學習(4)

9. Gene Set Enrichment Analysis

10. Empirical Bayes GSEA method

這是一種很有前途的GSEA方法奸晴，不受基因富集的CpGs數(shù)量或CpGs顯著水平的影響。

11.尋找作用通路網(wǎng)絡中的疾病關聯(lián)小網(wǎng)絡

TCGA

推薦閱讀更多精彩內容