idat數(shù)據(jù)類型
該包包含兩個(gè)測(cè)試數(shù)據(jù)集矗积,一個(gè)是HumanMethylation450 data (.idat)
虾宇,另一個(gè)是模擬的EPIC data
恃疯,可以用來測(cè)試ChAMP中可用的函數(shù)。這可以通過將目錄指向testDataSet來加載,如下所示:
library("ChAMP")
testDir=system.file("extdata",package="ChAMPdata")
myLoad <- champ.load(testDir,arraytype="450K")
450k肺腫瘤數(shù)據(jù)集僅包含8個(gè)樣本,4個(gè)肺腫瘤樣本(T)和4個(gè)對(duì)照樣本(C),我們使用這個(gè)數(shù)據(jù)集來展示ChAMP的功能浙炼。
對(duì)于EPIC仿真數(shù)據(jù)集,我們可以使用以下代碼進(jìn)行加載:
data(EPICSimData)
該仿真數(shù)據(jù)集包含16個(gè)樣本唯袄,它們實(shí)際上都來自一個(gè)樣本弯屈,但都被修改為DMP和DMR,并且單獨(dú)存在一些誤差方差恋拷。在這16個(gè)樣本數(shù)據(jù)集中资厉,我們模擬了8個(gè)樣本作為對(duì)照,8個(gè)樣本作為case蔬顾,樣本在EPICSimData對(duì)象的pd中標(biāo)記宴偿。在此數(shù)據(jù)中,我們從bumphunter package的clusterMaker()函數(shù)中隨機(jī)選取5000個(gè)區(qū)域诀豁。在每個(gè)區(qū)域窄刘,我們隨機(jī)選擇一些連續(xù)的CpGs作為DMR,然后增加或減少該DMR的beta值且叁。因此都哭,該數(shù)據(jù)集中的DMR(4700+)應(yīng)該小于5000,因?yàn)橐恍┠MDMR只包含1-2個(gè)CpGs逞带,所以在champ.DMR()函數(shù)中不被認(rèn)為是DMR欺矫。用戶可以使用這些數(shù)據(jù)測(cè)試ChAMP在EPIC數(shù)據(jù)上的功能。
450k肺腫瘤數(shù)據(jù)集僅包含8個(gè)樣本展氓,4個(gè)肺腫瘤樣本(T)和4個(gè)對(duì)照樣本(C)穆趴,接下來,我們使用450K這個(gè)數(shù)據(jù)集來展示ChAMP的功能遇汞。
ChAMP包用于分析Illumina甲基化beadarray數(shù)據(jù)(EPIC和450k)未妹,并提供了一個(gè)集成分析450k和EPIC分析方法。這包括各種不同的數(shù)據(jù)導(dǎo)入方法(例如從.idat文件或beta值矩陣導(dǎo)入
)和質(zhì)量控制圖空入。
Type-2 probe correction methods include SWAN1, Peak Based Correction (PBC)2 and BMIQ3 (the default choice).
minfi包也提供了流行的功能歸一化方法络它。
奇異值分解(SVD)方法允許處理批次效應(yīng),糾正多個(gè)批次處理效果歪赢,采用Combat包實(shí)現(xiàn)化戳。采用RefbaseEWAS9可以校正細(xì)胞類型的異質(zhì)性。
ChAMP還包括一個(gè)函數(shù)埋凯,該函數(shù)可以從450k或EPIC數(shù)據(jù)中推斷拷貝數(shù)變異点楼。
為了識(shí)別差異甲基化區(qū)域(DMR)扫尖, ChAMP除了提供Bumphunter和DMRcate這兩種檢測(cè)差異甲基化的方法,還提供了新的Probe Lasso Method掠廓。
對(duì)于那些需要尋找差異甲基化區(qū)塊( Differentially Methylated Blocks
)的人换怖,新版ChAMP包含了一個(gè)檢測(cè)這些區(qū)塊的功能。
基因集富集分析(GSEA)也是可能的蟀瞧,ChAMP的新版本結(jié)合了一些方法沉颂,可以糾正由于基因中探針表示不均勻而造成的偏差。
此外黄橘,新版ChAMP還整合了FEM 包兆览,該包可以在用戶指定的基因網(wǎng)絡(luò)(表現(xiàn)出不同表型間甲基化的差異)中推斷基因模塊。
雖然還有一些管道和包可以用于450k或EPIC陣列分析(比如IMA塞关、minfi抬探、methylumi、RnBeads和wateRmelon)帆赢。ChAMP提供了一個(gè)更加全面完整的分析管道小压,從讀取原始數(shù)據(jù)文件到最終的三級(jí)分析結(jié)果,例如GSEA椰于,它為研究人員簡(jiǎn)化了甲基化陣列分析怠益。新版ChAMP還提供了一系列閃亮的、基于程序的web瀏覽器交互分析函數(shù)(GUI函數(shù))瘾婿,以幫助科學(xué)家查看ChAMP的結(jié)果蜻牢。這需要一個(gè)基于web瀏覽器的交互式框架,用于本地或遠(yuǎn)程調(diào)用圖形系統(tǒng)偏陪。
安裝
if (!requireNamespace("BiocManager", quietly=TRUE))
install.packages("BiocManager")
BiocManager::install("ChAMP")
Test Data
該包包含兩個(gè)測(cè)試數(shù)據(jù)集抢呆,一個(gè)是HumanMethylation450 data (.idat)
,另一個(gè)是模擬EPIC data
笛谦,可以用來測(cè)試ChAMP中可用的函數(shù)抱虐。可以像下面這樣將目錄指向testDataSet來加載它
library("ChAMP")
testDir=system.file("extdata",package="ChAMPdata")
myLoad <- champ.load(testDir,arraytype="450K")