舉個栗子撰洗,GSE99410和GSE78200。
library(GEOquery)
gse = "GSE78200"
eSet <- getGEO(gse, destdir = '.',getGPL = F)
exp <- exprs(eSet[[1]])
#Error in exp[1:4, 1:4] : subscript out of bounds
exp[1:4,1:4]
boxplot(exp)
#Error in names(groups) <- nam : 'names' attribute [10] must be the same length as the vector [0]
代碼看起來沒有問題滩届,怎么就畫不了圖?
dim(exp)
#[1] 0 10
因為它是空數(shù)據(jù)啊被啼。
有兩種情況
第一類帜消,不是芯片數(shù)據(jù),用于后續(xù)分析的文件以其他形式存儲了浓体,這是GSE99410的
這是GSE78200的:
第二類泡挺,就是作者沒有并上傳表達(dá)矩陣,而是只提供了原始數(shù)據(jù)文件命浴,如CEL娄猫、txt、gpr等格式生闲。
原始數(shù)據(jù)的處理媳溺,有法可依呀。
CEL格式的芯片原始數(shù)據(jù)處理方法
aglient 家txt格式的芯片原始數(shù)據(jù)處理方法
gpr格式的芯片原始數(shù)據(jù)處理方法
如果是illumina的bead芯片碍讯,可以用lumi試試悬蔽,還沒有整理。
處理原始數(shù)據(jù)的技能搞定捉兴,還有一個問題可以一并解決:
表達(dá)矩陣?yán)镉胸?fù)值蝎困,無法正常用limma包做下游分析了,也可以找找原始數(shù)據(jù)去處理它 ~