以GSE111229為例
1 下載并保存GEO數(shù)據(jù)
下載有error可以:設(shè)置鏡像、翻墻模捂、rm(list=ls())一下重試…
library(GEOquery)
GSE_name = 'GSE111229'
options( 'download.file.method.GEOquery' = 'libcurl' ) #windows系統(tǒng)
gset <- getGEO( GSE_name, getGPL = F )
save( gset, file = 'gset.Rdata' )
- 下載得到一個(gè)list班缰,需學(xué)習(xí)list的處理顾复;
2 加載GEO數(shù)據(jù)
gset包含下載的所有信息
由于gset是列表,故將其轉(zhuǎn)為可操作的數(shù)據(jù)結(jié)構(gòu)Gset
load("gset.Rdata")
Gset <- gset[[1]]
- 對(duì)于向量和矩陣,[]和[[]]基本上一樣鲁捏;
但對(duì)于列表list芯砸,如[1],相當(dāng)于提取列表中的第1個(gè)子表的整體给梅,輸出結(jié)果還是個(gè)列表list假丧;而[[1]]相當(dāng)于直接提取第1個(gè)子表中的所有元素,輸出結(jié)果就是數(shù)列或字符串或向量等與其中元素類型一致的東西动羽。
實(shí)際中包帚,對(duì)于列表,盡量采用[[]]直接提取其中的元素對(duì)象运吓,不容易出錯(cuò)渴邦。
3 用GEOquery里的pdata函數(shù)獲取樣本信息
處理后得到數(shù)據(jù)框結(jié)構(gòu)的數(shù)據(jù)
pdata<-pData(Gset)
class(pdata)
View(pdata)
-看到一篇文章,挺好的拘哨,有空多看看谋梭;R語言中知識(shí)點(diǎn)總結(jié)(二)
4 dim查看行列 colnames查看列名
dim(pdata)
colnames(pdata)