今天想復(fù)現(xiàn)一下一篇芯片平臺(tái)為GPL17077的文章底扳,發(fā)現(xiàn)該平臺(tái)沒(méi)有對(duì)應(yīng)的R包匆浙。
按照之前的思路:
一般有三種方法可以得到芯片探針與gene的對(duì)應(yīng)關(guān)系:
金標(biāo)準(zhǔn)當(dāng)然是去基因芯片的廠商的官網(wǎng)直接去下載啦
一種是直接用bioconductor的包准颓。
一種是從NCBI里面下載文件來(lái)解析好美浦!
嘗試第三種方法尽棕,發(fā)現(xiàn)下載速度真的是......無(wú)解答憔。
雖然前面分享了生信技能樹(shù)良心佳作-Jimmy的四個(gè)GEO分析的萬(wàn)能R包內(nèi)容如下:軟件剛剛出爐的時(shí)候只是演示了一下味赃,還沒(méi)有真正用過(guò)。發(fā)現(xiàn)GPL17077在idmap2中∨巴兀現(xiàn)在還不知為啥分為兩個(gè)包心俗。
options(stringsAsFactors = F)#在調(diào)用as.data.frame的時(shí),將stringsAsFactors設(shè)置為FALSE可以避免character類(lèi)型自動(dòng)轉(zhuǎn)化為factor類(lèi)型
#加載萬(wàn)能包
library(GEOmirror)
library(idmap1)
library(idmap2)
library(idmap3)
#了解一下每個(gè)包
ls('package:GEOmirror')
ls('package:idmap1')
ls('package:idmap2')
ls('package:idmap3')
#下載數(shù)據(jù)
geoChina('GSE97368')
load("GSE97368_eSet.Rdata")
gset
a=exprs(gset[[1]])
a[1:4,1:4]
gset[[1]]@annotation
#發(fā)現(xiàn)GPL17077在idmap2包中
ids <- getIDs("GPL17077")#失敗
idmap2::get_soft_IDs('GPL17077')#成功
head(ids)
ls('package:idmap1')
ls('package:idmap2')
idmap2::get_soft_IDs('GPL17077')
idmap1解決了bioconductor包下載困難的問(wèn)題蓉驹,idmap2解決了GPL平臺(tái)的soft文件下載困難城榛,而這個(gè)idmap3解決了那些并不提供探針的注釋信息的平臺(tái)。
GEO數(shù)據(jù)庫(kù)中國(guó)區(qū)鏡像橫空出世
第一個(gè)萬(wàn)能芯片探針I(yè)D注釋平臺(tái)R包
第二個(gè)萬(wàn)能芯片探針I(yè)D注釋平臺(tái)R包
第三個(gè)萬(wàn)能芯片探針I(yè)D注釋平臺(tái)R包
最關(guān)鍵的是還有一個(gè)萬(wàn)能的包态兴,AnnoProbe狠持。Jimmy創(chuàng)建這個(gè)一系列的包初衷可以從 :有趣的是,因?yàn)檫@些包存儲(chǔ)在GitHub诗茎,而且每個(gè)包自帶的數(shù)據(jù)是40~50M工坊,對(duì)很多在中國(guó)大陸的朋友來(lái)說(shuō), 幾乎是不可能完成敢订,所以我把這4個(gè)包整合成為了一個(gè)GitHub包(AnnoProbe)王污!總共不到5M,相信大家使用起來(lái)應(yīng)該是很方便啦楚午!
看出來(lái)昭齐。
保姆式的教學(xué)-----為大家更好的學(xué)習(xí)體驗(yàn)操碎了心。
致敬Jimmy矾柜!