GEO上都是芯片數(shù)據(jù)嗎挂据?GSE開頭的都是芯片嗎

看過很多GEO數(shù)據(jù)挖掘的教程,一直都是芯片數(shù)據(jù)舉例喉悴。我自己也根據(jù)流程(Taolu)分析過好幾個geo芯片數(shù)據(jù)棱貌。一直有個疑惑,

GEO上都是芯片數(shù)據(jù)嗎箕肃?

GSE開頭的都是芯片數(shù)據(jù)嗎婚脱?

今天在大神健明老師的敦促下,我又一次打開熟悉又陌生的GEO頁面勺像。重新讀一下GEO數(shù)據(jù)庫的介紹障贸。熟悉是因為這個頁面我打開過不止百次了,陌生是因為從沒認真讀過這個頁面的內(nèi)容吟宦。


image.png

開篇第一句就寫了芯片和測序數(shù)據(jù)我們都是接受的篮洁。
但是我看到的GEO挖掘?qū)嵗际切酒瑸槔]見過GEO上的測序數(shù)據(jù)是啥樣殃姓。所以這也是導致我產(chǎn)生這個錯覺的主要原因袁波。我需要找到一個不是芯片的例子來看看。畢竟眼見為實嘛蜗侈。于是我開始搜索篷牌。希望找到GEO數(shù)據(jù)的一些存放規(guī)律。

1.解讀GEO數(shù)據(jù)存放規(guī)律及下載踏幻,一文就夠

首先看到了健明老師這一篇枷颊,開篇就說了

GEO數(shù)據(jù)庫起先只是為表達芯片數(shù)據(jù)準備的,后期納入了各種NGS組學數(shù)據(jù)该面,文章里面會給出數(shù)據(jù)地址夭苗,GSE ID號,由此我們就可以進入GEO數(shù)據(jù)庫隔缀,進而了解它题造!

image.png

其實只需要理解下面的4個概念。
GEO Platform (GPL)
GEO Sample (GSM)
GEO Series (GSE)
GEO Dataset (GDS)
理解起來也很容易猾瘸。一篇文章可以有一個或者多個GSE數(shù)據(jù)集晌梨,一個GSE里面可以有一個或者多個GSM樣本桥嗤。多個研究的GSM樣本可以根據(jù)研究目的整合為一個GDS,不過GDS本身用的很少仔蝌。而每個數(shù)據(jù)集都有著自己對應(yīng)的芯片平臺,就是GPL荒吏。

然后還是芯片挖掘的例子

2.從GEO數(shù)據(jù)庫下載得到表達矩陣 一文就夠

然后又看到了這一篇敛惊,文中提到geo上的illumina測序芯片。這個illumina我是知道的绰更,這個公司就是二代測序的代表瞧挤,有點靠近轉(zhuǎn)錄組的意思了。

image.png

3.GEO數(shù)據(jù)挖掘技術(shù)可以應(yīng)用到表達芯片也可以是轉(zhuǎn)錄組測序

最終定位到這一篇解決了我的疑惑儡湾。

那如果是RNA-seq測序數(shù)據(jù)呢特恬?
通常呢,RNA-seq測序數(shù)據(jù)并不會把其表達矩陣存儲在Series Matrix File(s) 里面徐钠,所以 你使用我的標準代碼:

rm(list = ls())  ## 魔幻操作癌刽,一鍵清空~
options(stringsAsFactors = F)#在調(diào)用as.data.frame的時,將stringsAsFactors設(shè)置為FALSE可以避免character類型自動轉(zhuǎn)化為factor類型
# 注意查看下載文件的大小尝丐,檢查數(shù)據(jù) 
f='GSE103611_eSet.Rdata'
# https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE103611
library(GEOquery)
# 這個包需要注意兩個配置显拜,一般來說自動化的配置是足夠的。
#Setting options('download.file.method.GEOquery'='auto')
#Setting options('GEOquery.inmemory.gpl'=FALSE)
if(!file.exists(f)){
  gset <- getGEO('GSE103611', destdir=".",
                 AnnotGPL = F,     ## 注釋文件
                 getGPL = F)       ## 平臺文件
  save(gset,file=f)   ## 保存到本地
}
load('GSE103611_eSet.Rdata')  ## 載入數(shù)據(jù)
class(gset)  #查看數(shù)據(jù)類型
length(gset)  #
class(gset[[1]])
gset
# assayData: 352859 features, 48 samples

比如對 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE106292 上面的代碼就拿不到表達矩陣

因為爹袁,這個是RNA-seq數(shù)據(jù)远荠,作者會把自己的表達矩陣變成Excel表格,方便大家探索失息!

image.png

記住譬淳,我這里強調(diào)了是作者自己的表達矩陣,因為RNA-seq數(shù)據(jù)分析流程還不一樣盹兢!參數(shù)不一樣邻梆,軟件不一樣,數(shù)據(jù)庫不一樣蛤迎,而且最后的表達矩陣的表現(xiàn)形式又不一樣确虱!是原始的counts還是RPKM,TPM都不一樣替裆!如果作者確實不上傳其表達矩陣校辩,你也沒辦法,只能是自己走RNA-seq數(shù)據(jù)分析流程:

image.png

這里面的知識細節(jié)太復(fù)雜了辆童,我就不一一展開宜咒!建議大家看我們閱讀量過10萬的RNA-seq系列推文,比如:表達矩陣的歸一化和標準化把鉴,去除極端值故黑,異常值
然后我想下載下來看看儿咱,先用網(wǎng)絡(luò)下載一個是不完整是空白,換用手機熱點场晶,提示需要14天才能下載完混埠。

image.png

等以后網(wǎng)速好的時候再看好了。至少我已經(jīng)知道了GEO上是有測序數(shù)據(jù)的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末诗轻,一起剝皮案震驚了整個濱河市钳宪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌扳炬,老刑警劉巖吏颖,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異恨樟,居然都是意外死亡半醉,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進店門劝术,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缩多,“玉大人,你說我怎么就攤上這事夯尽∏谱常” “怎么了?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵匙握,是天一觀的道長咆槽。 經(jīng)常有香客問我,道長圈纺,這世上最難降的妖魔是什么秦忿? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮蛾娶,結(jié)果婚禮上灯谣,老公的妹妹穿的比我還像新娘。我一直安慰自己蛔琅,他們只是感情好胎许,可當我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著罗售,像睡著了一般辜窑。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上寨躁,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天穆碎,我揣著相機與錄音,去河邊找鬼职恳。 笑死所禀,一個胖子當著我的面吹牛方面,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播色徘,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼恭金,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了贺氓?” 一聲冷哼從身側(cè)響起蔚叨,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎辙培,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邢锯,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡扬蕊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了丹擎。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尾抑。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖蒂培,靈堂內(nèi)的尸體忽然破棺而出再愈,到底是詐尸還是另有隱情,我是刑警寧澤护戳,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布翎冲,位于F島的核電站,受9級特大地震影響媳荒,放射性物質(zhì)發(fā)生泄漏抗悍。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一钳枕、第九天 我趴在偏房一處隱蔽的房頂上張望缴渊。 院中可真熱鬧,春花似錦鱼炒、人聲如沸衔沼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽指蚁。三九已至,卻和暖如春硬爆,著一層夾襖步出監(jiān)牢的瞬間欣舵,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工缀磕, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留缘圈,地道東北人劣光。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像糟把,于是被迫代替她去往敵國和親绢涡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,543評論 2 349

推薦閱讀更多精彩內(nèi)容