geo數(shù)據(jù)庫

GEO蚜迅,全稱 Gene Expression Omnibus(基因表達(dá)綜合數(shù)據(jù)庫)捎泻,網(wǎng)址∶ https∶/ww.ncbinlm.nih.gov/geo/,是由美國國立生物技術(shù)信息中心 ( National Center for Biotechnology Information诡曙,NCBD于2000年創(chuàng)建并維護(hù)至今的高通量基因表達(dá)數(shù)據(jù)庫讲仰。

GEO是一個(gè)國際公共存儲庫,收錄并整理了全球范圍內(nèi)研究工作者上傳的微陣列芯片击奶、二代測序以及其他形式的高通量基因組數(shù)據(jù)渔呵,并提供免費(fèi)下載。

GEO數(shù)據(jù)有兩種存儲形式

  • GEO DataSets 以數(shù)據(jù)集為單位荠雕,存儲同一個(gè)實(shí)驗(yàn)中的數(shù)據(jù)稳其;
  • GEO Profiles 以基因?yàn)閱挝唬鎯蛟跀?shù)據(jù)集中的表達(dá)譜炸卑。

組織結(jié)構(gòu)從大到屑染稀:

  • Platforms:高通量實(shí)驗(yàn)檢測所用工具(哪個(gè)公司哪款產(chǎn)品),編號GPL開頭盖文,例如 GPL570
  • Series:構(gòu)成某個(gè)實(shí)驗(yàn)的相關(guān)樣本嘱蛋,組成一個(gè)有生物意義的數(shù)據(jù)集。包括樣本信息和方案設(shè)計(jì)等信息五续,可以看做一套完整的實(shí)驗(yàn)方案洒敏,實(shí)際上每個(gè) Series基本對應(yīng)一篇完整的論文。編號GSE開頭疙驾,例如GSE5764凶伙。一個(gè)gse有多個(gè)sample(樣本)
  • Datasets & Profiles:高質(zhì)量的GSE數(shù)據(jù)集還會被GEO官方工作者整理為Datasets和Profiles。Datasets 是分析好的Series它碎,編號以GDS開頭函荣,所有g(shù)ds也有多個(gè)sample。
  • Sample:樣本

GEO的研究數(shù)據(jù)類型:

數(shù)據(jù)類型有9種扳肛,以芯片為主傻挂,例如RNA、甲基化和SNP芯片數(shù)據(jù)等挖息。也包括很多高通量測序數(shù)據(jù)金拒。

高通量測序數(shù)據(jù),原始數(shù)據(jù)存儲在SRA旋讹,處理后數(shù)據(jù)則存儲在GEO中殖蚕。

在使用GEO數(shù)據(jù)時(shí),千萬不要忘記注明引用該數(shù)據(jù)文獻(xiàn)的PMID編號沉迹!


image.png

下載數(shù)據(jù)

使用R語言下載:

library(GEOquery)
GSE57820 <- getGEO("GSE57820", GSEMatrix =TRUE, destdir = ".", getGPL = T, AnnotGPL = T)
# 支持多種編號下載:GSE57820睦疫、
# # destdir設(shè)置當(dāng)前目錄,getGPL 和AnnotGPL都設(shè)置TRUE鞭呕,可以下載和獲得平臺的注釋文件

利用GDS號下載

 GDS6100 <- getGEO("GDS6100", GSEMatrix =TRUE, destdir = ".", getGPL = T, AnnotGPL = T)

利用GSM號下載(單樣本的表達(dá)數(shù)據(jù)):

 GSM1394594 <- getGEO("GSM1394594", GSEMatrix =TRUE, destdir = ".", getGPL = T, AnnotGPL = T)

利用GPL號下載:

 GPL10558 <- getGEO("GPL10558", GSEMatrix =TRUE, destdir = ".", getGPL = T, AnnotGPL = T)

針對芯片平臺蛤育,利用GPL號下載得到的數(shù)據(jù)是芯片的設(shè)計(jì)和注釋信息,可以獲得探針組和基因的對應(yīng)關(guān)系。

參考文章

https://www.sohu.com/a/583980773_121118947
https://www.cnblogs.com/yahengwang/p/9676422.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瓦糕,一起剝皮案震驚了整個(gè)濱河市底洗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌咕娄,老刑警劉巖亥揖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異圣勒,居然都是意外死亡费变,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門圣贸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挚歧,“玉大人,你說我怎么就攤上這事吁峻』海” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵用含,是天一觀的道長矮慕。 經(jīng)常有香客問我,道長耕餐,這世上最難降的妖魔是什么凡傅? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮肠缔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘哼转。我一直安慰自己明未,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布壹蔓。 她就那樣靜靜地躺著趟妥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪佣蓉。 梳的紋絲不亂的頭發(fā)上披摄,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音勇凭,去河邊找鬼疚膊。 笑死,一個(gè)胖子當(dāng)著我的面吹牛虾标,可吹牛的內(nèi)容都是我干的寓盗。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼傀蚌!你這毒婦竟也來了基显?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤善炫,失蹤者是張志新(化名)和其女友劉穎撩幽,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體箩艺,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡窜醉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了舅桩。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片酱虎。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖擂涛,靈堂內(nèi)的尸體忽然破棺而出读串,到底是詐尸還是另有隱情,我是刑警寧澤撒妈,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布恢暖,位于F島的核電站,受9級特大地震影響狰右,放射性物質(zhì)發(fā)生泄漏杰捂。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一棋蚌、第九天 我趴在偏房一處隱蔽的房頂上張望嫁佳。 院中可真熱鬧,春花似錦谷暮、人聲如沸蒿往。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽瓤漏。三九已至,卻和暖如春颊埃,著一層夾襖步出監(jiān)牢的瞬間蔬充,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工班利, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留饥漫,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓肥败,卻偏偏與公主長得像趾浅,于是被迫代替她去往敵國和親愕提。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容