GPL頁面表格奇奇怪怪的更新

GPL頁面表格奇奇怪怪的更新

0.因數(shù)據(jù)庫和R包更新導(dǎo)致的問題

從GPL頁面上下載注釋表格,是獲取探針注釋的方法之一合瓢,通常是找不到注釋包的第二選擇坦胶。


更新之前的下載方式是(2022年之前我們的直播課堂上是這樣講的,2022年以及之后的課上已經(jīng)更新好了):


library(GEOquery)

a = getGEO("GPL570",destdir = ".")

b = a@dataTable@table

ids2 = b[,c("ID","Gene Symbol")]

更新之前:運(yùn)行g(shù)etGEO這句代碼晴楔,函數(shù)會(huì)自動(dòng)讀取“GPL570.soft”文件顿苇,得到一個(gè)GPL對(duì)象。


更新之后: GPL570.soft文件從原來的75M變成了現(xiàn)在的幾十G税弃,而且所有的平臺(tái)soft都被壓縮成了gz格式纪岁。壓縮一下倒是不影響下載,但導(dǎo)致了工作目錄下確實(shí)有GPL570.soft文件的情況下则果,函數(shù)也不識(shí)別幔翰,而是從網(wǎng)頁上去下載GPL570.soft.gz漩氨,幾十G,實(shí)在是duck不必遗增。


1.小的文件才菠,方法不變

當(dāng)然,GPL570表格文件是本來就大(表格的大小在網(wǎng)頁上有寫)贡定,對(duì)于比較小的表格文件可以繼續(xù)使用原來的方法:


library(GEOquery)

a2 = getGEO("GPL7759",destdir = ".")

class(a2)


## [1] "GPL"

## attr(,"package")

## [1] "GEOquery"

2.針對(duì)大文件的新方法

針對(duì)這種比較大的注釋文件赋访,需要更改一下策略:


從GPL570的網(wǎng)頁上拉到最后,有一個(gè)文件:



從網(wǎng)頁上把它下載下來缓待,放在工作目錄蚓耽,本地讀取。


b = read.table("GPL570-55999.txt",header = T,

? ? ? ? ? ? ? ? quote = "\"",sep = "\t",check.names = F)

ids2 = b[,c("ID","Gene Symbol")]

colnames(ids2) = c("probe_id","symbol")

head(ids2)


##? ? probe_id? ? ? ? ? symbol

## 1 1007_s_at DDR1 /// MIR4640

## 2? 1053_at? ? ? ? ? ? RFC2

## 3? ? 117_at? ? ? ? ? ? HSPA6

## 4? ? 121_at? ? ? ? ? ? PAX8

## 5 1255_g_at? ? ? ? ? GUCA1A

## 6? 1294_at MIR5193 /// UBA7

3.備用方法

只要不是特別大的文件旋炒,可以先試試getgeo下載步悠,如果網(wǎng)絡(luò)不好導(dǎo)致失敗,就從網(wǎng)頁下載soft格式的文件瘫镇。



點(diǎn)開上面箭頭所指的地方鼎兽,就能網(wǎng)頁下載soft文件了,文件大小還可以接受铣除,不至于有幾個(gè)G的谚咬。


b2 = getGEO(filename = "GPL7759_family.soft.gz",destdir = ".")

class(b2)


## [1] "GPL"

## attr(,"package")

## [1] "GEOquery"

GEO數(shù)據(jù)挖掘

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市尚粘,隨后出現(xiàn)的幾起案子择卦,更是在濱河造成了極大的恐慌,老刑警劉巖郎嫁,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秉继,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡泽铛,警方通過查閱死者的電腦和手機(jī)尚辑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盔腔,“玉大人杠茬,你說我怎么就攤上這事〔酰” “怎么了澈蝙?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長撵幽。 經(jīng)常有香客問我,道長礁击,這世上最難降的妖魔是什么盐杂? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任逗载,我火速辦了婚禮,結(jié)果婚禮上链烈,老公的妹妹穿的比我還像新娘厉斟。我一直安慰自己,他們只是感情好强衡,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布擦秽。 她就那樣靜靜地躺著,像睡著了一般漩勤。 火紅的嫁衣襯著肌膚如雪感挥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天越败,我揣著相機(jī)與錄音触幼,去河邊找鬼。 笑死究飞,一個(gè)胖子當(dāng)著我的面吹牛置谦,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播亿傅,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼媒峡,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了葵擎?” 一聲冷哼從身側(cè)響起丝蹭,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坪蚁,沒想到半個(gè)月后奔穿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡敏晤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年贱田,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嘴脾。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡男摧,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出译打,到底是詐尸還是另有隱情耗拓,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布奏司,位于F島的核電站乔询,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏韵洋。R本人自食惡果不足惜竿刁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一黄锤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧食拜,春花似錦鸵熟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至呻待,卻和暖如春打月,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背带污。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工僵控, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人鱼冀。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓报破,卻偏偏與公主長得像,于是被迫代替她去往敵國和親千绪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子充易,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容