一般R代碼下載其實挺好的变逃,但是網(wǎng)絡(luò)狗是一件每個探索GEO小伙伴們都要經(jīng)歷的粗合,有時候我們選擇更換鏡像郑气,想避開蝸牛一般的的網(wǎng)速幅垮,但是也是不行,大家就可以去官網(wǎng)下載這個數(shù)據(jù)集(GSE)
網(wǎng)站連接
- 官網(wǎng)連接 https://www.ncbi.nlm.nih.gov/geo/
- 數(shù)據(jù)集下載連接 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE42872
若想下載不同的數(shù)據(jù)集尾组,只需要更換GSE編號
例如https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE42872
更換為https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE33335
網(wǎng)頁頁面
(一)GEO官網(wǎng)
GEO官網(wǎng)
1.此處可進行一些簡單的探索忙芒,例如輸入Lung(肺),可以找到一些你感興趣的數(shù)據(jù)集或者實驗
2. 也可以輸入你想找的數(shù)據(jù)集(GSE)或者平臺(GPL)
(二)GSE網(wǎng)頁
GSE42872
- SOFT——可下載GPL文件
- Series——下載矩陣
(三)GSE與GPL下載
-
點擊上圖讳侨,出現(xiàn)下面的頁面呵萨,大同小異
GPL下載
GSE下載
-
點擊上圖下載
下載中............
-
下載成功!?
下載的*GSE 的 gz.文件 -
①打開txt文件
打開GSE的txt文件
觀察讀取文件內(nèi)容跨跨,根據(jù)特性選擇讀取R的函數(shù)潮峦,代碼
- ②打開soft文件
(四)網(wǎng)站下載后其文件讀取
- GSE 的 gz.文件讀取
eSet = read.table('GSE42872_series_matrix.txt.gz',
sep='\t',quote = "",fill = T,
comment.char="!",header=T)
#也可以解壓后,直接讀取txt文件
eSet =read.table('GSE42872_series_matrix.txt',
sep='\t',quote = "",fill = T,
comment.char="!",header=T)
關(guān)于參數(shù)
comment.char="!" ——不讀取文件中“勇婴!”后的內(nèi)容
header=T——列名
- GPL的soft文件讀取
##注意 函數(shù) getGEO
GPL6244=getGEO(filename = 'GSE42872_family.soft')
- GPL也可以代碼下載
library(GEOquery)
GPL6244<- getGEO('GPL6244', destdir=".")
- 關(guān)于文件讀取也總結(jié)了一下小傳輸門——>
R讀取GSE文件后