問題描述:使用wget下載GEO數(shù)據(jù)_weixin_43551076的博客-CSDN博客
本來打算下載一點GEO的單細胞數(shù)據(jù)(直接得到表達矩陣而非原始數(shù)據(jù)),但是復制了http鏈接后wget卻無法下載?
我固然可以逐個點開GSM文件下載ftp村怪,但這未免也太麻煩了吧彼妻?
我嘗試改寫http的格式:
- 先觀察wget可下載的文件鏈接的格式
# RAW文件給出的鏈接俱饿,wget無法下載邮破,但是點擊該鏈接可以實現(xiàn)網(wǎng)頁下載
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE156441&format=file
# GSM文件給出的可以用wget下載的鏈接
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSM4731566&format=file&file=GSM4731566%5FMTXDBA1%5F2rps%5FcountsMatrix%2Etxt%2Egz
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSM4731562&format=file&file=GSM4731562%5FMTXBP04rpl%5FcountsMatrix%2Etxt%2Egz
https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM4731nnn/GSM4731566/suppl/GSM4731566_MTXDBA1_2rps_countsMatrix.txt.gz
https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM4731nnn/GSM4731562/suppl/GSM4731562_MTXBP04rpl_countsMatrix.txt.gz
我的改寫:
Samples (GSM)
Series (GSE)
https://ftp.ncbi.nlm.nih.gov/geo/series/GSE15nnn/GSE156441_RAW.tar
運行失敗低零,仔細查看
erythropoiesis - GEO DataSets - NCBI (nih.gov)
點擊Download data
可以查看GEO文件的各種組織形式
下載.soft文件可以找到series的下載地址
ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE156nnn/GSE156441/suppl/GSE156441_RAW.tar
#運行wget
wget ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE156nnn/GSE156441/suppl/GSE156441_RAW.tar
下載成功