Error: unexpected input in "gse72815 <- read.table('Referdatacounts/GSE72815_series_matrix.txt.gz',"
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 1 did not have 6 elements
你在導入文件的時候是不是也經(jīng)常遇到這種報錯呢?
這個文檔特指在導入GEO的GSE****_series_matrix.txt.gz
時候翠忠,我就是,面對著這個文件內的一些東西頭疼的很嚎于,剛開始學GEO的時候,老師搞不定憎亚。
但是現(xiàn)在有一些竅門了衙耕。
這種文件有一個竅門。假如你下載下來有幾M凡壤,那么你的表達譜數(shù)據(jù)也大概率在里面署尤。
這種數(shù)據(jù)是GEO的一個特定格式,有一個函數(shù)可以特定的讀取的
library(GEOquery)
gse_number = "GSE72815"
gset = getGEO(gse_number,destdir = 'Referdatacounts/',getGPL = F) #記得把文件地址改了亚侠,改成你的
gse72815=exprs(gset[[1]])
這樣子是讀取本地的曹体,你也可以把其余參數(shù)去掉,只剩下GSE號碼硝烂,這樣的話就是下載數(shù)據(jù)了箕别。但是大數(shù)據(jù)不推薦,下載的太慢了滞谢。
還有一種情況串稀,你下載了,但是里面沒有表達矩陣狮杨。
你就遇到了這種的表達矩陣
一讀就報錯母截,誒這個不典型,換一個
行吧橄教,這個也不典型清寇,都是倆csv,直接read.csv就行了
我想告訴你的是护蝶,你可以
他就直接給你了代碼华烟,可以直接復制,然后持灰,不用再一個一個的調參數(shù)讀取了盔夜,很方便吧
快去試試吧