利用GEOparse可以方便的從GEO數(shù)據(jù)庫(kù)(Gene Expression Omnibus Database)下載并處理數(shù)據(jù)罩缴。
在Python中安裝:
pip install GEOparse
同時(shí)請(qǐng)確保安裝了numpy 和pandas等包敢靡。
使用:
1:如果你想直接下載GSE1563這一個(gè)系列的芯片數(shù)據(jù)
import GEOparse
gse = GEOparse.get_GEO(geo="GSE1563", destdir="./")
2:如果你已經(jīng)在本地下載了芯片數(shù)據(jù)
import GEOparse
gse = GEOparse.get_GEO(filepath="./GSE1563.soft.gz")
以上兩條是下載或打開(kāi)芯片數(shù)據(jù)。
GEOparse有三個(gè)類(lèi)GSM:?jiǎn)我坏臉颖竞嬲溃籊SE:一系列的樣本立宜;GPL:平臺(tái)
.table 和.columns是GSM的兩個(gè)屬性站叼,返回的是pandas.dataframe對(duì)象。table是值随抠。