在單細(xì)胞數(shù)據(jù)分析過程中芯急,我們要分析某個(gè)亞群的特征鹊漠,往往離不開找到與之相關(guān)的基因集/通路/轉(zhuǎn)錄因子/蛋白網(wǎng)絡(luò)等队询,這時(shí)候就需要一個(gè)基因名與通路/轉(zhuǎn)錄因子/蛋白網(wǎng)絡(luò)的對(duì)應(yīng)關(guān)系。我們知道GSEA恰好系統(tǒng)地提供了一些對(duì)應(yīng)關(guān)系腾誉,這就像巨人的肩膀,有了它我們可以看得更遠(yuǎn)。
所謂:
吾嘗終日而思矣利职,不如須臾之所學(xué)也趣效;吾嘗跂而望矣,不如登高之博見也猪贪。登高而招跷敬,臂非加長也,而見者遠(yuǎn)热押;順風(fēng)而呼西傀,聲非加疾也,而聞?wù)哒猛把ⅰ<佥涶R者拥褂,非利足也,而致千里牙寞;假舟楫者饺鹃,非能水也,而絕江河碎税。君子生非異也尤慰,善假于物也。
下面我們就來看看GSEA基因集如何批量下載雷蹂。
GSEA 數(shù)據(jù)集主頁:
我要下載的基因集:
https://www.gsea-msigdb.org/gsea/msigdb/collections.jsp#C7
在瀏覽器上點(diǎn)擊要下載的文件后伟端,確認(rèn)下載:
在下載的地方,獲取下載鏈接匪煌。當(dāng)然這一步是關(guān)鍵的责蝠,懂HTML的話,可以直接在GSEA頁面獲取下載鏈接萎庭。
下載鏈接大概是這樣的:
https://data.broadinstitute.org/gsea-msigdb/msigdb/release/7.2/c4.all.v7.2.symbols.gmt
我們觀察到文件被放在https://data.broadinstitute.org/gsea-msigdb/msigdb/release/7.2/
下了霜医,于是,我們直接復(fù)制這個(gè)鏈接到瀏覽器驳规,回車:
可以看到所有的文件都在這了肴敛,我們可以挨個(gè)下載,也可以用Python吗购,wget医男,R等來下載。需要注意的是捻勉,在文件列表的結(jié)尾作者是給了壓縮包的:
有了基因集我們就可以做下游的分析了如:
AUCell:在單細(xì)胞轉(zhuǎn)錄組中識(shí)別細(xì)胞對(duì)“基因集”的響應(yīng)
把基因調(diào)節(jié)信息映射在細(xì)胞圖譜上镀梭,而不僅僅是基因表達(dá)量。