最近有很多小伙伴私信喵學(xué)姐敏簿,說設(shè)計(jì)課題、設(shè)計(jì)實(shí)驗(yàn)的時(shí)候宣虾,找不到思路惯裕,有目標(biāo)基因但是又無(wú)法確定相關(guān)的通路。
今天喵學(xué)姐就教大家怎么查找基因和通路的關(guān)系绣硝,減少試錯(cuò)成本蜻势。
查找現(xiàn)有的研究結(jié)果
對(duì)于之前研究結(jié)果的確定,首先我們打開genecards(www.genecards.org/)鹉胖。genecards當(dāng)中總結(jié)了這個(gè)基因參與哪些經(jīng)典的通路握玛。在genecards里面匯總了KEGG等多個(gè)通路數(shù)據(jù)庫(kù)當(dāng)中的信息。
這里我們就以TP53為例甫菠,輸入想要檢索的基因選擇pathways進(jìn)行快速定位可以查看與這個(gè)基因有關(guān)的通路
確定基因和通路內(nèi)基因的關(guān)系
01查詢通路內(nèi)的基因
有時(shí)候我們想研究的目標(biāo)通路不在檢索列表挠铲,那我們還可以進(jìn)一步探究候選基因和目標(biāo)通路內(nèi)其他基因之間的關(guān)系。這里就可以用到PathCards(https://pathcards.genecards.org/)對(duì)目標(biāo)通路進(jìn)行檢索寂诱,獲取參與目標(biāo)通路的所有基因列表
在這個(gè)數(shù)據(jù)庫(kù)市殷,我們以Cell Cycle為例,輸入檢索就可以看到該通路所有相關(guān)的基因
這樣我們就獲得了目標(biāo)通路的所有基因了刹衫。
02蛋白相互作用分析
在我們獲得基因之后鳖眼,就可以看一下他們之間的互作關(guān)系讨便,我們可以把獲得的所有基因以及目標(biāo)基因差牛,統(tǒng)一放到STRING(https://string-db.org/)里面景描,就可以查看TP53和其他基因有沒有關(guān)系了。
分析完成后在下方下載結(jié)果文件
在Excel中篩選與TP53互作的蛋白仓犬。
03共表達(dá)分析
如果還想探究候選基因和目標(biāo)通路中的基因在某個(gè)疾病中的共表達(dá)關(guān)系嗅绰,我們可以借助cBioPortal數(shù)據(jù)庫(kù)(www.cbioportal.org/)。選擇想要分析的疾病隊(duì)列(這里以以甲狀腺癌的TCGA隊(duì)列為例)搀继,并輸入候選基因后窘面,點(diǎn)擊Co-expression模塊獲取基因的共表達(dá)關(guān)系。
△下載數(shù)據(jù)表格流程
我們把相關(guān)的結(jié)果全部下載下來(lái)之后叽躯,在excel中篩選一下财边,根據(jù)需求設(shè)定相關(guān)系數(shù)的閾值。在本示例中点骑,我們以p<0.05和r>0.5為閾值酣难,
這里可以看出只有FGD1的相關(guān)系數(shù)是大于0.5的谍夭。那如果我們后續(xù)要做一些富集分析,可以把相關(guān)系數(shù)閾值靈活調(diào)整憨募,如設(shè)置為0.4紧索,篩出8000多個(gè)基因,我們可以選取前100個(gè)基因進(jìn)行后續(xù)的富集分析
通過這些方法菜谣,大家會(huì)發(fā)現(xiàn)要了解基因和通路的關(guān)系也并不復(fù)雜珠漂,除了看文獻(xiàn),花點(diǎn)時(shí)間在數(shù)據(jù)庫(kù)查詢尾膊,也能獲得不少有價(jià)值的數(shù)據(jù)媳危,更為后續(xù)的分析、實(shí)驗(yàn)設(shè)計(jì)做了基礎(chǔ)