一诱告、檢索已驗(yàn)證的調(diào)控單基因的轉(zhuǎn)錄因子
1、在線查詢數(shù)據(jù)庫(kù) (http://evexdb.org/)筑累,是以PubMed和PubMed Central中發(fā)表文章的摘要和全文為依據(jù)進(jìn)行文本挖掘探尋基因直接可能的相互作用的工具
貌似網(wǎng)站因?yàn)榘姹敬嬖谝稽c(diǎn)小問(wèn)題崇决,具體的內(nèi)容無(wú)法展開(kāi)。網(wǎng)友推薦以下解決方案
2键闺、使用Cytoscape的插件Cytoscape literature search,該插件可以通過(guò)給定關(guān)鍵字搜索文獻(xiàn)澈驼,并且基于搜索結(jié)果構(gòu)建互作網(wǎng)絡(luò)辛燥,幫助研究者快速搜索和提取基因之間,蛋白之間可能的聯(lián)系缝其。
從菜單欄Apps-Agilent Literature Search啟動(dòng)
使用界面如下挎塌。
左側(cè)一般輸入一個(gè)或多個(gè)基因 (若輸入多個(gè)則每一行輸入一個(gè)),右邊限制一個(gè)環(huán)境内边,可以是物種榴都,也可以是某種疾病如lung cancer,或某個(gè)過(guò)程stem cell漠其。下面的選項(xiàng)還可以選擇是否使用別名?(選擇后我們輸入的pou5f1就被轉(zhuǎn)成了oct4,?otf4等)嘴高,限定物種,限定相互作用的判斷 (個(gè)人一般使用relaxed)
前面輸入的內(nèi)容都會(huì)在Query Editor中轉(zhuǎn)換為邏輯查詢表達(dá)式的形式和屎,方便查看搜索的內(nèi)容是否符合自己的需要拴驮,也可以自行修改,比如我們把stem cell改為AND連接柴信。
點(diǎn)擊藍(lán)色箭頭就可以啟動(dòng)搜索莹汤。搜索到的文獻(xiàn)展示在左下角,可點(diǎn)擊跳轉(zhuǎn)到PubMed颠印,右鍵刪除某一項(xiàng)。
右側(cè)展示的是挖掘出的調(diào)控網(wǎng)絡(luò)抹竹,可以根據(jù)屬性進(jìn)行一些修飾线罕、美化和查詢。
但是我不太使用該方法窃判,下面介紹的這種方法我覺(jué)得還挺不錯(cuò)的钞楼,簡(jiǎn)潔明了,但是數(shù)據(jù)庫(kù)里錄入的靶基因與轉(zhuǎn)錄因子的關(guān)系不太多
3袄琳、TRRUST(Transcriptional Regulatory Relationships Unraveled by Sentence-based Text mining)询件,可公開(kāi)免費(fèi)獲得的人類TF-靶標(biāo)相互作用的數(shù)據(jù)庫(kù)
http://www.grnpedia.org/trrust/
Part 1
Search a gene in TRRUST database
這里可以查詢轉(zhuǎn)錄因子的靶基因:
非常智能的是燃乍,如果輸入的基因本身是編碼轉(zhuǎn)錄因子的基因,則會(huì)輸出該轉(zhuǎn)錄因子的靶基因宛琅、調(diào)控該轉(zhuǎn)錄因子的其他轉(zhuǎn)錄因子等內(nèi)容刻蟹。如果輸入的基因不是轉(zhuǎn)錄因子,則只會(huì)輸出調(diào)控該基因的轉(zhuǎn)錄因子嘿辟。
當(dāng)然這些在線數(shù)據(jù)庫(kù)也是具有預(yù)測(cè)功能的舆瘪,這里我們就不展開(kāi)討論了
二、預(yù)測(cè)單基因的轉(zhuǎn)錄因子
1红伦、結(jié)合UCSC英古、PROMO數(shù)據(jù)庫(kù)
首先,需要找到靶基因的啟動(dòng)子序列
打開(kāi)UCSC數(shù)據(jù)庫(kù)
以HOTAIR為例
點(diǎn)擊紅色的那個(gè)序列
點(diǎn)擊上圖中昙读,綠色框
繼續(xù)點(diǎn)擊
得到這個(gè)界面召调,我們需要修改一些參數(shù):轉(zhuǎn)錄起始位點(diǎn)上游2000nt和下游100nt區(qū)域?yàn)槲覀兯x的啟動(dòng)子區(qū)。
Submit
OK蛮浑,啟動(dòng)子序列有了唠叛。拷貝下來(lái)陵吸。
接下來(lái)玻墅,我們打開(kāi)PROMO數(shù)據(jù)庫(kù):
http://alggen.lsi.upc.es/cgi-b
在SelectSpecies進(jìn)行部分設(shè)置,
Submit
另外壮虫,如果對(duì)轉(zhuǎn)錄因子有選擇的話澳厢,也可以在SelectFactors中進(jìn)行設(shè)置。
最后囚似,我們點(diǎn)擊SearchSites
將剛剛得到的啟動(dòng)子序列粘貼進(jìn)行剩拢。另外,默認(rèn)容錯(cuò)率15%饶唤,如果得到的轉(zhuǎn)錄因子過(guò)多徐伐,我們可以進(jìn)行調(diào)整,設(shè)置成5%或0%募狂。
Submit
我最終設(shè)置了容錯(cuò)率為0办素,一共得到了120個(gè)預(yù)測(cè)的轉(zhuǎn)錄因子。
那么這些轉(zhuǎn)錄因子都有可能與HOTAIR的表達(dá)相關(guān)祸穷,可能存在正向或負(fù)向的調(diào)控關(guān)系性穿。
2、Genecards(https://www.genecards.org/Guide)
:這個(gè)數(shù)據(jù)庫(kù)是對(duì)基因信息的介紹很全面雷滚,包括基因組需曾、轉(zhuǎn)錄組和蛋白質(zhì)組學(xué)等。對(duì)于靶基因的轉(zhuǎn)錄因子預(yù)測(cè)也是可以查看的(詳細(xì)步驟如下圖)。以TP53基因?yàn)槔?/p>
1.先進(jìn)入genecards
2.搜索靶基因TP53:選擇第一個(gè)
3.進(jìn)入后如下呆万,并找到Genomics for TP53 Gene商源,就可以看到transcription factors binding sites了,也可以進(jìn)入圖形進(jìn)行查看谋减。
4. 找到SPP(Signaling Pathways Project)牡彻,點(diǎn)擊進(jìn)入:
5. SPP可以選擇物種類型,這里展示human的:(還可以選擇來(lái)源的系統(tǒng)哦)
6. 結(jié)果就是這樣的了:圖形中有對(duì)轉(zhuǎn)錄因子家族進(jìn)行分類逃顶,可以按照自己的需求進(jìn)行查看讨便。
數(shù)據(jù)庫(kù)預(yù)測(cè)靶基因的轉(zhuǎn)錄因子只是一種可能性,后續(xù)可以通過(guò)相關(guān)的文獻(xiàn)以及你的實(shí)驗(yàn)結(jié)果提示以政,進(jìn)一步去篩選可能性更大的轉(zhuǎn)錄因子霸褒,降低工作量(科研的有效時(shí)間應(yīng)該盡量做更多有效的實(shí)驗(yàn)!)
3盈蛮、Cistrome DB數(shù)據(jù)庫(kù)
https://link.zhihu.com/?target=http%3A//cistrome.org/db/%23/
點(diǎn)擊Toolkit?可以檢索哪個(gè)因子調(diào)控了我們感興趣的基因废菱,哪個(gè)因子結(jié)合在用戶的基因組區(qū)域或者和用戶的peak有顯著重疊。
使用方式和功能條件如下:
(1)輸入基因名稱抖誉, 查看有哪些轉(zhuǎn)錄因子可能調(diào)控該基因殊轴;
(2)輸入基因組區(qū)域,查看有哪些轉(zhuǎn)錄因子可能結(jié)合在該區(qū)域袒炉;
(3)輸入peak結(jié)果旁理,查看哪些轉(zhuǎn)錄因子的結(jié)果與你的輸入結(jié)果有明顯的overlap,可以用于轉(zhuǎn)錄因子的colocation分析。
這里我們重點(diǎn)介紹第一種:Toolkit從基因?qū)用婊卮稹癢hat factors regulate your gene of interest?”
以上面為例我磁,輸入基因GAPDH顯示內(nèi)容如下(因?yàn)樯厦嬷惠斎肓艘粋€(gè)基因孽文,沒(méi)有具體到位置,所以有多個(gè)位置選擇):
這里我們選擇片段:chr12:6534516:6538370:NM_001289746:GAPDH夺艰,點(diǎn)擊continue芋哭,提供內(nèi)容如下。
表格:
圖表:形式①郁副,可以選因子和生物來(lái)源:
橫坐標(biāo)表示調(diào)控潛勢(shì)(RP)减牺,縱坐標(biāo)表示不同的因子。
圖表:形式②:
上圖只展示前20(或更少)因子存谎,Y軸表示樣品中總peak的重疊峰比拔疚,X軸表示不同的因子,x軸上的點(diǎn)表示相同的因子既荚。
可以看到草雕,在這個(gè)功能中,我們可輸入任意的蛋白質(zhì)編碼基因固以,Cistrome DB Toolkit會(huì)返回按照調(diào)控潛能排序好的轉(zhuǎn)錄因子列表,哪個(gè)因子結(jié)合在用戶的基因組區(qū)域或者和用戶的peak有顯著重疊。
本次就先整理這么多憨琳,以上數(shù)據(jù)庫(kù)還有非常豐富實(shí)用的功能诫钓,等下次遇到我們?cè)僮隹偨Y(jié)。