由于之前的課題遺留了一些數(shù)據(jù)沒有進(jìn)行分析手蝎。
今天來嘗試一下所學(xué)榕莺,首先搜索
然后得到如下鏈接:2016年的時(shí)候曾老師已經(jīng)發(fā)過貼了。
http://www.biotrainee.com/thread-131-1-1.html
找到如下一系列相關(guān)功能網(wǎng)站:
1 JasPar http://jaspardev.genereg.net/
2 MotifMap http://motifmap.ics.uci.edu/
3 TRANSFAC Matrix models
http://www.gene-regulation.com/pub/databases.html
4 UniPROBE http://the_brain.bwh.harvard.edu/uniprobe/browse.php
5 Human Protein-DNA Interactome(hPDI) http://bioinfo.wilmer.jhu.edu/PDI/FAQ.html
6 Factorbook http://v1.factorbook.org/mediawi ... lcome_to_factorbook
7 DBD - TF prediction db http://www.transcriptionfactor.org/index.cgi?Home
8 HOCOMOCO http://hocomoco.autosome.ru/
9 一個(gè)轉(zhuǎn)錄因子相關(guān)數(shù)據(jù)庫列表:
http://meme-suite.org/db/motifs
Jaspar has motifs, not binding sites. These are short sequences of DNA that are known to attract transcription factor binding. You can use the motifs to predict where in the genome transcription factors might bind, however there is not necessarily experimental evidence that the transcription factor ever does.
Because of the random cutting step in ChIP-seq (fragments around 200bp), binding sites will be much larger than motifs (even though the region occupied by the transcription factor may not be much bigger than the motif).
Enrichr
http://amp.pharm.mssm.edu/Enrichr/
有了上述背景知識就好辦了棵介,現(xiàn)在我有一個(gè)123個(gè)候選轉(zhuǎn)錄因子列表(核蛋白IP后質(zhì)譜得到141個(gè)蛋白钉鸯,初篩去掉一些明顯的混雜因子),再去和已知的轉(zhuǎn)錄因子列表做一個(gè)map邮辽,估計(jì)能縮小后續(xù)驗(yàn)證范圍了唠雕。
想像很美好贸营,但是我打開這個(gè)MEME之后發(fā)現(xiàn)并不是這樣的情況啊。我需要先學(xué)習(xí)一下這個(gè)網(wǎng)站怎么使用岩睁。(太復(fù)雜不知道怎么用)
然后同學(xué)推薦用另一個(gè)在線工具g:pProfiler钞脂,這個(gè)在線工具糅合了ID轉(zhuǎn)換和功能富集分析大雜燴,網(wǎng)速還可以的情況下適合使用捕儒,批量導(dǎo)出圖片和數(shù)據(jù)還是比較快的冰啃,看起來功能還不錯(cuò)的樣子。
然后將之前獲核蛋白IP的list放進(jìn)去得到如下結(jié)果:
這種圖的解讀可以找到官方手冊來看净薛,但是具體的生物學(xué)意義就比較復(fù)雜了汪榔,我還沒完全搞懂蒲拉。
我得到的是 UniProt ID號,然后放在這里123個(gè)蛋白號做基因轉(zhuǎn)換后得到128個(gè)基因號
這種情況下該怎么改進(jìn)痴腌?我想要找到真正的轉(zhuǎn)錄因子雌团,最好是把motif一起展示出來,然后功能直接或間接抑制RCAN1-4的表達(dá)的士聪〗踉總不能一個(gè)一個(gè)去NCBI里面搜索吧。
有沒有相關(guān)的工具的推薦剥悟,謝謝灵寺。