寫在前面
Emmm... 似乎發(fā)現(xiàn)自己的記憶力大不如前势篡。類似的問題以前我在知識(shí)星球?qū)戇^,不過現(xiàn)在確實(shí)沒有太多去上面寫念祭。
TBtools最早期的兩大主要功能碍侦,1)序列提取站玄;2)GO分析濒旦,包括注釋和富集分析。當(dāng)我們對(duì)一個(gè)基因集合進(jìn)行 GO 分析的時(shí)候尔邓,往往可能會(huì)遇到一個(gè)問題梯嗽。即,GO 注釋結(jié)果過于分散和復(fù)雜灯节。于是存在 GO slim绵估。
GO slim
一般情況下国裳,我們?cè)谧鯣O分析的時(shí)候會(huì)使用
但是這個(gè)文件中偿警,其實(shí)包含的信息比較龐大,如:
- 人類神經(jīng)發(fā)育相關(guān)的注釋,但是...如果你做植物七嫌,那么肯定植物又沒神經(jīng)苞慢?
- 植物花粉發(fā)育相關(guān)的,但是....如果你做動(dòng)物挽放,那么動(dòng)物哪里有花粉辑畦?
。纯出。。
于是GO slim就有了存在的理由暂筝。這事實(shí)上就是一堆又一堆的人對(duì)已有GO數(shù)據(jù)庫進(jìn)行相對(duì)特異性的注釋標(biāo)注,如存在
打開其中的注釋信息可以看到
授粉,果然就是植物的鸵赖。
但是問題來了,
只有 98個(gè) Term菲饼!是的宏悦,如果用這個(gè)文件去做分析,那么你當(dāng)然可以得到只屬于植物的GO注釋結(jié)果饼煞。然而事實(shí)是砖瞧,如果生物體再簡單,也簡單不到98個(gè)Term就可以覆蓋块促。
回頭再看 go-basic.obo
有 40000+ 個(gè)... 如果看看里面的 GOslim 信息竭翠。
確實(shí)只有98個(gè)....
OK,那么缺少的是啥渡八?
GO slim 缺少了很多生物體通用的Term
我的課題比較詭異传货,會(huì)涉及到減數(shù)分裂....如果我們用減數(shù)分類來搜索,會(huì)發(fā)現(xiàn)
找不到.... 而在 go-basic.obo中
寫在最后
于是....我一般還是建議....用全面的,分析出來之后僻澎,自己愛怎么過濾就按照自己的心情來。