寫在前面
昨天建立了TBtools使用交流群-5氨淌,很快就快200人。主要還是感謝大家?guī)褪滞茝V伊磺。剛才看到一個有趣的問題盛正,正好,我手上在等一個流程的運行屑埋,那就大體寫寫豪筝。
TBtools輸出的基因結(jié)構(gòu)和GSDS_v2輸出的基因結(jié)構(gòu)不一樣?
以下貼圖
大體就是這位朋友或許并不相信TBtools的輸出摘能,我早已習(xí)慣這類续崖,所以也沒有太多脾氣(其實不相信的,就不要用就行啦)团搞。
GSDS是非常老牌的網(wǎng)頁工具严望,功能強(qiáng)大,非常適合用于做基因結(jié)構(gòu)展示莺丑,我本人非常仰慕這個網(wǎng)站的作者以及其維護(hù)團(tuán)隊著蟹。在我剛剛接觸生物信息數(shù)據(jù)時墩蔓,那會我還幫忙一個師兄本地化了GSDS網(wǎng)站。
這是一個相對繁瑣或者復(fù)雜的操作萧豆,主要是系統(tǒng)環(huán)境的配置等等奸披。但無論如何是需要本地化這個網(wǎng)站的,因為這個GSDS是面對全世界的互聯(lián)網(wǎng)用戶的涮雷,所以負(fù)載是一個問題阵面。這個跟一些云平臺一樣,如果你不進(jìn)行收費或者從其他方面變現(xiàn)洪鸭,那么純粹的公益样刷,是非常難堅持的。當(dāng)然览爵,也還有一種做法置鼻,就是量力而行。公益可以做蜓竹,但是保證在能力范圍內(nèi)箕母。所以大多數(shù)網(wǎng)頁服務(wù)類網(wǎng)站,會對用戶的輸入進(jìn)行一定的限制俱济。GSDS對基因的數(shù)目還是文件大小有一定的限制嘶是,超出這個限制,用戶需要自行本地化一個蛛碌。事實上聂喇,我認(rèn)為該團(tuán)隊能維護(hù)這個網(wǎng)頁服務(wù)至今,著實很不容易蔚携。
直到后面希太,我看到課題組有師妹需要做基因結(jié)構(gòu)可視化,想來這個東西事實似乎并不復(fù)雜浮梢,于是我就在TBtools里面寫了一個基因結(jié)構(gòu)可視化功能(純粹的Java碼從零實現(xiàn)跛十,與GSDS無關(guān))。我當(dāng)然沒想到秕硝,很快會有一些使用人群芥映。用戶的增加,加上使用交流群的活躍远豺。
我自認(rèn)為奈偏,基于用戶的反饋意見,目前這個工具很穩(wěn)健躯护,而且功能似乎也是比較完善惊来。
回到主題
事實上,我確實沒看明白這位朋友提出的問題棺滞。后續(xù)他給出另外的信息
我仍然沒看懂裁蚁,不過我事實上認(rèn)為:
- GSDS v2 幾乎不可能有問題矢渊,所以他沒錯
- TBtools 這個功能經(jīng)過數(shù)百上千人測試,也不會有錯
- 那么就只有他錯
事實如下
問題其實很簡單枉证,他將同一個gff文件輸入到GSDS和TBtools矮男,然后得到了看起來并不相同的結(jié)果:
- GSDS 只顯示Exon
- TBtools 顯示了CDS,也顯示了UTR
那么問題就在于室谚,用戶提供的文件里面毡鉴,并沒有UTR
但這正是TBtools開發(fā)過程中我個人的一些想法的融入
TBtools在基因結(jié)構(gòu)可視化上的考慮
雖然我使用過GSDS,不過我并沒有去研究過源碼秒赤。事實上猪瞬,我很少看別人的源碼,因為我真的看不懂入篮。那次的使用經(jīng)驗告訴我陈瘦,如果我來寫一個工具,那么我會考慮其他一些相對常見的情況:
- gff3/gtf文件崎弃,兩種格式應(yīng)該同時自動支持
- 不應(yīng)該由用戶自行準(zhǔn)備gff3或gff文件的子集甘晤,因為文件可能很大,比如100Mb饲做,從其中抽取子集,可能會有麻煩遏弱。所以應(yīng)該允許用戶直接提供原始的gff3或GTF文件盆均,軟件自動完成提取并可視化
- 基因結(jié)構(gòu)的展示,常常主要目的是看編碼區(qū)域的變化漱逸,所以CDS是一個核心泪姨。加入一個文件只有CDS和mRNA,那么應(yīng)該考慮兩者的邊界饰抒,如果邊界不一致肮砾,那么問題很簡單,剩余的部分是UTR袋坑。所以在上述情況下仗处,TBtools自動計算出UTR
- 蛋白結(jié)構(gòu)域坐標(biāo)應(yīng)該支持自動映射到基因外顯子內(nèi)含子坐標(biāo)
- ....
事實上,還有很多枣宫。TBtools當(dāng)然也支持非編碼序列的基因結(jié)構(gòu)可視化婆誓,那種情況就只有Exon。
大體上也颤,用一張圖來說明TBtools就基因結(jié)構(gòu)可視化的一些特點
請注意洋幻,圖形是可以交互了。你可以快速的批量的:
1.修改顏色
2.修改字體
3.修改性狀
4.....
寫在后面
用了半個小時翅娶,寫了一個推文文留『梦ǎ總的來說,沒有一個工具是完美的燥翅,但是有一些工具是活著的渠啊。