基因結(jié)構(gòu)可視化摔握,是不是有坑?丁寄!

寫在前面

昨天建立了TBtools使用交流群-5氨淌,很快就快200人。主要還是感謝大家?guī)褪滞茝V伊磺。剛才看到一個有趣的問題盛正,正好,我手上在等一個流程的運行屑埋,那就大體寫寫豪筝。

TBtools輸出的基因結(jié)構(gòu)和GSDS_v2輸出的基因結(jié)構(gòu)不一樣?

以下貼圖


大體就是這位朋友或許并不相信TBtools的輸出摘能,我早已習(xí)慣這類续崖,所以也沒有太多脾氣(其實不相信的,就不要用就行啦)团搞。
GSDS是非常老牌的網(wǎng)頁工具严望,功能強(qiáng)大,非常適合用于做基因結(jié)構(gòu)展示莺丑,我本人非常仰慕這個網(wǎng)站的作者以及其維護(hù)團(tuán)隊著蟹。在我剛剛接觸生物信息數(shù)據(jù)時墩蔓,那會我還幫忙一個師兄本地化了GSDS網(wǎng)站。
這是一個相對繁瑣或者復(fù)雜的操作萧豆,主要是系統(tǒng)環(huán)境的配置等等奸披。但無論如何是需要本地化這個網(wǎng)站的,因為這個GSDS是面對全世界的互聯(lián)網(wǎng)用戶的涮雷,所以負(fù)載是一個問題阵面。這個跟一些云平臺一樣,如果你不進(jìn)行收費或者從其他方面變現(xiàn)洪鸭,那么純粹的公益样刷,是非常難堅持的。當(dāng)然览爵,也還有一種做法置鼻,就是量力而行。公益可以做蜓竹,但是保證在能力范圍內(nèi)箕母。所以大多數(shù)網(wǎng)頁服務(wù)類網(wǎng)站,會對用戶的輸入進(jìn)行一定的限制俱济。GSDS對基因的數(shù)目還是文件大小有一定的限制嘶是,超出這個限制,用戶需要自行本地化一個蛛碌。事實上聂喇,我認(rèn)為該團(tuán)隊能維護(hù)這個網(wǎng)頁服務(wù)至今,著實很不容易蔚携。
直到后面希太,我看到課題組有師妹需要做基因結(jié)構(gòu)可視化,想來這個東西事實似乎并不復(fù)雜浮梢,于是我就在TBtools里面寫了一個基因結(jié)構(gòu)可視化功能(純粹的Java碼從零實現(xiàn)跛十,與GSDS無關(guān))。我當(dāng)然沒想到秕硝,很快會有一些使用人群芥映。用戶的增加,加上使用交流群的活躍远豺。
我自認(rèn)為奈偏,基于用戶的反饋意見,目前這個工具很穩(wěn)健躯护,而且功能似乎也是比較完善惊来。

回到主題

事實上,我確實沒看明白這位朋友提出的問題棺滞。后續(xù)他給出另外的信息



我仍然沒看懂裁蚁,不過我事實上認(rèn)為:

  1. GSDS v2 幾乎不可能有問題矢渊,所以他沒錯
  2. TBtools 這個功能經(jīng)過數(shù)百上千人測試,也不會有錯
  3. 那么就只有他錯

事實如下


問題其實很簡單枉证,他將同一個gff文件輸入到GSDS和TBtools矮男,然后得到了看起來并不相同的結(jié)果:

  1. GSDS 只顯示Exon
  2. TBtools 顯示了CDS,也顯示了UTR

那么問題就在于室谚,用戶提供的文件里面毡鉴,并沒有UTR

但這正是TBtools開發(fā)過程中我個人的一些想法的融入

TBtools在基因結(jié)構(gòu)可視化上的考慮

雖然我使用過GSDS,不過我并沒有去研究過源碼秒赤。事實上猪瞬,我很少看別人的源碼,因為我真的看不懂入篮。那次的使用經(jīng)驗告訴我陈瘦,如果我來寫一個工具,那么我會考慮其他一些相對常見的情況:

  1. gff3/gtf文件崎弃,兩種格式應(yīng)該同時自動支持
  2. 不應(yīng)該由用戶自行準(zhǔn)備gff3或gff文件的子集甘晤,因為文件可能很大,比如100Mb饲做,從其中抽取子集,可能會有麻煩遏弱。所以應(yīng)該允許用戶直接提供原始的gff3或GTF文件盆均,軟件自動完成提取并可視化
  3. 基因結(jié)構(gòu)的展示,常常主要目的是看編碼區(qū)域的變化漱逸,所以CDS是一個核心泪姨。加入一個文件只有CDS和mRNA,那么應(yīng)該考慮兩者的邊界饰抒,如果邊界不一致肮砾,那么問題很簡單,剩余的部分是UTR袋坑。所以在上述情況下仗处,TBtools自動計算出UTR
  4. 蛋白結(jié)構(gòu)域坐標(biāo)應(yīng)該支持自動映射到基因外顯子內(nèi)含子坐標(biāo)
  5. ....

事實上,還有很多枣宫。TBtools當(dāng)然也支持非編碼序列的基因結(jié)構(gòu)可視化婆誓,那種情況就只有Exon。

大體上也颤,用一張圖來說明TBtools就基因結(jié)構(gòu)可視化的一些特點


請注意洋幻,圖形是可以交互了。你可以快速的批量的:
1.修改顏色
2.修改字體
3.修改性狀
4.....

寫在后面

用了半個小時翅娶,寫了一個推文文留『梦ǎ總的來說,沒有一個工具是完美的燥翅,但是有一些工具是活著的渠啊。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市权旷,隨后出現(xiàn)的幾起案子替蛉,更是在濱河造成了極大的恐慌,老刑警劉巖拄氯,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件躲查,死亡現(xiàn)場離奇詭異,居然都是意外死亡译柏,警方通過查閱死者的電腦和手機(jī)镣煮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鄙麦,“玉大人典唇,你說我怎么就攤上這事】韪” “怎么了介衔?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長骂因。 經(jīng)常有香客問我炎咖,道長,這世上最難降的妖魔是什么寒波? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任乘盼,我火速辦了婚禮,結(jié)果婚禮上俄烁,老公的妹妹穿的比我還像新娘绸栅。我一直安慰自己,他們只是感情好页屠,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布粹胯。 她就那樣靜靜地躺著,像睡著了一般卷中。 火紅的嫁衣襯著肌膚如雪矛双。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天蟆豫,我揣著相機(jī)與錄音议忽,去河邊找鬼。 笑死十减,一個胖子當(dāng)著我的面吹牛栈幸,可吹牛的內(nèi)容都是我干的愤估。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼速址,長吁一口氣:“原來是場噩夢啊……” “哼玩焰!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起芍锚,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤昔园,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后并炮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體默刚,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年逃魄,在試婚紗的時候發(fā)現(xiàn)自己被綠了荤西。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡伍俘,死狀恐怖邪锌,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情癌瘾,我是刑警寧澤觅丰,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站柳弄,受9級特大地震影響舶胀,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜碧注,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望糖赔。 院中可真熱鬧萍丐,春花似錦、人聲如沸放典。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽奋构。三九已至壳影,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間弥臼,已是汗流浹背宴咧。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留径缅,地道東北人掺栅。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓烙肺,卻偏偏與公主長得像,于是被迫代替她去往敵國和親氧卧。 傳聞我的和親對象是個殘疾皇子桃笙,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容