以「同源蛋白」為參考,高效提升「基因結(jié)構注釋」質(zhì)量

雖然我注,我在 IGV 的基礎上按咒,優(yōu)化增強,并開發(fā)了 IGV-GSAman但骨,但其實我也就前幾天才認認真真自己用了下励七,也做了不少優(yōu)化。大體上奔缠,應該是花了兩三天時間掠抬,優(yōu)化了20Mb*3 ,一共三條染色體的基因結(jié)構注釋校哎。
當然两波,我們知道,二代測序數(shù)據(jù)闷哆,更或者是三代測序數(shù)據(jù)從某個角度來說是最優(yōu)標準腰奋?但也有不少時候,二代數(shù)據(jù)根本看不清楚抱怔,而三代測序數(shù)據(jù)(轉(zhuǎn)錄本完整度OK劣坊,可是覆蓋率低)常常測不到不少位置的轉(zhuǎn)錄本。
于是屈留,往往會出現(xiàn)下述類似情況(其中橙色為擬南芥或和水稻比對到當然參考基因組的gff3結(jié)果)



此時讼稚,二代數(shù)據(jù)來看,很可能兩個轉(zhuǎn)錄本绕沈,在原始電子注釋中锐想,只注釋出左邊的部分。而同源蛋白注釋(水稻或者擬南芥)則表示乍狐,這里應該是一個蛋白赠摇。所以準確的注釋是一個蛋白,而不是兩個基因。當然藕帜,這個是比較簡單的情況烫罩。
很多時候,當一個位點的可變剪切模式過多的時候洽故,或者兩個位點靠得非常近贝攒,同源蛋白注釋可以告訴我們,這是兩個基因时甚,不是一個基因隘弊。而二代測序數(shù)據(jù),不行荒适。
更比如下面這個位點梨熙,其實也是一個。那么為什么中間二代測序數(shù)據(jù)會突然下降刀诬,一個是錯配問題咽扇,事實上,我們猜測是 hisat2 在這塊有小bug陕壹,提議用 STAR 质欲。另外,這個位點是原來沒有注釋出來的糠馆,同源注釋也讓我們更明確把敞,這就是一個可信的coding位點。


更或者這種時候榨惠,我們會更明確,其實中間有一個靠譜的蛋白需要我們?nèi)プ⑨尦鰜怼?/p>

那么問題來了盛霎,我們?nèi)绾蔚玫揭粋€「同源蛋白比對到當前物種基因組的 GFF3 文件」赠橙?答案就是lh3大神前面發(fā)表的一個軟件工作「miniprot」。這個軟件可以很快將蛋白序列比對到基因組序列上愤炸,快速重構出GFF3期揪。感覺非常不錯。使用起來也非常簡單规个,其實就是一個命令

miniprot -t 4 --gff ref.genome.fa query.prot.faa > out.gff3

當然凤薛,盡管只是一個命令,用起來還是不太方便诞仓。比如我還是看了一下manual缤苫,(或者說,以前我用過了墅拭,每次我還要看manual)活玲。同時呢,不少朋友其實就沒有服務器....在本地比如windows上跑起來不太方便。于是我想了想舒憾,方便以后操作镀钓,干脆做一個界面化功能出來。

用 TBtools 的「CLI Program Wrapper Creator」快速界面化已有軟件

我完全沒想到镀迂,整體使用非常簡單丁溅,感興趣的朋友可以參考之前的視頻教程,



前后居然不到 10min探遵,我相信窟赏,就算我自己來 Coding 一個出來,也不知道要寫是不是大半個小時别凤。同時還要debug饰序。但是現(xiàn)在,我一遍過规哪,導出來就是一個「實用插件」直接可以上架到 TBtools 的 Plugin Store....
太強了求豫!

寫在最后

Emmm,還是歡迎大伙一起來做做一些插件诉稍。一定要相信蝠嘉,有些事情,真的可以一勞永逸杯巨!

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蚤告,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子服爷,更是在濱河造成了極大的恐慌杜恰,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仍源,死亡現(xiàn)場離奇詭異心褐,居然都是意外死亡,警方通過查閱死者的電腦和手機笼踩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門逗爹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嚎于,你說我怎么就攤上這事掘而。” “怎么了于购?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵袍睡,是天一觀的道長。 經(jīng)常有香客問我肋僧,道長女蜈,這世上最難降的妖魔是什么持舆? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮伪窖,結(jié)果婚禮上逸寓,老公的妹妹穿的比我還像新娘。我一直安慰自己覆山,他們只是感情好竹伸,可當我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著簇宽,像睡著了一般勋篓。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上魏割,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天譬嚣,我揣著相機與錄音,去河邊找鬼钞它。 笑死拜银,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的遭垛。 我是一名探鬼主播尼桶,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼锯仪!你這毒婦竟也來了泵督?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤庶喜,失蹤者是張志新(化名)和其女友劉穎小腊,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體久窟,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡秩冈,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了瘸羡。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡搓茬,死狀恐怖犹赖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情卷仑,我是刑警寧澤峻村,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站锡凝,受9級特大地震影響粘昨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一张肾、第九天 我趴在偏房一處隱蔽的房頂上張望芭析。 院中可真熱鬧,春花似錦吞瞪、人聲如沸馁启。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惯疙。三九已至,卻和暖如春妖啥,著一層夾襖步出監(jiān)牢的瞬間霉颠,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工荆虱, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蒿偎,地道東北人。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓克伊,卻偏偏與公主長得像酥郭,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子愿吹,可洞房花燭夜當晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容