RNA-seq融合檢測(cè)軟件

STAR-Fusion

地址:Home · STAR-Fusion/STAR-Fusion Wiki · GitHub

輸出文件示例:

#FusionName JunctionReadCount SpanningFragCount SpliceType LeftGene LeftBreakpoint RightGene RightBreakpoint LargeAnchorSupport FFPM LeftBreakDinuc LeftBreakEntropy RightBreakDinuc RightBreakEntropy annots

THRA--AC090627.1? ? ? 27? ? ? ? ? ? ? ? 93? ? ? ? ? ? ? ? ONLY_REF_SPLICE? ? ? THRA^ENSG00000126351.8? ? ? ? ? chr17:38243106:+? AC090627.1^ENSG00000235300.3? ? chr17:46371709:+? YES_LDAS? ? ? ? ? ? 23875.8456? GT? ? ? ? ? ? ? 1.8892? ? ? ? ? ? AG? ? ? ? ? ? ? 1.9656? ? ? ? ? ? ["CCLE","FA_CancerSupp","INTRACHROMOSOMAL[chr17:8.12Mb]"]

輸出文件說(shuō)明(難懂列說(shuō)明):

JunctionReadCount:支持?jǐn)帱c(diǎn)的split-reads數(shù)目

SpanningFragCount:包含斷點(diǎn)的RNA片段數(shù)目(一個(gè)RNA片段的兩條reads分別比對(duì)到不同的基因上)

SpliceType:斷點(diǎn)是否發(fā)生在參考轉(zhuǎn)錄本上

LargeAnchorSupport:斷點(diǎn)是否有左右兩端長(zhǎng)度比較長(zhǎng)的split-reads支持(即:斷點(diǎn)是否傾向于發(fā)生在split-reads中間)捣域;缺乏spanning片段和LargeAnchorSupport支持的斷點(diǎn)傾向于是假陽(yáng)性跺讯;LDAS = long double anchor support

FFPM:fusion fragments per million total reads(每M reads中支持融合的片段數(shù))

LeftBreakEntropy|RightBreakEntropy:斷點(diǎn)左右15bp(外顯子上)序列的Shannon Entropy潮太,代表序列復(fù)雜度(0-2之間,越高越復(fù)雜)

annots:對(duì)融合基因的簡(jiǎn)要注釋



Arriba

地址:Output files - Arriba

輸出文件示例:

#gene1 gene2 strand1(gene/fusion) strand2(gene/fusion) breakpoint1 breakpoint2 site1 site2 type split_reads1 split_reads2 discordant_mates coverage1 coverage2 confidence reading_frame tags retained_protein_domains closest_genomic_breakpoint1 closest_genomic_breakpoint2 gene_id1 gene_id2 transcript_id1 transcript_id2 direction1 direction2 filters fusion_transcript peptide_sequence read_identifiers

DDIT3 FUS -/- +/+ chr12:57914200 chr16:31196261 intron CDS/splice-site translocation 1 9 0 37 1082 high . . |RNA_recognition_motif._(a.k.a._RRM__RBD__or_RNP_domain)(100%),Zn-finger_in_Ran_binding_protein_and_others(100%) . . ENSG00000175197.6 ENSG00000089280.14 ENST00000551116.1 ENST00000254108.7 upstream upstream duplicates(7),mismatches(1) CTGAGCGTATCATGTTA?AGATGAGCGGGTGGCAGCGACAGAGCCAAAATCAGAGCTGGAACCTGAGGAGAGAGG|TAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAG . trn_433874,trn_135477,trn_142589,trn_1739741,trn_1779998,trn_2308393,trn_2332626,trn_242633,trn_2787100,trn_2946895,trn_297708,trn_3040178,trn_32450,trn_426992,trn_62570,trn_723483,trn_855077,trn_990866

輸出文件說(shuō)明(難懂列說(shuō)明):

strand:斜杠前后分別是基因strand和融合轉(zhuǎn)錄本strand;發(fā)生在基因間區(qū)的斷點(diǎn),基因?qū)?yīng)strand用‘.’表示,無(wú)法預(yù)測(cè)轉(zhuǎn)錄本方向的庵佣,也用‘.’表示

site:斷點(diǎn)位置類(lèi)型

filters:被篩選掉的支持?jǐn)帱c(diǎn)的reads數(shù)目及其原因


原理:

Arriba總的來(lái)說(shuō)是一個(gè)過(guò)濾器的集成軟工具,其主要有兩種水平的過(guò)濾:read-level和event-level汛兜。

先說(shuō)read-level:

(1)duplicates(重復(fù)):對(duì)于重復(fù)reads的過(guò)濾主要通過(guò)兩種方法(內(nèi)部和外部)巴粪,一種是根據(jù)片段比對(duì)位置(內(nèi)部),一種是根據(jù)文庫(kù)屬性(外部粥谬;比較適用于需要考慮文庫(kù)屬性肛根、加UMI標(biāo)簽的或無(wú)法利用比對(duì)位置去重的情況);內(nèi)部方法默認(rèn)不可改漏策,外部方法可用“-u”關(guān)掉派哲。

(2)uninteresting_contigs:去除涉及非感興趣染色體上(例如:人的24條染色體)的嵌合類(lèi)型;“-i”參數(shù)掺喻。

(3)viral_contigs:去除不涉及主染色體的嵌合類(lèi)型芭届,“-u”參數(shù)。

(4)top_expressed_viral_contigs:用于保留top N表達(dá)的病毒嵌合感耙,“-t”參數(shù)褂乍。參數(shù)思想是如果腫瘤真的源于病毒感染,那么會(huì)有大量的reads能夠比對(duì)到病毒序列上即硼;而且逃片,由于基因相關(guān)區(qū)域的缺乏,病毒嵌合很大程度上是一個(gè)隨機(jī)過(guò)程只酥,很多嵌合位點(diǎn)都是位于基因間區(qū)褥实;因此,大比例的intergenic-to-genic integration sites也是真正的病毒滲透的暗示裂允。

(5)low_coverage_viral_contigs:去除高覆蓋及低覆蓋的病毒contigs损离,參數(shù)“-C”。參數(shù)思想是一些病毒contigs會(huì)吸引一些比對(duì)錯(cuò)誤绝编,通常草冈,這些比對(duì)錯(cuò)誤會(huì)有聚集的焦點(diǎn)區(qū)域;而真正的病毒滲透會(huì)相對(duì)均勻瓮增。覆蓋度小于所有病毒contig平均覆蓋度的5%被認(rèn)為是不充分的怎棱,如果充分覆蓋占比小于15%,所有與病毒contig有關(guān)的融合候選都會(huì)被去除绷跑。

(6)read_through:去除測(cè)序一端比對(duì)到基因上拳恋,另一端比對(duì)到基因外且距離小于一定值(參數(shù)“-R”設(shè)置)的片段,以及配對(duì)reads的方向來(lái)自于經(jīng)典剪接的片段砸捏∶耍可以排除接近基因末端的短片段缺失。

(7)inconsistently_clipped:去除由于插入片段長(zhǎng)度過(guò)小垦藏,兩端有重合梆暖,但一端表現(xiàn)為split-reads,另一端不是的片段掂骏。

(8)homopolymer:去除斷點(diǎn)鄰近同聚體的候選融合轰驳。

(9)small_insert_size:去除起始終止位置相差小于5bp及方向是由于重復(fù)產(chǎn)生的reads對(duì)。

(10)long_gap:去除有長(zhǎng)gaps(>700kb)和短比對(duì)片段(<15nt)的reads弟灼。由于某些基因有超過(guò)1M的內(nèi)含子级解,有人在用STAR比對(duì)時(shí),為了容納這些內(nèi)含子會(huì)選擇把比對(duì)內(nèi)含子最大長(zhǎng)度(--alignIntronMax)設(shè)置超過(guò)該內(nèi)含子長(zhǎng)度田绑,這種可能會(huì)導(dǎo)致比對(duì)artifact勤哗。

(10)same_gene:去除比對(duì)到一個(gè)基因上的reads對(duì)。

---------------------待更新------------------------

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末掩驱,一起剝皮案震驚了整個(gè)濱河市芒划,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌欧穴,老刑警劉巖民逼,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異苔可,居然都是意外死亡缴挖,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)焚辅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)映屋,“玉大人,你說(shuō)我怎么就攤上這事同蜻∨锏悖” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵湾蔓,是天一觀的道長(zhǎng)瘫析。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么贬循? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任咸包,我火速辦了婚禮,結(jié)果婚禮上杖虾,老公的妹妹穿的比我還像新娘烂瘫。我一直安慰自己,他們只是感情好奇适,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布坟比。 她就那樣靜靜地躺著,像睡著了一般嚷往。 火紅的嫁衣襯著肌膚如雪葛账。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,144評(píng)論 1 285
  • 那天皮仁,我揣著相機(jī)與錄音籍琳,去河邊找鬼。 笑死魂贬,一個(gè)胖子當(dāng)著我的面吹牛巩割,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播付燥,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼宣谈,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了键科?” 一聲冷哼從身側(cè)響起闻丑,我...
    開(kāi)封第一講書(shū)人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎勋颖,沒(méi)想到半個(gè)月后嗦嗡,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡饭玲,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年侥祭,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茄厘。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡矮冬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出次哈,到底是詐尸還是另有隱情胎署,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布窑滞,位于F島的核電站琼牧,受9級(jí)特大地震影響恢筝,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜巨坊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一撬槽、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧抱究,春花似錦恢氯、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)勋磕。三九已至妈候,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間挂滓,已是汗流浹背苦银。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赶站,地道東北人吸祟。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓焰枢,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子乳绕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容