【circRNA】circRNA鑒定-find_circ篇

Find_circ工具是最早利用高通量測序數(shù)據(jù)預(yù)測環(huán)狀RNA的開山鼻祖。該工具是Memczak等人2013年在權(quán)威Nature雜志上發(fā)表題為“CircularRNAs are a large class of animal RNAs with regulatory potency”的文章時首次發(fā)布的喧兄,從而掀起了環(huán)狀RNA的研究熱潮乍构。

它的工作流程是:和參考基因組比對完之后西设,首先剔除和基因組完全比對的reads,保留沒比對上的reads, 這部分reads 直接比是比對不上基因組的,因為其來自不同的外顯子區(qū)域干签,直接比對的話不允許這么大片段的缺失,那么如何區(qū)分剪切的spliced read 和 來自環(huán)狀RNA的junction read呢拆撼,從上面的示意圖我們可以直接看出容劳,spliced read 的兩部分比對在基因組上的前后位置和轉(zhuǎn)錄本中的位置保持一致,而來自circRNA的junction read 其比對的位置是相反的闸度;具體操作的時候竭贩,首先從junction read的5'端和3'端取一部分序列,分別叫做5' anchor 和 3" anchor, 如果兩個序列比對的位置是相反的莺禁,這條reads 就是一個可能的junction read, 然后將anchor read 一直延伸留量,直到連接處為止,如果到連接處為止序列都能夠完全匹配哟冬,再看連接點處的剪切模式是否符合AG-GT的剪切模式楼熄,如果以上條件都滿足,就認定這是一個circRNA浩峡。(其實我在這里是疑惑的可岂,一定要AG-GT的剪切模式嗎,我看有的文章還有別的剪切模式翰灾,如果是這樣缕粹,感覺這個方法會預(yù)過濾掉一批circRNA數(shù)據(jù)

===下載和安裝====

下載:https://github.com/marvin-jens/find_circ

Find_circ需要運行在裝有python 2.7的64位系統(tǒng)上,同時需要安裝numpy和pysam這兩個python模塊预侯。其運行需要借助bowtie2和samtools來完成基因組mapping的過程致开。

====測試====

第一步:比對

bowtie2 -p 40 --very-sensitive--score-min=C,-15,0 --mm -x K326 -q -1 CK_0_1_1.fq.gz -2 CK_0_1_2.fq.gz -S CK_0_1.sam

samtools-1.9/samtools view -hbuS -o CK_0_1.bam CK_0_1.sam

samtools-1.9/samtools sort -@ 30 CK_0_1.bam -o CK_0_1.sort.bam

第二步:提取沒有比對上的序列

samtools-1.9/samtools view -hf 4 CK_0_1.sort.bam | samtools-1.9/samtools view -Sb - > CK_0_1.unmapped.bam

第三步:從序列兩端提取錨點序列(anchor)

source activate python27

python unmapped2anchors.py CK_0_1.unmapped.bam | gzip > CK_0_1.anchor.fq.gz

第四步:將錨點序列比對參考基因組

bowtie2 -p 40 --reorder --mm --score-min=C,-15,0 -q -x K326 -U CK_0_1.anchor.fq.gz -S CK_0_1.align.sam

第五步:預(yù)測circRNA

cat CK_0_1.align.sam | python find_circ.py -G Nitab-v4.5_genome_Scf_Edwards2017.fasta -p Nitab_? -n CK_0_1 -s CK_0_1_stats.txt -R CK_0_1_spliced_reads.fa > CK_0_1_splice_sites.bed

splice_sites結(jié)果如下圖所示:

-p參數(shù)指定的是第四列內(nèi)容的前綴,建議指定為物種對應(yīng)的三字母縮寫萎馅,需要注意的是双戳,在sites.bed中同時包含了環(huán)狀RNA和線性RNA,環(huán)狀RNA的名稱用circ標識,線性RNA的名稱用norm標識糜芳。

第六步:結(jié)果過濾與篩選

?

我看網(wǎng)上建議的過濾標注如下:

  1. 根據(jù)關(guān)鍵詞CIRCULAR篩選環(huán)狀RNA

  2. 去除線粒體上的環(huán)狀RNA

  3. 篩選unique junction reads數(shù)至少為2的環(huán)狀RNA

  4. 去除斷裂點不明確的環(huán)狀RNA

  5. 過濾掉長度大于100kb的circRNA,這里的100kb為基因組長度飒货,直接用環(huán)狀RNA的頭尾相減即可

grep CIRCULAR CK_0_1_splice_sites.bed | grep -v chrM | awk '$5>=2' | grep UNAMBIGUOUS_BP | grep ANCHOR_UNIQUE | python maxlength.py 100000 > CK_0_1_circ_candidates.bed

本文使用 文章同步助手 同步

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末魄衅,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子塘辅,更是在濱河造成了極大的恐慌晃虫,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扣墩,死亡現(xiàn)場離奇詭異哲银,居然都是意外死亡,警方通過查閱死者的電腦和手機呻惕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門荆责,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人亚脆,你說我怎么就攤上這事做院。” “怎么了濒持?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵键耕,是天一觀的道長。 經(jīng)常有香客問我柑营,道長屈雄,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任由境,我火速辦了婚禮棚亩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘虏杰。我一直安慰自己讥蟆,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布纺阔。 她就那樣靜靜地躺著瘸彤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪笛钝。 梳的紋絲不亂的頭發(fā)上质况,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機與錄音玻靡,去河邊找鬼结榄。 笑死,一個胖子當(dāng)著我的面吹牛囤捻,可吹牛的內(nèi)容都是我干的臼朗。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼视哑!你這毒婦竟也來了绣否?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤挡毅,失蹤者是張志新(化名)和其女友劉穎蒜撮,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體跪呈,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡段磨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了耗绿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片薇溃。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖缭乘,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情琉用,我是刑警寧澤堕绩,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站邑时,受9級特大地震影響奴紧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜晶丘,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一黍氮、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧浅浮,春花似錦沫浆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至郁油,卻和暖如春本股,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背桐腌。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工拄显, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人案站。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓躬审,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子盒件,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容