tophat軟件比對(duì)-實(shí)戰(zhàn)(2018-05-29)

1 比對(duì)的是:使用idba_ud拼接的AER314-4raw_data基因組與轉(zhuǎn)錄組數(shù)據(jù)经瓷。

2 bowtie2做index(bowtie2使用conda安裝)


安裝

建索引:bowtie2-build AER314-4_scaffold.fa AER314-4_scaffold.fa


索引目錄

3 reads mapping到參考基因組——tophat2軟件:基于bowtie2(tophat安裝見(jiàn)軟件安裝)

命令:tophat2 -p 12 -o AER314-4_output /home/test04/lyr/rna-seq/02align_out/AER314-4_scaffold.fa /home/test04/lyr/rna-seq/01data/YSH-qurRNA-42-314-4_L001_R1.fastq /home/test04/lyr/rna-seq/01data/YSH-qurRNA-42-314-4_L001_R2.fastq

4 然后就很順利的跑出來(lái)結(jié)果了

使用公司服務(wù)器败明,12個(gè)線程,大概五個(gè)小時(shí)就跑完啦逞姿。


結(jié)果文件

5 cufflink

[?? Cufflinks輸出結(jié)果

cufflinks的輸入文件是sam或bam格式辞嗡。并且sam或bam格式的文件必須排好序。(The SAM file supplied to Cufflinksmustbe sorted by? ? ? ? ? reference position.)Tophat的輸出結(jié)果sam或bam已經(jīng)排好了序滞造。針對(duì)其他的未排序的sam或bam文件采用如下排序方式:

sort -k 3,3 -k 4,4n hits.sam > hits.sam.sorted

1. transcripts.gtf

該文件包含Cufflinks的組裝結(jié)果isoforms续室。前7列為標(biāo)準(zhǔn)的GTF格式,最后一列為attributes断部。其每一列的意義:

列數(shù)? 列的名稱? 例子? ? ? ? 描述

1? ? 序列名? ? chrX? ? ? ? 染色體或contig名; 2? ? 來(lái)源? ? ? Cufflinks? 產(chǎn)生該文件的程序名; 3? ? 類型? ? ? exon? ? ? ? 記錄的類型猎贴,一般是transcript或exon; 4? ? 起始? ? ? 1? ? ? ? ? 1-base的值; 5? ? 結(jié)束? ? ? 1000? ? ? ? 結(jié)束位置; 6? ? 得分? ? ? 1000? ? ? ? ; 7? ? 鏈? ? ? ? +? ? ? ? ? Cufflinks猜測(cè)isoform來(lái)自參考序列的那一條鏈,一般是'+','-'或'.';8? ? frame? ? .? ? ? ? ? Cufflinks不去預(yù)測(cè)起始或終止密碼子框的位置; 9? ? attributes? ...? ? ? 詳見(jiàn)下

每一個(gè)GTF記錄包含如下attributes:

Attribute? ? ? 例子? ? ? 描述

gene_idCUFF.1Cufflinks的gene id;transcript_idCUFF.1.1? Cufflinks的轉(zhuǎn)錄子 id; FPKM? ? ? ? ? 101.267? isoform水平上的豐度,FragmentsPerKilobase of exon model perMillion mapped fragments; frac? ? ? ? ? 0.7647? ? 保留著的一項(xiàng)蝴光,忽略即可她渴,以后可能會(huì)取消這個(gè);conf_lo? ? ? ? 0.07? ? ? isoform豐度的95%置信區(qū)間的下邊界,即 下邊界值 = FPKM * ( 1.0 - conf_lo );conf_hi? ? ? ? 0.1102? ? isoform豐度的95%置信區(qū)間的上邊界蔑祟,即 上邊界值 = FPKM * ( 1.0 + conf_hi ); cov? ? ? ? ? ? 100.765?計(jì)算整個(gè)transcript上read的覆蓋度;full_read_support? yes? 當(dāng)使用 RABT assembly 時(shí)趁耗,該選項(xiàng)報(bào)告所有的introns和exons是否完全被reads所覆蓋

2. ispforms.fpkm_tracking

isoforms(可以理解為gene的各個(gè)外顯子)的fpkm計(jì)算結(jié)果

3. genes.fpkm_tracking

gene的fpkm計(jì)算結(jié)果Cuffmerge簡(jiǎn)介

Cuffmerge將各個(gè)Cufflinks生成的transcripts.gtf文件融合稱為一個(gè)更加全面的transcripts注釋結(jié)果文件merged.gtf。以利于用Cuffdiff來(lái)分析基因差異表達(dá)疆虚。

2. 使用方法

$ cuffmerge [options]*

輸入文件為一個(gè)文本文件苛败,是包含著GTF文件路徑的list。常用例子:

$ cuffmerge -o ./merged_asm -p 8 assembly_list.txt

3. 使用參數(shù)

-h | --help

-o? default: ./merged_asm

將結(jié)果輸出至該文件夾径簿。

-g | --ref-gtf將該reference GTF一起融合到最終結(jié)果中罢屈。

-p | --num-threads? defautl: 1

使用的CPU線程數(shù)

-s | --ref-sequence /該參數(shù)指向基因組DNA序列。如果是一個(gè)文件夾篇亭,則每個(gè)contig則是一個(gè)fasta文件缠捌;如果是一個(gè)fasta文件,則所有的contigs都需要在里面译蒂。Cuffmerge將使用該ref-sequence來(lái)幫助對(duì)transfrags分類曼月,并排除repeats。比如transcripts包含一些小寫堿基的將歸類到repeats.? ]

cufflinks:

<1>命令:cufflinks -p 4 -o test_cuff /home/andengdi/lyr/rna-seq/02-align_out/test_output/accepted_hits.bam

流程及結(jié)果

5 用相同的方法將其他兩個(gè)樣本跑一遍柔昼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哑芹,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子捕透,更是在濱河造成了極大的恐慌聪姿,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咳燕,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡曹货,警方通過(guò)查閱死者的電腦和手機(jī)玩般,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門镊绪,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蝴韭,“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵堡牡,是天一觀的道長(zhǎng)擦剑。 經(jīng)常有香客問(wèn)我惠勒,道長(zhǎng),這世上最難降的妖魔是什么售担? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮剖煌,結(jié)果婚禮上耕姊,老公的妹妹穿的比我還像新娘。我一直安慰自己邦邦,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布黔龟。 她就那樣靜靜地躺著惑畴,像睡著了一般如贷。 火紅的嫁衣襯著肌膚如雪尚猿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音秉馏,去河邊找鬼脱羡。 笑死萝究,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的锉罐。 我是一名探鬼主播帆竹,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼脓规!你這毒婦竟也來(lái)了栽连?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤侨舆,失蹤者是張志新(化名)和其女友劉穎秒紧,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體挨下,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡熔恢,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了臭笆。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片叙淌。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖愁铺,靈堂內(nèi)的尸體忽然破棺而出鹰霍,到底是詐尸還是另有隱情,我是刑警寧澤茵乱,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布衅谷,位于F島的核電站,受9級(jí)特大地震影響似将,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蚀苛,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一在验、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧堵未,春花似錦腋舌、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)赞辩。三九已至,卻和暖如春授艰,著一層夾襖步出監(jiān)牢的瞬間辨嗽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工淮腾, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留糟需,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓谷朝,卻偏偏與公主長(zhǎng)得像洲押,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子圆凰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容