組裝結(jié)果統(tǒng)計(jì)及繪圖

組裝結(jié)果統(tǒng)計(jì)

下面對(duì)組裝得到fasta 格式基因組序列進(jìn)行長(zhǎng)度、N50 等統(tǒng)計(jì)即纲。

使用assembly-stats對(duì)組裝結(jié)果進(jìn)行統(tǒng)計(jì)

下載地址:https://github.com/sanger-pathogens/assembly-stats

assembly-stats K41.scafSeq \ #輸入組裝結(jié)果文件
 > out.N50.stat #輸出文件

cat out.N50.stat
stats for K41.scafSeq
sum = 4551705, n = 166, ave = 27419.91, largest = 236234 N50 = 95421, n = 15
N60 = 78576, n = 21
N70 = 57780, n = 28 N80 = 42471, n = 36 N90 = 29527, n = 49 N100 = 100, n = 166 N_count = 428
Gaps = 19

gc-depth 分析

得到組裝結(jié)果后啦撮,可以通過(guò)將測(cè)序數(shù)據(jù)比對(duì)回拼接結(jié)果谭网,將全基因組劃分窗口,統(tǒng)計(jì)每個(gè)窗口的平均GC 含量和覆蓋深度赃春,得到gc-depth 圖蜻底。

#構(gòu)建基因組bwa index
bwa index genome.fasta

#比對(duì)并排序
bwa mem -t 4 \#線(xiàn)程數(shù)
genome.fasta ./ecoli_R1.fastq.gz ./ecoli_R2.fastq.gz | \ #輸入文件
samtools sort - -o aln_sort.bam

#定義變量
genome=genome.fasta ## 基因組文件
bam=aln_sort.bam ## 比對(duì)結(jié)果文件
prefix=gcdep ## 輸出結(jié)果前綴
window=500 ## 窗口大小
step=250 ## 步長(zhǎng)

#計(jì)算基因組序列長(zhǎng)度
seqtk comp $genome | awk '{print $1"\t"$2}' > $prefix.len

#劃分窗口 生成bed文件
bedtools makewindows -w $window -s $step -g $prefix.len > $prefix.window.bed

#按窗口提取序列并計(jì)算gc含量
seqtk subseq $genome $prefix.window.bed > $prefix.window.fasta
seqtk comp $prefix.window.fasta |awk '{print $1 "\t" ($4+$5)/($3+$4+$5+$6) }' > $prefix.window.gc

#按窗口計(jì)算平均深度
bedtools coverage -b aln_sort.bam -a gcdep.window.bed -mean | awk '{print $1":"$2+1"-"$3"\t"$4}' > $prefix.window.depth

#繪圖
Rscript run_gcdep.R $prefix.window.gc $prefix.window.depth $prefix.pdf 0 0.8 0 500

歡迎關(guān)注Bioinfor 生信云!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末聘鳞,一起剝皮案震驚了整個(gè)濱河市薄辅,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌抠璃,老刑警劉巖站楚,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異搏嗡,居然都是意外死亡窿春,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)采盒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)旧乞,“玉大人,你說(shuō)我怎么就攤上這事磅氨〕咂埽” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵烦租,是天一觀的道長(zhǎng)延赌。 經(jīng)常有香客問(wèn)我,道長(zhǎng)叉橱,這世上最難降的妖魔是什么挫以? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮窃祝,結(jié)果婚禮上掐松,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好大磺,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布泻仙。 她就那樣靜靜地躺著浪汪,像睡著了一般廷痘。 火紅的嫁衣襯著肌膚如雪虐急。 梳的紋絲不亂的頭發(fā)上故痊,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天煤篙,我揣著相機(jī)與錄音吩屹,去河邊找鬼屋灌。 笑死益眉,一個(gè)胖子當(dāng)著我的面吹牛袭灯,可吹牛的內(nèi)容都是我干的刺下。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼稽荧,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼橘茉!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起姨丈,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤畅卓,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后蟋恬,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體翁潘,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年歼争,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拜马。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡沐绒,死狀恐怖俩莽,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情乔遮,我是刑警寧澤扮超,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站申眼,受9級(jí)特大地震影響瞒津,放射性物質(zhì)發(fā)生泄漏蝉衣。R本人自食惡果不足惜括尸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望病毡。 院中可真熱鬧濒翻,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至雀摘,卻和暖如春裸删,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背阵赠。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工涯塔, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人清蚀。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓匕荸,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親枷邪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子榛搔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容