記錄今天學(xué)會(huì)的一個(gè)小知識(shí):統(tǒng)計(jì)測(cè)序文件的reads長(zhǎng)度分布
由于某些原因,需要統(tǒng)計(jì)reads長(zhǎng)度分布對(duì)建庫(kù)方法進(jìn)行質(zhì)控须肆,對(duì)測(cè)序數(shù)據(jù)進(jìn)行可用與否的評(píng)估匿乃。
有兩個(gè)文庫(kù):質(zhì)檢差別比較大,一個(gè)從100bp開始起峰豌汇,主峰在200bp幢炸;另一個(gè)從200bp開始起峰,主峰在300+bp
為了去探究?jī)煞N文庫(kù)到底哪一種更適合我們進(jìn)行下游的分析拒贱,因此我們進(jìn)行了這個(gè)操作宛徊。
首先需要產(chǎn)生sorted的bam文件佛嬉,并利用 samtools index -b test.bam
命令產(chǎn)生相應(yīng)的index file
接下來使用不知道到底是deeptools還是bedtools的bamPEFragmentSize進(jìn)行統(tǒng)計(jì)分析:
bamPEFragmentSize --histogram fragmentSize.png -T "Fragment Size" --maxFragmentLength 1000 -b <input.sorted.bam> --samplesLabel <sample_name>
**屆時(shí)統(tǒng)計(jì)結(jié)果會(huì)直接輸出屏幕,而png會(huì)直接產(chǎn)生闸天,可下載本地查看暖呕,如果增加--table參數(shù)還會(huì)輸出一個(gè)table。具體參數(shù)詳見[bamPEFragmentSize — deepTools 3.5.0 documentation]
(https://deeptools.readthedocs.io/en/develop/content/tools/bamPEFragmentSize.html)
例圖如下:
另外還有其他方法詳見博文:給你bam文件苞氮,你會(huì)畫插入片段長(zhǎng)度分布圖嗎湾揽? - 云+社區(qū) - 騰訊云 (tencent.com)
PS:實(shí)測(cè)bamPEFragmentSize出結(jié)果很快,約莫1-2分鐘笼吟,而給出鏈接的博文很慢很慢很慢吶