deeptools系列01-multiBamSummary

一狱杰、deeptools?multiBamSummary詳細(xì)介紹

官網(wǎng)說明書——deeptools multiBamSummary

功能:計(jì)算兩個(gè)以上(含兩個(gè))BAM文件的基因組區(qū)域的覆蓋度差凹。

兩種模式:

? ? ? ? bin模式是對(duì)全基因組進(jìn)行計(jì)算,針對(duì)大小相等的bins(默認(rèn)值:10kb)期奔,這種模式用于評(píng)估BAM文件的全基因組相似性侧馅;

? ? ? ? BED-file模式是對(duì)指定區(qū)域進(jìn)行計(jì)算。

標(biāo)準(zhǔn)輸出文件:

? ? ? ? 以.npz為后綴的文件呐萌,該文件不僅可以直接用于deeptools中的“plotCorrelation”計(jì)算并可視化覆蓋度之間的相關(guān)性馁痴,而且也能用于deeptools中的“plotPCA”進(jìn)行主成分分析。



二肺孤、deeptools?multiBamSummary用法及參數(shù)

(1)bins mode

multiBamSummary bins --bamfiles file1.bam file2.bam -o results.npz

--bamfiles(-b):bam文件

--outFileName(-out / -o ):? 輸出文件名罗晕。

參數(shù):

--labels(-l ) : 非默認(rèn)的標(biāo)簽,用戶自定義文件名標(biāo)簽赠堵。標(biāo)簽之間用空格隔開小渊。

--smartLabels: 不用手動(dòng)給輸入的bam文件加標(biāo)簽,deeptools 會(huì)移除路徑和擴(kuò)展名后使用文件名茫叭。

--genomeChunkSize : 手動(dòng)指定基因組大小酬屉。默認(rèn)值為不指定,由bam文件的read 密度決定揍愁。

--binSize (-bs): 用于樣品的基因組窗口大小呐萨。默認(rèn)值是10kb。

--distanceBetweenBins (-n ): 默認(rèn)情況下莽囤,multiBamSummary認(rèn)為窗口是連續(xù)的谬擦。但是,為了節(jié)省計(jì)算時(shí)間朽缎,可以指定比窗口數(shù)更大的間隔長度惨远,服務(wù)器會(huì)識(shí)別更少的bins.默認(rèn)值是0。

--version: 顯示程序版本號(hào)并退出话肖。

--region(-r): 用于限制運(yùn)行的基因組區(qū)域锨络。當(dāng)測試參數(shù)時(shí),利用--region這個(gè)參數(shù)可以大大減少運(yùn)行時(shí)間狼牺。格式是:chr:start:end。如 -region chr10 或者 -region chr10:456700:891000礼患。

--blackListFileName(-bl):bed或gtf格式文件能夠包括不用于分析的區(qū)域是钥。通過排除基因組區(qū)塊,能夠產(chǎn)生重疊區(qū)域缅叠。對(duì)于Bam文件而言悄泥,如果一條read有部分黑名單區(qū)域或者片段間隔,那么這個(gè)read或者fragment也仍會(huì)被考慮在內(nèi)肤粱。如果有相關(guān)情況弹囚,注意你應(yīng)該調(diào)整有效的基因組大小。

--numberOfProcessor(-p): 使用處理器的數(shù)量领曼。默認(rèn)值是1鸥鹉。

--verbose(-v): 設(shè)置查看運(yùn)行消息蛮穿。

--outRawCounts:保存的couts數(shù)區(qū)域(制表符隔開)文件。

--scalingFactors:計(jì)算比例因子(DESeq2 方式)能用于bamCoverage并寫入一個(gè)文件毁渗。該文件用制表符隔開樣品列和比例因子列践磅。

--extendReads(-e) : 該參數(shù)可以把reads擴(kuò)展到fragment大小。

--ignoreDuplicates:具有相同起始終止位點(diǎn)的reads僅讀一次灸异。

--minMappingQuality:那些至少達(dá)到最低mapping質(zhì)量得分的reads才能被考慮在內(nèi)府适。

--centerReads:相對(duì)于片段長度,reads處于中心位置肺樟。

--samFlagInclude:基于sam flag包括在內(nèi)的reads檐春。默認(rèn)值:None。

--samFlagExclude:基于sam flag之外的reads么伯。默認(rèn)值:None疟暖。

--minFragmentLength:最小的片段長度。默認(rèn)值為0蹦狂。

--maxFragmentLength:最大的片段長度誓篱。默認(rèn)值為0。


(2)BED-file mode

multiBamSummary BED-file --BED selection.bed --bamfiles file1.bam file2.bam -o results.npz

參數(shù):

--bamfiles(-b):bam文件凯楔,文件之間用空格隔開窜骄。

--outFileName(-out/-o): 輸出文件名。

--BED:限制覆蓋度分析的區(qū)域摆屯。

--labels(-l ) : 非默認(rèn)的標(biāo)簽邻遏,用戶自定義文件名標(biāo)簽。標(biāo)簽之間用空格隔開虐骑。

--smartLabels: 不用手動(dòng)給輸入的bam文件加標(biāo)簽准验,deeptools 會(huì)移除路徑和擴(kuò)展名后使用文件名。

--genomeChunkSize : 手動(dòng)指定基因組大小廷没。默認(rèn)值為不指定糊饱,由bam文件的read 密度決定。

--version: 顯示程序版本號(hào)并退出颠黎。

--region(-r): 用于限制運(yùn)行的基因組區(qū)域另锋。當(dāng)測試參數(shù)時(shí),利用--region這個(gè)參數(shù)可以大大減少運(yùn)行時(shí)間狭归。格式是:chr:start:end夭坪。如 -region chr10 或者 -region chr10:456700:891000。

--blackListFileName(-bl):bed或gtf格式文件能夠包括不用于分析的區(qū)域过椎。通過排除基因組區(qū)塊室梅,能夠產(chǎn)生重疊區(qū)域。對(duì)于Bam文件而言,如果一條read有部分黑名單區(qū)域或者片段間隔亡鼠,那么這個(gè)read或者fragment也仍會(huì)被考慮在內(nèi)赏殃。如果有相關(guān)情況,注意你應(yīng)該調(diào)整有效的基因組大小拆宛。

--numberOfProcessor(-p): 使用處理器的數(shù)量嗓奢。默認(rèn)值是1。

--verbose(-v): 設(shè)置查看運(yùn)行消息浑厚。

--outRawCounts:保存的couts數(shù)區(qū)域(制表符隔開)文件股耽。

--scalingFactors:計(jì)算比例因子(DESeq2 方式)能用于bamCoverage并寫入一個(gè)文件。該文件用制表符隔開樣品列和比例因子列钳幅。

--extendReads(-e) : 該參數(shù)可以把reads擴(kuò)展到fragment大小物蝙。

--ignoreDuplicates:具有相同起始終止位點(diǎn)的reads僅讀一次。

--minMappingQuality:那些至少達(dá)到最低mapping質(zhì)量得分的reads才能被考慮在內(nèi)敢艰。

--centerReads:相對(duì)于片段長度诬乞,reads處于中心位置。

--samFlagInclude:基于sam flag包括在內(nèi)的reads钠导。默認(rèn)值:None震嫉。

--samFlagExclude:基于sam flag之外的reads。默認(rèn)值:None牡属。

--minFragmentLength:最小的片段長度票堵。默認(rèn)值為0。

--maxFragmentLength:最大的片段長度逮栅。默認(rèn)值為0悴势。

GTF/BED12 參數(shù):

--metagene : 當(dāng)BED12或GTF文件用于提供區(qū)域,會(huì)計(jì)算合并的外顯子措伐,而不是用5'端或3'端來定義間隔特纤。默認(rèn)值是False。

--transcriptID: 當(dāng)GTF文件用于提供區(qū)域侥加,第三列transcript用于計(jì)算捧存。默認(rèn)值是transcript。

--exonID: 當(dāng)GTF文件用于提供區(qū)域担败,第三列exon用于計(jì)算矗蕊。默認(rèn)值是exon。

--transcript_id_designator: 默認(rèn)值是transcript_id氢架。


三、deeptools?multiBamSummary實(shí)際操作

multiBamSummary bins --bamfiles x.bam y.bam --binSize=500 -p 20 --smartLabels -out readCounts.npz --outRawCounts readCounts.tab

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末朋魔,一起剝皮案震驚了整個(gè)濱河市岖研,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖孙援,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件害淤,死亡現(xiàn)場離奇詭異,居然都是意外死亡拓售,警方通過查閱死者的電腦和手機(jī)窥摄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來础淤,“玉大人崭放,你說我怎么就攤上這事「胄祝” “怎么了币砂?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長玻侥。 經(jīng)常有香客問我决摧,道長,這世上最難降的妖魔是什么凑兰? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任掌桩,我火速辦了婚禮,結(jié)果婚禮上姑食,老公的妹妹穿的比我還像新娘波岛。我一直安慰自己,他們只是感情好矢门,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布盆色。 她就那樣靜靜地躺著,像睡著了一般祟剔。 火紅的嫁衣襯著肌膚如雪隔躲。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天物延,我揣著相機(jī)與錄音宣旱,去河邊找鬼。 笑死叛薯,一個(gè)胖子當(dāng)著我的面吹牛浑吟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播耗溜,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼组力,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了抖拴?” 一聲冷哼從身側(cè)響起燎字,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤腥椒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后候衍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體笼蛛,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年蛉鹿,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了滨砍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡妖异,死狀恐怖惋戏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情随闺,我是刑警寧澤日川,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站矩乐,受9級(jí)特大地震影響龄句,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜散罕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一分歇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧欧漱,春花似錦职抡、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至窑邦,卻和暖如春擅威,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背冈钦。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國打工郊丛, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人瞧筛。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓厉熟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親较幌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子揍瑟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • deepTools 是一套基于python開發(fā)的工具,適用于有效處理分析高通量測序數(shù)據(jù)乍炉,可用于ChIP-seq, ...
    JeremyL閱讀 55,531評(píng)論 9 71
  • 1. 環(huán)境配置 2. 數(shù)據(jù)下載 (1)prefetch下載 首先找到要下載的數(shù)據(jù)(SRR...號(hào))創(chuàng)建projec...
    陳小云的筆記本閱讀 9,763評(píng)論 2 49
  • 全文分析流程學(xué)習(xí)按照:九月學(xué)徒ChIP-seq學(xué)習(xí)成果展 一月培、 怎么將SAR文件轉(zhuǎn)為fastq文件嘁字? 1. 【方...
    Htt_1996閱讀 3,576評(píng)論 1 9
  • 上次我們整理到bwa比對(duì)后得到bam文件,下一步我們要通過GATK流程從bam文件中call variant杉畜。 一...
    耕讀者閱讀 1,964評(píng)論 0 4
  • 翻譯DMRfinder官方說明文檔。 Introduction DMRfinder 是一款用于WGBS的C位點(diǎn)提取...
    黃晶_id閱讀 10,029評(píng)論 6 23