基于富集的5fC測(cè)序分析思路

一播赁、過(guò)濾與質(zhì)控

測(cè)序獲得一對(duì)fastq文件蕊肥,命名為treatment和control,各含兩個(gè)生物學(xué)重復(fù)扳埂,即:treatment_1业簿、treatment_2;control_1阳懂、control_2

首先梅尤,回貼測(cè)序reads到參考基因組,但是我們都知道測(cè)序reads中可能存在測(cè)序接頭和低質(zhì)量的序列岩调,故需要截去接頭序列和低質(zhì)量序列以保留高質(zhì)量的序列巷燥。

而目前針對(duì)數(shù)據(jù)過(guò)濾、質(zhì)控的軟件也非常的多号枕,為了在最大程度長(zhǎng)挽救分析的reads缰揪,可以采用trim的方式進(jìn)行過(guò)濾處理,即僅把接頭序列和低質(zhì)量的堿基/序列截掉葱淳,故最終的高質(zhì)量reads的長(zhǎng)度一定是長(zhǎng)短不一的钝腺,但不會(huì)對(duì)后續(xù)的分析帶來(lái)影響抛姑。

推薦使用trim_galore進(jìn)行處理:

trim_galore -q 10 --stringency 8 -o ${out} --paired ${sample}_R1.fastq.gz? ${sample}_R2_001.fastq.gz

生成${sample}_R1_val_1.fq.gz和${sample}_R2_val_2.fq.gz

對(duì)于免疫共沉淀測(cè)序數(shù)據(jù)后續(xù)檢峰的需要,需要同時(shí)測(cè)序一個(gè)對(duì)照樣本艳狐,即input樣本定硝。

trim_galore官網(wǎng):http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/

類(lèi)似的有trimmomatic等

trimmomatic官網(wǎng):http://www.usadellab.org/cms/index.php?page=trimmomatic

二、比對(duì)

針對(duì)比對(duì)的話(huà)毫目,常用的短序列比對(duì)軟件均可蔬啡,如bwa,bowtie2等等

這里以bwa為例:

# alignment & sort

bwa mem -M -t 8? ${reference}? ${sample}_R1_val_1.fq.gz? ${sample}_R2_val_2.fq.gz | samtools sort -@ 8 - -o ${sample}.bam

# index

samtools index ${sample}.bam

生成比對(duì)后的bam文件及其索引文件:

${sample}.bam

${sample}.bam.bai

三镀虐、Deduplication

由于PCR擴(kuò)增會(huì)產(chǎn)生序列完全一樣的測(cè)序reads從而產(chǎn)生了重復(fù)比對(duì)箱蟆,需要去除這些重復(fù)比對(duì)到同一位置的reads,使用picard-tools里的MarkDuplicates功能進(jìn)行標(biāo)記處理:

# 標(biāo)記重復(fù)

java

-Xmx3G -jar?picard.jarMarkDuplicates VALIDATION_STRINGENCY=SILENT

I={sample}.bam O=${sample}.dedup.bam M=${sample}.markdup.txt

# flag過(guò)濾 & sort

samtools view {sample}.dedup.bam -f 3 -F 3840 -q 10 -b | samtools?sort -@ 20 -T /tmp/ -o ${sample}.clean.bam -

# index

samtools index ${sample}.clean.bam

最終刮便,得到去重復(fù)的顽腾,同時(shí)過(guò)濾低質(zhì)量比對(duì)的、多重比對(duì)的reads诺核,得到高質(zhì)量比對(duì)的用于下游分析的reads抄肖。

保留flag=3,即read paired窖杀、? read mapped in proper pair漓摩;?

過(guò)濾 flag=3840。即 not primary alignment入客、 read fails platform/vendor quality checks和 read is PCR or optical duplicate.

四管毙、檢? 峰

一般,對(duì)于免疫共沉淀測(cè)序的數(shù)據(jù)桌硫,采用macs2等檢峰工具夭咬,python編寫(xiě)、使用方便铆隘、出來(lái)速度較快:

macs2 callpeak --keep-dup all --bdg -f BAMPE -t {sample}.clean.bam -c control.bam -g hs -n ${sample}

其中卓舵,control.bam比對(duì)文件為本文開(kāi)頭提到的input樣本,用于檢峰扣除背景信號(hào)膀钠。

最終掏湾,本步驟會(huì)產(chǎn)生barrowPeak文件,如果存在生物學(xué)重復(fù)肿嘲,需要合并重復(fù)樣本的peak(80%的重疊)融击,可以使用bedtools

merge配合awk命令進(jìn)行篩選,得到重復(fù)樣本的一致性peak雳窟∽鹄耍或者,可以使用IDR軟件得到重復(fù)樣本內(nèi)的consensus peaks。

MACS2軟件: https://pypi.org/project/MACS2/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拇涤,一起剝皮案震驚了整個(gè)濱河市捣作,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌工育,老刑警劉巖虾宇,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搓彻,死亡現(xiàn)場(chǎng)離奇詭異如绸,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)旭贬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)怔接,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人稀轨,你說(shuō)我怎么就攤上這事扼脐。” “怎么了奋刽?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵瓦侮,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我佣谐,道長(zhǎng)肚吏,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任狭魂,我火速辦了婚禮罚攀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘雌澄。我一直安慰自己斋泄,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布镐牺。 她就那樣靜靜地躺著炫掐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪睬涧。 梳的紋絲不亂的頭發(fā)上卒废,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音宙地,去河邊找鬼摔认。 笑死,一個(gè)胖子當(dāng)著我的面吹牛宅粥,可吹牛的內(nèi)容都是我干的参袱。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼抹蚀!你這毒婦竟也來(lái)了剿牺?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤环壤,失蹤者是張志新(化名)和其女友劉穎晒来,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體郑现,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡湃崩,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了接箫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片攒读。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖辛友,靈堂內(nèi)的尸體忽然破棺而出薄扁,到底是詐尸還是另有隱情,我是刑警寧澤废累,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布邓梅,位于F島的核電站,受9級(jí)特大地震影響邑滨,放射性物質(zhì)發(fā)生泄漏日缨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一驼修、第九天 我趴在偏房一處隱蔽的房頂上張望殿遂。 院中可真熱鬧,春花似錦乙各、人聲如沸墨礁。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)恩静。三九已至,卻和暖如春蹲坷,著一層夾襖步出監(jiān)牢的瞬間驶乾,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工循签, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留级乐,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓县匠,卻偏偏與公主長(zhǎng)得像风科,于是被迫代替她去往敵國(guó)和親撒轮。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 原文:http://blog.sina.com.cn/s/blog_751bd9440102v72b.html 一...
    簡(jiǎn)單點(diǎn)lili閱讀 4,055評(píng)論 0 8
  • wes定義: 全外顯子組測(cè)序贼穆,是利用目標(biāo)序列捕獲技術(shù)题山, 將全基因組編碼基因外顯子區(qū)域的DNA捕獲并富集后,進(jìn)行高通...
    鳳凰_0949閱讀 4,149評(píng)論 0 7
  • DAY5學(xué)習(xí)內(nèi)容:過(guò)濾和比對(duì) 過(guò)濾 通過(guò)DAY4_fastqc結(jié)果故痊,我們開(kāi)始對(duì)數(shù)據(jù)進(jìn)行過(guò)濾顶瞳,主要是去除接頭和低質(zhì)量...
    善良土豆閱讀 1,665評(píng)論 0 6
  • 預(yù)套料解決同一規(guī)格板厚這一臺(tái)設(shè)備上加工不能滿(mǎn)足工期時(shí),用最優(yōu)的套料方案分配的多臺(tái)加工設(shè)備上愕秫,先設(shè)置一個(gè)虛擬的加工設(shè)...
    代吉偉閱讀 492評(píng)論 0 0
  • 百花絢爛的街頭慨菱,微風(fēng)夾雜著細(xì)雨,總在這個(gè)季節(jié)豫领,與人不期而遇抡柿。南方雨水多舔琅,淡柔清風(fēng)等恐,微雨也能摧花落蕊。下了一上午的雨...
    徐謐浮水流燈閱讀 714評(píng)論 2 4