關(guān)于測序數(shù)據(jù)去重問題網(wǎng)上有很多大神的分析,我就不濫竽充數(shù)了,我挑取了幾篇比較好的文章:
第二代測序原理的詳細(xì)解析!
高通量測序之duplicated reads
試論NGS數(shù)據(jù)的Duplication問題
如何去除二代測序數(shù)據(jù)中的PCR duplication才科學(xué)旦事?
對于甲基化測序來說,主要根據(jù)建庫的不同來看是否需要去重:
- 全基因組甲基化測序(WGBS):跟普通測序一樣急灭,需要去重
- 簡并代表性甲基化測序(RRBS):由于酶切位點(diǎn)是固定姐浮,自然會產(chǎn)生較多的重復(fù)片段,因此不需去重
- 靶向甲基化測序(TBS):屬于擴(kuò)增子測序葬馋,因?yàn)槠螏缀醵际怯赡告湐U(kuò)增出來的卖鲤,同一區(qū)域會擴(kuò)增出來許多相同的擴(kuò)增子,只要控制PCR過程不產(chǎn)生較大的bias就沒有問題畴嘶,因此也不必去重蛋逾。