作者:ahworld
鏈接:Hi-C數(shù)據(jù)質(zhì)控原理
來源:微信公眾號-seqyuan
著作權(quán)歸作者所有,任何形式的轉(zhuǎn)載都請聯(lián)系作者枕磁。
Hi-C文庫的插入片段是經(jīng)過酶切連接的片段术吝,其測序數(shù)據(jù)的比對和有效數(shù)據(jù)的篩選比較特殊茸苇。這個視頻重點介紹了以下3個方面:
- Hi-C實驗建庫原理
- Hi-C數(shù)據(jù)的比對策略
- Hi-C文庫的分子類型
Hi-C實驗建庫原理
Hi-C實驗建庫原理的部分重點介紹了什么樣的實驗建庫原理導(dǎo)致了"PE測序的Reads1 Reads2分別來自不同的基因組酶切片段才符合Valid Pair Reads特征"
Hi-C數(shù)據(jù)常用的數(shù)據(jù)質(zhì)控軟件HiC-Pro的主要分為:Alignment和Map2Fragment兩個主要步驟沦寂。
Hi-C數(shù)據(jù)的比對策略
在這一部分重點介紹了以下4點內(nèi)容:
- Reads1 Reads2分別比對到基因組
- 挑選R1传藏、R2分別比對到基因組唯一位置的PE Reads進(jìn)行后續(xù)分
- Hi-C文庫是junction類型,對于跨LS site的Reads有提高比對率的比對策略設(shè)計
- 建議在平衡unique map 和multiple map的情況下用比較短的Reads進(jìn)行比對(避免Reads跨過ligation site)
Hi-C文庫的分子類型
這一節(jié)主要講了哭靖,對來源于相同酶切片段的PE Reads進(jìn)行細(xì)分統(tǒng)計叫惊,有利于我們改進(jìn)Hi-C實驗條件,實現(xiàn)Valid reads比例的提升抡草。Dangling 太高可能是由于連接步驟不好蔗坯,導(dǎo)致后面步驟末端生物素沒有去除干凈等原因
對map到不同酶切片段的Pre Valid Pair Reads再進(jìn)行嚴(yán)格質(zhì)控是Dumped reads pair的主要來源。具體的嚴(yán)格質(zhì)控點包括:
- R1/R2 所在的Fragment1/Fragment2 大小不符合設(shè)定范圍
- Prediction insert size不在設(shè)定的參數(shù)范圍
“R1和R2比對到同一條染色體的情況腿短,R1與R2比對位置之間的線形距離過小”的情況該不該被去除绘梦?,如果想去除選擇設(shè)置哪個參數(shù)钝诚?
Re-Ligation是什么榄棵?怎樣產(chǎn)生的?
Hi-C文庫的PCR Dup應(yīng)該怎么處理拧略?為什么需要處理瘪弓。
如果對這些問題感興趣,歡迎觀看視頻。