圖片.png
圖片.png
Bowite 對參考基因組建立索引的方法是 Burrows-Wheeler transform (BWT) 和 FM index
挺神奇的闲擦,通過簡單的建矩陣-排序就能還原原序列
BWT算法的特點(diǎn)
1召边、非常少的內(nèi)存占用。與輸入相同(或更少)
不需要整個(gè)矩陣忆嗜,或字符串凄贩,只是指針
編碼:簡單地排序指針。解碼:遵循指針
2苟鸯、原始(傳統(tǒng))應(yīng)用:字符串壓縮(bZip2)
運(yùn)行的相同字母壓縮成1個(gè)字母
3同蜻、生物信息學(xué)應(yīng)用:子字符串搜索
實(shí)現(xiàn)類似的運(yùn)行時(shí)間作為哈希表,后綴樹
但:非常節(jié)省內(nèi)存→實(shí)際速度增益
4早处、比對100,000個(gè)reads:只需轉(zhuǎn)換一次
預(yù)處理一次;轉(zhuǎn)換空間中的讀計(jì)數(shù)湾蔓。
反向變換一次,比對到基因組坐標(biāo)
IDR
Chip-seq
ChIP指染色質(zhì)免疫共沉淀技術(shù)(Chromatin Immunoprecipitation,ChIP)砌梆,seq 指的是二代測序默责,那么ChIP-seq實(shí)際上也就是染色質(zhì)免疫共沉淀+二代測序的一個(gè)過程。
參考資料:
https://blog.csdn.net/weixin_34039159/article/details/112763207