以下羅列了ChIP-seq數(shù)據(jù)分析中的ENCODE標(biāo)準(zhǔn),針對不同的免疫共沉淀類型有不同的標(biāo)準(zhǔn)娶桦,以下從組蛋白和轉(zhuǎn)錄因子2個方向介紹:
一、組蛋白
生物學(xué)重復(fù):
至少2個
抗體:
滿足ENCODE Consortium的標(biāo)準(zhǔn)”诱溃可以進(jìn)一步參考以下文獻(xiàn)標(biāo)準(zhǔn):https://www.encodeproject.org/documents/4bb40778-387a-47c4-ab24-cebe64ead5ae/@@download/attachment/ENCODE_Approved_Oct_2016_Histone_and_Chromatin_associated_Proteins_Antibody_Characterization_Guidelines.pdf
input對照:
每次ChIP實驗必需有input對照樣品
文庫復(fù)雜度:
由Non-Redundant Fraction (NRF) 、PCR Bottlenecking Coefficients 1 and 2, or PBC1 and PBC2進(jìn)行計算橙困,標(biāo)準(zhǔn)為:NRF>0.9, PBC1>0.9, and PBC2>10.
數(shù)據(jù)量:
對于narrow-peak組蛋白實驗瞧掺,每次重復(fù) ≥ 20M 可用的插入片段
對于broad-peak組蛋白實驗, 每個重復(fù)? ≥45 M 可用的插入片段
進(jìn)一步參考:https://www.encodeproject.org/data-standards/terms/#read-depth
注意凡傅! H3K9me3是一個例外辟狈,其富集于基因組中的重復(fù)區(qū)域。相對于其他的broad標(biāo)記,僅有少量的H3K9me3 peaks位于非重復(fù)區(qū)域哼转。
這就導(dǎo)致了許多ChIP-seq數(shù)據(jù)不能比對到基因組中的唯一區(qū)域明未。 組織和原代細(xì)胞(primary cells)需要保證45M的總比對reads。
下表為寬(broad)壹蔓、窄(narrow)峰的組蛋白類型:
二趟妥、轉(zhuǎn)錄因子
大部分指標(biāo)同組蛋白
以下為特有指標(biāo):
數(shù)據(jù)量:
至少20M可用的插入片段
? ? 低深度:10-20 M
??? 不足的: 5-10 M
??? 極低深度: < 5 M
可重復(fù)性:
IDR values (Irreproducible Discovery Rate)
重復(fù)間和假定重復(fù)間的IDR值均要小于2
進(jìn)一步參考:https://sites.google.com/site/anshulkundaje/projects/idr
三、參考資料:
https://www.encodeproject.org/chip-seq/histone/#standards
https://www.encodeproject.org/chip-seq/transcription_factor/