參考:
本講 PPT 下載鏈接為:http://pan.baidu.com/s/1skJAaAx中姜,密碼:ga2l
視頻鏈接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw
第一部分:ChIP-seq 簡介
- 首先了解兩個概念:
Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.
Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell
-
一般的雙端測序,R1/R2 比對到兩條鏈上面跟伏。通過Flag 可以提取比對到正反鏈的read,使用基因組瀏覽器可視化得到兩個峰圖丢胚。
(Tips:而ChIA-PET 也是雙端測序,但是R1/R2 可能同一條鏈)
- 張勇老師開發(fā)出第一個peak callling 工具(macs,現(xiàn)在更新到macs3酬姆,由師弟劉濤維護J茸馈)
- ChIP-exo : 從5 -end 進行酶切,提高TFBS分辨率,幾乎直接看peak,而不需要軟件找辞色。
-
iChIP : 對不同細胞進行index,再進行抗體富集骨宠,運用到單細胞領域.
-
不同的TF 結合模型:
一般TF是sharp peak.
第二部分:ChIP-seq 實驗設計
-
關于實驗重復及其測序深度:
- 以人類為例浮定,一般對于轉錄因子達到20M,寬峰達到40M read 比較好层亿。當然read越多越好桦卒,但是read 不太多,足以檢測結合比較強的位點匿又。
- 重復的問題方灾,由于剛開始的一些文章ChIP-seq沒有重復,帶了一個不好的頭碌更,后面慢慢要求2-3個重復(2-3個質量好的重復裕偿,不是做了3個重復就好)。
對照組:一般來說Input 和IgG 有一個就行痛单,對于一些特別容易富集的區(qū)域嘿棘,也就是假陽性,可以通過對照組來過濾掉旭绒。
第三部分:檢測ChIP質量
-
通過IGV瀏覽器查看peak 是否明顯
-
通過計算Frip 值:不同的TF鸟妙,F(xiàn)rip 大小不同,結合越強的位點挥吵,F(xiàn)rip 可能越高
-
交聯(lián)系數:通過移動 計算正反鏈read 皮爾遜相關系數變化過程重父。
- 高質量的ChIP 正負鏈的peak ,移動到最大 重疊位置忽匈,相關系數最大房午,也就是圖中ChIP peak 位置。
同時比較兩個peak高度值脉幢,計算差異倍數歪沃,得到NSC/RSC 結果.下圖左邊為質量高的實驗結果.
-
同時計算Frip 和NSC關系,兩者之間存在明顯的聯(lián)系.也就是說Frip 高的NSC,RSC 往往也較高嫌松。
-
IDR 方法:此方法對于重復間質量好的樣本沪曙,IDR可能效果好,否則滿足條件的peak 會很少萎羔。
從B圖可知液走,20000左右的peak ,IDR (不可重復率)較低,也就是peak 很可信贾陷。
-
也可以通過peak 區(qū)域motif 富集情況缘眶,評價質量好壞。
-
通過序列保守型來看:也就是通過通過profile 圖反映出富集效果髓废。
第四部分:完成項目后巷懈,需要提交哪些數據
第五部分:分析流程
- 第一步:數據比對
- 下一步:peak calling
-
要發(fā)布的部分peak calling 工具
-
下一步:差異peak 分析
- 定性問題:通過設置閾值,對兩組sample進行peak 差異位點分析慌洪。得到有無peak的差異結果顶燕,但是對于一些在閾值邊界的位置凑保,可能得到的差異peak 位點,存在假陽性問題涌攻。
- 定量問題:通過差異倍數欧引,及其顯著性來判斷差異peak. 對于組蛋白修飾來說,修飾水平的高度和表達強弱有關系恳谎;但是對于轉錄因子來說芝此,可能沒有太大影響。
- 差異peak 目前的工具
-
下一步:peak注釋
-
下一步:motif 分析
-
目前的工具
-
下一步:靶基因預測
-
也可以嘗試對TF進行敲除因痛,過表達研究目標基因.
-
下一步:目標基因GO注釋
思考
- 感覺做差異分析時候婚苹,定量分析采取Deseq2 或者DiffBind 結果差別較大時候,不好判斷選擇哪一個工具result.
-
了解到ChIP-seq 靶基因尋找工具鸵膏。比如結合RNA-seq結果租副,判斷敲除TF,那些基因是差異基因。工具如BETA
歡迎大家評論留言较性,相互學習~