Hi-C技術(shù)源于染色體構(gòu)象捕獲(Chromosome Conformation Capture, 3C)技術(shù)粮揉,利用高通量測(cè)序技術(shù),結(jié)合生物信息分析方法,研究全基因組范圍內(nèi)整個(gè)染色質(zhì)DNA在空間位置上的關(guān)系递沪,獲得高分辨率的染色質(zhì)三維結(jié)構(gòu)信息。Hi-C技術(shù)不僅可以研究染色體片段之間的相互作用蕉扮,建立基因組折疊模型屋灌,還可以應(yīng)用于基因組組裝、單體型圖譜構(gòu)建尉咕、輔助宏基因組組裝等,并可以與RNA-Seq、ChIP-Seq等數(shù)據(jù)進(jìn)行聯(lián)合分析萤悴,從基因調(diào)控網(wǎng)絡(luò)和表觀遺傳網(wǎng)絡(luò)來(lái)闡述生物體性狀形成的相關(guān)機(jī)制。
以下來(lái)自菲沙基因講解視頻的整理柳沙。原視頻https://www.bilibili.com/video/BV1f7411n7zU?p=23
Hi-C與其他三維基因組技術(shù)特點(diǎn)
HiC技術(shù)實(shí)驗(yàn)原理
將三維基因組甲醛交聯(lián)固定梗顺,用內(nèi)切酶進(jìn)行酶切粟关,酶切完在末端加生物素進(jìn)行末端修復(fù)艺玲,然后進(jìn)行連接,連接后對(duì)去除蛋白并打斷成小片段盐茎,用磁珠捕獲帶生物素的片段進(jìn)行測(cè)序兴垦。
Hi-C分析流程
(a)首先是質(zhì)控,過(guò)濾后高質(zhì)量的FASTQ數(shù)據(jù)(PE,150bp)探越,如果比對(duì)軟件不支持split mapping的話狡赐,一般選用迭代比對(duì),因?yàn)檫B接處由于是基因組外的堿基钦幔,可能比對(duì)不上枕屉。從序列左端25bp開(kāi)始比對(duì),如果有唯一比對(duì)鲤氢,則停止搀庶,如果多個(gè)比對(duì)位置,則再繼續(xù)延伸5bp铜异,直到出現(xiàn)唯一比對(duì)〗占埽或者可以可以選擇支持split mapping的軟件進(jìn)行比對(duì)揍庄,可以通過(guò)分段比對(duì)處理。
(b)選擇高質(zhì)量的比對(duì)數(shù)據(jù)
(c)HiC特異的比對(duì)標(biāo)準(zhǔn)
(d)對(duì)Vaild pairs進(jìn)行矯正东抹。矯正完可以得到互作矩陣蚂子。
常用的分析軟件
Software tools for Hi-C data analysis
Tool | Short-read | Mapping | Read | Read-pair | Normalization | Visualization | Confidence | Implementation |
---|---|---|---|---|---|---|---|---|
aligner(s) | improvement | filtering | filtering | estimation | language(s) | |||
:-- | :-- | :-- | :-- | :-- | :-- | :-- | :-- | :-- |
HiCUP [46] | Bowtie/Bowtie2 | Pre-truncation | ? | ? | ? | ? | ? | Perl, R |
Hiclib [47] | Bowtie2 | Iterative | ? a | ? | Matrix balancing | ? | ? | Python |
HiC-inspector [131] | Bowtie | ? | ? | ? | ? | ? | ? | Perl, R |
HIPPIE [132] | STAR | ? b | ? | ? | ? | ? | ? | Python, Perl, R |
HiC-Box [133] | Bowtie2 | ? | ? | ? | Matrix balancing | ? | ? | Python |
HiCdat [122] | Subread | ?c | ? | ? | Three options d | ? | ? | C++, R |
HiC-Pro [134] | Bowtie2 | Trimming | ? | ? | Matrix balancing | ? | ? | Python, R |
TADbit [120] | GEM | Iterative | ? | ? | Matrix balancing | ? | ? | Python |
HOMER [62] | ? | ? | ? | ? | Two options e | ? | ? | Perl, R, Java |
Hicpipe [54] | ? | ? | ? | ? | Explicit-factor | ? | ? | Perl, R, C++ |
HiBrowse [69] | ? | ? | ? | ? | ? | ? | ? | Web-based |
Hi-Corrector [57] | ? | ? | ? | ? | Matrix balancing | ? | ? | ANSI C |
GOTHiC [135] | ? | ? | ? | ? | ? | ? | ? | R |
HiTC [121] | ? | ? | ? | ? | Two options f | ? | ? | R |
chromoR [59] | ? | ? | ? | ? | Variance stabilization | ? | ? | R |
HiFive [136] | ? | ? | ? | ? | Three options g | ? | ? | Python |
Fit-Hi-C [20] | ? | ? | ? | ? | ? | ? | ? | Python |
Hi-C可視化
數(shù)據(jù)分析
序列過(guò)濾
數(shù)據(jù)矯正
為什么要做數(shù)據(jù)矯正?
可做的分析
1.cis/trans互作比例
2.互作頻率與距離有關(guān)
3.compartment分析
4.TAD分析
5.顯著互作分析
Hi-C的應(yīng)用
1.解析全基因組互作模式
2.輔助提升基因組組裝
3.構(gòu)建基因組單體型圖譜
歡迎關(guān)注食茎!
參考:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4556012/
https://www.ncbi.nlm.nih.gov/pubmed/?term=Bryan+R.+Lajoie+%3B+2014
https://www.ncbi.nlm.nih.gov/pubmed/?term=Eitan+Yaffe%3B2011
http://yulijia.net/cn/%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF/2016/04/15/3C-4C-5C-HiC-ChIAPET-and-ChIPloop.html
https://www.bilibili.com/video/BV1f7411n7zU?p=23
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4347522/
https://www.nature.com/articles/ng.947.pdf