Week24 — 人類原發(fā)性腫瘤的染色質(zhì)可及性圖譜-01
上篇文章首先回顧了ATAC-seq方法的原理和優(yōu)點(diǎn),以及與其他研究染色質(zhì)可及性方法的比較,然后介紹了這篇文章的主要結(jié)果和亮點(diǎn)笋轨,以及提供的數(shù)據(jù)資源聂沙。
這篇文章將會從文章思路和主要結(jié)果解讀。
1. 數(shù)據(jù)質(zhì)控
數(shù)據(jù)分析前的質(zhì)控瘫寝,TSS富集蜒蕾、片段長度分布特征稠炬、peaks的reads比例。
其中常用于判斷實(shí)驗(yàn)是否失敗的片段長度分布特征原理如下(摘抄于ATAC-seq交流群中來自菲沙基因小伙伴的總結(jié)):
核小體完整的話咪啡,纏繞核小體的DNA不會被切首启,被切的是核小體之間的片段,纏繞核小體的146bp的DNA是完整的撤摸,加上接頭毅桃,就會形成特有的280-300bp左右的片段。而且以這個(gè)為基數(shù)准夷,兩倍就是兩個(gè)核小體钥飞,三倍就是三個(gè)核小體,依次類推衫嵌,就形成了層次分明的特征條帶代承。如果核小體解聚,那么纏繞核小體的146bp也會被切除渐扮,自然就沒有特定大小的DNA富集论悴,形成的就是一片模糊的彌散條帶。
- 這篇文章中他們首先做的是確保數(shù)據(jù)與捐贈者對應(yīng)墓律。通過ATAC-seq的基因型與其對應(yīng)的捐贈者的SNP芯片的基因型的相關(guān)性分析確保ATAC-seq的數(shù)據(jù)與捐贈者對應(yīng)膀估。
-
然后也有核小體片段特征圖。片段大小的分布特征具有明顯的核小體周期性分布耻讽,數(shù)據(jù)質(zhì)量符合要求察纯。
下面就是數(shù)據(jù)分析了
2. 鑒定到多少DNA調(diào)控元件
call peaks 后對peaks數(shù)目統(tǒng)計(jì),當(dāng)然對peaks數(shù)目統(tǒng)計(jì)前也會做質(zhì)控针肥,只保留重復(fù)性好的peaks饼记。 通過對410個(gè)腫瘤樣本的23種腫瘤類型(其中386個(gè)樣本有技術(shù)重復(fù))進(jìn)行ATAC-seq分析,共繪制出796個(gè)染色質(zhì)可及性圖譜慰枕,鑒定到 562,709個(gè)調(diào)控元件具则,即ATAC-seq數(shù)據(jù)分析中對peaks數(shù)目統(tǒng)計(jì),共有562,709個(gè)可重復(fù)具帮、轉(zhuǎn)座酶可接近的染色質(zhì)可及性位點(diǎn)博肋。其中562,709peaks是總的數(shù)目,實(shí)際每種癌癥類型的peaks數(shù)目從 56,125 到215,978蜂厅,數(shù)目不等匪凡。
-
ATAC-seq peaks與Roadmap DNase peaks的overlapy以及與chromHMM-defined regulatory states的overlap
另外掘猿,將ATAC-seq得到的腫瘤特異的peaks與Roadmap Epigenetics project中DNase-seq測序得到peaks比較病游,該研究中的peaks與以往發(fā)現(xiàn)的調(diào)控元件共有65%的overlap。該結(jié)果一表明了此研究中觀測到的調(diào)控元件與以往研究中的一致性稠通,二揭示了腫瘤樣本中新的染色質(zhì)可及性敏感位點(diǎn)衬衬。
3. ATAC-seq遠(yuǎn)端元件买猖,promotor,RNA-seq得到的表達(dá)矩陣聚類
對遠(yuǎn)端元件和啟動子佣耐,還有RNA-Seq的表達(dá)量做Pearsn相關(guān)性層次聚類政勃,遠(yuǎn)端元件展現(xiàn)出更好的腫瘤特異性。
4. 聚類、腫瘤亞型分型讽挟、鑒定cluster-specific peaks
取所有腫瘤類型中變化大的250,000 peaks的top 50主成分進(jìn)行t-SNE聚類懒叛,鑒定到18個(gè)模塊,且發(fā)現(xiàn)基于ATAC-seq的聚類與用TCGA中mRNA-seq, miRNA–seq, DNA 甲基化 reverse-phase protein array (RPPA)和DNA拷貝數(shù)數(shù)據(jù)做iCluster的結(jié)果高度一致耽梅。聚類的結(jié)果表明一些癌癥被分成兩個(gè)模塊薛窥,如乳腺癌分為基底和非基底的,食管癌分為鱗癌和腺癌眼姐;來自相同組織的腫瘤樣本經(jīng)常聚在一起诅迷,如腎透明細(xì)胞癌和腎乳頭狀細(xì)胞癌;有的是不同組織相同類型的腫瘤聚在一起,如鱗癌众旗。
5. cluster-specific peaks的遠(yuǎn)端元件罢杉、motif和甲基化分析
遠(yuǎn)端調(diào)控元件和TFs都展現(xiàn)出組織和腫瘤特異性。
6. Footprinting分析TF的活動
轉(zhuǎn)錄因子對染色質(zhì)可及性和腫瘤的產(chǎn)生和轉(zhuǎn)移有什么影響贡歧?首先做的是TF的足跡分析滩租。
理解幾個(gè)概念:
- TF footprint:當(dāng)一個(gè)或多個(gè)核小體的移位時(shí)在側(cè)翼序列中會產(chǎn)生高DNA可及性,而TF與DNA的結(jié)合會保護(hù)蛋白質(zhì)-DNA結(jié)合位點(diǎn)免于轉(zhuǎn)位利朵。這種現(xiàn)象認(rèn)為是TF footprint律想。
- Flanking Accessbility: a measure of the accessibility of the DNA adjacent to a TF motif;
- Footprint Depth: a measure of the relative protection of the motif site from transposition
這篇文章用了兩種TF 足跡的分析方法: - 1) quantifies the “flanking accessibility(doi: 10.1016/j.celrep.2017.05.003)绍弟;
- 2) ChromVAR:( doi:10.1038/nmeth.4401)
兩種方法的得到TFs高度重合技即。
結(jié)論: - 一個(gè)TF如果能夠與DNA結(jié)合,那么footprint depth 和 flanking accessibility 與其基因表達(dá)顯著相關(guān)
-
flanking accessibility的增高和footprint depth的降低可能伴隨著甲基化水平的降低
7. DNA調(diào)控元件與基因的相互作用
為了識別鑒定ATAC-seq peaks和基因表達(dá)之間的假定因果聯(lián)系晌柬,他們基于相關(guān)性的方法建立模型進(jìn)行預(yù)測姥份。具體方法如下圖所示:
8. 突變是如何影響染色質(zhì)可及性和腫瘤的發(fā)生?
這篇文章其中的一個(gè)亮點(diǎn)是揭示了調(diào)控元件處的突變影響著染色質(zhì)的可及性年碘,如突變通過影響轉(zhuǎn)錄因子的結(jié)合調(diào)控染色質(zhì)的可及性。他們通過整合WGS數(shù)據(jù)和ATAC-seq數(shù)據(jù)展鸡,鑒定到上千個(gè)體細(xì)胞突變落在啟動子區(qū)域和調(diào)控元件區(qū)域屿衅。如TERT啟動子區(qū)域的突變,這也表明ATAC-seq與外顯子測序相比莹弊,可以鑒定調(diào)控元件處的突變涤久,而WES是不包括啟動子區(qū)域涡尘。
除了TERT啟動子處的突變,還有增強(qiáng)子的突變响迂,如FGD4考抄。eFGD4的突變產(chǎn)生NKK TF的結(jié)合位點(diǎn),導(dǎo)致在FGD4上游12-kb區(qū)域內(nèi)的染色質(zhì)可及性大幅增加蔗彤。FGD4的高表達(dá)與膀胱癌低生存率顯著相關(guān)川梅,進(jìn)一步表明FGD4的突變可能對特定癌癥產(chǎn)生影響。
除了體細(xì)胞突變然遏,他們還整合了GWAS數(shù)據(jù)贫途,發(fā)現(xiàn)MYC位點(diǎn)附近有兩個(gè)腫瘤易感性SNP位點(diǎn)rs6983267和rs35252396。其中SNP rs6983267與結(jié)腸癌和前列腺癌的染色質(zhì)可及性增強(qiáng)相關(guān)待侵,該結(jié)果與以往報(bào)道一致丢早,同時(shí)也與乳腺癌和鱗癌染色質(zhì)可及性相關(guān),后者是之前研究沒有發(fā)現(xiàn)的秧倾。另一個(gè)SNP位點(diǎn)rs35252396與腎透明細(xì)胞癌(KIRC)怨酝、乳腺癌、甲狀腺癌的染色質(zhì)可及性有強(qiáng)烈的相關(guān)性那先。這些結(jié)果都表明SNP可能在腫瘤中扮演者潛在的重要作用农猬。
9. 鑒定與腫瘤免疫治療相關(guān)的DNA調(diào)控元件
他們基于已知的免疫細(xì)胞特異性調(diào)節(jié)元件的可及性來估計(jì)免疫浸潤的水平。這些區(qū)域的可及性還與腫瘤純度成反比胃榕,為去卷積體瘤數(shù)據(jù)提供了附加信息盛险。
同時(shí)他們還研究了與免疫治療的一個(gè)重要靶標(biāo)PDL1相關(guān)的峰值,PDL1的表達(dá)受50kb之內(nèi)的四種調(diào)控元件的影響勋又,并且不同癌癥類型的可及性不同苦掘。了解PDL1和其他藥物靶點(diǎn)的調(diào)節(jié)元件的狀態(tài)或許可以為個(gè)性化治療提供一個(gè)路徑。