第21周 2018— 10.7-10.13
題目:An atlas of chromatin accessibility in the adult human brain
DOI (url) :10.1101/gr.232488.117
發(fā)表日期:2018 Aug
發(fā)表雜志:Genome Res(Q1:10.101)
關(guān)鍵詞:open chromatin region (OCR)例证, cis regulatory elements (CREs)涂炎,genetic risk variants女淑,lncRNAs
概述
問(wèn)題:很多遺傳風(fēng)險(xiǎn)的變異與神經(jīng)性疾病的關(guān)聯(lián)是非編碼的因子望抽,它們通過(guò)破壞順式調(diào)控元件(如啟動(dòng)子和增強(qiáng)子)發(fā)揮功能翼闹。染色質(zhì)通過(guò)特定的模式排列呈現(xiàn)出的順式調(diào)控元件參與基因表達(dá)的時(shí)空調(diào)控纳本。因此,為了進(jìn)一步探索大腦的轉(zhuǎn)錄調(diào)控機(jī)制,他們用凍存的死后樣本進(jìn)行ATAC-seq測(cè)序尿扯,產(chǎn)生染色質(zhì)開(kāi)放數(shù)據(jù)。
方法:
- 兩種細(xì)胞類(lèi)型— 神經(jīng)細(xì)胞和非神經(jīng)細(xì)胞(neurons & non-neurons)
- 14個(gè)不同的腦組織區(qū)域
- 5個(gè)成年人凍存樣本
主要結(jié)論/結(jié)果:
- 神經(jīng)細(xì)胞和非神經(jīng)細(xì)胞的染色質(zhì)結(jié)構(gòu)明顯不同焰雕,其中神經(jīng)細(xì)胞的染色質(zhì)在不同腦區(qū)域呈現(xiàn)出更大的差異
- 將人類(lèi)的ATAC-seq實(shí)驗(yàn)中的得到的開(kāi)放染色質(zhì)應(yīng)用到鼠衷笋,可以預(yù)測(cè)細(xì)胞類(lèi)型和不同腦區(qū)域的表達(dá)模式
- 差異的開(kāi)放染色質(zhì)區(qū)域與神經(jīng)性性狀的遺傳結(jié)構(gòu)重合,并鑒定到他們的分子通路和生物功能
- 結(jié)合轉(zhuǎn)錄因子的分析矩屁,鑒定到細(xì)胞特異性和不同腦區(qū)域特異性的蛋白質(zhì)編碼基因和lncRNA
-
將他們的數(shù)據(jù)公開(kāi)提供了一個(gè)在線database—— “Brain Open Chromatin Atlas (BOCA)”
Outline of this study design
主要內(nèi)容和結(jié)論
1. 不同細(xì)胞類(lèi)型和腦區(qū)域在染色質(zhì)可及性上的差異
首先是分析兩種細(xì)胞類(lèi)型和腦區(qū)域的開(kāi)放染色質(zhì)區(qū)域辟宗;然后統(tǒng)計(jì)這些開(kāi)放染色質(zhì)區(qū)域在基因組特征區(qū)域(啟動(dòng)子/增強(qiáng)子/外顯子等)的分布,發(fā)現(xiàn)神經(jīng)細(xì)胞在遠(yuǎn)端區(qū)域分布比非神經(jīng)細(xì)胞多吝秕;基于t-SNE的方法對(duì)ATAC-seq的counts矩陣聚類(lèi)泊脐,可以清晰的將神經(jīng)和非神經(jīng)性樣本分開(kāi)。
2. 轉(zhuǎn)錄因子的結(jié)合對(duì)基因表達(dá)的影響
通過(guò)對(duì)轉(zhuǎn)錄因子的足跡分析(用的是PIQ)預(yù)測(cè)不同細(xì)胞類(lèi)型和不同腦部位開(kāi)放染色質(zhì)區(qū)域的轉(zhuǎn)錄因子的結(jié)合烁峭。然后通過(guò)每個(gè)TF位點(diǎn)可能被結(jié)合的概率和距TSS的距離的加權(quán)來(lái)評(píng)估每個(gè)轉(zhuǎn)錄因子對(duì)基因表達(dá)的調(diào)控值容客。接下來(lái)又看了不同細(xì)胞類(lèi)型和腦部位在蛋白質(zhì)編碼水平,lncRNA和miRNA水平的調(diào)控差異约郁。
主要方法
-
peaks的counts矩陣
這篇文章用MACS2 call peaks后缩挑,用RSubread的featureCounts
函數(shù)計(jì)算每個(gè)peak的fragments,最終得到counts矩陣鬓梅。counts矩陣后期經(jīng)過(guò)標(biāo)準(zhǔn)化用于差異開(kāi)放染色質(zhì)的分析供置。
用的參數(shù)如下:
allowMultiOverlap = F,
isPairedEnd = T,
strandSpecific = 0,
requireBothEndsMapped = F,
minFragLength = 0,
maxFragLength = 2000,
checkFragLength = T,
countMultiMappingReads = F,
countChimericFragments = F
-
TF足跡分析
轉(zhuǎn)錄因子的足跡分析用的是:PIQ(https://www.nature.com/articles/nbt.2798) -
差異開(kāi)放染色質(zhì)分析
limma包voomWithQualityWeights
函數(shù) -
開(kāi)放染色質(zhì)區(qū)域在基因組區(qū)域的分布特征
用的是Y叔的ChIPSeeker -
對(duì)開(kāi)放染色質(zhì)區(qū)域臨近基因的富集和功能注釋
用的是GREAT R包,GREAT也有網(wǎng)頁(yè)版http://great.stanford.edu/public/html/, 之前也介紹過(guò)第8篇:用網(wǎng)頁(yè)版工具做功能分析和motif分析 -
機(jī)器學(xué)習(xí)的方法構(gòu)建表觀基因組特征和細(xì)胞類(lèi)型/不同腦部位鑒定的分類(lèi)指標(biāo)
他們優(yōu)化的特征選來(lái)源于遞歸特征消除算法己肮,是基于線性核的支持模型向量機(jī)士袄。用caret
R包實(shí)現(xiàn)。 - Caret package:https://www.jstatsoft.org/article/view/v028i05
- LIBSVM: a library for support vector machines:https://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf
其他相關(guān)資源
神經(jīng)性基因組學(xué)研究:http://www.med.unc.edu/pgc
國(guó)際阿爾茲海默研究:http://web.pasteur-lille.fr/en/recherche/u744/
社會(huì)科學(xué)遺傳學(xué)聯(lián)合協(xié)會(huì):https://www.thessgac.org/
冠狀動(dòng)脈疾不哑А:http://cardiogramplusc4d.org/
總結(jié)
這篇文章屬于觀察到了現(xiàn)象娄柳,但是沒(méi)有闡述機(jī)制的類(lèi)型。如發(fā)現(xiàn)了神經(jīng)性疾病與非神經(jīng)性疾病染色質(zhì)結(jié)構(gòu)的差異艘绍,以及不同腦部位染色質(zhì)結(jié)構(gòu)的差異赤拒,也鑒定到大量的表觀特征因子,以及編碼基因和非編碼RNA诱鞠,但是沒(méi)有細(xì)致地去驗(yàn)證這些因子是否參與以及如何影響腦的發(fā)育和神經(jīng)性疾病的產(chǎn)生挎挖。整篇給人的感覺(jué)就是結(jié)論不明確,發(fā)現(xiàn)的這些因子是否真的發(fā)揮作用都需要進(jìn)一步驗(yàn)證航夺。不過(guò)也算是提供了一些數(shù)據(jù)資源蕉朵,他們將他們的數(shù)據(jù)也簡(jiǎn)單整合為一個(gè)數(shù)據(jù)庫(kù)(https://bendlj01.u.hpc.mssm.edu/multireg/),做相關(guān)研究的可以繼續(xù)深入挖掘阳掐。另外上面提到的幾個(gè)方法可以倒是可以再深入了解和試用始衅。
相關(guān)文獻(xiàn)
- https://www.nature.com/articles/nbt.2798
- Kuhn M. 2008. Caret package. Journal of Statistical Software 28: 1-26.
- Chang C-C, Lin C-J. 2011. LIBSVM: a library for support vector machines. ACM transactions on 1158 intelligent systems and technology (TIST) 2: 27.