- 長期以來衣吠,研究人員一直在基于轉錄組數(shù)據(jù)來探索有關復雜細胞群體和過程的生物學見解。樣本本身的異質性以及基因表達的細胞間差異促使科學家從批量(bulk)細胞的平均值測定轉向單細胞RNA測序壤靶,以便更準確地描述復雜的生物系統(tǒng)缚俏。然而,單單憑借轉錄組的信息萍肆,也許無法講述細胞的完整故事袍榆,科學家通常還想了解造成這些基因表達差異背后的原因 – 也就是說,從機理上解釋通過轉錄分析觀察到的基因表達模式變化塘揣。
- 轉錄組在本質上其實是高度協(xié)調的基因表達程序的副產物。該程序受到表觀基因組宿崭、DNA和組蛋白修飾的調控亲铡,這些因素通過影響轉錄因子等DNA結合蛋白與基因組DNA的相互作用,從而激活或抑制基因表達葡兑。表觀基因組調控增加了生物學的復雜性奖蔓,不僅驅動了令人著迷的發(fā)育相關事件,讓有著相同DNA的細胞具有不同的身份并形成多種類型的組織和器官讹堤,同時也推動了細胞的異質性吆鹤,從而促進了復雜的疾病生物學。了解這種調控如何在單細胞中發(fā)揮作用洲守,有望揭示不同細胞間轉錄差異背后的深層次的生物學復雜機制疑务。
從開放染色質到深入了解基因調控
- 染色質轉座酶可接近性分析(ATAC)是一種通過鑒定開放染色質區(qū)域來研究基因組物理結構的方法。該技術使用了一種高活性的轉座酶梗醇,該酶可以結合在開放染色質區(qū)域知允,在對該區(qū)域進行切割的同時插入測序接頭,通過該方法獲得的測序文庫包含了開放染色質區(qū)域所富含的序列叙谨。
從開放染色質中可以獲得什么信息温鸽?
- 染色質結構的動態(tài)重塑是影響哪些基因會發(fā)生轉錄以及何時轉錄的主要機制之一。當染色質開放時手负,DNA結合蛋白可以接近調控序列涤垫,從而實現(xiàn)轉錄姑尺。scATAC-seq能夠提供染色質可接近性的信息,并揭示單個細胞中基因轉錄活躍的區(qū)域蝠猬。但是股缸,它的功能并不止于此。數(shù)十萬個調控元件在不同背景下協(xié)同作用以協(xié)調基因表達模式吱雏,而scATAC-seq能夠提供這些不同元件的信息敦姻,包括其細胞類型特異性、結合位點基序歧杏,以及轉錄因子之類的低表達基因是否有可能開啟镰惦。
- 染色質開放區(qū)域與基因轉錄的活躍區(qū)域相關。染色質轉座酶可接近性分析(ATAC)可以特異性生成染色質開放區(qū)域的DNA短片段犬绒。將這些剪切位點映射回基因組可以給我們提供一個窗口旺入,以便了解轉錄因子基序結合、啟動子和增強子區(qū)域凯力,以及常染色質和異染色質區(qū)域茵瘾。
通過ATAC-seq來定義細胞類型和狀態(tài)
- 與單細胞RNA-seq一樣,單細胞ATAC-seq也可以對相似的細胞類型和狀態(tài)進行鑒定和聚類咐鹤。不過拗秘,scATAC-seq數(shù)據(jù)所用的細胞類型注釋方法略有不同。使用scATAC-seq進行細胞注釋的最簡單的方法是將開放啟動子區(qū)域作為轉錄活性的信號祈惶。
此外也可以利用細胞類型特異性的特征集合對細胞類型進行注釋雕旨,這些集合是根據(jù)已分選細胞子集的批量細胞ATAC數(shù)據(jù)得出的。最后捧请,如果有相同或相似樣本的單細胞基因表達數(shù)據(jù)凡涩,那么scRNA-seq數(shù)據(jù)的注釋可作為完善scATAC-seq聚類注釋的參考。這些不同策略的相對表現(xiàn)疹蛉,以及如何使用它們的詳細信息活箕,都可以在這篇技術指南中找到(1)。
scATAC-seq提供了與單細胞基因表達數(shù)據(jù)互補的信息可款,在某些情況下育韩,甚至可以提供更高的細胞狀態(tài)分辨率。在對免疫檢查點調節(jié)劑VISTA的深入分析中筑舅,研究人員結合單細胞基因表達座慰、T細胞受體(TCR)圖譜分析和單細胞ATAC分析,發(fā)現(xiàn)VISTA的缺失會導致記憶樣T細胞的擴增翠拣,并以靜息細胞為代價版仔。此外,ATAC-seq的數(shù)據(jù)表明,記憶樣T細胞簇中TCR效應基因的可接近性增加蛮粮,說明這些細胞已啟動對TCR的應答益缎。歡迎查閱這篇《單細胞測序深化免疫腫瘤學研究》,了解scRNA-seq和scATAC-seq聯(lián)合使用如何提供強大的多組學分辨率然想,以幫助研究免疫檢查點調控莺奔。
推斷發(fā)育軌跡和鑒定調控元件
scATAC-seq還能夠對發(fā)育軌跡進行計算推斷。染色質可接近性的改變是細胞分化和發(fā)育的主要驅動特征变泄。為了改變細胞狀態(tài)(或細胞類型)令哟,細胞必須首先準備好改變其轉錄程序,而scATAC-seq提供了這些準備過程的讀數(shù)妨蛹。發(fā)育軌跡的鑒定是基于這樣一個事實屏富,即轉錄程序相似的細胞可能是相關的,開放染色質圖譜相似的細胞可以被分在一組蛙卤。
研究人員可以根據(jù)這些關系以數(shù)字序列來編排單個細胞狠半,從而確定分化過程中細胞的時間順序。為了展示如何推斷發(fā)育軌跡颤难,10x Genomics的科學家對近20,000個骨髓單核細胞和CD34+分選細胞開展了scATAC-seq神年。這篇中文的應用指南(2)介紹了他們如何推斷從干細胞到B細胞、單核細胞和紅系細胞的發(fā)育軌跡行嗤。有了發(fā)育軌跡已日,scATAC-seq數(shù)據(jù)可幫您實現(xiàn)更進一步的研究,確定不同分化狀態(tài)下變化并可能決定分化狀態(tài)的轉錄因子基序和增強子昂验。
- 斯坦福大學的研究人員發(fā)布了一個重要的應用案例,在其混合表型急性白血病(MPAL)研究中證明了利用單細胞ATAC數(shù)據(jù)構建發(fā)育軌跡的能力瓢阴。這種癌癥是由代表多個造血譜系的細胞組成的咐蚯。此外,患者樣本中的癌細胞顯示了與淋巴樣細胞和髓樣細胞都相關的標志物基因苛让,這導致它們的細胞類型含糊不清沟蔑。為了弄清這些癌細胞的真正細胞表型和發(fā)育起源,研究人員利用寡核苷酸偶聯(lián)抗體來研究表面蛋白狱杰,借助scRNA-seq來研究基因表達瘦材,并通過scATAC-seq來研究染色質可接近性,以此繪制出健康人體血液的發(fā)育軌跡參考圖浦旱。然后宇色,他們將癌細胞樣MPAL細胞的表型投影到該參考圖中,首先將其分為“健康樣”或“疾病樣”颁湖,然后按照最相關的發(fā)育狀態(tài)進一步分類宣蠕,包括祖細胞樣、紅細胞樣甥捺、淋巴細胞樣抢蚀、髓細胞樣和T/NK細胞樣(3)。
探索基因調控網(wǎng)絡
-
有了繪制開放染色質區(qū)域的能力镰禾,研究人員還能開始了解細胞內的信息流皿曲。轉錄因子在哪里結合以及它們開啟或關閉哪些基因,這取決于DNA上是否存在結合位點吴侦,以及該結合位點是否可接近屋休。因此,通過scRNA-seq揭示或通過scATAC-seq推斷的轉錄因子基因活性备韧,以及只能通過表觀遺傳學方法辨別的靶基因結合位點的可接近性劫樟,都對細胞類型特異性的網(wǎng)絡有著重要貢獻。例如织堂,為了讓轉錄因子1(TF1)調控特定細胞中的TF2叠艳,該細胞中的TF1基因必須具有活性,且TF2基因上的TF1結合位點必須可以接近易阳。
-
通過scATAC-seq數(shù)據(jù)拒课,研究人員可以根據(jù)開放染色質上順式調控元件的基因活性評分來推斷特定細胞中轉錄因子的表達徐勃。推定的轉錄因子結合位點的可接近性可作為轉錄因子表達數(shù)據(jù)的補充,以建立細胞類型特異性的調控網(wǎng)絡捕发。斯坦福大學的研究人員在上文提到的混合表型急性白血病研究中疏旨,利用這種方法及其scATAC-seq數(shù)據(jù),將啟動子可接近性與靶基因表達相關聯(lián)扎酷,從而確定了調控白血病基因的疾病特異性網(wǎng)絡(3)檐涝。重要的是,各個細胞譜系和發(fā)育狀態(tài)的轉錄因子活性以及更廣泛的調控網(wǎng)絡都可以追蹤法挨,而這在單獨使用scRNA-seq時頗具挑戰(zhàn)性谁榜。
單細胞ATAC-seq入門
起初,ATAC-seq提供的這種表觀遺傳數(shù)據(jù)似乎令人望而卻步答渔。您將直接查看DNA序列片段关带,而不是對轉錄本進行計數(shù)。然而沼撕,Loupe Browser(4)等工具可幫助您以單細胞分辨率獲得染色質可接近性的整體視圖宋雏,而從中獲得的見解將加深您對復雜系統(tǒng)的生物學理解,從僅僅知道基因已經打開到了解其如何被激活务豺。
參考資料
- https://support.10xgenomics.com/single-cell-atac/index/doc/technical-note-cell-type-annotation-strategies-for-single-cell-atac-seq-data
- https://www.10xgenomics.com/cn/resources/application-notes/deciphering-epigenetic-regulation-with-single-cell-atac-seq/
- J Granja et al., Single-cell multiomic analysis identifies regulatory programs in mixed-phenotype acute leukemia. Nat Biotechnol. 37, 12 (2019).
- https://support.10xgenomics.com/single-cell-atac/software/visualization/latest/tutorial
- https://www.sohu.com/a/412892456_120776019