hello窍仰,大家好岩四,今天是個好日子,女神節(jié)屏镊,什么是女神呢依疼?我百度了一下,意思指對女性的神明或至尊的稱謂而芥,特指神話傳說中的女性至高者律罢。后來引申為善良、純潔棍丐、高素質(zhì)误辑、氣質(zhì)脫俗以及容貌美的女性。在現(xiàn)代社會骄酗,女神常用來定義男性心目中喜愛稀余,但還未成為真正戀愛對象的女生,那么女孩子們趋翻,你們是不是女神睛琳,看來還是取決于男性的內(nèi)心啊 盒蟆,??~~~~
今天我們來分享一篇關于女性的研究文章,婦科惡性腫瘤的研究內(nèi)容师骗,文章在A multi-omic single-cell landscape of human gynecologic malignancies历等,發(fā)表于Molecular Cell, IF 18分辟癌,從實際來講寒屯,女性確實需要更多的保護。
文章種最重要的分析點就是單細胞和ATAC聯(lián)合分析 Peak-to-gene correlation analysis with empirically derived FDR (eFDR)黍少,放在最前面寡夹,供大家參考
SUMMARY
驅(qū)動癌細胞轉(zhuǎn)錄程序的調(diào)節(jié)機制的Deconvolution是理解腫瘤生物學的關鍵。在此厂置,研究了手術(shù)切除后立即處理的human ovarian和子宮內(nèi)膜腫瘤的單細胞分辨率匹配的轉(zhuǎn)錄組 (scRNA-seq) 和染色質(zhì)可及性 (scATAC-seq) profiles菩掏。該數(shù)據(jù)集揭示了這些腫瘤復雜的細胞異質(zhì)性,能夠定量地將染色質(zhì)可及性的變異與基因表達聯(lián)系起來昵济。分析表明智绸,惡性細胞獲得了以前unannotated regulatory elements 來驅(qū)動標志性的癌癥途徑。此外访忿,來自同一患者體內(nèi)的惡性細胞顯示出與轉(zhuǎn)錄輸出相關的染色質(zhì)可及性的顯著變化瞧栗,突出了腫瘤內(nèi)異質(zhì)性的重要性。最后海铆,推斷出轉(zhuǎn)錄因子的惡性細胞類型特異性活性迹恐。通過定義癌細胞的調(diào)控邏輯,這項工作揭示了對致癌調(diào)控元件的重要依賴游添,并強調(diào)了匹配的 scRNA-seq/scATAC-seq 揭示婦科癌癥中腫瘤發(fā)生的臨床相關機制的能力系草。
INTRODUCTION
實體瘤中各種類型的惡性和非惡性細胞之間的動態(tài)相互作用促成了從癌癥進展到治療反應的一系列生物學現(xiàn)象。 單細胞技術(shù)提高了我們研究腫瘤潛在細胞異質(zhì)性的能力唆涝,但迄今為止找都,大多數(shù)努力僅限于通過單細胞 RNA 測序 (scRNA-seq) 進行的轉(zhuǎn)錄組學。 盡管最初的報道具有變革性廊酣,但很明顯能耻,基因組的非編碼區(qū),包含調(diào)節(jié)元件(例如亡驰,順式遠端增強子元件)晓猛,對腫瘤生物學有著深遠的貢獻。 這些調(diào)節(jié)元件通常被癌細胞重新連接和重新利用凡辱,以驅(qū)動致癌轉(zhuǎn)錄戒职。 因此,對癌細胞調(diào)控邏輯的更深入理解將為腫瘤生物學和異質(zhì)性的分子基礎提供新的見解透乾。
在單細胞水平 (scATAC-seq) 轉(zhuǎn)座酶可接近染色質(zhì)分析的進展使染色質(zhì)可及性圖譜的強大分析成為可能洪燥,揭示了包括順式調(diào)節(jié)元件在內(nèi)的基因調(diào)控層磕秤。 scRNA-seq 和 scATAC-seq 共同提供了前所未有的分辨率,以揭示腫瘤生物學背后的復雜表觀遺傳事件捧韵,并為發(fā)現(xiàn)超出細胞類型標準分類學鑒定的腫瘤發(fā)生途徑提供了潛力市咆。
很少有與 scRNA-seq 和 scATACseq 匹配的癌癥數(shù)據(jù)集存在,并且沒有關于人類婦科腫瘤的數(shù)據(jù)集的報道再来。卵巢癌 (OC) 和子宮內(nèi)膜癌 (EC) 是女性中最致命的兩種癌癥蒙兰。這部分是由于這些癌癥的侵襲性、缺乏靶向治療以及通常處于診斷后期芒篷。值得注意的是搜变,OC 預示著預后不良,雖然不如乳腺癌常見梭伐,但其致死率是其三倍痹雅。 EC 是全球第六大女性最常診斷的癌癥,也是死亡率上升的少數(shù)癌癥之一糊识。癌癥基因組圖譜 (TCGA) 聯(lián)盟已經(jīng)提出了這些癌癥的分子亞型,但這些分層系統(tǒng)無法解釋腫瘤內(nèi)的細胞類型組成和惡性細胞異質(zhì)性摔蓝。假設患者腫瘤內(nèi)和腫瘤之間的細胞群由驅(qū)動癌基因表達的非編碼調(diào)控元件delineated赂苗,從而增強增殖、耐藥性和/或存活率贮尉。
在這里拌滋,提供了 11 種人類婦科腫瘤的匹配 scRNA-seq 和 scATAC-seq 數(shù)據(jù)catalog。 該數(shù)據(jù)集包含超過 170,000 個單細胞猜谚,在單細胞基因組學和癌癥生物學領域具有廣泛的用途败砂。 通過使用匹配的 scRNA-seq 和 scATAC-seq 分析這些腫瘤,揭示了 EC 和 OC 的腫瘤內(nèi)異質(zhì)性和發(fā)病機制的臨床相關非編碼機制魏铅。 還推斷了與惡性細胞類型特異性調(diào)節(jié)元件相互作用的轉(zhuǎn)錄因子 (TF) 的活性昌犹,并根據(jù)預測的成藥性對 TF 進行優(yōu)先排序(看來涉及到一些臨床驗證)。
RESULTS
Matched scRNA-seq and scATAC-seq of human gynecologic tumors
11 名未接受過治療的患者接受了以治愈為目的的減瘤手術(shù)览芳,以切除在子宮內(nèi)膜或ovary 中發(fā)現(xiàn)的腫瘤斜姥。 手術(shù)切除后,每個腫瘤被分離成活細胞懸浮液沧竟,并準備用于基于脂滴的 scRNA-seq 和 scATACseq铸敏。 腫瘤標本從未以任何方式冷凍或固定,從而在單細胞中實現(xiàn)高水平的細胞活力和穩(wěn)健的測序覆蓋率悟泵。 除患者 6 被診斷為轉(zhuǎn)移至ovary 的 EC 和患者 11 被診斷為轉(zhuǎn)移至 ovary 的胃腸道間質(zhì)瘤 (GIST) 外杈笔,所有腫瘤均為原發(fā)性腫瘤。 在對每個患者數(shù)據(jù)集進行質(zhì)量控制和雙細胞去除后糕非,獲得了 75,523 個使用 scRNA-seq 進行分析的細胞和 74,621 個使用 scATAC-seq 進行分析的細胞蒙具。
為了分析整個隊列中的 scRNA-seq 細胞敦第,使用所有 75,523 個細胞中前 2,000 個最可變表達的基因進行了主成分分析 (PCA)。 使用前 50 個主成分 (PC) 將細胞分類為具有基于圖形的聚類的轉(zhuǎn)錄不同cluster店量,并使用統(tǒng)一流形近似和投影 (UMAP) 圖進行可視化芜果。 這表明可以將cluster注釋到已知的細胞類型,并且批次效應不是主要的混雜因素融师。 為了識別整個隊列中的惡性cluster右钾,使用了臨床生物標志物基因表達和推斷的拷貝數(shù)擴增/缺失事件。 使用美國食品和藥物管理局 (FDA) 批準的生物標志物 MUC16/CA125 和 WFDC2/HE4 的表達來識別 EC 和 OC 癌癥clusters旱爆。 KIT/CD117 的表達用于鑒定 GIST 癌clusters舀射。 推斷的拷貝數(shù)變異 (CNV) 用于幫助識別 OC 和 GIST,而不是 EC怀伦,因為該疾病很少表現(xiàn)出 CNV事件脆烟。
為了分析整個隊列中的 scATAC-seq 細胞,在整個基因組中創(chuàng)建了一個連續(xù)基因組切片矩陣房待,我們在其中量化了片段計數(shù)邢羔。 對前 25,000 個可變性最大的基因組 bin 執(zhí)行了iterative latent semantic indexing。 為了將匹配的 scRNAseq 數(shù)據(jù)中的細胞類型cluster標簽分配給 scATAC-seq 細胞桑孩,使用了 Seurat 第 3 版跨模式整合方法(僅限于同一患者腫瘤的細胞)拜鹤。 這揭示了主要按細胞類型而非患者聚集的 scATAC-seq 細胞,突出了數(shù)據(jù)集的質(zhì)量.
總體而言流椒,我們在整個隊列中發(fā)現(xiàn)了 10 種 general 細胞類型敏簿,兩種模式中都存在 36 個subcluster。 盡管這些亞群的大小各不相同宣虾,但免疫亞群在所有患者中包含大致相等比例的細胞惯裕,而惡性和成纖維細胞亞群仍然具有高度的患者特異性。 這部分反映在每個腫瘤的每個推斷的 CNV 譜的獨特性上绣硝。 觀察結(jié)果與之前關于 OC蜻势、肺癌和鼻咽癌的 scRNAseq 報告一致。 這些模式可能反映了所有患者中非惡性細胞的生物學重疊域那,并突出了每個腫瘤內(nèi)惡性細胞的獨特且可能易于處理的生物學特征咙边。
Systematic discovery of cancer-specific distal regulatory elements in human gynecologic cancers
接下來,分析探索了染色質(zhì)圖譜次员,以確定可以幫助解釋這些惡性細胞的不同生物學狀態(tài)的遠端調(diào)節(jié)元件 (dRE)败许。 為了在所有 scATAC-seq 細胞中識別推定的調(diào)節(jié)元件,我們首先在每個細胞類型subcluster內(nèi)進行峰值調(diào)用淑蔚,并使用迭代重疊峰值合并程序生成逐個峰值矩陣市殷。In order to link variation in chromatin accessibility to differences in gene expression, we executed a largescale peak-to-gene linkage analysis and developed a robust empirical false discovery rate (eFDR) procedure for determining statistically significant peak-to-gene associations in single-cell data(峰與基因的相關性)。
簡而言之刹衫,匯總了通過 k 最近鄰識別的相似 scATAC-seq 細胞組內(nèi)的稀疏峰計數(shù)醋寝,為我們的峰-基因相關性分析生成更多信息的metacell觀察搞挣。然后,使用 scATACseq metacell(即相似細胞的聚集體)來計算每個峰的可及性與 cis 中每個基因的表達之間的相關性音羞,為每個 scATAC-seq 細胞估算囱桨。這種峰-基因相關性分析產(chǎn)生了 2,748,906 個順式峰-基因組合。為了估計 eFDR嗅绰,我們選擇了 1e 12 的原始 p 值閾值舍肠,并記錄了與原始 p 值 <=1e 12 觀察到的峰基因關聯(lián)的數(shù)量。峰-基因相關性分析在置換條件下重復 100 次窘面,對于每個置換翠语,改組 scATAC-seq metacell 標簽以打破峰可訪問性和基因表達之間的聯(lián)系。對于每個排列财边,與觀察到的數(shù)據(jù)相比肌括,峰-基因?qū)χg的相關性較小,原始 p 值分布接近均勻酣难。然后通過將與原始 p 值 <= 1e 12 的空峰與基因關聯(lián)的中位數(shù)除以與原始 p 值 <=1e 12 觀察到的關聯(lián)數(shù)來計算 eFDR谍夭。這些數(shù)據(jù)突出了觀察數(shù)據(jù)中峰值可及性和基因表達之間的真正生物學關系.
峰基因相關性分析揭示了 345,791 個具有統(tǒng)計學意義的峰基因鏈接(p 值 <= 1e 12,eFDR = 0.00014)鲸鹦。為了確定積極的調(diào)節(jié)效應(即峰可及性和基因表達之間的正相關)慧库,專注于相關性 R >= 0.45 (n = 133,811) 的峰與基因之間的聯(lián)系。大多數(shù)這些峰到基因的聯(lián)系涉及內(nèi)含子峰(50.2%)和遠端峰(28.3%)馋嗜。在這組中,啟動子和外顯子峰到基因的聯(lián)系最低(分別為 11.3% 和 10.2%)吵瞻。為了揭示這些婦科腫瘤中活躍的遠端調(diào)節(jié)機制葛菇,在下游分析中繼續(xù)進行了 37,833 個遠端峰到基因的鏈接。我們進一步將峰到基因的鏈接分類為 36 k-means cluster橡羞,并觀察到推斷的基因表達和關聯(lián)的峰可訪問性之間高度一致的模式眯停。將這些相連的遠端峰稱為推定的 dRE。大多數(shù)已識別的 dRE 由 ENCODE 注釋卿泽,為我們的計算方法提供支持莺债,并表明它們是真正的bona fide regulatory elements。
為了識別所有患者癌細胞特異性的 dRE签夭,我們從富含癌癥的 k-means 組中提取了遠端峰齐邦,并使用來自非癌組織的表觀基因組圖譜進行了基因組區(qū)間重疊分析。 將 14,043 個富含癌癥的遠端峰的基因組坐標與在源自正常 ovary 表面上皮和正常輸卵管分泌上皮組織的細胞系中活躍的假定增強子元素(由 H3K27ac 定義)重疊第租。 還篩選了所有現(xiàn)有的 ENCODE regulatory elements措拇。 重疊分析揭示了正常 ovary 表面上皮、正常輸卵管分泌上皮或 ENCODE 數(shù)據(jù)庫中不存在的 3,688 個遠端峰慎宾。 因此丐吓,這 3,688 個遠端峰參與了 5,827 個峰到基因的鏈接浅悉,代表了癌癥特異性 dRE。 剩余的遠端峰 (n = 22,166) 代表在正常組織中活躍的調(diào)控元件券犁。
為了進一步表征癌癥特異性 dRE术健,量化了癌癥特異性和正常峰組中每個遠端峰的相關靶基因。 引人注目的是粘衬,與非惡性峰(平均值 = 1.44)相比荞估,癌癥特異性峰與更多基因(平均值 = 1.58)相關(p <= 1.6e-05,Wilcoxon 秩和檢驗)色难。 以前的研究已經(jīng)對每個 dRE 的推定靶基因數(shù)量提出了類似的估計泼舱,預計這種差異會在更大的患者群體中被放大.
發(fā)現(xiàn)了許多與使用 scRNA-seq 測量的惡性細胞群中上調(diào)基因相關的癌癥特異性 dRE 的顯著實例。 例如枷莉,標志性 mTOR 通路調(diào)節(jié)因子 RHEB 在標記為 3 卵巢癌的亞群中顯著上調(diào)娇昙,該亞群來自被診斷患有子宮內(nèi)膜樣 OC 的患者 7。 這種惡性細胞亞群也顯示出 mTOR 通路基因特征的陽性富集(p < 0.01笤妙,Kruskal-Wallis 檢驗)冒掌。 在所有惡性 population 的 RHEB 啟動子處發(fā)現(xiàn)了強烈的染色質(zhì)可及性信號,但我們強調(diào)了在 3 卵巢癌亞群中富集的四種癌癥特異性 dRE 的可及性顯著增加蹲盘。 總之股毫,這為通過富含子宮內(nèi)膜樣 OC 惡性細胞的致癌 dRE 提供了 mTOR 通路失調(diào)的可能機制。 事實上召衔,高 RHEB 表達預示著 OC 患者的預后較差铃诬。
eFDR peak-to-gene linkage和基因組區(qū)間重疊分析分別揭示了 EC/OC 和 GIST 中臨床生物標志物 CA125 和 CD117 的額外推定的癌癥特異性 dRE。 這些基因也分別預示著 OC 和胃癌的不良生存率苍凛。 連同我們對 RHEB 的研究結(jié)果趣席,這表明 dRE 的分子重新布線在婦科惡性腫瘤的發(fā)病機制中起關鍵作用,并具有重要的臨床意義醇蝴。
為了從完整的隊列分析過渡到癌癥類型特異性分析宣肚,并確定更精細的轉(zhuǎn)錄組和表觀基因組差異,我們進行了 pseudo-bulk 聚類分析悠栓。 該分析揭示了兩組患者腫瘤霉涨,這些腫瘤在數(shù)據(jù)類型中是保守的:患者 1-5(子宮內(nèi)膜樣 EC [EEC])和患者 8 和 9(高級別漿液性 OC [HGSOC])。有趣的是惭适,患者 6 和患者 10 的腫瘤在pseudo-bulk RNA-seq 方面更類似于 HGSOC 腫瘤笙瑟,但在pseudo-bulk ATAC-seq 方面更類似于 EEC 腫瘤。
Cancer-specific regulatory mechanisms in EEC
EC 是美國最常見的婦科惡性腫瘤腥沽,子宮內(nèi)膜樣組織學類型占大多數(shù)病例逮走。為了分析 EEC 患者隊列,合并了來自患者 1-5 的所有細胞,產(chǎn)生了使用 scRNA-seq 分析的 32,234 個細胞和使用 scATAC-seq 分析的 32,155 個細胞师溅。發(fā)現(xiàn)細胞主要按細胞類型而非患者聚集茅信,這表明批次效應不是主要的混雜因素∧钩簦總體而言蘸鲸,在患者 1-5 中觀察到 8 種 general 細胞類型,在 scRNA-seq 中有 29 個亞群窿锉,在 scATAC-seq 中有 28 個亞群酌摇。在 scATAC-seq 中,第 20 個成纖維細胞亞群只有 10 個細胞嗡载,因此從下游分析中刪除窑多。接下來使用 EC 生物標志物 MUC16/CA125 和 WFDC2/HE4 篩選惡性亞群。同樣洼滚,觀察到成纖維細胞/基質(zhì)和 EC 亞群具有高度的患者特異性埂息。分析還強調(diào),四個亞群幾乎完全由來自患者 3(6-遥巴、14-千康、15-和 21-子宮內(nèi)膜癌)的細胞形成,表明該腫瘤內(nèi)具有高度的瘤內(nèi)異質(zhì)性铲掐。
接下來拾弃,為了想更好地了解這些 EEC 亞群之間的轉(zhuǎn)錄差異,以及是否有任何模式可以通過染色質(zhì)可及性的變化來解釋。 在 EEC 隊列中進行了cancer-specific peak-to-gene linkage analysis,并確定了 324,626 個peak-to-gene linkage(p <= 1e 12,eFDR < 5.5e 5),其中 34,231 個位于遠端列荔,相關性 > 0.45 . 與正常參考表觀基因組圖譜的比較確定了 1,943 個推定的癌癥特異性遠端峰,形成 2,950 個癌癥特異性peak-to-gene linkage。 有趣的是诚亚,觀察到與 EEC 患者隊列的正常峰相關的與癌癥特異性峰相關的基因數(shù)量同樣增加(p = 4.23e-05,Wilcoxon 秩和檢驗)滴某。
為了評估這些 dRE 是否在 EEC 患者中共享磅摹,使用來自完整 EEC 分析的同一組峰分別對每位患者重復peak-to-gene linkage analysis。 我們 query 每位患者在 34,231 個 dRE 或峰值基因?qū)χ械目苫謴捅壤?患者 1-5 的患者特異性分析分別恢復了原始 EEC dRE 的 49.68%霎奢、52.03%户誓、40.91%、62.17% 和 52.32%幕侠。 此外帝美,發(fā)現(xiàn)在每個患者特異性分析中恢復了 17.23% 的原始 EEC dRE。 因此晤硕,多個患者參與這些假定的調(diào)節(jié)關系悼潭。
接下來庇忌,想研究癌癥特異性 dRE 在惡性細胞群中相對于 EEC 隊列的正常細胞群的重新連接程度。 獨立重復了 EEC 隊列中惡性和非惡性部分的peak-to-gene linkage analysis舰褪,并評估了在每個部分中回收了多少癌癥特異性 dRE皆疹。 在惡性特異性分析中鑒定出 27,738 個 dRE,在非惡性分析中鑒定出 34,172 個 dRE占拍。 惡性特異性分析比非惡性分析恢復了更多的 2,950 個癌癥特異性 dRE(分別為 47.5% 和 6.3%)略就。 這些數(shù)據(jù)表明,相對于正常細胞狀態(tài)晃酒,遠端調(diào)控landscope在惡性腫瘤中被rewired表牢。
然后,確定了三個明確的癌癥特異性 dRE 例子贝次,這些例子解釋了惡性 population 中相對于 EEC 隊列中正常細胞群的基因表達上調(diào)崔兴。例如,EEC 隊列的惡性部分中 IMPA2 表達增加浊闪,并且 IMAP2 基因座內(nèi)癌癥特異性 dRE 的染色質(zhì)可及性增加恼布。 IMPA2 編碼參與磷脂酰肌醇信號傳導的肌醇單磷酸酶 2 蛋白。盡管很少有研究報道 IMPA2 在癌癥中的作用搁宾,但 IMPA2 的高表達預示著子宮內(nèi)膜樣癌 (UCEC) 患者的存活率低折汞。還發(fā)現(xiàn)了三個明確的癌癥特異性 dRE,這些 dRE 與 EEC 隊列惡性部分中 SOX9 表達增加有關盖腿。由于高 SOX9 表達預示著 UCEC 患者的預后較差爽待,并且 SOX9 與 EC 中子宮內(nèi)膜增生性病變的形成有關,這些數(shù)據(jù)可能為子宮內(nèi)膜癌變背后的非編碼機制提供見解翩腐。最后鸟款,注意到 CD24 在 EEC 隊列的惡性部分中高度表達,并且我們強調(diào)了與 CD24 表達相關的三種癌癥特異性 dRE茂卦。據(jù)報道何什,CD24 是子宮內(nèi)膜增生性病變和 EC 之間的有效鑒別因子。此外等龙,增加的 CD24 表達提供了對化療劑的抗性处渣,并促進了子宮內(nèi)膜癌細胞中巨噬細胞吞噬作用的免疫逃逸。這些臨床相關的致癌 dRE 只是 EEC regulatory landscape 改變的一個snapshot蛛砰。
Cancer cell populations of HGSOC acquire cancerspecific dREs for genes involved in drug resistance
HGSOC 是 OC 最常見的組織學類型罐栈,其特點是高拷貝數(shù)改變和很少的驅(qū)動突變,這被認為是這種疾病的臨床侵襲性的原因泥畅。為了分析 HGSOC 患者隊列荠诬,我們合并了來自患者 8 和 9 ,產(chǎn)生了 13,646 個由 scRNA-seq 分析的細胞和 17,677 個由 scATAC-seq 分析的細胞「陶辏總體而言方椎,在患者 8 和 9 中觀察到六種general細胞類型,在 scRNA-seq 中有 24 個亞群凌外,在 scATAC-seq 中有 19 個亞群辩尊。在 scATAC-seq 中,五個細胞類型subcluster的細胞少于 30 個康辑,因此從下游分析中刪除摄欲。使用推斷的 CNV 事件和 OC 生物標志物 MUC16/CA125 和 WFDC2/HE4 的表達來鑒定惡性亞群。同樣疮薇,觀察到成纖維細胞/基質(zhì)和 OC 亞群具有高度的患者特異性胸墙,這反映了來自每個患者腫瘤的惡性和成纖維細胞群的生物學獨特性,這部分得到了它們不同推斷的 CNV 譜的支持按咒。值得注意的是迟隅,患者 9 有四個惡性亞群,表明該腫瘤內(nèi)具有高度的瘤內(nèi)異質(zhì)性励七。
為了了解這些亞群的regulatory landscape智袭,我們進行了 peak-to-gene linkage analysis,以確定推定的癌癥特異性 dRE掠抬,這些 dRE 驅(qū)動了惡性population的轉(zhuǎn)錄譜吼野。 該分析確定了 486,293 個具有統(tǒng)計學意義 (p <= 1e-12, eFDR < 2.1e-06) 的peak-to-gene links,其中 62,087 個位于遠端两波,相關性 > 0.45瞳步。 基因組區(qū)間重疊分析確定了 5,202 個推定的癌癥特異性遠端峰,形成 11,134 個癌癥特異性peak-to-gene links腰奋。 總體而言单起,與 HGSOC 隊列的正常峰相比,癌癥特異性峰平均與更多基因相關(p = 6.6e 12劣坊,Wilcoxon 秩和檢驗)嘀倒。 再次調(diào)查了癌癥特異性 dRE 在 HGSOC 隊列的惡性細胞群中重新連接的程度,發(fā)現(xiàn)惡性特異性分析比非惡性分析恢復了更多的 11,134 個癌癥特異性 dRE(63.6% versus 3.9%, respectively).
在 HGSOC 隊列中的 11,134 個癌癥特異性 dRE 中局冰,重點介紹了惡性部分中癌癥特異性基因調(diào)控的兩個例子括儒。 PI3 編碼肽酶抑制劑 3(Elafin 蛋白),在惡性部分中高度表達锐想,其上調(diào)可以用四種癌癥特異性 dRE 來解釋。 PI3 不僅可以預測漿液性 OC 患者的不良生存率乍狐,它還與 OC 化學抗性有關赠摇,并通過激活 MEK-ERK 信號使 OC 細胞具有增殖優(yōu)勢.
分析還強調(diào)了兩種癌癥特異性 dRE,它們與 HGSOC 患者隊列的惡性部分中 LAPTM4B 表達增加密切相關。 LAPTM4B 可預測 OC 患者的不良生存率藕帜,據(jù)報道是化療藥物流出和 PI3K/AKT 信號傳導的有效促進劑烫罩。將 LAPTM4B 癌癥特異性 dRE 標記為增強子 2 (Enh2) 和增強子 4 (Enh4),并且我們注意到在該基因座內(nèi)注釋了三個額外的 dRE(Enh1洽故、3 和 5)贝攒。To interrogate TF occupancy at these dREs, we performed find individual motif occurrences (FIMO) analysis for each putative enhancer region using the patient 9 DNA sequence after accounting for single-nucleotide variants in the malignant fraction (subclusters 0-, 7-, 11-, and 16-ovarian cancer) of patient 9. 有趣的是,來自患者 9 惡性部分的細胞在 Enh2 內(nèi)含有一個 SNP(rs10955131)时甚,但我們無法確定這種突變是否是體細胞獲得的隘弊,因為我們在這個特定基因組區(qū)域的正常免疫細胞中沒有達到足夠的讀取深度來執(zhí)行variant calling。在每個假定的增強子區(qū)域內(nèi)觀察到統(tǒng)計學上顯著的 TF motif 匹配荒适,并通過患者 9 惡性部分中的 scRNA-seq TF 表達進一步對它們進行排序梨熙。值得注意的是,在 Enh2刀诬、Enh4 和 LAPTM4B 啟動子區(qū)域內(nèi)發(fā)現(xiàn)了 YY1 motif咽扇,這表明這些癌癥特異性增強子參與了患者 9 惡性細胞內(nèi)的活性增強子啟動子連接。
Functional validation of LAPTM4B enhancers and predicted TF regulators
為了進一步驗證dRE 識別流程陕壹,進行了實驗以確認這些 dRE 和 TF 是 LAPTM4B 表達的真正增強劑质欲。 首先,在 HGSOC 細胞系 OVCAR3 中使用 dCas9-KRAB 介導的 CRISPR 干擾測定來抑制 LAPTM4B 基因座中最活躍的癌癥特異性 dRE (Enh2) 和譜系特異性 dRE (Enh3)糠馆。 用靶向 Enh2 和 Enh3 的單向?qū)?RNA (sgRNA) 轉(zhuǎn)染穩(wěn)定表達 dCas9-KRAB 的 OVCAR3 細胞嘶伟,以誘導局部染色質(zhì)抑制。 然后測量了對基因表達的影響榨惠,發(fā)現(xiàn) LAPTM4B 在靶向 Enh2 和 Enh3 時顯著降低奋早。 因此,得出結(jié)論赠橙,Enh2 和 Enh3 是 LAPTM4B 的真正增強劑耽装,為整個研究中確定的剩余 dRE 提供支持(體外實驗基因敲除驗證,這個很有意義啊)期揪。
接下來通過 OVCAR3 細胞中的 RNAi 介導的敲低驗證了 LAPTM4B 的預測 TF 調(diào)節(jié)劑掉奄。 在敲除每個預測的 TF 調(diào)節(jié)因子后測量了 LAPTM4B 的表達:YY1、CEBPD 和 KLF6凤薛。 事實上姓建,當靶向 YY1、CEBPD 和 KLF6 時缤苫,我們觀察到 LAPTM4B 表達在統(tǒng)計學上顯著下降速兔,但在靶向陰性對照 GAPDH 時則沒有。 因此活玲,YY1涣狗、CEBPD 和 KLF6 是 LAPTM4B 的真正 TF 調(diào)節(jié)劑谍婉,為 TF 預測提供了信心。
Linking dREs to TF activity in human gynecologic malignancies
在確定了可能在癌癥進展中起關鍵作用的 dRE 之后镀钓,在整個數(shù)據(jù)集中query了這些 dRE 中存在的反式作用因子穗熬,以更好地了解這些腫瘤的調(diào)控邏輯。我們采用了我們已發(fā)表的方法丁溅,稱為增強子元素的總功能評分 (TFSEE)唤蔗,以預測哪些 TF 在惡性細胞類型中的活性 dRE(增強子樣元素)中富集。通過將此方法應用于匹配的 scRNA-seq 和 scATAC-seq窟赏,TFSEE 允許同時評估 TF 表達妓柜、增強子活性、增強子位置和增強子上存在的 TF饰序。在整個患者隊列中领虹,根據(jù)患者特異性、推斷的 CNV 事件和/或癌癥生物標志物表達模式選擇 11 個惡性細胞類型亞群進行 TFSEE 分析求豫。進行了 TFSEE 分析并觀察到惡性細胞類型傾向于按患者和癌癥類型聚集塌衰。為了進一步優(yōu)先考慮跨活性增強子元素的富集 TF,我們通過 canSAR 數(shù)據(jù)庫通過基于結(jié)構(gòu)和基于配體的評估確定的預測成藥性狀態(tài)(二進制)突出顯示每個 TF蝠嘉。
為了用單細胞數(shù)據(jù)舉例說明 TFSEE 的效用最疆,研究了兩名具有罕見組織學亞型的患者的腫瘤內(nèi)異質(zhì)性。 對于被診斷為轉(zhuǎn)移至 ovary 的漿液性組織學 EC 的患者 6蚤告,有兩個不同的腫瘤亞克屡帷(19 和 34 子宮內(nèi)膜癌),其不同的 CNV 特征highlighted杜恰。 可視化了這兩個亞克隆之間 TF 活性的差異获诈,并觀察到了在每個亞克隆中富集的幾個值得注意的 TF。 值得注意的是心褐,發(fā)現(xiàn) MAFB 在患者 6 腫瘤的 19 子宮內(nèi)膜癌亞克隆中相對于 34-endometrial cancer 亞克隆富集舔涎。 此外,根據(jù) canSAR 數(shù)據(jù)庫逗爹,通過基于配體的評估預測 MAFB 可成藥亡嫌。 還觀察到 STAT1 在患者 6 腫瘤的 34 個子宮內(nèi)膜癌亞克隆中富集。這些 TF 活性的差異可能為漿液性 EC 的瘤內(nèi)異質(zhì)性提供有價值的見解掘而。
還選擇調(diào)查診斷為卵巢癌肉瘤的患者 10 腫瘤的兩個組織病理學部分(16 和 17 卵巢癌)挟冠。盡管這兩種組織病理學部分具有相似的推斷 CNV 譜,但對所有惡性細胞類型的pseudo-bulk基因集變異分析 (GSVA) 揭示了 16-卵巢癌亞群袍睡。這表明 16 卵巢癌亞群代表肉瘤部分知染,而 17 卵巢癌亞群代表癌部分。 16-卵巢癌與 GIST subcluster 0-/27-GIST 的聚類以及 17-卵巢癌與 HGSOC subcluster 9-/10-卵巢癌的聚類也支持這些分數(shù)身份分配斑胜。為了揭示患者 10 腫瘤的癌部分(17-卵巢癌)和肉瘤部分(16-卵巢癌)之間 TF 活性的差異持舆,可視化了比例 TFSEE 評分的差異色瘩,并確定了每個部分中富集的許多 TF。相對于癌部分逸寓,ZEB1 在肉瘤部分中富集。這一結(jié)果與 ZEB1 在 EMT 和抑制上皮特異性基因中的作用一致覆山。我們還觀察到相對于肉瘤部分富含癌部分的上皮特異性 TF ELF3竹伸。這些不同的 TF 活性譜,以及卵巢癌肉瘤組織病理學部分之間的共同推斷 CNV 事件簇宽,可能有助于研究人員和臨床醫(yī)生更好地了解婦科癌肉瘤的病因勋篓。
TFSEE 分析使我們能夠?qū){液性與子宮內(nèi)膜樣 OC、漿液性與 EEC 以及 GIST 與漿液性 OC 進行額外比較魏割。在每種情況下譬嚣,我們都確定了富含任一組織學類型的重要 TF 調(diào)節(jié)劑。值得注意的是钞它,觀察到 RARG 相對于子宮內(nèi)膜樣 OC 富含漿液 OC拜银,MAFB 相對于 EEC 富含漿液 EC,ZEB1 相對于漿液 OC 富含 GIST遭垛∧嵬埃總體而言,TFSEE 分析是單細胞基因組學中的一個新框架锯仪,它揭示了與 TF 表達耦合的 TF 活性的可靠推斷泵督。該策略試圖通過豐富具有非零表達的 TF 并為具有零或可忽略不計表達的 TF 賦予較低的權(quán)重來降低基于基序的 TF 預測的誤報率。在某些情況下庶喜,一些 TF 在沒有被主動轉(zhuǎn)錄的情況下仍然可以發(fā)揮作用小腊。因此,我們選擇通過省略與 TF 表達式矩陣的最后一個元素乘法來探索與 TF 表達式無關的 TFSEE 分析的替代版本久窟,并發(fā)現(xiàn)了類似的結(jié)果秩冈。
DISCUSSION
迄今為止,OC 和 EC 的護理標準是手術(shù)瘸羡、化學療法和放射療法的組合漩仙。盡管有這些積極的治療方法,但大多數(shù)晚期 EC 和 OC 的女性都會死于他們的疾病犹赖,這凸顯了開發(fā)更好的靶向治療的必要性队他。我們的工作代表了一種有價值的多組學資源,它以單細胞分辨率繪制了婦科腫瘤的轉(zhuǎn)錄和調(diào)控格局峻村。該數(shù)據(jù)集的反卷積確定了促進腫瘤發(fā)生的新機制麸折,并優(yōu)先考慮了使用批量基因組方法隱藏的治療干預的潛在途徑。我們還闡明了許多臨床相關生物標志物和參與癌癥發(fā)病機制的主要參與者的非編碼調(diào)控機制粘昨。此外垢啼,我們預計該數(shù)據(jù)集將有助于啟發(fā) EC 和/或 OC 中的新治療策略窜锯,作為 (1) 臨床醫(yī)生了解腫瘤內(nèi)異質(zhì)性的參考,(2) 癌癥生物學中的假設生成芭析,(3) 細胞類型注釋在未來的單細胞數(shù)據(jù)集中锚扎,以及 (4) 開發(fā)新的生物信息學方法。
我們重申分析這個單細胞數(shù)據(jù)集的四個重要發(fā)現(xiàn)馁启。 首先驾孔,證明癌細胞從頭獲得非編碼 dRE,這些 dRE 以癌癥特異性方式調(diào)節(jié)標志性癌癥通路惯疙,包括 mTOR 信號傳導翠勉。 這與最近在 OC 患者聯(lián)合治療中測試 mTOR 抑制劑的臨床試驗一致。 由此霉颠,我們推測富含 mTOR 的患者 7 可能受益于 mTOR 抑制劑治療对碌,盡管需要進一步研究。 盡管如此蒿偎,這些數(shù)據(jù)證明了癌細胞如何由于染色質(zhì)可及性和 TF 占有率的變化而獲得侵襲性表型的重要非編碼機制朽们。
此外,與譜系特異性 dRE 相比酥郭,每個分析隊列中發(fā)現(xiàn)的癌癥特異性 dRE 平均與更多靶基因相關华坦。 根據(jù)我們的數(shù)據(jù),我們預計這一趨勢在更大的患者腫瘤組中會更大不从,并假設顯著的癌癥特異性 dRE 相對于在正常組織中活躍的 dRE 具有更高的“調(diào)節(jié)負荷”惜姐。 這可以通過拓撲關聯(lián)域邊界和高階染色質(zhì)結(jié)構(gòu)的改變來解釋,但這需要進一步研究
接下來椿息,患者腫瘤內(nèi)部和之間的惡性群體在與轉(zhuǎn)錄輸出相關的染色質(zhì)可及性方面表現(xiàn)出顯著的異質(zhì)性歹袁。 這對 EC 和 OC 治療構(gòu)成了具有挑戰(zhàn)性的障礙,并突出了腫瘤內(nèi)異質(zhì)性的重要性以及對更多實體瘤單細胞數(shù)據(jù)集的日益增長的需求寝优,特別是在對化療的反應中条舔。 惡性細胞群在多大程度上可以被描述為不同的“細胞類型”或“細胞狀態(tài)”仍然難以捉摸,并激發(fā)了對時間調(diào)控的致癌調(diào)控元件和惡性細胞群的譜系追蹤的進一步研究乏矾。
最后孟抗,我們推斷惡性細胞群之間差異 TF 活性的方法揭示了在癌細胞中重新利用的另一個復雜的基因調(diào)控層。 我們的 TFSEE 分析是一個強大的工具钻心,可以促進 scRNA-seq 和 scATAC-seq 數(shù)據(jù)集的整合凄硼,以探究復雜的基因調(diào)控機制。 這有助于優(yōu)先考慮 TF 進行后續(xù)調(diào)查捷沸,并有助于激發(fā)婦科惡性腫瘤的新治療途徑摊沉。
Method
單細胞分析部分(質(zhì)控的部分大家要注意)
CNV分析(inferCNV)
單細胞注釋
ATAC分析
單細胞ATAC聯(lián)合分析(Seurat && ArchR)
Pseudo-bulk clustering of patient tumors
Peak-to-gene correlation analysis with empirically derived FDR (eFDR)
Genomic coordinate overlap analysis with normal epigenome profiles
生活很好,有你更好