[圖片上傳失敗...(image-e0cc23-1727284601103)]
Basic Information
- 英文標(biāo)題: Deciphering cell states and genealogies of human haematopoiesis
- 中文標(biāo)題:解析人類造血的細胞狀態(tài)和譜系
- 發(fā)表日期:22 January 2024
- 文章類型:Article
- 所屬期刊:Nature
- 文章作者:Chen Weng | Vijay G. Sankaran
- 文章鏈接:https://www.nature.com/articles/s41586-024-07066-z
Abstract
Para
- 人類血液系統(tǒng)通過有限數(shù)量的長壽造血干細胞(HSCs)的分化和大量擴增來維持购裙。
- 這一過程的擾動是多種疾病的基礎(chǔ),但人類造血的克隆貢獻及其隨年齡的變化仍不完全清楚想虎。
- 盡管最近從模型系統(tǒng)的條形碼研究中獲得了見解几莽,但同時在人類中檢測自然條形碼的細胞狀態(tài)和系統(tǒng)發(fā)育仍具有挑戰(zhàn)性腾仅。
- 在這里力惯,我們介紹了一種改進的單細胞譜系追蹤系統(tǒng)跑筝,該系統(tǒng)基于對自然發(fā)生的線粒體DNA突變的深度檢測死讹,同時讀取轉(zhuǎn)錄狀態(tài)和染色質(zhì)可及性。
- 我們使用這個系統(tǒng)來定義HSCs的克隆結(jié)構(gòu)曲梗,并繪制克隆的生理狀態(tài)和輸出赞警。
- 我們發(fā)現(xiàn)HSC克隆的功能異質(zhì)性在數(shù)月內(nèi)是穩(wěn)定的妓忍,表現(xiàn)為總HSC輸出的差異以及傾向于產(chǎn)生不同成熟細胞類型的偏倚。
- 我們還發(fā)現(xiàn)愧旦,隨著年齡的增長世剖,HSC克隆的多樣性顯著減少,導(dǎo)致形成具有多個不同克隆擴張的寡克隆結(jié)構(gòu)笤虫。
- 因此旁瘫,我們的研究提供了一個克隆解析和細胞狀態(tài)感知的人類造血單細胞分辨率圖譜,展示了人類HSC克隆未被充分認識的功能多樣性琼蚯,并在更廣泛的范圍內(nèi)酬凳,為在人類健康和疾病中精細研究多種組織的克隆動力學(xué)鋪平了道路。
Main
Para
- 造血干細胞(HSCs)維持著終身的血液和免疫細胞生成遭庶,具有廣泛的治療應(yīng)用宁仔,并作為理解干細胞生物學(xué)的范例。
- 近期研究表明峦睡,HSCs在功能上是異質(zhì)的翎苫,具有多樣的克隆行為。
- 為了更深入地理解HSCs的功能多樣性榨了,關(guān)鍵在于追蹤造血過程中的克隆和亞克隆關(guān)系煎谍,以揭示HSC在健康狀態(tài)、血液疾病阻逮、癌癥以及HSC功能常受擾亂的衰老環(huán)境中的貢獻和行為粱快。
Para
- 移植實驗已經(jīng)證明了造血干細胞(HSCs)的克隆異質(zhì)性,但其與穩(wěn)態(tài)造血的相關(guān)性仍不清楚叔扼。
- 在模式生物中事哭,可以通過對造血干細胞進行遺傳標(biāo)記來研究穩(wěn)態(tài)下的HSC行為,但標(biāo)記效率和實驗方法的變異性導(dǎo)致了關(guān)于HSC克隆如何貢獻于造血的不同觀點瓜富。
- 盡管在基因治療試驗中的罕見移植情況下鳍咱,可以對人類HSC進行遺傳標(biāo)記,但這種外源性標(biāo)記不能在人類中常規(guī)使用与柑。
Para
- 體細胞獲得的突變作為自然積累的條形碼谤辜,可用于人類樣本的回顧性譜系追蹤。
- 最近的研究通過全基因組測序分析由單個造血祖細胞分化而來的細胞克隆价捧,推進了我們對人類造血克隆動態(tài)的理解丑念。
- 然而,這些方法無法保留原始細胞狀態(tài)结蟋,而這種測量對于展示細胞狀態(tài)如何影響造血干細胞和其他細胞類型在造血中的行為和貢獻至關(guān)重要脯倚。
- 原則上,能夠同時提供單細胞豐富細胞狀態(tài)讀數(shù)并從自然細胞條形碼中獲得詳細譜系信息的技術(shù),將克服這一局限推正。
- 我們和其他研究者先前證明了線粒體DNA突變作為人類自然細胞條形碼的潛力恍涂。
- 然而,現(xiàn)有方法只能檢測到有限的一部分mtDNA突變植榕,阻礙了解析精細尺度亞克隆關(guān)系和層級的能力再沧。
Para
- 我們在此介紹一種新方法,單細胞調(diào)控多組學(xué)(轉(zhuǎn)錄組學(xué)和染色質(zhì)可及性)與深度線粒體突變分析(ReDeeM)尊残,其突變檢測率提高了約十倍炒瘸。
- 我們應(yīng)用ReDeeM生成了一個克隆解析的、單細胞轉(zhuǎn)錄組和可及染色質(zhì)圖譜夜郁,涵蓋了來自12位捐贈者的約15萬個人類造血細胞什燕,這些細胞經(jīng)過富集以確保適當(dāng)覆蓋稀有的造血干細胞和祖細胞(HSPC)群體。
- 通過這種方法竞端,我們定義了人類造血的克隆結(jié)構(gòu),并展示了單個HSC克隆對總體和譜系特異性產(chǎn)出的貢獻庙睡。
- 最后事富,我們評估了這些模式如何隨人類衰老而變化。
Single-cell deep mtDNA mutation recovery
Para
- 許多特征使mtDNA非常適合作為自然進化的條形碼乘陪,包括其基因組的緊湊性(約16.7 kb)统台、高拷貝數(shù)(每個細胞數(shù)百到數(shù)千個)和高自發(fā)突變率(估計比核DNA高10到100倍)。
- 因此啡邑,已經(jīng)有許多努力嘗試利用mtDNA突變作為內(nèi)源性贱勃、進化的細胞條形碼,用于譜系追蹤和克隆推斷谤逼,這些努力為諸如血液癌癥研究等過程提供了見解贵扰。
- 然而,由此產(chǎn)生的系統(tǒng)發(fā)育分析的分辨率存在局限性流部。
- 檢測特定亞克隆中發(fā)現(xiàn)的罕見mtDNA突變的能力受到區(qū)分測序偽影和真實變異的挑戰(zhàn)的阻礙戚绕。
- 為了提高我們調(diào)用更完整mtDNA突變集的能力,我們試圖使用單分子共識校正枝冀,這可以最小化測序和PCR錯誤的影響(方法)舞丛。
- 我們通過修改10X Genomics平臺的基于液滴的單細胞多組學(xué)方法,使用完整細胞并進一步優(yōu)化了最大化mtDNA覆蓋率的協(xié)議果漾,同時保留了單細胞RNA測序(scRNA-seq)和單細胞轉(zhuǎn)座酶可及染色質(zhì)測序(scATAC-seq)文庫的質(zhì)量(圖1a球切,補充圖1和方法)。
- 我們設(shè)計了用于基于雜交捕獲的mtDNA特異性探針(補充數(shù)據(jù)1和方法)绒障。
- 為測序生成了三個獨立的文庫(mtDNA吨凑、ATAC和RNA),并帶有匹配的細胞條形碼以便下游整合(圖1a)端盆。
- 細胞條形碼怀骤,加上mtDNA片段的起始和結(jié)束位置费封,作為內(nèi)源性獨特分子標(biāo)識符(eUMIs),無需人工條形碼(eUMI碰撞率約為3%蒋伦;方法和擴展數(shù)據(jù)圖1a)弓摘。
- eUMI使得單分子共識錯誤校正成為可能,從而顯著提高了變異調(diào)用的靈敏度和準(zhǔn)確性痕届,進而促進了低異質(zhì)性罕見mtDNA突變的檢測(擴展數(shù)據(jù)圖2和補充方法)韧献。
- 我們基于eUMIs開發(fā)了一個開源的計算流程(redeemV和redeemR包),用于單細胞多組學(xué)分析中的共識mtDNA突變調(diào)用研叫。
Fig. 1: Single-cell deep mtDNA mutation detection with joint multiomics.
[圖片上傳失敗...(image-301658-1727284601103)]
- a, ReDeeM工作流程示意圖锤窑。GDN,1%糖基薯蕷皂苷(方法部分)嚷炉。
- b, 在線粒體DNA富集前后每個細胞的mtDNA拷貝數(shù)和UMI組大小的比較渊啰。UMI組大小是每個UMI組中原始讀數(shù)的數(shù)量。Q30申屹,測序質(zhì)量評分30或以上(準(zhǔn)確度≥99.9%)绘证。
- c, 在7,104個細胞中,通過mgatk軟件包在mtDNA富集前和通過UMI共識調(diào)用后在mtDNA富集后確定的mtDNA突變總數(shù)比較哗讥。
- d, 在優(yōu)化協(xié)議下嚷那,重鏈(H)和輕鏈(L)的單核苷酸和三核苷酸變化的每個類別的突變特征。突變特征在未過濾(頂部)杆煞、通過UMI共識調(diào)用得到的4,831個mtDNA突變(中部)和之前報道的bulk mtDNA突變特征(底部魏宽,改編自參考文獻35)之間進行比較。
- e, 通過mgatk在mtDNA富集前和通過UMI共識調(diào)用在mtDNA富集后每個細胞中確定的mtDNA突變數(shù)量的分布决乎。
- f, 在mtDNA富集前(通過mgatk队询,左側(cè))和后(通過UMI共識調(diào)用,右側(cè))的網(wǎng)絡(luò)連通性分析瑞驱。每個點代表一個細胞娘摔,每條線連接具有共享突變的細胞。連通性定義為與任何給定細胞共享至少一個mtDNA突變的"鄰居"細胞的數(shù)量唤反。Lib.凳寺,文庫。
Para
- 作為ReDeeM的初步基準(zhǔn)彤侍,我們對來自一位健康年輕捐贈者(31歲)的7,104個人類CD34+ HSPCs進行了分析肠缨。
- 對靶向mtDNA文庫的深度測序顯著增加了mtDNA片段覆蓋率(平均每個細胞51.7個線粒體基因組拷貝,而未經(jīng)富集的為14.3個)以及理想的eUMI組大小用于共識校正(平均每個eUMI拷貝4.8個原始讀數(shù)盏阶,而未經(jīng)富集的為1.6個晒奕;圖1b)。
- 經(jīng)過嚴格的多步驟過濾,我們在7,104個細胞中鑒定出4,831個高置信度的mtDNA突變脑慧,這比之前報道的方法高出十倍以上(圖1c魄眉,擴展數(shù)據(jù)圖3,方法及補充說明)闷袒。
- 我們進一步檢查了這4,831個mtDNA突變坑律,并驗證了它們在每個eUMI組中通常由多個讀數(shù)支持,具有高共識分數(shù)和配對末端鏈之間的一致重疊(擴展數(shù)據(jù)圖1c,e–g)囊骤。
- 值得注意的是晃择,這4,831個mtDNA突變的突變特征與之前報道的mtDNA突變譜非常吻合(圖1d)。
- 因此也物,每個細胞呈現(xiàn)的mtDNA突變數(shù)量顯著增加(中位數(shù)為九個宫屠,而未經(jīng)富集的為一個),且這些突變與其他細胞共享滑蚯,從而將細胞間的連接性提高了一個數(shù)量級(圖1e,f)浪蹂。
- 這種增強的細胞間連接性為精細尺度的亞克隆和系統(tǒng)發(fā)育分析提供了前所未有的機會。
- 我們還評估了來自相同細胞的另外兩種模態(tài)——scRNA-seq和scATAC-seq的數(shù)據(jù)質(zhì)量告材。
- 這兩種模態(tài)均表現(xiàn)出優(yōu)異的捕獲效率乌逐,每個細胞的中位數(shù)為5,084個轉(zhuǎn)錄本和15,590個ATAC片段。
- ATAC插入顯示了預(yù)期的尺寸分布创葡,并且在轉(zhuǎn)錄起始位點高度富集(補充圖1c,e,f)。
- 此外绢慢,大多數(shù)mtDNA突變未發(fā)現(xiàn)顯著的選擇性特征灿渴,表明總體上呈中性,使得這些突變可以作為無害的追蹤標(biāo)記(擴展數(shù)據(jù)圖4和補充說明)胰舆。
Para
- 為了測試 ReDeeM 生成的系統(tǒng)發(fā)育重建的準(zhǔn)確性骚露,我們使用了 Kras;Trp53 驅(qū)動的肺腺癌譜系追蹤小鼠模型來檢測同一單個細胞中核基因組中的工程化 CRISPR 基因編輯的進化條形碼和自然發(fā)生的線粒體體細胞突變。
- 在兩個實驗批次中缚窿,共采樣了十個腫瘤(第一批次六個棘幸,第二批次四個)。
- 由 ReDeeM 確定的細胞間親緣關(guān)系和克隆分組在單細胞水平(親緣關(guān)系正相關(guān)的中位數(shù)倦零,或親緣關(guān)系一致率误续,為 0.78)和克隆簇水平(在不同聚類分辨率和樣本中的調(diào)整后蘭德指數(shù)為 0.2–0.7;擴展數(shù)據(jù)圖 5扫茅,補充圖 2 和 3 及方法部分)上均得到了 CRISPR 基因編輯方法的有力支持蹋嵌。
- 此外,對單菌落全基因組測序譜系追蹤數(shù)據(jù)的線粒體突變重新分析顯示葫隙,克隆和亞克隆一致性栽烂,盡管靈敏度有限,與 ReDeeM 增強突變檢測能力相比(擴展數(shù)據(jù)圖 6 和補充說明)。
- 這些發(fā)現(xiàn)與最近一項報告一致腺办,該報告顯示在高頻 mtDNA 突變方面與菌落全基因組測序一致焰手,但在低頻 mtDNA 突變中噪聲更多(補充說明)。
- 綜合來看怀喉,這些獨立驗證支持 ReDeeM 能夠穩(wěn)健地檢測 mtDNA 突變并實現(xiàn)系統(tǒng)發(fā)育推斷书妻。
Haematopoietic phylogenies and cell states
Para
- 我們接下來使用ReDeeM研究了人類造血過程。
- 我們從兩位健康的年輕捐贈者(分別為31歲和26歲磺送,分別標(biāo)記為young-1和young-2)收集了骨髓吸出物驻子,并分離了單核細胞(主要是分化的血細胞和前體細胞)以及CD34+ HSPCs,以確保未分化和更分化細胞的充分代表性估灿。
- 我們在young-1和young-2中分別對11,009個造血細胞(5,415個骨髓單核細胞(BMMCs)和5,594個HSPCs)和15,101個造血細胞(7,147個BMMCs和7,954個HSPCs)進行了三種模態(tài)的 profiling(圖2a)崇呵。
- 我們確信在young-1的BMMCs和HSPCs中分別識別出3,896和4,803個mtDNA突變,在young-2的BMMCs和HSPCs中分別識別出4,087和5,137個mtDNA突變馅袁。
- 基于共享的深層mtDNA突變譜域慷,我們使用鄰接法算法重建了每位捐贈者造血部分的系統(tǒng)發(fā)育樹(圖2b,補充圖5a和方法)汗销。
- 所得到的樹得到了多個mtDNA突變的有力支持(補充圖4a)犹褒,表現(xiàn)出高度的多克隆性,這與基于健康捐贈者造血克隆核基因組測序的最近系統(tǒng)發(fā)育分析一致弛针。
Fig. 2: Fine-scale lineage tracing with simultaneous state profiling for human haematopoiesis at steady state.
[圖片上傳失敗...(image-6f741a-1727284601102)]
- a, 人類造血細胞ReDeeM實驗的示意圖叠骑。
- b, 基于共享mtDNA突變使用鄰接法構(gòu)建的供體年輕-1造血細胞的系統(tǒng)發(fā)育樹。每個細胞的可共享mtDNA突變數(shù)量已標(biāo)明削茁,中位數(shù)為十(本文中用于樹狀圖可視化的為進化樹圖)宙枷。
- c, 年輕-1的聯(lián)合多組學(xué)聚類(與b中相同的細胞)。加權(quán)最近鄰均勻流形近似和投影(wnnUMAP)顯示了11,019個單細胞的ATAC和RNA聯(lián)合圖譜茧跋。HSC慰丛,造血干細胞;MPP瘾杭,多能祖細胞诅病;MKP,巨核細胞祖細胞粥烁;CMP贤笆,普通髓系祖細胞;GMP页徐,粒細胞-單核細胞祖細胞苏潜;MDP,單核細胞-樹突狀細胞祖細胞变勇;MEP恤左,巨核細胞-紅細胞祖細胞贴唇;CLP,普通淋巴系祖細胞飞袋;LMPP戳气,淋巴-髓系啟動祖細胞;ProB巧鸭,B細胞祖細胞瓶您;EryP,紅細胞前體纲仍;Mono呀袱,單核細胞;cDC郑叠,常規(guī)樹突狀細胞夜赵;pDC,漿細胞樣樹突狀細胞乡革;NK寇僧,自然殺傷細胞。
- d, 分析造血干細胞(HSCs)向髓系和巨核-紅細胞系分化軌跡中的染色質(zhì)可及性(偽批量ATAC沸版,左)嘁傀、mRNA表達(中)和SPI1和GATA1轉(zhuǎn)錄因子(TFs)的DNA結(jié)合活性(右)∈恿福基于JASPAR2020人類轉(zhuǎn)錄因子數(shù)據(jù)庫细办,使用ChromVar計算轉(zhuǎn)錄因子DNA結(jié)合基序頻率的偏差。
- e, 測量不同細胞類型中的mtDNA突變負擔(dān)蕾殴;n = 11,019個細胞蟹腾。箱線圖顯示了25th-75th百分位數(shù)的數(shù)據(jù),須延伸至1.5×四分位距(IQR)內(nèi)的最小和最大值区宇。P值來自雙側(cè)Wilcoxon秩和檢驗。
- f, 系統(tǒng)發(fā)育樹和多組學(xué)基礎(chǔ)細胞類型之間的綜合分析值戳。突出了細胞類型限制的局部類群示例(類群i-viii)议谷。富集P值通過單側(cè)二項式檢驗后進行q值校正計算悦施。
- g, 基于譜系信息mtDNA突變(11,009個細胞對631個變異)的細胞類型起源分析妓羊。顏色強度表示每個目標(biāo)細胞類型(x軸)在查詢細胞類型的mtDNA突變基礎(chǔ)k最近鄰(KNN)中的比例(y軸)他嫡。
Para
- 接下來澳窑,我們使用每個葉(單個細胞)在我們的系統(tǒng)發(fā)育樹中可用的轉(zhuǎn)錄組和表觀基因組信息來評估細胞狀態(tài)谈况。
- 我們使用加權(quán)最近鄰(WNN)指標(biāo)整合這兩種模態(tài)可很,并識別出17種主要的造血細胞類型/簇(圖2c和補充數(shù)據(jù)2)蓝仲。
- 單個細胞的scRNA-seq和scATAC-seq譜圖的配對也使我們能夠探索造血細胞命運決策中的調(diào)控回路辜梳。
- 例如赦政,在其他髓系譜系和巨核細胞/紅細胞譜系之間的分支路徑上胜宇,我們觀察到主要的轉(zhuǎn)錄調(diào)控因子SPI1和GATA1是如何通過與特定的調(diào)控元件結(jié)合而被激活耀怜,并隨后促進分化軌跡,其特征是其中一個或另一個轉(zhuǎn)錄因子基序的可及性增加(圖2d)桐愉。
- 我們發(fā)現(xiàn)GATA1基序在HSC分化過程中開始激活得更早财破,即使在低GATA1表達水平下,與SPI1相比从诲,這與之前的研究一致39,40左痢。
- 有趣的是,HSCs的mtDNA突變負擔(dān)顯著低于更成熟的祖細胞和分化細胞系洛,這表明在相對靜止的HSCs分化過程中俊性,細胞快速分裂時會發(fā)生額外的亞克隆mtDNA突變41,如以下討論所示描扯,這為探索不同細胞類型之間的系統(tǒng)發(fā)育關(guān)系提供了機會(圖2e和補充圖5c)定页。
- 總的來說,我們的數(shù)據(jù)提供了一個克隆解析的荆烈、細胞狀態(tài)感知的人類造血細胞圖譜拯勉,分辨率達到單細胞水平,使得對這一復(fù)雜分化過程背后的調(diào)控機制進行前所未有的推斷成為可能憔购。
Haematopoietic cell-type origins
Para
- 細胞狀態(tài)感知的人類造血系統(tǒng)發(fā)育樹使我們能夠探索不同血液和免疫細胞類型的發(fā)育起源和相互關(guān)系宫峦,其中一些細胞類型尚未完全了解。
- 將多組學(xué)數(shù)據(jù)衍生的細胞類型注釋映射到發(fā)育樹上顯示玫鸟,由于多克隆起源导绷,不同造血細胞群體在樹上的分布廣泛。
- 然而屎飘,有趣的是妥曲,我們還識別了許多精細的亞克隆結(jié)構(gòu),或稱進化枝(即钦购,從共同祖先衍生出的完整細胞集檐盟,從而涵蓋發(fā)育樹的一個分支),其中在兩名供體中分別有1,650和2,079個進化枝顯著富集于特定細胞類型(假發(fā)現(xiàn)率(FDR) < 0.2押桃,倍數(shù)變化 > 2)(圖2f葵萎,補充圖4b和5d及補充數(shù)據(jù)3)。
- 接下來唱凯,我們使用基于mtDNA突變的最近鄰分析定量評估細胞類型的起源羡忘。
- 如預(yù)期的那樣,大多數(shù)細胞類型(13種中的11種)的最近克隆鄰居是相同的細胞類型磕昼。
- 值得注意的是卷雕,這一分析在很大程度上重建了先前在傳統(tǒng)造血研究中廣泛描述和表征的血液細胞類型起源的層次結(jié)構(gòu)(圖2g和補充圖5e)。
- 然而票从,我們的分析也揭示了一些意想不到的見解漫雕。
- 例如滨嘱,明確界定產(chǎn)生傳統(tǒng)樹突狀細胞和漿細胞樣樹突狀細胞(分別為cDCs和pDCs)的祖細胞群體一直具有挑戰(zhàn)性。
- 在我們的數(shù)據(jù)中蝎亚,cDCs和pDCs顯示出較少受限制的克隆起源九孩,并且兩者似乎都有更多的髓系起源,這與最近在小鼠中的譜系追蹤研究相呼應(yīng)发框。
- 總的來說躺彬,我們的方法解析了天然穩(wěn)態(tài)人類造血的克隆和亞克隆關(guān)系,并將這些關(guān)系與豐富的細胞狀態(tài)讀數(shù)聯(lián)系起來梅惯。
HSC cell-state heterogeneity
Para
- 在系統(tǒng)發(fā)育樹中關(guān)系更密切的克隆與造血細胞狀態(tài)之間的耦合可能由以下兩個因素之一引起:(1)在表現(xiàn)出譜系偏好的HSC克隆中出現(xiàn)的mtDNA突變宪拥;(2)在分化過程中后期獲得的mtDNA突變。
- 前一種可能性——或者HSC具有克隆和功能異質(zhì)性的程度——具有重要的臨床意義铣减,但在原生人類造血方面仍不清楚她君。
- 我們所取得的技術(shù)進步為解決這些不同的可能性提供了獨特的機會,特別是剖析HSC異質(zhì)性葫哗。
- 為了提高HSC的恢復(fù)率缔刹,我們首先通過深度分析表型CD34+CD45RA?CD90+群體來富集HSC。
- 然后劣针,我們篩選出特異性表達HSC標(biāo)記基因HLF和CRHBP的細胞(方法校镐,圖3a和擴展數(shù)據(jù)圖7a–e)。
- 我們在young-1和young-2中分別鑒定出5,393和3,292個HSC捺典,這些HSC通過檢查其他已知特異性富集在HSC中的標(biāo)記基因的表達而獨立驗證鸟廓,包括MECOM、MLLT3和RBPMS(圖3b和方法)襟己。
- 重要的是引谜,為了檢查HSC分子和行為異質(zhì)性的穩(wěn)定性——從而建立我們的系統(tǒng)發(fā)育樹與HSC克隆行為之間的確切聯(lián)系——我們從同一供體(young-1)在4個月的過程中兩次采樣HSC(圖3a)。
- 我們進一步基于WNN空間使用結(jié)合轉(zhuǎn)錄組和可訪問染色質(zhì)狀態(tài)對HSC進行無監(jiān)督聚類擎浴,并在該供體中鑒定出14個亞群(圖3c)员咽。
- 值得注意的是,所有亞群在ATAC和RNA空間中均一致鑒定贮预,并在兩個時間點均可重復(fù)檢測到(圖3c和擴展數(shù)據(jù)圖7f)骏融。
- 在HSC亞群中,我們鑒定了差異表達基因和差異轉(zhuǎn)錄因子可訪問性(擴展數(shù)據(jù)圖7g和補充圖6a)萌狂。
- 例如,盡管在所有HSC中總體高表達怀泊,但一些關(guān)鍵HSC基因茫藏,包括MECOM、FLT3霹琼、CDK6务傲、JUN和FOS凉当,在不同亞群中差異表達(圖3d和補充圖6b)。
- 這些基因已知在HSC功能方面很重要售葡,包括HSC維持看杭、自我更新、分化和炎癥反應(yīng)挟伙,這些因素的失調(diào)可能導(dǎo)致白血病的發(fā)生楼雹。
- 我們還發(fā)現(xiàn)亞群之間存在幾種差異通路,在基因表達和轉(zhuǎn)錄因子活性變化水平上均有證據(jù)尖阔,如BMP–SMAD信號通路改變和AP1信號通路變化(擴展數(shù)據(jù)圖7g和補充圖6a)贮缅,這與之前在小鼠中的研究相似,提示這些通路在HSC異質(zhì)性中起關(guān)鍵作用介却。
- 值得注意的是谴供,我們發(fā)現(xiàn)主要的HSC亞群在young-2中可重復(fù),但我們也在每個個體中鑒定出特定的稀有亞群(擴展數(shù)據(jù)圖7h–n和補充圖6c)齿坷。
- 總體而言桂肌,我們的數(shù)據(jù)提供了一個多組學(xué)資源,使我們能夠解析人類HSC異質(zhì)性永淌。
Fig. 3: HSC clonal architecture and clonal-dependent cell-state biases.
[圖片上傳失敗...(image-ff5db-1727284601102)]
- a, 實驗設(shè)計的示意圖崎场。骨髓樣本從同一個人在相隔4個月的兩個不同時間點獲取,并通過ReDeeM處理仰禀。HSCs通過熒光激活細胞分選(FACS)富集照雁,并通過單細胞基因表達(expr.)標(biāo)記進一步定義。
- b, HSC分類的驗證答恶。展示了多個獨立HSC標(biāo)記的基因表達饺蚊;n = 34,017個細胞。箱線圖顯示了25th–75th百分位的數(shù)據(jù)悬嗓,須延伸至1.5 × IQR內(nèi)的最小值和最大值污呼。***P < 2.2 × 10?16,來自單側(cè)Wilcoxon秩和檢驗包竹。
- c, 基于單細胞RNA和ATAC分析單獨燕酷,以及基于聯(lián)合WNN空間的HSC亞群。
- d, HSC亞群間差異表達基因的示例周瞎。
- e, 使用共享mtDNA突變(供體年輕-1)從兩個時間點采樣的HSC的系統(tǒng)發(fā)育樹苗缩。
- f, 使用超幾何檢驗分析HSC克隆群與HSC狀態(tài)亞群之間的重疊。顏色強度表示組合富集FDR(補充數(shù)據(jù)4)声诸。
- g, 比較兩個時間點HSC克隆-狀態(tài)富集(enrich.)(如f所示)酱讶;比較富集倍數(shù)變化。顏色強度表示組合富集FDR彼乌。
HSC clonal structure
Para
- 接下來泻肯,基于5,393個分子定義的HSCs中共享的mtDNA突變渊迁,我們重建了一棵系統(tǒng)發(fā)育樹,展示了HSCs之間的克隆關(guān)系灶挟。
- 為了研究HSC克隆特征琉朽,我們通過將樹結(jié)構(gòu)劃分為小分支來定義HSC克隆群,這些小分支是最密切相關(guān)HSC克隆的組(見圖3e和方法部分)稚铣。
- 為了清晰起見箱叁,此處使用的‘HSC克隆’和‘克隆群’術(shù)語指的是在發(fā)育過程中共享起源的一組HSCs,而不是指單個HSCs榛泛。
- 結(jié)果樹顯示HSCs具有平衡的多克隆結(jié)構(gòu)蝌蹂。
- 總的來說,我們從5,393個單HSCs中定義了78個HSC克隆群曹锨。
- 值得注意的是孤个,大多數(shù)HSC克隆群可以在同一捐贈者的連續(xù)采樣中重新觀察到,這表明它們代表了至少在體內(nèi)數(shù)月時間內(nèi)對造血有貢獻的HSCs沛简,這是一個時間尺度齐鲤,大多數(shù)非HSC細胞類型被認為至少已經(jīng)更換了一次。
Para
- 目前尚不清楚不同的造血干細胞(HSCs)是否具有可遺傳的細胞狀態(tài)椒楣,或者HSC狀態(tài)的變化是否代表隨機的给郊、短暫波動。
- 我們的數(shù)據(jù)將克隆身份和細胞狀態(tài)聯(lián)系起來捧灰,來自同一細胞淆九,因此我們可以直接測量78個HSC克隆群在14個基于細胞狀態(tài)的多組學(xué)HSC亞群中的分布。
- 我們發(fā)現(xiàn)48個(約三分之二)HSC克隆群在不同HSC狀態(tài)中隨機分布毛俏,而30個(約三分之一)在一種或少數(shù)特定狀態(tài)亞群中顯著富集(圖3f)炭庙。
- 有趣的是,我們發(fā)現(xiàn)HSC克隆到亞群的富集在相同供體中跨越兩個時間點(相隔4個月)顯著相關(guān)(圖3g)煌寇,這表明HSC偏好在人類中至少可以持續(xù)數(shù)月焕蹄。
- 我們還檢查了年輕-2中的HSC克隆結(jié)構(gòu)。
- 與年輕-1的分析一致阀溶,我們也觀察到多克隆結(jié)構(gòu)腻脏,既有隨機HSC變異,也有其他克隆银锻,顯示出與年輕-1中觀察到的相似比例的細胞狀態(tài)偏好(擴展數(shù)據(jù)圖7o,p)永品。
- 總之,我們調(diào)查了HSC克隆及其分子狀態(tài)击纬,這表明大約三分之一的HSC克隆具有部分可遺傳且相對穩(wěn)定的狀態(tài)偏好鼎姐。
HSC clonal output and cell-type biases
Para
- 傳統(tǒng)上,造血干細胞(HSCs)的功能輸出只能在移植環(huán)境中或通過模型系統(tǒng)中的條形碼技術(shù)進行測量。
- 鑒于我們在檢測深層次線粒體DNA突變作為自然細胞條形碼方面的進展症见,我們推測現(xiàn)在可以在原生造血過程中追蹤人類HSC的輸出。
- 為了避免特定線粒體DNA突變的脫落或檢測失敗帶來的混淆殃饿,我們開發(fā)了基于網(wǎng)絡(luò)傳播策略的計算方法——單細胞變異富集網(wǎng)絡(luò)傳播基因組學(xué)追蹤數(shù)據(jù)(SCAVENGE–L)谋作,該方法最大限度地利用信息豐富的線粒體DNA突變來識別不同HSC克隆的后代(圖4a和方法)。
- 通過SCAVENGE–L分析乎芳,我們發(fā)現(xiàn)大多數(shù)細胞可以以極高的分配概率映射到一個獨特的HSC克隆組(補充圖7a)遵蚜。
- 為了進一步驗證該方法的準(zhǔn)確性,我們將基于網(wǎng)絡(luò)傳播的分配與最初識別的HSC克隆組(真實情況)進行了比較奈惑。
- 如預(yù)期的那樣吭净,分配的準(zhǔn)確性對于那些具有更高最大分配概率的細胞有所提高。
- 然后肴甸,我們過濾了最大概率為0.7的細胞寂殉,通過這種方法,超過80%的HSC可以被正確分配到相應(yīng)的HSC克隆組(補充圖7b和方法)原在。
- 總體而言友扰,在兩個時間點對兩位捐贈者的基準(zhǔn)分析表明,SCAVENGE–L具有強大的穩(wěn)健性和一致性(補充圖7b–e)庶柿。
Fig. 4: HSC clonal output activity and lineage biases.
[圖片上傳失敗...(image-12a69d-1727284601102)]
- a, 使用基于mtDNA突變的細胞網(wǎng)絡(luò)通過網(wǎng)絡(luò)傳播策略將后代細胞分配到HSC克隆群示意圖村怪。
- b, 年輕-1中兩個采樣時間點的HSC克隆輸出活性(每個HSC克隆的后代細胞數(shù)量)總結(jié)。后代數(shù)量已標(biāo)準(zhǔn)化為HSC克隆大小浮庐。
- c, 兩個時間點(時間點1甚负,T1;時間點2审残,T2)之間的克隆輸出活性相關(guān)性分析梭域。
- d, 年輕-1和年輕-2中,在兩個時間點维苔,每個HSC克隆的輸出貢獻碰辅,按對總后代群體的貢獻從高到低排序。虛線表示所有克隆的平等貢獻預(yù)期介时。
- e, 對于每個HSC克隆群没宾,顯示分化為四種主要譜系的后代百分比:巨核細胞(MK)、淋巴樣細胞(Lym)沸柔、紅細胞(Ery)和髓樣細胞(Mye)循衰。在兩個時間點均一致富集的克隆被歸類為偏倚克隆『峙欤克隆譜系偏倚的顯著性指示(FDR *0.05–0.20, **0.01–0.05, ***<0.01会钝;補充數(shù)據(jù)4和方法)。頂部,指示每個克隆在兩個時間點的克隆譜系偏倚的倍數(shù)變化迁酸。
- f, HSC克隆輸出活性與克隆譜系偏倚之間的相關(guān)性先鱼。誤差帶為線性模型預(yù)測的95%置信區(qū)間。P值來自Wald檢驗奸鬓。
Para
- 造血干細胞(HSC)輸出變異和譜系偏倚存在的程度是有爭議的焙畔,大多數(shù)先前的研究依賴于在小鼠模型中的標(biāo)記和/或移植實驗。
- 在供體年輕-1中串远,22,349個(或59%)已定向和分化的細胞被確信地分配到HSC克隆群中宏多,其中最高分配概率大于0.7(通過SCAVENGE–L)。
- 特定克隆向分化血細胞和免疫細胞的輸出可以直接測量澡罚,并在對不同HSC克隆群進行克隆大小標(biāo)準(zhǔn)化后進行比較(圖4b和方法)伸但。
- 我們發(fā)現(xiàn)所有HSC克隆群都在積極產(chǎn)生后代,但克隆之間的輸出程度存在一些變異留搔,最高和最低克隆十分位的輸出差異為4.9倍(圖4b)更胖。
- 有趣的是,這種可變輸出活性在跨越4個月的兩個時間點上的克隆水平上表現(xiàn)出高度一致性(Pearson相關(guān)系數(shù)=0.69)(圖4b,c)催式。
- 如預(yù)期的那樣函喉,在年輕-2中,HSC克隆輸出活性也表現(xiàn)出類似的變異模式(最高和最低克隆十分位之間的變化為4.5倍荣月;補充圖7f)管呵。
- 我們進一步量化了HSC克隆在造血中的總體貢獻,發(fā)現(xiàn)基于輸出的前50%HSC克隆在兩個時間點和兩個供體中產(chǎn)生了約60%的成熟造血細胞(圖4d)哺窄。
- 這些結(jié)果表明捐下,大多數(shù)HSC克隆積極參與人類穩(wěn)態(tài)造血,但觀察到HSC之間存在持續(xù)數(shù)月的某些變異萌业。
Para
- HSC在天然人類造血過程中表現(xiàn)出譜系偏好的程度尚不清楚坷襟。
- 我們的數(shù)據(jù)允許我們調(diào)查分配到不同HSC克隆群體的子代細胞狀態(tài)。
- 為了清晰起見生年,本文中使用的‘譜系’或‘譜系偏好’術(shù)語指的是基于細胞狀態(tài)的分化軌跡婴程。
- 我們通過基于多組學(xué)數(shù)據(jù)分組細胞狀態(tài)定義了四個主要譜系:髓系(單核細胞、GMP抱婉、MDP档叔、cDC)、淋巴系(CD4蒸绩、CD8衙四、自然殺傷細胞(NK)、B細胞患亿、ProB传蹈、CLP)、紅細胞系(MEP、EryP)和巨核細胞系(MK)(圖2c)惦界。
- 然后我們計算了每個HSC克隆群體的譜系貢獻挑格。
- 與使用所有細胞預(yù)期的譜系分布相比,我們識別出47個(60%)HSC克隆群體在兩個時間點上表現(xiàn)出一致的譜系偏好沾歪,有31個(40%)HSC克隆未顯示出可檢測的譜系偏好(圖4e恕齐,補充數(shù)據(jù)4和方法)。
- 值得注意的是瞬逊,偏倚克隆的譜系偏好顯示出中等效應(yīng)大小(中位數(shù)為1.55倍變化)仪或,但在跨越數(shù)月的兩個時間點上高度可重復(fù)(Pearson相關(guān)系數(shù)為0.59)确镊。
- 一致地,我們也觀察到在年輕-2中有69%的譜系偏倚HSC克路渡尽(補充圖7g)蕾域。
- 當(dāng)我們探索克隆輸出與譜系偏好之間的關(guān)系時,發(fā)現(xiàn)淋巴系偏好與HSC克隆輸出負相關(guān)到旦;紅細胞系和髓系與HSC克隆輸出正相關(guān)旨巷,而MK譜系未顯示出顯著差異(圖4f)。
- 這在兩個供體中是一致的添忘,并與之前使用正交方法的研究結(jié)果一致(補充圖7h)采呐。
- 最后,我們開發(fā)了一種‘克隆行為軌跡分析’方法搁骑,以調(diào)查不同克隆功能在輸出活性和分化偏好方面的潛在分子驅(qū)動因素(擴展數(shù)據(jù)圖8a)斧吐。
- 我們識別出多個可訪問區(qū)域,但不是基因表達變化仲器,這些區(qū)域與一個或多個行為軌跡顯著相關(guān)(2,931個差異峰煤率,F(xiàn)DR < 0.01;擴展數(shù)據(jù)圖8b和補充數(shù)據(jù)5)乏冀。
- 我們通過基因集富集和基序分析調(diào)查了與不同偏好相關(guān)的峰組附近的基因(擴展數(shù)據(jù)圖8c-e)蝶糯。
- 有趣的是,這些附近基因的功能讓人聯(lián)想到所檢查的相應(yīng)輸出和譜系偏好辆沦,這表明染色質(zhì)可訪問性變化可能預(yù)示HSC的命運決定昼捍,呼應(yīng)了之前的研究報告。
- 綜上所述众辨,這些結(jié)果表明HSC在天然人類造血過程中具有中等但相對穩(wěn)定的譜系偏好端三。
Oligoclonal expansions in ageing
Para
- 近期研究表明,隨著年齡增長鹃彻,造血干細胞(HSCs)會出現(xiàn)耗竭郊闯,同時特定攜帶疾病驅(qū)動突變的克隆會擴張,這增加了患白血病和其他疾病的風(fēng)險,這種現(xiàn)象被稱為克隆造血团赁。
- 然而育拨,這類克隆擴張的檢測主要依賴于通過 bulk-測序方法監(jiān)測特定驅(qū)動突變,因此單細胞分辨率下可觀察到的克隆復(fù)雜程度尚未被研究欢摄。
- 為探討這一問題熬丧,我們使用 ReDeeM 對來自兩位年長捐贈者的 9,519 和 14,715 個造血細胞進行了分析,這兩位捐贈者分別為 76 歲和 78 歲怀挠,我們分別稱之為 aged-1 和 aged-2析蝴。
- 我們在這些年長捐贈者中檢測到顯著增加的線粒體 DNA 突變負擔(dān),涉及所有已識別的細胞類型绿淋,這與核基因組中的體細胞突變報告一致闷畸。
- 基于共享的線粒體 DNA 突變,我們?yōu)槊课荒觊L捐贈者重建了系統(tǒng)發(fā)育樹吞滞。
- 值得注意的是佑菩,與年輕捐贈者相比,所得樹狀圖顯示出明顯更多的寡克隆結(jié)構(gòu)裁赠。
- 通過簡化系統(tǒng)發(fā)育樹結(jié)構(gòu)的方法殿漠,我們分別識別了 aged-1 和 aged-2 的 48 和 84 個克隆群。
- 年長捐贈者擁有多個主導(dǎo)造血結(jié)構(gòu)的大型克隆佩捞,克隆多樣性(Shannon 多樣性指數(shù))低于年輕捐贈者绞幌,這一點通過分析五名額外年輕捐贈者和三名額外年長捐贈者的混合樣本進一步得到證實。
- 為研究亞克隆動態(tài)一忱,我們采用統(tǒng)計測試以量化相對于中性進化模型預(yù)期下的克隆大小啊奄。
- 我們在年長捐贈者中識別出多個擴張克隆(在正選擇下大于 500 個細胞且 P < 0.01)掀潮,這些在年輕捐贈者中幾乎完全缺失菇夸。
- 擴張克隆中的細胞比例在 aged-1 中為 34.4%,aged-2 中為 46.3%仪吧,而在年輕捐贈者中僅為 3.4% 和 8.7%庄新。
- 接下來,我們推斷出每個單細胞的‘健康分數(shù)’薯鼠,定義為相對于剩余群體的生長優(yōu)勢择诈。
- 這些分析顯示同一捐贈者內(nèi)單細胞健康存在變異。如預(yù)期出皇,擴張克隆中的細胞顯示出高健康分數(shù)羞芍。
Fig. 5: Clonal structure alterations in human haematopoiesis with ageing.
[圖片上傳失敗...(image-a56f16-1727284601101)]
- a, 比較 mtDNA 突變負擔(dān)在年輕和老年供體之間不同細胞類型的情況。年輕-1郊艘、年輕-2荷科、老年-1 和老年-2 的細胞數(shù)量分別為 11,009唯咬、15,101、9,519 和 14,715 個(yo畏浆,歲)胆胰。箱線圖顯示了第 25 至 75 百分位的數(shù)據(jù),須線延伸至 1.5× IQR 內(nèi)的最小值和最大值刻获。***P < 2.2 × 10?16蜀涨,來自單側(cè) Wilcoxon 秩和檢驗。
- b,c, 來自年輕(b)和老年供體(c)的系統(tǒng)發(fā)育樹蝎毡『窳克隆群在外環(huán)上用不同顏色表示。
- d, 兩個年輕和兩個老年供體中每個克隆對總?cè)后w的貢獻沐兵。
- e, 年輕和老年供體之間克隆組成的 Shannon 多樣性指數(shù)草娜。
- f, 在老年-1 的系統(tǒng)發(fā)育樹上映射單細胞適應(yīng)性評分和具有 LOY 的細胞。外環(huán)顯示了原始和平滑的 LOY 細胞分布痒筒。顯示了 LOY 富集的 P 值(以及使用 q 值的 FDR)(單側(cè)二項式檢驗)。
- g, 每個擴展譜系中細胞類型的貢獻茬贵〔就福灰色區(qū)域表示預(yù)期的平衡細胞類型分布。
Para
- 造血嵌合性Y染色體丟失(mLOY)在男性衰老過程中常見解藻,并與多種疾病相關(guān)老充。
- 然而,mLOY的原因和后果尚不清楚螟左。
- 基于單細胞ATAC技術(shù)在Y染色體上的片段啡浊,我們開發(fā)了用于估算單細胞中LOY的定量指標(biāo)(方法部分)。
- 我們在aged-1和aged-2中分別鑒定出119個和11個具有LOY的細胞胶背,但在年輕男性供體中未發(fā)現(xiàn)(擴展數(shù)據(jù)圖9i,j)巷嚣。
- 對于aged-1,我們在系統(tǒng)發(fā)育樹上繪制了有或無LOY細胞的身份钳吟,發(fā)現(xiàn)LOY細胞出現(xiàn)在多個分支中廷粒,但在擴展的A族中顯著富集,該族顯示出最高的適應(yīng)性評分红且。
- 有趣的是坝茎,我們還鑒定出其他擴展,如擴展的B族沒有LOY富集暇番,但可能由不同的驅(qū)動因素引起(圖5f)嗤放。
- 這些結(jié)果表明,在aged-1中壁酬,LOY事件發(fā)生率低次酌,但可能獨立發(fā)生多次恨课,并在適應(yīng)性評分較高的細胞中富集,這與之前的報道一致和措。
- 這一分析的重要注意事項是荚守,使用單細胞ATAC片段檢測LOY受限于Y染色體上可訪問讀數(shù)的稀缺性。
Para
- 最后玄呛,我們調(diào)查了每個擴展譜系內(nèi)的細胞類型組成揩环,這是通過我們方法提供的聯(lián)合多組學(xué)讀數(shù)實現(xiàn)的。
- 我們發(fā)現(xiàn)贫母,不同的擴展譜系在兩位老年供體中都顯示出偏斜的細胞類型分布文兑。
- 這一發(fā)現(xiàn)通過分析額外的老年供體進一步得到支持(圖5g和擴展數(shù)據(jù)圖9e和10h–j)。
- 有趣的是腺劣,老年供體1中擴展的譜系A(chǔ)顯示出LOY富集绿贞,偏向淋巴系,這與我們最近使用群體數(shù)據(jù)進行的分析相呼應(yīng)橘原,顯示LOY與個體淋巴細胞計數(shù)之間存在強相關(guān)性籍铁。
- 此外,在一位已知在群體中檢測到克隆性造血突變的額外老年供體(老年-5)(ASXL1-Q373X)中趾断,所識別的擴展譜系中紅細胞減少拒名,這讓人聯(lián)想到Asxl1突變小鼠模型中觀察到的表型(擴展數(shù)據(jù)圖10j)。
- 未來進一步結(jié)合單細胞基因分型與ReDeeM將有助于明確確定帶有驅(qū)動突變的克隆芋酌,并定義觀察到的擴展譜系的潛在分子機制增显。
- 總的來說,這些結(jié)果重塑了我們對老年造血的認識脐帝,并且與通常認為的隨年齡相關(guān)的克隆性造血檢測到單一克隆擴展不同同云,我們檢測到了一個更復(fù)雜且普遍的寡克隆結(jié)構(gòu)。
Discussion
Para
- 人類造血系統(tǒng)的研究已成為我們理解干細胞生物學(xué)的范例堵腹。
- 盡管經(jīng)過數(shù)十年的努力炸站,關(guān)于人類造血系統(tǒng)的核心問題仍未解決。
- 例如疚顷,‘克隆繼替’(僅有少數(shù)干細胞參與)和‘克隆穩(wěn)定性’(許多干細胞同時參與)這兩種模型究竟哪一種最能描述自然造血過程尚不清楚武契,同樣,未受干擾的造血干細胞群體在分化潛能或譜系偏倚方面的限制程度也不明確荡含。
- 各種基于移植的檢測方法以及基于細胞標(biāo)記的技術(shù)咒唆,雖然提供了重要見解,但各自存在局限性释液,特別是在探索這些問題在自然人類環(huán)境中的情況時尤為明顯全释。
Para
- 我們在此介紹了一種高分辨率、無需工程化误债、大規(guī)模并行浸船、單細胞譜系追蹤方法妄迁,可直接應(yīng)用于人類樣本。
- 利用這種方法李命,我們提供了一個克隆解析和細胞狀態(tài)感知的單細胞圖譜登淘,用于研究人類原生造血過程,并利用該圖譜探討了人體內(nèi)穩(wěn)態(tài)下造血干細胞(HSCs)的克隆結(jié)構(gòu)和異質(zhì)性行為封字。
- 我們顯示黔州,在年輕個體中,大多數(shù)HSC克隆在穩(wěn)態(tài)下積極參與造血阔籽,但克隆特異性的輸出活性存在一些差異(約五倍)流妻,并且這些差異在至少幾個月的時間尺度上穩(wěn)定維持。
- 我們還證明笆制,存在固有的克隆特異性譜系偏倚绅这,這些偏倚與克隆輸出差異一樣,在幅度上受限在辆,但在時間上持續(xù)证薇。
- 最后,我們通過聯(lián)合轉(zhuǎn)錄組和表觀基因組狀態(tài)識別了HSC亞群匆篓,發(fā)現(xiàn)一個顯著的HSC克隆群體在某些由基因表達和表觀基因組狀態(tài)定義的HSC亞群中富集浑度。
- 有趣的是,我們發(fā)現(xiàn)人類原生環(huán)境中HSC克隆特異性的細胞狀態(tài)偏好也是一個相對穩(wěn)定的固有特征奕删,這與使用基于標(biāo)記方法在小鼠中的某些發(fā)現(xiàn)相呼應(yīng)。
- 值得注意的是疗认,我們描述的是具有共同祖先的HSC克隆群體的行為和細胞狀態(tài)偏倚完残,而不是單個HSC的偏倚。
- 由于骨髓吸液中細胞采樣有限横漏,克隆群體中的HSC可能不是最直接的同胞谨设。
- 因此,通過增加細胞數(shù)量缎浇、位置和時間點的進一步改進采樣扎拣,將提供對系統(tǒng)發(fā)育關(guān)系的更清晰視圖,這對于識別最近衍生的克隆群體素跺,甚至單個人類HSC所觀察到的細胞狀態(tài)和行為偏倚的機制至關(guān)重要二蓝。
Para
- 因此,結(jié)合之前的研究指厌,我們的工作揭示了一幅正常造血的圖景刊愚,其中在年輕個體中,造血干細胞對造血的貢獻具有豐富且平衡的多克隆結(jié)構(gòu)踩验,每個亞克隆在細胞狀態(tài)鸥诽、輸出和譜系偏倚方面具有獨特但有限的偏好商玫。
- 相比之下,在老年個體中牡借,這種克隆多樣性顯著下降拳昌。
- 克隆擴張,或克隆多樣性的改變钠龙,涉及各種癌癥和癌前病變炬藤。
- 然而,克隆多樣性減少的原因和后果在很大程度上是未知的俊鱼,并且在人類中難以研究刻像。
- 我們的結(jié)果表明,克隆擴張可能源于多個起源并具有不同的譜系偏倚并闲。
- 我們能夠在單細胞分辨率下捕獲和表征衰老過程中的克隆擴張细睡,這應(yīng)有助于深入探索這些擴張克隆的分子本質(zhì)。
Para
- 更廣泛地說帝火,體細胞突變越來越多地被發(fā)現(xiàn)對多種疾病過程有貢獻溜徙,而不僅僅是造血和癌癥。
- 與單克隆或單細胞全基因組測序相比犀填,ReDeeM通過共識錯誤校正顯著提高了mtDNA突變的可檢測性蠢壹,并提供了全面的細胞狀態(tài)信息。
- 它具有高可擴展性九巡,并顯著降低了每個細胞的成本图贸,促進了在人類健康和疾病中廣泛探索亞克隆變化的可能。
- 未來的改進旨在通過ReDeeM提高系統(tǒng)發(fā)育推斷冕广,考慮到線粒體基因組的獨特動態(tài)和其他生物學(xué)特征疏日,將能夠改善譜系樹重建,為深入理解克隆鑲嵌如何對多種人類疾病做出貢獻鋪平道路撒汉。
Methods
Bone marrow donors
骨髓捐獻者
Para
- 來自健康年輕捐贈者的新鮮骨髓樣本在知情同意的情況下被抽取沟优,該樣本庫協(xié)議已獲得波士頓兒童醫(yī)院機構(gòu)審查委員會的批準(zhǔn)。
- 來自老年捐贈者的胸骨骨髓在心臟手術(shù)中進行胸骨切開術(shù)后收集睬辐,該樣本庫協(xié)議已獲得馬薩諸塞州總醫(yī)院布里格姆機構(gòu)審查委員會的批準(zhǔn)挠阁,并在知情同意的情況下進行。
- 每個捐贈者的信息顯示在補充表1中溯饵。
Primary BMMC extraction
初級BMMC提取
Para
- 從健康年輕和老年供體中收集骨髓侵俗。
- 骨髓吸取物用等體積的洗滌緩沖液(PBS,2%胎牛血清(FBS)丰刊,1 mM EDTA)稀釋坡慌。
- 將Ficoll介質(zhì)加入SepMate管(STEMCELL Technologies,目錄號85460)中藻三,然后將稀釋的骨髓樣本層疊在其上洪橘,隨后在室溫下以1,200g離心20分鐘跪者。
- 含有單核細胞的頂層被轉(zhuǎn)移到一個新管中,然后該管用洗滌緩沖液填滿熄求。
- 單核細胞以300g離心8分鐘渣玲。
- 棄去上清液,細胞洗滌兩次弟晚,并重懸于洗滌緩沖液中以進行進一步富集或冷凍緩沖液(10% DMSO在FBS中)忘衍。
Enrichment for HSPCs
HSPCs 的富集
Para
- 從上一步中分離出的BMMCs開始,我們使用EasySep人臍血CD34陽性選擇試劑盒II(STEMCELL Technologies卿城,目錄號17896)富集CD34+細胞枚钓。
- 簡要地說,EasySep人CD34陽性選擇雞尾酒(STEMCELL Technologies瑟押,目錄號18096 C)被添加到BMMC懸液中搀捷,濃度達到100 μl ml?1,并在室溫下孵育10分鐘多望。
- EasySep Dextran RapidSpheres(STEMCELL Technologies嫩舟,目錄號50100)被渦旋并添加到每個樣本中,濃度達到50 μl ml?1怀偷,混合物在室溫下孵育3分鐘家厌。
- 接下來,向管中加入洗滌緩沖液(7 ml)椎工,細胞在The Big Easy EasySep磁鐵(STEMCELL Technologies饭于,目錄號18001)中洗滌四次。
- 最后维蒙,細胞被重懸于洗滌緩沖液中掰吕,并在300g離心10分鐘。
- 然后木西,CD34+細胞沉淀被重懸于冷凍緩沖液(10% DMSO在FBS中)畴栖。
Para
- 為進一步富集造血干細胞(HSCs)随静,將一份富集的CD34+細胞染色八千,使用以下抗體組合之一:(1)CD34 PerCP-Cy5.5(BD Biosciences目錄號347222),CD45RA Alexa Fluor 488(BioLegend目錄號304114)和CD90 PE-Cy7(BD Biosciences目錄號561558)燎猛,并使用DAPI(Thermo Fisher Scientific目錄號D1306)作為活細胞染料恋捆;或(2)CD34 BV421(BD Biosciences目錄號562577),CD45RA-APC-H7(BD Biosciences目錄號560674)和CD90 PE-Cy7(BD Biosciences目錄號561558)重绷,并使用7-AAD作為活細胞染料(BD Biosciences目錄號559925)沸停。
- 隨后使用每種抗體3 μl對100 μl細胞懸液進行染色。
- 細胞進一步通過BD FACSAria進行分選昭卓,以CD34+CD45RA?CD90+為標(biāo)準(zhǔn)富集HSCs愤钾。
- 分選策略見補充信息瘟滨。
Para
- BMMCs以及富集的CD34+和CD34+CD45RA?CD90+細胞在冷凍緩沖液(10% DMSO在FBS中)中進行了冷凍保存。
- 解凍后能颁,細胞立即進行處理杂瘸,盡快用于實驗,不進行培養(yǎng)伙菊。
Principle of ReDeeM
ReDeeM原則
Para
- 我們在此開發(fā)了ReDeeM败玉,這是一種基于10X Genomics平臺修改后的、大規(guī)模并行單細胞協(xié)議镜硕,能夠同時進行多組學(xué)分析并深度測序mtDNA运翼。
- 該系統(tǒng)的關(guān)鍵特性如下:(1)優(yōu)化了最大化mtDNA產(chǎn)量的協(xié)議;
- (2)特定富集的mtDNA文庫兴枯,可以承受非常高的測序覆蓋度血淌;
- (3)獨特的分子標(biāo)識符,用于標(biāo)記單個mtDNA分子念恍,允許使用錯誤校正以實現(xiàn)高精度mtDNA突變的調(diào)用六剥;
- (4)一種穩(wěn)健的推理算法,利用更深入和改進的mtDNA突變檢測進行系統(tǒng)發(fā)育重建峰伙;
- (5)同時進行的scRNA-seq和scATAC-seq疗疟,將系統(tǒng)發(fā)育關(guān)系與細胞狀態(tài)讀數(shù)聯(lián)系起來。
- 通過ReDeeM瞳氓,生成了三個獨立的文庫策彤,包括一個用于深度測序和突變分析的富集mtDNA文庫,一個用于基因表達的RNA文庫匣摘,以及一個用于染色質(zhì)可及性分析的ATAC文庫店诗,所有這些文庫都通過可匹配的單細胞條形碼連接。
Para
- 遵循我們之前工作的原則28,29音榜,我們首先修改了基于液滴的10X Genomics多組學(xué)協(xié)議(目錄號100283)庞瘸,通過處理整個細胞,而不是細胞核赠叼,進行固定和輕度滲透擦囊,以最大限度地保留mtDNA。
- 接下來嘴办,我們設(shè)計了mtDNA特異性探針組瞬场,通過DNA雜交來富集線粒體片段。
- RNA和ATAC文庫的制備遵循標(biāo)準(zhǔn)的10X Genomics協(xié)議涧郊,并進行了一些修改贯被。
Para
- 進一步的方法細節(jié)在補充方法和 ReDeeM 協(xié)議中有所描述。
- ReDeeM 進一步通過共識變異調(diào)用流程 redeemV 以及 R 包 redeemR 獲得計算支持,用于下游突變質(zhì)量控制以及單細胞系統(tǒng)發(fā)育和綜合分析彤灶。
ReDeeM protocol
ReDeeM協(xié)議
Para
- 詳細的協(xié)議可作為補充協(xié)議提供看幼。
CRISPR lineage-tracing experiment with ReDeeM
CRISPR譜系追蹤實驗與ReDeeM
Para
- 小鼠實驗得到了麻省理工學(xué)院機構(gòu)動物護理和使用委員會的批準(zhǔn)(機構(gòu)動物福利保證,編號A-3125-01)幌陕。
- 一個攜帶條件等位基因KrasLSL-G12D/+和Trp53fl/fl的雄性小鼠胚胎干細胞系被工程化桌吃,帶有譜系追蹤盒。
- 詳細的工程化過程苞轿,包括載體信息茅诱、腫瘤收獲和單細胞懸液的制備,如參考文獻36中所述搬卒。
- 兩個獨立的小鼠胚胎干細胞系被用于批次1和批次2的實驗瑟俭。
Para
- 批次1(六個腫瘤)和批次2(四個腫瘤)的單細胞用Cell Hash標(biāo)記,并使用ReDeeM進行表征契邀,除了以下修改:需要額外的目標(biāo)位點文庫摆寄。
- 擴增的cDNA文庫使用含有Illumina兼容適配器和樣本索引(oDYT023-oDYT038,正向:5′CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGAATCCAGCTAGCTGTGCAGC坯门;反向:5′-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNTCTTTCCCTACACGACGCTCTTCCGATCT微饥;N表示樣本索引)的目標(biāo)位點特異性引物進一步擴增,使用Kapa HiFi ReadyMix(Roche)古戴,如前所述欠橘。
Para
- 對于單細胞RNA、單細胞ATAC和線粒體DNA文庫的測序现恼,采用了ReDeeM方法中描述的策略肃续,但設(shè)計了四組小鼠特異性探針以富集線粒體片段(補充方法和補充數(shù)據(jù)1)。
- 對于目標(biāo)位點文庫的測序叉袍,預(yù)期每個細胞總共15,000個讀數(shù)始锚,并使用了以下讀長:Read1,26個循環(huán)喳逛;i7瞧捌,八個循環(huán);Read2润文,290個循環(huán)姐呐。
Para
- CRISPR和ReDeeM基礎(chǔ)上的譜系追蹤的綜合分析詳見補充方法。
mtDNA mutation burden
線粒體DNA突變負擔(dān)
Para
- 我們使用定量方法估計了線粒體DNA(mtDNA)突變負擔(dān)转唉。
- 每個細胞中檢測到的突變數(shù)量是生物學(xué)突變負擔(dān)和技術(shù)可檢測性的函數(shù)皮钠,后者受mtDNA捕獲率的影響稳捆。
- 我們通過兩種方式計算mtDNA突變負擔(dān):一是相對于mtDNA覆蓋度(每個細胞中每個位置的mtDNA拷貝數(shù))進行標(biāo)準(zhǔn)化赠法,二是使用eUMI過濾率,用于校正不同實驗中由于測序深度、測序質(zhì)量等因素引起的批次效應(yīng)砖织。
- 對于樣本j中的單個細胞i款侵,突變負擔(dān)的計算方式為
Inferring lineage distance and phylogenetic tree using mtDNA mutations
使用線粒體DNA突變推斷親緣距離和系統(tǒng)發(fā)育樹
Para
- 在完成所有使用 R 包 ReDeeM-R (https://github.com/sankaranlab/redeemR) 的過濾步驟后,包括變異和細胞過濾(擴展數(shù)據(jù)圖 1i侧纯;所有包含的參數(shù)都可以調(diào)整以控制嚴格性)新锈,我們生成了稀疏矩陣 C,以包含所有變異等位基因計數(shù)(細胞與 mtDNA 突變)眶熬。
- 等位基因計數(shù)矩陣進一步被 mtDNA 拷貝數(shù)矩陣(每個位置每個細胞)除妹笆,生成了用于可視化的異質(zhì)共生矩陣 H。
- 由于突變計數(shù)數(shù)據(jù)較為稀疏娜氏,定量異質(zhì)共生水平容易受到 mtDNA 覆蓋度變化的影響拳缠。
- 為了最小化覆蓋度和下游分析中異質(zhì)共生動態(tài)的偏差,我們對矩陣 C 進行了二值化處理贸弥,生成了矩陣 Cbin窟坐。
- 我們發(fā)現(xiàn),考慮到每個單細胞中識別出的變異數(shù)量绵疲,二值化更為可靠哲鸳,并提供了足夠的分辨率。
- 盡管如此盔憨,定量矩陣 C 和二值化矩陣 Cbin 都被提供用于 ReDeeM-R 的下游分析徙菠。
Para
- 基于矩陣 Cbin,我們計算了細胞間的加權(quán) Jaccard 距離郁岩。
- 利用多個供體中 mtDNA 突變頻率的先驗信息對 Jaccard 距離進行加權(quán)懒豹,以考慮潛在的趨同進化。
- 直觀地說驯用,加權(quán) Jaccard 距離衡量任意兩個細胞共享突變的程度——也就是說脸秽,在適當(dāng)?shù)臉?biāo)準(zhǔn)化之后,共享的 mtDNA 突變越多蝴乔,兩個細胞的關(guān)系越密切记餐。
- 我們首先為每個突變定義了一個先驗概率,該概率優(yōu)先考慮在供體中突變率較低的突變(即薇正,不太可能是獨立發(fā)生的相同突變)片酝。
- 對于細胞 x 和 y,加權(quán) Jaccard 距離(Dw_Jaccard)定義為
Para
- 接下來挖腰,將加權(quán)Jaccard距離輸入到鄰接算法中雕沿,用于使用ape和ggtree包進行系統(tǒng)發(fā)育樹的重建和可視化(本文中始終使用clado圖進行可視化,以便專注于樹結(jié)構(gòu)的拓撲)猴仑。
Lineage origins of haematopoietic cell types
造血細胞類型的譜系起源
Para
- 我們最初通過建模所有細胞類型中的突變分布來選擇‘譜系信息性’的線粒體DNA(mtDNA)突變审轮。
- 我們移除了隨機分布的突變,這些突變可能出現(xiàn)在某些無偏的干細胞克隆中,因此在研究細胞類型亞克隆起源方面信息量較少疾渣。
- 具體來說篡诽,我們首先將所有細胞類型分為四大主要分化軌跡:髓樣(GMP, MDP, 單核細胞),淋巴樣(CLP, ProB, CD4, CD8, B, NK)榴捡,巨核細胞(MK前體)和紅細胞(MEP, 紅細胞前體)杈女。
- 使用二項檢驗測試任意兩個分化軌跡之間每種mtDNA突變的頻率。
- 當(dāng)所有比較的P值大于0.05時吊圾,mtDNA突變被定義為隨機分布达椰。
- 我們過濾掉了所有隨機分布的突變,并生成了一份譜系信息性mtDNA突變列表(圖2g中使用了631個譜系信息性突變)项乒。
- 使用這些突變砰碴,我們生成了矩陣Cbin并計算了加權(quán)Jaccard距離。
- 然后我們生成了描述基于共享突變的細胞間譜系關(guān)系的KNN圖G板丽。
- 接著我們將多組學(xué)分析中的細胞類型注釋與圖G整合呈枉。
- 對于任何給定的細胞(查詢細胞),計算圖G上KNN中每種細胞類型(目標(biāo)細胞類型)的比例埃碱。
- 然后匯總并縮放每個查詢細胞類型的目標(biāo)細胞類型比例猖辫,如圖2g和補充圖5所示。
- 最后砚殿,根據(jù)鄰居內(nèi)的目標(biāo)細胞類型比例啃憎,通過層次聚類對查詢細胞類型進行分組。
HSC subpopulations and clone-to-state preferences
HSC亞群及克隆-狀態(tài)偏好
Para
- 為了對HSCs進行特定研究似炎,我們實驗性地富集了CD34+CD45RA?CD90+群體辛萍,如前所述。
- 我們進一步使用半無監(jiān)督方法細化HSC群體羡藐。
- 首先贩毕,我們使用Seurat71對所有細胞在WNN上進行基于社區(qū)檢測的聚類。
- 其次仆嗦,我們計算了每個簇的HLF基因表達水平平均值辉阶,并定義了HLF高表達(HLFhi)和HLF低表達(HLFlow)簇。
- 第三瘩扼,我們同時檢查了每個單細胞的HLF和CRHBP基因表達水平谆甜。
- 我們要求任何HSC細胞都高度表達HLF和CRHBP,并且歸類于HLFhi簇中集绰。
- 定義的HSCs進一步使用其他HSC特征進行檢驗规辱,包括MECOM、HOPX栽燕、AVP罕袋、MLLT3改淑、RBPMS等。
- 為了提高弱表達基因的穩(wěn)健性炫贤,表達數(shù)據(jù)使用Rmagic包進行增強以供可視化。
Para
- 對于上述精細化的造血干細胞(HSCs)付秕,我們在加權(quán)最近鄰網(wǎng)絡(luò)(WNN)上進行了二次聚類以定義亞群兰珍。
- 這些亞群是使用Seurat軟件在0.6分辨率下識別的。
- 亞群在基于RNA询吴、ATAC和WNN的UMAP圖上進行了可視化掠河。
- 差異表達基因和可訪問染色質(zhì)是通過Seurat軟件的FindMarker功能識別的。
- 差異峰的DNA結(jié)合基序是通過‘find individual motif occurrences’掃描猛计,使用HOCOMOCOv11_full_HUMAN_mono人類轉(zhuǎn)染因子基序數(shù)據(jù)庫進行分析的唠摹,隨后通過二項式測試跨造血干細胞亞群特異性的開放染色質(zhì)峰(相關(guān)內(nèi)容見補充圖6)。
- 在單細胞水平上對差異基序的可視化是通過chromVar軟件進行的奉瘤。
Para
- 為了最佳捕捉主要造血干細胞(HSC)克隆結(jié)構(gòu)勾拉,我們使用詞頻-逆文檔頻率和奇異值分解對二進制化的mtDNA變體-細胞矩陣進行了歸一化和降維處理。
- 使用前30個潛在語義索引來測量歐幾里得距離盗温,該距離進一步傳遞給鄰接算法以構(gòu)建系統(tǒng)發(fā)育樹藕赞。
- 接下來,使用之前描述的最大似然法將mtDNA突變分配到樹分支上卖局,該方法已集成在redeemR中(Add_AssignVariant函數(shù))斧蜕。
- 我們將HSC克隆群定義為包含至少50個單細胞的最小進化枝單元,其基礎(chǔ)邊緣至少有一個確信分配的突變(‘邊緣’指的是系統(tǒng)發(fā)育樹中連接兩個節(jié)點的線砚偶;使用了ReDeeM-R中的Add_tree_cut函數(shù))批销。
Para
- 接下來,我們檢查了每個造血干細胞(HSC)克隆群在所有基于RNA和ATAC細胞狀態(tài)的HSC亞群中的分布情況染坯。
- 與背景相比均芽,計算了給定克隆群在每個細胞狀態(tài)亞群中的富集倍數(shù),并通過超幾何檢驗估計了P值单鹿。
- 比較了來自兩個采樣時間點的HSC的富集倍數(shù)和P值骡技。
- 使用Fisher方法合并了兩個時間點的P值,并使用qvalue R包計算了FDR羞反。
- 定義HSC克隆到細胞狀態(tài)偏好的截止標(biāo)準(zhǔn)如下:合并P值小于0.01且FDR小于0.05布朦,且log2倍數(shù)變化(時間點1)大于0.25且log2倍數(shù)變化(時間點2)大于0.25。
- 完整統(tǒng)計數(shù)據(jù)見補充數(shù)據(jù)4昼窗。
HSC progeny clonal assignment using network propagation
使用網(wǎng)絡(luò)傳播進行HSC后裔克隆分配
Para
- 結(jié)合同一供體中HSCs的采樣以及已定型和分化的后代是趴,我們旨在利用mtDNA突變譜的相似性將后代分配到其中一個HSC克隆群。
- 簡而言之澄惊,我們首先利用同一供體所有細胞的共享mtDNA突變構(gòu)建了一個包容性的克隆網(wǎng)絡(luò)唆途。
- 接下來富雅,每個HSC克隆群的HSC細胞作為種子,通過克隆網(wǎng)絡(luò)傳播克隆信息肛搬,直到達到穩(wěn)態(tài)没佑。
- 每個克隆群都迭代用于網(wǎng)絡(luò)傳播。
- 網(wǎng)絡(luò)傳播后温赔,每個細胞攜帶的信息代表了給定HSC克隆群的分配概率蛤奢,并通過比較所有克隆群的歸一化概率來確定最終分配。
Para
- 由于mtDNA變體-細胞矩陣高度稀疏陶贼,確定單個細胞的任務(wù)具有挑戰(zhàn)性啤贩。
- 我們之前的研究表明,盡管單細胞基因組學(xué)數(shù)據(jù)固有的高維性和廣泛的稀疏性拜秧,單個細胞的表型相關(guān)性可以在細胞-細胞相似性圖中忠實地建模痹屹,并通過網(wǎng)絡(luò)傳播算法有效識別。
- 在這里枉氮,使用類似原理志衍,我們開發(fā)了SCAVENGE–L,它使用利用克隆鄰域信息的網(wǎng)絡(luò)傳播策略聊替,并高效地通過概率度量分配細胞足画。
- 我們認為,單個細胞的克隆結(jié)構(gòu)可以忠實地蒸餾到一個網(wǎng)絡(luò)中佃牛,其中每個節(jié)點代表一個細胞淹辞,每條邊代表細胞間的mtDNA突變譜相似性。
- 通過定義感興趣的細胞(即HSC克隆組)俘侠,我們可以利用這個網(wǎng)絡(luò)象缀,結(jié)合網(wǎng)絡(luò)拓撲結(jié)構(gòu)和細胞-細胞距離,搜索高度相關(guān)的細胞(即后代)爷速。
Para
- 我們首先生成了一個完全二值化的mtDNA變異-細胞矩陣央星,其中包含了來自特定捐贈者的所有干細胞、祖細胞和分化細胞惫东。
- 我們進行了詞頻-逆文檔頻率處理莉给,然后通過奇異值分解進行歸一化和降維。
- 前30個潛在語義索引用于構(gòu)建相互KNN圖(mKNN)廉沮。
- 接下來颓遏,我們在mKNN圖上突出顯示了每個HSC克隆群,然后使用帶重啟的隨機游走方法來發(fā)現(xiàn)每個HSC克隆群細胞的子代滞时,我們稱之為種子細胞叁幢。
- mKNN圖上的信息可以傳播,并且在穩(wěn)態(tài)下網(wǎng)絡(luò)中保留的信息可以用來衡量任何給定細胞屬于HSC克隆群(種子細胞)的概率坪稽。
- 我們使用0.05的阻尼因子從每個HSC克隆群(種子)迭代進行網(wǎng)絡(luò)傳播分析曼玩。
- 最終生成了一個細胞-克隆群概率矩陣鳞骤,用于衡量分配的置信度。
- 我們將0.7以上的最大概率作為截止值黍判,以過濾掉模糊的子代(補充圖7a-e)豫尽。
Para
- 由于HSCs也被納入mKNN網(wǎng)絡(luò)并通過網(wǎng)絡(luò)傳播進行處理,它們可以通過算法通過網(wǎng)絡(luò)傳播被分配到一個克隆組顷帖;同時美旧,實際的HSC克隆組被用作真實值。
- 通過比較預(yù)測的HSC克隆組與真實值窟她,我們設(shè)法在將SCAVANGE–L應(yīng)用于將后代分配到HSC克隆組之前陈症,對其魯棒性進行了基準(zhǔn)測試(補充圖7)蔼水。
HSC clonal output and lineage biases
HSC克隆輸出和譜系偏倚
Para
- 為了研究HSC克隆輸出活性震糖,我們從同一供體在兩個采樣時間點收集了HSC及其所有分化后代。
- 基于mtDNA突變趴腋,我們應(yīng)用SCAVENGE–L將分化后代分配到每個HSC克隆吊说。
- 接下來,我們通過計算每個HSC克隆組的后代數(shù)量來測量克隆輸出水平优炬,然后通過與HSC克隆大邪渚(每個克隆組的HSC數(shù)量)進行標(biāo)準(zhǔn)化。
- 我們比較了兩個采樣時間點的克隆輸出水平蠢护,并計算了Pearson相關(guān)系數(shù)雅宾。
- 為了評估不同HSC克隆對造血的貢獻,我們將它們從高到低進行排名葵硕,并計算這些克隆貢獻的分化后代累積比例眉抬。
Para
- 接下來患民,我們對每個造血干細胞(HSC)克隆計算了四種主要譜系的比例芜飘,這些譜系根據(jù)細胞狀態(tài)定義:髓系(單核細胞、GMP侧但、MDP介评、cDC)库北、紅細胞系(MEP、EryP)们陆、巨核系(MKP)和淋巴系(CD4寒瓦、CD8、NK坪仇、B孵构、ProB、CLP)烟很。
- 譜系偏倚通過二項分布模型與兩個采樣時間點的所有細胞背景進行對比颈墅。
- 在兩個時間點均具有一致富集倍數(shù)變化的HSC克隆被歸類為偏倚克隆蜡镶。
- 兩個時間點的富集P值通過費舍爾方法合并,合并后的P值使用R包qvalue進行調(diào)整作為FDR恤筛。
- 富集倍數(shù)變化分別獨立計算每個采樣時間點官还。
- 最后,HSC克隆輸出水平和譜系偏倚進行標(biāo)準(zhǔn)化毒坛,并計算皮爾遜相關(guān)系數(shù)以評估輸出活性與譜系偏倚之間的關(guān)系望伦。
Clonal expansion analysis in ageing
衰老中的克隆擴增分析
Para
- 首先,我們從兩位年輕捐贈者(31歲的女性和26歲的男性煎殷,分別標(biāo)記為young-1和young-2)和兩位老年捐贈者(76歲的男性和78歲的男性屯伞,分別標(biāo)記為aged-1和aged-2)中收集了BMMCs和CD34+ HSPCs。
- 使用之前描述的相同共識變異調(diào)用流程和鄰接算法豪直,我們?yōu)樗兴奈痪栀浾咧亟讼到y(tǒng)發(fā)育樹劣摇。
- 克隆擴張通過兩種方法進行估算:基于克隆的和基于類群的。
- 對于前者弓乙,我們首先按照上述方法識別克隆群末融。
- 簡而言之,變異被概率性地分配到分支上暇韧,然后我們剪掉具有至少n個置信變異且克隆群大小至少為m的分支勾习。
- 涉及的參數(shù)包括m(克隆中的最小細胞數(shù),默認為50)懈玻、n(分支上要剪掉的最小累積變異數(shù)巧婶,默認為1)、P(變異被分配的概率涂乌,默認為0.6)和D(丟棄小于D個細胞的小克乱照弧)。
- 我們通過累積比例比較了年輕和老年捐贈者之間克隆大小的分布骂倘。
- 為了排除定義克隆群的參數(shù)潛在偏差眼滤,我們調(diào)整了參數(shù)組合(m, n, P, D)并比較了年輕和老年捐贈者之間的克隆大小分布(擴展數(shù)據(jù)圖9c)。
- 接下來历涝,還計算了每個捐贈者的Shannon多樣性指數(shù)S诅需,以衡量年輕和老年捐贈者之間的克隆多樣性。
- 給定克隆群i荧库,sizei是該克隆的細胞數(shù)堰塌。Shannon多樣性指數(shù)的計算公式為
Para
- 對于基于進化枝的方法,我們按照之前描述的方法識別了擴張進化枝分衫,并使用Cassiopeia包中的cassiopeia.tl.compute_expansion_pvalues函數(shù)實現(xiàn)了這一過程(該包可在https://github.com/YosefLab/Cassiopeia獲瘸⌒獭)。
- 簡而言之蚪战,我們將子克隆中包含的細胞數(shù)量與其直接的‘姐妹’細胞進行比較牵现,并使用合并模型計算在自然選擇下觀察到這一現(xiàn)象的概率铐懊。
- P值小于0.01且至少包含5%細胞的進化枝被注釋為擴張進化枝(擴展數(shù)據(jù)圖9a)。
- 最后瞎疼,每個供體中由擴張進化枝貢獻的細胞比例被總結(jié)出來(擴展數(shù)據(jù)圖9b)科乎。
Inferring single-cell fitness
推斷單細胞適應(yīng)性
Data availability
Para
- 手稿中生成的所有數(shù)據(jù)已存入GEO(GSE219015)。
- 處理后的Seurat對象可在figshare上獲仍艏薄:https://doi.org/10.6084/m9.figshare.23290004茅茂。
- 處理后的突變調(diào)用文件可在figshare上獲取:https://doi.org/10.6084/m9.figshare.24418966.v1太抓。
- 單菌落全基因組測序數(shù)據(jù)來源于dbGaP(phs002308.v1.p1)空闲。
- 轉(zhuǎn)錄因子基序數(shù)據(jù)庫JASPAR2020(https://jaspar2020.genereg.net/)用于ChromVar分析。
- HOCOMOCOv.11(https://hocomoco11.autosome.org/downloads_v11)人類轉(zhuǎn)錄因子數(shù)據(jù)庫用于‘查找單個基序出現(xiàn)’分析走敌。
Code availability
Para
- ReDeeM 數(shù)據(jù)集可以通過共識變異調(diào)用命令工具 REDEEM-V (https://github.com/sankaranlab/redeemV) 和內(nèi)部 R 包 REDEEM-R (https://github.com/sankaranlab/redeemR) 進行下游的系統(tǒng)發(fā)育和綜合分析碴倾。本工作中包含的分析的可重復(fù)性代碼也已提供 (https://github.com/sankaranlab/redeem_reproducibility)。