Construction of a human cell landscape at single-cell level
2020年發(fā)表在nature上坟募,這篇文章是我兩個月之前看的了,現(xiàn)在整理發(fā)出來
通訊作者:郭國驥教授 浙江大學醫(yī)學院未辆。
Highlight
?Determined the cell-type composition of all major human organs and constructed a scheme for the human cell landscape (HCL).
?Performed a single-cell comparative analysis of landscapes from both human and mouse to reveal the conserved genetic networks.
?Found that stem and progenitor cells exhibit strong transcriptomic stochasticity, while the differentiated cells are more distinct.
?Established a ‘single-cell HCL analysis’ pipeline that helps to define human cell identity.
這篇文章的目的是繪制一個完整的人類單細胞圖譜。文章使用單細胞mRNA測序來確定所有主要人體器官的細胞類型組成复亏,并構建了一個人類細胞景觀圖譜(HCL)鲁驶。揭示了許多組織的單細胞層次結構。文章也對人類和小鼠的圖譜進行了單細胞比較分析饱狂,揭示了兩物種間保守的遺傳網(wǎng)絡。另外發(fā)現(xiàn)宪彩,干細胞和祖細胞表現(xiàn)出很強的轉錄隨機性休讳,而在分化的細胞中則更加特異。在技術方面尿孔,文章建立了一個“單細胞HCL分析”pipeline俊柔,幫助確定人類細胞的分型。
Results
Fig.1 | Constructing an HCL using Microwell-seq
????文章思路較為清晰簡單活合,較容易理解雏婶。流程如圖所示。對來自胎兒和成人的60個組織和7種培養(yǎng)的細胞類型白指,包括誘導性多能干細胞(iPS)留晚、胚狀體細胞、造血細胞和胰腺細胞等進行單細胞測序告嘲,方法采用Microwell單細胞轉錄組測序技術倔丈,并按照之前發(fā)表過的pipeline進行后續(xù)數(shù)據(jù)分析憨闰,最后總共獲得70萬2968個細胞 。
????首先文章繪制了人類組織數(shù)據(jù)集的圖譜需五,這里不包括培養(yǎng)的細胞。上面這個TSNE圖的每種顏色代表細胞分成的cluster轧坎,一共102個cluster宏邮,在圖中用序號標出,下面的TSNE圖的顏色代表著細胞來自的組織缸血,并在右側進行了注釋蜜氨。上下對照來看可以得出,動脈捎泻、氣管飒炎、胸膜、食道笆豁、輸卵管等組織郎汪,形成明確的成年基質細胞的cluster,包括cluster4 (C4)闯狱、C18煞赢、C27、C70哄孤。還有其他的顯著由多組織構成的cluster包括胎兒基質細胞群照筑、內皮細胞群、巨噬細胞群和胎兒上皮細胞群等瘦陈。然后對102個cluster進行了聚類凝危,以系統(tǒng)進化樹的形式呈現(xiàn)。并且結合bulk與單細胞數(shù)據(jù)的相關分析晨逝,證明了這個單細胞圖譜在關于基因和細胞類型方面的覆蓋度很廣蛾默。
文章對每個特定的器官都進行了TSNE和基因表達分析,發(fā)現(xiàn)了在人體組織細胞中未曾發(fā)現(xiàn)的的異質性咏花。文章展示了腎臟和肺部的具體分析趴生。胎兒腎器官分為了21個細胞亞型,成年腎器官分成22個細胞亞型昏翰,包括上皮細胞苍匆、內皮細胞、基質細胞和組織駐留免疫細胞等棚菊。在胎兒腎臟中發(fā)現(xiàn)了新的s型體細胞(FC1浸踩、FC9和FC15),在成人腎臟中發(fā)現(xiàn)了新的IC-tran-PC細胞類型(AC19)统求。在肺中检碗,確定了22個胎兒cluster和25個成人cluster据块,在胎兒肺中發(fā)現(xiàn)了遠端祖細胞(FC4)和近端祖細胞(FC9),以及在成人發(fā)現(xiàn)了肺泡2型細胞(AC1)折剃、肺泡1型細胞(AC3)等獨有的細胞亞型另假,尤其是肺泡雙能/中間細胞(AC14)同時表達KRT8、細胞周期蛋白基因怕犁,以及來自肺泡1型2型的譜系標記边篮。
????文章對這兩種器官構建配體-受體圖,以揭示腎臟和肺組織的細胞與細胞間相互作用奏甫。正如圖所示戈轿,內皮細胞和基質細胞位于這兩種器官細胞互作網(wǎng)絡的中心。研究人員猜測阵子,在胎兒組織中思杯,基質細胞和內皮細胞與上皮細胞祖細胞相互作用以支持組織發(fā)育。然而挠进,在成年期色乾,猜測它們與免疫細胞如T細胞和巨噬細胞進行相互作用。
Fig.2 | Immune activation of non-immune cells in the HCL.?
值得注意的是奈梳,文章在包括膀胱和腎臟在內的多種成人組織中發(fā)現(xiàn)了表達MHC II類基因如HLA-DPA1和HLA-DRA的內皮細胞群(圖2a)杈湾。內皮細胞標記物PECAM1 (CD31)和MHCII類標記物HLA-DR的免疫熒光檢測進一步證實了成人膀胱內抗原呈遞內皮細胞的存在(圖2b)。這種特異性的抗原呈遞信號提示內皮細胞具有潛在的免疫功能攘须。為了評估非免疫細胞在人類區(qū)域免疫中的參與情況漆撞,文章對內皮細胞、上皮細胞和基質細胞進行了跨階段跨組織比較于宙,以了解其免疫相關基因的表達情況(圖2c)浮驳。在大約一半的成人組織中發(fā)現(xiàn)了MHC II類+內皮細胞、白介素表達的基質細胞和CXCL+上皮細胞(擴展數(shù)據(jù)見圖6e和f)捞魁。發(fā)現(xiàn)了非免疫細胞的廣泛免疫激活為 組織特異性免疫 提供了一種新的細胞調控機制至会。
為了描述內皮細胞的整體細胞層次結構,文章整合了不同組織的內皮細胞數(shù)據(jù)并鑒定了14個主要的細胞簇谱俭。在tSNE圖中奉件,cluster2 3 9包含多個胎兒組織,包括心臟昆著、皮膚和腎臟县貌。C8、C11凑懂、C12和C13內皮細胞具有組織特異性煤痕,而C6和C10則由不同的成人器官共享。重要的是,有一組內皮細胞包括C1摆碉、C5和C7塘匣,它們具有高表達的免疫相關基因。C1內皮細胞廣泛存在于成人器官巷帝,如膀胱忌卤、腎臟、動脈锅睛、甲狀腺埠巨、網(wǎng)膜等;它們表達HLA-DRA、CD74和HLA-DRB1现拒。C5內皮細胞來源于成人子宮,高表達CXCL8望侈、IL6等印蔬。C7內皮細胞來源于成人腎臟,高表達HLA- DQA1脱衙、HLA-DPA1和EMCN侥猬。以類似的方法,文章對基質細胞也進行了跨組織分析捐韩,確定了人類圖譜中基質細胞層次結構中的四個免疫活性cluster(C5退唠、C8、C12和C15)荤胁。
????然后瞧预,文章想要通過評估胎兒期和成人期組織細胞類型的相似性來研究人體器官的發(fā)育。在腎臟和肺中仅政,上皮細胞垢油、基質細胞、內皮細胞和免疫細胞的基因表達模式在這兩個階段之間存在相關性;組織內的免疫細胞和基質細胞在器官發(fā)生過程中較早出現(xiàn)圆丹。
為了可視化整體譜系發(fā)展的過程滩愁,文章使用PAGA方法對胎兒和成人HCL數(shù)據(jù)進行了軌跡分析。獲得了一幅顯示胎兒祖細胞對成年成熟細胞類型的預測圖(擴展數(shù)據(jù)圖8c和d)辫封。在這幅圖上硝枉,定義了36個細胞cluster,排列成10多個譜系分支倦微。重要的是妻味,胎兒細胞位于圖譜的中心并且它們之間的距離更近。成體細胞從中間密集區(qū)向不同方向擴散璃诀。然后在成年階段高度分離弧可。此外,研究人員用SLICE算法計算單細胞熵表示轉錄組的穩(wěn)定性,胎兒期的單細胞熵比成體期的單細胞熵大棕诵,說明胎兒期的細胞具有更高的轉錄可塑性裁良,而成體期的細胞則具有更穩(wěn)定的轉錄組。
文章中用現(xiàn)有的數(shù)據(jù)構建了一個單細胞人類細胞圖譜分析的pipeline校套〖燮ⅲ可以將測序結果匹配到構建的人類細胞圖譜的reference上,做相關分析笛匙,以分辨細胞類型侨把。研究人員并用這套pipeline進行了一項分析,發(fā)現(xiàn)妹孙,在第24天的分化培養(yǎng)中秋柄,許多細胞與已知的胰腺細胞類型有很強的相關性(圖3b),紅色代表匹配的相關性高蠢正,灰色相反骇笔。C3、C5嚣崭、C8細胞在基因的表達上可以看出有向不同細胞分化的趨勢笨触。然而在這個pipeline的結果中較難區(qū)分開。
然后使用這個pipeline分析來自H9/OP9共培養(yǎng)的造血細胞雹舀。只有含有內皮細胞和紅細胞的C7和C11細胞在成熟的人類細胞類型中具有較高的評分(圖3c)芦劣。少數(shù)C7和C11細胞在H9/OP9共培養(yǎng)體系中表現(xiàn)出較低的轉化效率。沒有發(fā)現(xiàn)任何與人類造血干細胞和祖細胞相關的細胞说榆。
接下來虚吟,我們檢查了從胚胎干細胞分化的第20天胚狀體細胞也就是EB細胞的單細胞數(shù)據(jù)。EB的單個細胞被分成15個不同的cluster娱俺,根據(jù)reference匹配稍味,cluster分別映射到間充質細胞、神經(jīng)元細胞荠卷、室管膜細胞和免疫細胞模庐。但是也有幾個cluster無法被識別。發(fā)育軌跡和RNA velocity分析表明油宜,未定義的細胞簇位于分化層次的根部掂碱,RNA變化率較高,而已定義的細胞類型位于軌跡的末端慎冤,轉錄組相對穩(wěn)定(圖3d)疼燥。在分化20天后,許多EB細胞似乎仍處于原始未確定狀態(tài)蚁堤,而有些細胞則經(jīng)歷了這種高變化率狀態(tài)并表現(xiàn)出穩(wěn)態(tài)醉者。這種體外干細胞分化層次結構模擬了體內胎兒-成體細胞類型(擴展數(shù)據(jù)圖8c和d)。并且還發(fā)現(xiàn),利用CD34+臍帶血和CD34+外周血的單細胞數(shù)據(jù)撬即,人類造血分化系統(tǒng)也具有類似的模式立磁。
????單細胞轉錄組學為細胞類型的跨物種分析提供了機會“保可以在人類和小鼠之間做個比較細胞景觀唱歧。研究人員構建了老鼠細胞圖譜,將分析參數(shù)調成和人類圖譜一致粒竖。從數(shù)據(jù)中提取同源基因以進行跨物種分析颅崩。102個人類和104個小鼠細胞類型之間的correlatio熱圖顯示,同源基因表達的細胞類型相似性超過了物種間的差異蕊苗,特別是對于免疫細胞和上皮細胞(圖4a)沿后。Circos圖顯示,哺乳動物主要細胞類型的基因表達模式是保守朽砰,圖中所示的都是相關評分大于0.9的連線得运,種間約95%的細胞類型具有很強的相關性(圖4b)。
????然后文章研究了構成哺乳動物細胞類型保守性的遺傳網(wǎng)絡锅移。我們使用SCENIC算法從HCL和MCA數(shù)據(jù)中提取TF調節(jié)子。在哺乳動物細胞結構中鑒定了140個同源TF饱搏,分為15個主要模塊(圖4c);例如非剃,M1與神經(jīng)元、M6/8/11/13/15與免疫細胞推沸、M7與內皮細胞备绽、M9與基質細胞類型相關。這些模塊不僅富含家族特異性的轉錄因子鬓催,而且還含有保守的結合基序肺素,從而導致譜系建立中協(xié)調的模塊激活(圖4c)。
雖然文中也發(fā)現(xiàn)了一些特異的TF匿情,但是大部分的TF還是保守的蟆炊。例如猜绣,少突膠質細胞的SOX10調節(jié)子和神經(jīng)元的SOX11調節(jié)子是人類和小鼠共享的(圖4d)。發(fā)育相關的SOX4調控子支配著聚在一起未分離的胎兒細胞cluster;但又同時在人類和小鼠中廣泛而隨機的分布(圖4e)塌西。這點與所見的基因表達譜一致,干細胞和祖細胞調控子缺乏譜系特異性和穩(wěn)定性筝尾。然而捡需,已經(jīng)分化細胞的調控子似乎連接得更特異且;他們可以通過持續(xù)的自我強化達到穩(wěn)定狀態(tài)。
總體來說文章的思路就是筹淫,使用Microwell-seq對不同人體組織進行大量的單細胞轉錄組分析站辉。然后研究在人類各組織器官之間的異質性。由于還有胎兒的數(shù)據(jù),于是研究了胎兒到成人之間細胞亞型的轉變饰剥。用目前測得的人類數(shù)據(jù)設計了自己的pipeline殊霞,并用培養(yǎng)的細胞驗證。最后構建了小鼠的細胞圖譜捐川,并在跨物種之間進行了比較脓鹃。
這個景觀圖譜研究的優(yōu)勢在于對胎兒和成人組織類型的廣泛覆蓋。在于細胞數(shù)量的多而且組織豐富古沥,并且為其他人研究單細胞的細胞分型構建了很方便的pipeline瘸右,在我們的研究中可以嘗試獲得細胞分型的驗證。同時這篇文章思路簡單清晰岩齿,從胎兒到成年的時間跨越太颤,從小鼠到人類的物種跨越都有研究,研究十分廣泛盹沈,是一篇對人類細胞總結的研究龄章。