單細(xì)胞RNA-seq(single cell RNA-seq, scRNA-seq)是目前用于細(xì)胞類型竞帽、細(xì)胞狀態(tài)研究的核心工具,很多實(shí)驗(yàn)室也同時(shí)圍繞scRNA-seq技術(shù)建立了多種計(jì)算方法并且優(yōu)化了建庫(kù)方法窟哺,不同方法在如何鑒別分子的細(xì)胞來源和文庫(kù)建立方面有所區(qū)別。scRNA-seq技術(shù)不斷革新技肩、升級(jí)的同時(shí)且轨,隨之產(chǎn)生的高分辨、高通量數(shù)據(jù)也助力發(fā)表了多項(xiàng)研究成果虚婿,以Human Cell Atlas (HCA)為代表的大型單細(xì)胞綜合數(shù)據(jù)庫(kù)也被建立旋奢,致力于在單細(xì)胞水平上繪制所有人類細(xì)胞轉(zhuǎn)錄組圖譜,推動(dòng)發(fā)展疾病的診斷然痊、檢測(cè)和治療至朗。
圖1.Human Cell Atlas(https://www.humancellatlas.org/)
雖然scRNA-seq給生物研究帶來了巨大的影響,但是該技術(shù)的實(shí)際應(yīng)用時(shí)剧浸,仍然面臨著巨大的挑戰(zhàn)和困境锹引。
1)單細(xì)胞懸液的制備是單細(xì)胞技術(shù)的重要環(huán)節(jié)矗钟,scRNA-seq非常依賴單細(xì)胞懸液的質(zhì)量,常用的10x Genomics平臺(tái)對(duì)于單細(xì)胞懸液的要求為細(xì)胞起始量大于1×10^5個(gè)嫌变,活細(xì)胞數(shù)目在85%以上吨艇,無細(xì)胞團(tuán),無碎片初澎,因此scRNA-seq技術(shù)僅適用于新鮮組織樣本秸应,但是大量的珍貴樣本都是以低溫凍存的狀態(tài)進(jìn)行保存的,所以這類樣本不適用于scRNA-seq碑宴;
2)不同的組織软啼、樣品類型的適用性不同,在單細(xì)胞懸液的制備時(shí)需要對(duì)樣品解離獲取單細(xì)胞狀態(tài)延柠,可是不同類型細(xì)胞的解離效率存在差異祸挪,不同組織類型的解離條件需要多次優(yōu)化,像成纖維細(xì)胞贞间、內(nèi)皮細(xì)胞等多遷入細(xì)胞外基質(zhì)和基底膜中贿条,很難分離,一些敏感細(xì)胞在物理外力的處理下會(huì)發(fā)生破碎增热,可見不同的組織整以、樣品類型的適用性不同;
3)部份樣本類型峻仇,如心臟公黑、肌肉、脂肪組織(含有直徑比較大的心肌細(xì)胞摄咆、骨骼肌細(xì)胞凡蚜、成熟脂肪細(xì)胞等),這些細(xì)胞體積大吭从,商業(yè)化的單細(xì)胞平臺(tái)對(duì)細(xì)胞大小有嚴(yán)格的限制朝蜘,建議捕獲的細(xì)胞大小不超過40um,因此30-40um的分子篩會(huì)過濾掉感興趣的大體積細(xì)胞涩金,有效信息會(huì)大大減少谱醇;
4)細(xì)胞本身是很脆弱的,解離過程中有可能導(dǎo)致細(xì)胞死亡鸭廷,酶解時(shí)間枣抱,酶濃度,是否使用寬口槍頭辆床,離心力等對(duì)細(xì)胞狀態(tài)均有較大影響佳晶,37度下借助物理外力的解離和酶消化過程也會(huì)給細(xì)胞狀態(tài)造成很大的影響,改變細(xì)胞的生物學(xué)狀態(tài)讼载,從而在數(shù)據(jù)中引入實(shí)驗(yàn)造成的偏差(bias)轿秧。
酶的類型中跌、酶解時(shí)間、酶濃度菇篡、機(jī)械損傷漩符、離心條件、環(huán)境溫度驱还、緩沖液等均可影響單細(xì)胞懸液的制備嗜暴。
單細(xì)胞核測(cè)序(single nucleus RNA-seq, snRNA-seq)對(duì)單個(gè)核進(jìn)行分離測(cè)序,這種建庫(kù)策略用單個(gè)細(xì)胞核代替單個(gè)細(xì)胞來表示細(xì)胞個(gè)體的基因表達(dá)水平议蟆,穩(wěn)定性高且信息更加全面闷沥,細(xì)胞核可以從冰凍或者輕度固定的組織中進(jìn)行提取,單核技術(shù)的這一特征有效的避免了細(xì)胞懸液制備這一過程對(duì)細(xì)胞狀態(tài)的影響咐容,很好的解決了scRNA-seq僅適用于新鮮樣本的問題舆逃,本期公眾號(hào)結(jié)合相關(guān)文獻(xiàn)深度比較scRNA-seq和snRNA-seq測(cè)序技術(shù)的實(shí)際應(yīng)用的優(yōu)缺點(diǎn)。
圖2.腎臟纖維化的單核戳粒、單細(xì)胞測(cè)序技術(shù)比較https://jasn.asnjournals.org/content/jnephrol/30/1/23.full.pdf
snRNA-seq在處理罕見樣本類型和發(fā)掘新的細(xì)胞狀態(tài)時(shí)具有極大的技術(shù)優(yōu)勢(shì)路狮。下文將從實(shí)驗(yàn)方法、基本信息覆蓋統(tǒng)計(jì)蔚约、無監(jiān)督聚類奄妨、等方面綜合比較在腎臟組織應(yīng)用結(jié)果中兩種技術(shù)的具體表現(xiàn)。
優(yōu)勢(shì)1:樣品前處理苹祟,snRNA-seq更為簡(jiǎn)單展蒂。
例如腎臟和其他實(shí)體樣本,想要獲得高質(zhì)量的單細(xì)胞測(cè)序數(shù)據(jù)苔咪,技術(shù)挑戰(zhàn)就是解離困難,如何順利的解離細(xì)胞柳骄,保證RNA不降解团赏,并且不引進(jìn)任何因?yàn)閷?shí)驗(yàn)造成的數(shù)據(jù)偏差,是當(dāng)下首要的技術(shù)難題耐薯。本篇文章中用的scRNA-seq和snRNA-seq高通量技術(shù)的樣本前處理的大致流程如下舔清。
圖3.單細(xì)胞和單核樣品處理的實(shí)驗(yàn)流程簡(jiǎn)圖
實(shí)驗(yàn)方法1:?jiǎn)渭?xì)胞解離+甲醇處理
C57BL/6小鼠腎臟切割為1mm大小組織塊,250U/ml Liberase和40U/ml DNaseI解離緩沖液在37攝氏度酶解曲初,之后進(jìn)行10min研磨消化体谒,使用10%FBS終止消化,分離得到的細(xì)胞500x 5min離心臼婆,洗兩遍抒痒,過35um濾網(wǎng),然后離心500x 5分鐘颁褂,PBS中細(xì)胞重懸故响,添加1%BSA傀广,FACS純化,然后使用FACS進(jìn)行前向角散射(forward scatter)和側(cè)向角散射(side scatter)彩届,每個(gè)腎臟收獲約2百萬個(gè)細(xì)胞伪冰,用甲醇處理,200ul冷PBS重懸樟蠕,預(yù)冷100%甲醇緩慢滴入細(xì)胞懸濁液中進(jìn)行固定贮聂,7天存儲(chǔ)后PBS從-80移動(dòng)到冰上,PBS洗兩遍過40um過濾網(wǎng)寨辩,技術(shù)吓懈,稀釋預(yù)處理用于DropSeq。
實(shí)驗(yàn)方法2:?jiǎn)魏朔蛛x
使用添加有蛋白酶抑制劑和RNase酶抑制劑和Nuclei EZ裂解緩沖液(NUC-101捣染;Sigma-Aldrich)捕獲單個(gè)細(xì)胞核骄瓣,樣品分割為大小,使用Dounce Homogenizer在裂解緩沖液中均一化耍攘,過40um過濾網(wǎng)榕栏,離心,重懸洗滌蕾各,過20um過濾網(wǎng)后計(jì)數(shù)扒磁。
優(yōu)勢(shì)2:信息覆蓋snRNA-seq更全面。
scRNA-seq使用scDropSeq方法實(shí)現(xiàn)式曲,而snRNA-seq通過snDropSeq\DroNc-seq\sn10X獲取妨托。
圖4.snRNA-seq核scRNA-seq的reads匹配比較
scRNA-seq和snRNA-seq產(chǎn)生的數(shù)據(jù)各自有什么特點(diǎn)?
1)scRNA-seq產(chǎn)生的數(shù)據(jù)大部分比對(duì)到外顯子區(qū)域吝羞,而snRNA-seq多數(shù)匹配到內(nèi)含子和基因間區(qū)兰伤,雖然單細(xì)胞數(shù)據(jù)更多的覆蓋到外顯子區(qū)域;
2)因?yàn)榫€粒體是獨(dú)立于細(xì)胞核獨(dú)立存在的細(xì)胞器钧排,所以只是在scDropSeq數(shù)據(jù)中檢測(cè)到線粒體來源的RNA信息敦腔,占到了整個(gè)細(xì)胞的24%,這一部分信息時(shí)scRNA-seq獨(dú)有的恨溜;
3)雖然細(xì)胞核的mRNA含量遠(yuǎn)遠(yuǎn)低于整個(gè)細(xì)胞符衔,但是單核測(cè)序平均每個(gè)細(xì)胞的基因表達(dá)數(shù)量和整個(gè)細(xì)胞的基因表達(dá)數(shù)目相當(dāng),把這部分信息除去以后snRNA-seq的基因檢出率反而要高于scDropSeq數(shù)據(jù)糟袁,尤其在基因表達(dá)檢測(cè)方面相當(dāng)甚至由于單細(xì)胞測(cè)序判族。
圖5.無監(jiān)督聚類結(jié)果比較
優(yōu)勢(shì)3:snRNA-seq聚類效果更佳。
1)在無監(jiān)督聚類的結(jié)果上比較snRNA-seq和scRNA-seq的表現(xiàn)项戴。如果僅分析外顯子匹配得到的reads信息形帮,單核測(cè)序結(jié)果可以找到4個(gè)cluster,單細(xì)胞測(cè)序結(jié)果可以找到7個(gè)cluster;再加入內(nèi)含子信息的時(shí)候沃缘,單核測(cè)序可以找到6種細(xì)胞類型躯枢,單細(xì)胞測(cè)序的細(xì)胞亞群數(shù)目沒有改變,可見當(dāng)充分應(yīng)用內(nèi)含子匹配到的reads信息時(shí)槐臀,snRNA-seq在無監(jiān)督聚類的分類數(shù)目同scRNA-seq相當(dāng)锄蹂;
2)scRNA-seq聚類分析得到的7個(gè)細(xì)胞壓群中,有一個(gè)細(xì)胞亞群(Artifact水慨,對(duì)應(yīng)圖5H的灰色亞群)高表達(dá)壓力應(yīng)答基因得糜,這些基因的高表達(dá)實(shí)際上是由于細(xì)胞解離時(shí)因?yàn)閷?shí)驗(yàn)操作引入的偏差,snRNA-seq消除了這一部分錯(cuò)誤的信息晰洒,其次在組織解離時(shí)由于細(xì)胞破裂從而導(dǎo)致釋放到環(huán)境中的mRNA能夠污染單細(xì)胞測(cè)序數(shù)據(jù)宦搬,在其他發(fā)表的論文中凌盯,相關(guān)數(shù)據(jù)分析也發(fā)現(xiàn)在幾乎所有的cluster中Slc34a1基因都是高表達(dá)的,雖然在單核測(cè)序數(shù)據(jù)中也發(fā)現(xiàn)了類似的情況,但是相比于scRNA-seq數(shù)據(jù)控妻,單核測(cè)序的污染程度已經(jīng)被大大緩解募壕;
3)引入內(nèi)含子reads的時(shí)候可以提高snRNA-seq聚類結(jié)果中不同類內(nèi)部的cohesion(拉近同一個(gè)cluster內(nèi)樣品的基因表達(dá)平均值)并且增加不同亞群之間的間隔(separation)镰踏,但是對(duì)于單細(xì)胞測(cè)序分析來講念链,對(duì)聚類的結(jié)果沒有顯著改變;
圖6整合分析和Marker基因的相關(guān)性分析
單細(xì)胞與單核測(cè)序數(shù)據(jù)進(jìn)行整合分析贝润,去批次效應(yīng)绊茧,t-SNE發(fā)現(xiàn)了包括足細(xì)胞、內(nèi)皮細(xì)胞打掘、腎小球膜細(xì)胞华畏、腎小管細(xì)胞和巨噬細(xì)胞在內(nèi)的共13個(gè)cluster,和其他最近發(fā)表的腎臟單細(xì)胞測(cè)序數(shù)據(jù)比較分析尊蚁,對(duì)細(xì)胞亞群的注釋結(jié)果進(jìn)行確認(rèn)亡笑。
圖7整合分析和Marker基因的相關(guān)性分析
優(yōu)勢(shì)4:snRNA-seq在整合分析中占主導(dǎo)作用,部分細(xì)胞的檢出靈敏度更高横朋,結(jié)果可靠
tSNE結(jié)果能分析每個(gè)平臺(tái)數(shù)據(jù)對(duì)每個(gè)cluster的貢獻(xiàn)度况芒,圖7C當(dāng)中顯示,紅色叶撒、綠色、藍(lán)色所代表的單核測(cè)序數(shù)據(jù)的貢獻(xiàn)程度均高于黃色的單細(xì)胞數(shù)據(jù)耐版,這三種測(cè)序平臺(tái)在檢測(cè)足細(xì)胞祠够、內(nèi)皮細(xì)胞、閏細(xì)胞(intercalated cell)方面有更高的靈敏度粪牲,從圖7D中看到古瓤,EC、IC-A、IC-B三種細(xì)胞的紅落君、綠穿香、藍(lán)色代表的單核測(cè)序數(shù)據(jù)對(duì)應(yīng)細(xì)胞的檢測(cè)頻率要明顯高于黃色的單細(xì)胞測(cè)序平臺(tái),圖4E的結(jié)果顯示绎速,snRNA-seq結(jié)果中的足細(xì)胞檢出率是scRNA-seq對(duì)應(yīng)檢出率的20倍(2.4% vs. 0.12%皮获,P=0.02)。
在基因差異表達(dá)方面纹冤,9588(71.4%)個(gè)表達(dá)的基因在scRNA-seq和snRNA-seq中的表達(dá)情況類似洒宝,有676個(gè)基因(5%)在單細(xì)胞數(shù)據(jù)中高表達(dá)(fc 1.5;P)萌京,863(6.4%)個(gè)基因在單核數(shù)據(jù)中高表達(dá)雁歌。scRNA-seq數(shù)據(jù)中高表達(dá)基因功能分析顯示,這些基因主要包括線粒體知残、核糖體靠瞎、熱休克信號(hào)通路相關(guān),值得一提是的在snRNA-seq中高表達(dá)的基因是和一些cell identity求妹、轉(zhuǎn)錄因子相關(guān)的基因乏盐,和最近發(fā)表的有關(guān)腦組織中的富集分析結(jié)論一致。同樣在單核數(shù)據(jù)中能夠檢測(cè)到更多的長(zhǎng)鏈非編碼分子扒最。
這些表達(dá)差異是否會(huì)影響細(xì)胞聚類結(jié)果丑勤?從snDropSeq和DroNc-seq我們提取了足細(xì)胞、內(nèi)皮細(xì)胞吧趣、系膜細(xì)胞共650個(gè)單核法竞,通過隨機(jī)森林算法在腎小球單細(xì)胞圖譜(glomerular single-cell atlas)中選取了最相似的650個(gè)最匹配的單細(xì)胞整合分析,所有細(xì)胞可以聚類成三種獨(dú)特的細(xì)胞類型强挫,通過MetaNeighbor方法來預(yù)測(cè)scDropSeq得到的細(xì)胞亞群岔霸。盡管一些基因的表達(dá)數(shù)據(jù)有所差別,但是snRNA-seq基本能夠以較高置信度的完成細(xì)胞分類俯渤。
圖8壓力應(yīng)激基因在snRNA與sCell中的相關(guān)表達(dá)
優(yōu)勢(shì)5:snRNA-seq高信噪比
37攝氏度下的組織解離過程確實(shí)誘導(dǎo)一些壓力應(yīng)激基因的表達(dá)呆细,在scRNA-seq數(shù)據(jù)的當(dāng)中,有一個(gè)細(xì)胞亞群就是基于壓力應(yīng)答基因進(jìn)行分類獲得的八匠,整個(gè)抽核過程是在冰上進(jìn)行絮爷,這樣可以成功的避免轉(zhuǎn)錄組數(shù)據(jù)的改變,我們?cè)趯?duì)glomerular atlas數(shù)據(jù)重分析時(shí)候發(fā)現(xiàn)梨树,幾乎所有細(xì)胞也都存在豐富的壓力應(yīng)答基因的廣泛高表達(dá)(圖8J)坑夯,但是在snRNA-seq數(shù)據(jù)中無明顯表達(dá)。
圖9腎小球細(xì)胞snRNA-seq和scRNA-seq在線粒體抡四、熱休克柜蜈、凋亡相關(guān)基因的表達(dá)差異
通過對(duì)glomercular細(xì)胞類型的差異基因分析可以發(fā)現(xiàn)仗谆,線粒體基因、熱休克基因淑履、細(xì)胞凋亡基因在scRNA-seq平臺(tái)中都會(huì)呈現(xiàn)高表達(dá)隶垮,而在snRNA-seq數(shù)據(jù)中,這類基因的表達(dá)豐度相對(duì)較低秘噪。
優(yōu)勢(shì)6:snRNA-seq分析罕見細(xì)胞類型和細(xì)胞亞群的發(fā)現(xiàn)
接下來使用纖維化炎癥腎臟組織對(duì)單核數(shù)據(jù)進(jìn)行驗(yàn)證狸吞,一共發(fā)現(xiàn)在sn10X平臺(tái)上產(chǎn)生的數(shù)據(jù)檢測(cè)平均每個(gè)單核有763個(gè)基因1206個(gè)分子標(biāo)記,無監(jiān)督聚類的結(jié)果發(fā)現(xiàn)17個(gè)獨(dú)特的細(xì)胞亞群缆娃,在這些結(jié)果中發(fā)現(xiàn)了兩類新的近端小管(proximal tubule)細(xì)胞亞群捷绒,其中一類高表達(dá)增值相關(guān)的基因(proliferative gene signature),因此將這類基因注釋為proliferative 近端小管細(xì)胞(Prolif.PT)贯要,與此同時(shí)這類細(xì)胞還表達(dá)損傷相關(guān)的marker基因暖侨,比如Havcr1和Vcam1。另一類新的近端小管(proximal tubule)高表達(dá)細(xì)胞運(yùn)動(dòng)相關(guān)基因崇渗,有趣的是這類細(xì)胞亞群也表達(dá)部份損傷相關(guān)基因字逗,如Vcam1,但不表達(dá)Havcr1宅广,同時(shí)還高表達(dá)許多分泌促炎細(xì)胞因子葫掉,包括巨噬細(xì)胞趨化Ccl2、巨噬細(xì)胞因子 Il34和中性粒細(xì)胞趨化因子Cxcl1和Cxcl2跟狱,定義為dedifferentiated近端小關(guān)細(xì)胞(Dediff.PT)俭厚。
差異基因分析顯示proliferating cluster主要富集一些細(xì)胞周期相關(guān)的條目,dedifferentiated cluster主要是細(xì)胞運(yùn)動(dòng)調(diào)控相關(guān)的條目驶臊,例如rhoGEF Dock10主要在dedifferentiated cluster中富集表達(dá)挪挤,這個(gè)基因調(diào)控通過Cdc42信號(hào)通路進(jìn)行細(xì)胞形態(tài)塑造(morphogenesis)。
圖10 t-SNE腎臟snRNA-seq分析與Marker基因的表達(dá)
1)基于Ren1和內(nèi)皮素受體A表達(dá)找到了一些罕見的球旁復(fù)合體(juxtaglomerular apparatus)細(xì)胞关翎,而這類細(xì)胞也表達(dá)Hopx基因扛门;
2)新發(fā)現(xiàn)了兩群獨(dú)特的活化的成纖維細(xì)胞,其中一群表達(dá)2型甘露糖受體纵寝,這種分子和結(jié)合膠原減輕腎纖維化论寨,另外一類活化的成纖維表達(dá)tenascine C,在最近的研究認(rèn)為這類分子是細(xì)胞外基質(zhì)磷酸糖蛋白爽茴,能夠促進(jìn)腎纖維化葬凳,這兩類細(xì)胞都能表達(dá)平滑肌肌動(dòng)蛋白。
3)snRNA-seq數(shù)據(jù)的細(xì)胞通訊分析能發(fā)現(xiàn)一些新的細(xì)胞間交流的信號(hào)通路室奏,分析顯示像已知的Bmp6沮明、Pdgfd、Spp1和新的Sema3c窍奋、Sema6a、Gpc和Slit3信號(hào)通路,圖11G就總結(jié)了纖維化腎臟的腎小管間質(zhì)互作網(wǎng)絡(luò)琳袄。
圖11受體配體相互集合與細(xì)胞間信號(hào)傳導(dǎo)通路
總結(jié):snRNA-seq實(shí)驗(yàn)過程中避免因?yàn)榻怆x細(xì)胞帶來的實(shí)驗(yàn)偏差江场,但是在基因表達(dá)檢測(cè)方面可以提供與單細(xì)胞技術(shù)同等的效能,這一點(diǎn)非常重要窖逗,相比于單細(xì)胞測(cè)序址否,單核實(shí)驗(yàn)過程減少了所需的細(xì)胞數(shù)量同時(shí)增加了有效信息量。使用snRNA-seq技術(shù)在腎纖維化組織上確實(shí)發(fā)現(xiàn)了新的細(xì)胞狀態(tài)和一些罕見的細(xì)胞類型碎紊,并且成功構(gòu)建了更加完整的細(xì)胞通訊網(wǎng)絡(luò)佑附,細(xì)粒度的分析并理解了腎臟纖維化的生物學(xué)過程。總體來看仗考,snRNA-seq的優(yōu)勢(shì)在于樣品處理過程更加簡(jiǎn)單音同、測(cè)序信息覆蓋更加全面、細(xì)胞亞群聚類效果更好秃嗜、信噪比权均、靈敏度高且結(jié)果可靠,針對(duì)罕見樣本和發(fā)現(xiàn)新的細(xì)胞狀態(tài)和細(xì)胞亞型具有明顯的技術(shù)優(yōu)勢(shì)锅锨。