大家好,今天周日掺喻。最近發(fā)現(xiàn)有些單細胞測序數(shù)據(jù)結(jié)果不是很好盯漂,或許在作者取樣的時候,就注定了后續(xù)的生信分析不會太成功~
本次主要發(fā)現(xiàn)一個數(shù)據(jù)集中出現(xiàn)一大群紅細胞基因高表達亞群去件,對后續(xù)分析影響還是挺大的坡椒。下面先介紹一下為啥單細胞測序前,我們通常要去除紅細胞
1?單細胞測序之前的樣本處理流程
下圖是單細胞測序之前的樣本處理流程
對于組織解離出來的細胞懸液尤溜,其質(zhì)控主要采取對細胞懸液進行臺盼藍染色觀察為主倔叼。若組織塊消化完全,顯微鏡下觀察細胞無成團或聚集現(xiàn)象宫莱,細胞懸液即為達標(biāo)丈攒;同時單細胞實驗要求細胞懸液符合以下標(biāo)準(zhǔn):①細胞活性>85%;②細胞總數(shù)> 20000;③雜質(zhì)或紅細胞占比小于20%
對于離心重懸后的獲取到的細胞懸液巡验,如果紅細胞占比大于20%际插,則需要進行紅細胞裂解步驟,裂紅后細胞懸液需通過鏡檢判斷紅細胞是否裂解徹底深碱,若紅細胞數(shù)量依然大于20%腹鹉,則需要二次裂紅處理;若紅細胞占比小于10%可以直接清洗重懸鏡檢敷硅。
2 我們不禁要問下面兩個問題:
為什么單細胞測序過程中要去除紅細胞功咒?
如果紅細胞沒有去除干凈,在后續(xù)分析時绞蹦,出現(xiàn)大量紅細胞基因高表達亞群咋辦力奋????
為什么單細胞測序過程中要去除紅細胞:
由于紅細胞不包含核糖體,其RNA序列主要由血紅蛋白基因(HBB)組成幽七,這些序列對于我們研究其他細胞的基因表達沒有太多意義景殷,因此會降低其他細胞的RNA測序效率。
測序深度的固定:在單細胞測序中澡屡,通常會設(shè)定一個固定的總測序深度猿挚,即總測序的數(shù)據(jù)量是一定的。如果樣本中存在大量的紅細胞驶鹉,它們的RNA序列會占據(jù)較大比例的總測序深度绩蜻,從而減少其他細胞的測序深度。這就意味著其他細胞的RNA序列被稀釋了室埋,其表達水平可能無法準(zhǔn)確地檢測和分析办绝。
在后續(xù)分析時,出現(xiàn)大量紅細胞基因高表達亞群咋辦:??
數(shù)據(jù)過濾和篩選:通過對單細胞測序數(shù)據(jù)進行篩選和過濾姚淆,將紅細胞基因高表達的細胞排除在分析之外孕蝉。
數(shù)據(jù)糾正和規(guī)范化:使用專門的數(shù)據(jù)糾正方法,如Scrublet腌逢、SoupX等降淮,對紅細胞干擾進行更精確的估計和消除。這些方法可以校正紅細胞引起的扭曲上忍,減少其對其他細胞的影響骤肛。
細胞亞群分析:如果紅細胞基因高表達的亞群數(shù)量較少,可以將其視為一個獨立的細胞亞群進行分析窍蓝。這樣可以避免紅細胞的影響對其他細胞群體的解讀造成干擾腋颠。
我發(fā)現(xiàn)使用SoupX這個工具比較方便,就三句代碼吓笙,大家可以去官網(wǎng)自己看看:
#https://github.com/constantAmateur/SoupX#https://rawcdn.githack.com/constantAmateur/SoupX/204b602418df12e9fdb4b68775a8b486c6504fe4/inst/doc/pbmcTutorial.htmlsc = load10X('path/to/your/cellranger/outs/folder')sc = autoEstCont(sc)out = adjustCounts(sc)
但是淑玫,
我覺得最好的辦法:單細胞測序前盡可能地去除紅細胞,以避免這類問題的出現(xiàn)。
最后絮蒿,祝各位在分析實戰(zhàn)過程中尊搬,都能得償所愿,順利發(fā)表~
看完記得順手點個“在看”哦土涝!