主要有兩種形式:
1.一個樣本的所有scRNA-seq數(shù)據(jù)(或者隨機(jī)選一部分?jǐn)?shù)據(jù))合并成一個樣本的bulk數(shù)據(jù)沛申,比較不同樣本劣领。
2.scRNA-seq的某個或某種細(xì)胞簇下面的所有細(xì)胞合并成一個樣本的bulk數(shù)據(jù),比較不同細(xì)胞類型铁材。
前述文章圖片的數(shù)據(jù)就是把心肌細(xì)胞的三個亞類(CM1剖踊、CM2、CM3)按照不同疾病類型(Control衫贬、TOF德澈、DCM等)合并,使用PCA進(jìn)行評估展示固惯,發(fā)現(xiàn)CHD diagnosis是樣本間的主要差異來源梆造。
實(shí)現(xiàn)方法:
- R包:muscat,封裝好的函數(shù)直接用葬毫。
- 像文章中一樣镇辉,利用aggregate函數(shù)分組統(tǒng)計(jì),將單細(xì)胞數(shù)據(jù)整合成bulk數(shù)據(jù)贴捡,之后用Deseq2等方法分析差異忽肛。
參考文獻(xiàn):Nature, 2022, 608, 181–191.
Nature Communications, 2021, 12, 5692.