Nature子刊 | 將對應(yīng)分析(CA)應(yīng)用于scRNA-seq數(shù)據(jù)的降維、批量整合和可視化

有效降維對于scRNA-seq分析至關(guān)重要夸浅。主成分分析(PCA)被廣泛使用仑最,但需要連續(xù)的、正態(tài)分布的數(shù)據(jù)帆喇;因此警医,它經(jīng)常與scRNA-seq應(yīng)用中的對數(shù)變換相結(jié)合,這可能會扭曲數(shù)據(jù)并掩蓋有意義的變化坯钦。近日《Scientific Reports》發(fā)表了一種基于計數(shù)的PCA替代方案:對應(yīng)分析(correspondence analysis预皇,CA),其基于卡方殘差矩陣的分解婉刀,避免了失真的對數(shù)變換吟温。

將CA應(yīng)用于scRNA-seq

標(biāo)準(zhǔn)對應(yīng)分析(CA)在列聯(lián)表分析框架中投射scRNA-seq讀取計數(shù),其規(guī)范形式可以被概念化為兩步程序(下圖中以圖形方式概述)突颊。計數(shù)矩陣首先被變換為Pearson卡方殘差鲁豪,然后用奇異值分解(SVD)對所得殘差矩陣進行分解潘悼。


CA的adaptations及其性能測試

為了解決scRNAseq數(shù)據(jù)中的過度分散和高稀疏性,研究團隊提出了五種CA的adaptations爬橡,其可擴展且性能優(yōu)于標(biāo)準(zhǔn)CA 和glmPCA治唤,在9個數(shù)據(jù)集中的8個里以更高的性能或可比的聚類精度計算細(xì)胞嵌入。特別是CA with Freeman–Tukey residuals (CA-FT) 在不同數(shù)據(jù)集上表現(xiàn)特別好糙申。



CA 框架的其他優(yōu)勢包括在““CA biplot中”可視化基因和細(xì)胞群之間的關(guān)聯(lián)宾添,以及擴展到多表分析。


研究團隊還在 corral 中為 scRNA-seq 數(shù)據(jù)實現(xiàn)CA:這是一個 R/Bioconductor 包郭宝,它直接與 Bioconductor 中的單細(xì)胞類接口辞槐。從 PCA 到 CA 的切換是通過簡單的流程替換實現(xiàn)的,并改進了 scRNA-seq 數(shù)據(jù)集的降維粘室。


特別是當(dāng)位于更廣泛的二元圖框架內(nèi)時榄檬,CA可以作為進一步方法開發(fā)的平臺和豐富的來源。通過同時可視化細(xì)胞和基因嵌入衔统,CA biplot強調(diào)了這些數(shù)據(jù)中固有的行列二元性鹿榜,促進了基因和細(xì)胞的聯(lián)合分析〗蹙簦基因和細(xì)胞嵌入分析的統(tǒng)一方法提供了一個自然框架來擴展和/或與其他方法集成舱殿,包括基因集富集分析、監(jiān)督分解和將補充數(shù)據(jù)投影到共享潛在空間险掀。嵌入可以用作矩陣運算符沪袭,將補充數(shù)據(jù)投射到共享潛在空間中,從而實現(xiàn)多模態(tài)和多批次集成樟氢,以及快速逼近方法冈绊。通過乘法進行矩陣投影是快速且可擴展的,即使對于非常大的數(shù)據(jù)集也是如此埠啃,并且在未來的擴展中死宣,可以作為基于分解數(shù)據(jù)的代表性子集然后將整個矩陣投影到空間中的快速近似降維方法的基礎(chǔ)。


Codeavailability

?? 本研究中corral R/Bioconductor軟件包中提供了代碼和文件:

https://bioconductor.org/packages/release/bioc/html/corral.html.?

?? 在Github上可以找到重現(xiàn)本文中功能和分析的R代碼:

https://github.com/laurenhsu1/corral_manuscript.?

?? 描述PCA和 CA(包括 corral的不同實現(xiàn)的教程可在以下網(wǎng)址獲得:

https://aedin.github.io/PCAworkshop.?


首發(fā)公號國家基因庫大數(shù)據(jù)平臺


參考文獻

Hsu, L.L., Culhane, A.C. Correspondence analysis for dimension reduction, batch integration, and visualization of single-cell RNA-seq data.?Sci Rep?13, 1197 (2023).

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末碴开,一起剝皮案震驚了整個濱河市毅该,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌潦牛,老刑警劉巖眶掌,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異巴碗,居然都是意外死亡朴爬,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門良价,熙熙樓的掌柜王于貴愁眉苦臉地迎上來寝殴,“玉大人,你說我怎么就攤上這事明垢◎汲#” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵痊银,是天一觀的道長抵蚊。 經(jīng)常有香客問我,道長溯革,這世上最難降的妖魔是什么贞绳? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮致稀,結(jié)果婚禮上冈闭,老公的妹妹穿的比我還像新娘。我一直安慰自己抖单,他們只是感情好萎攒,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著矛绘,像睡著了一般耍休。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上货矮,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天羊精,我揣著相機與錄音,去河邊找鬼囚玫。 笑死喧锦,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的劫灶。 我是一名探鬼主播裸违,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼本昏!你這毒婦竟也來了供汛?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤涌穆,失蹤者是張志新(化名)和其女友劉穎怔昨,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宿稀,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡趁舀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了祝沸。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片矮烹。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡越庇,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出奉狈,到底是詐尸還是另有隱情卤唉,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布仁期,位于F島的核電站桑驱,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏跛蛋。R本人自食惡果不足惜熬的,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望赊级。 院中可真熱鬧押框,春花似錦、人聲如沸理逊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挡鞍。三九已至骑歹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間墨微,已是汗流浹背道媚。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留翘县,地道東北人最域。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像锈麸,于是被迫代替她去往敵國和親镀脂。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容