scATAC分析神器ArchR初探-單細(xì)胞嵌入(6)

scATAC分析神器ArchR初探-簡介(1)
scATAC分析神器ArchR初探-ArchR進(jìn)行doublet處理(2)
scATAC分析神器ArchR初探-創(chuàng)建ArchRProject(3)
scATAC分析神器ArchR初探-使用ArchR降維(4)
scATAC分析神器ArchR初探--使用ArchR進(jìn)行聚類(5)
scATAC分析神器ArchR初探-單細(xì)胞嵌入(6)
scATAC分析神器ArchR初探-使用ArchR計(jì)算基因活性值和標(biāo)記基因(7)
scATAC分析神器ArchR初探-scRNA-seq確定細(xì)胞類型(8)
scATAC分析神器ArchR初探-ArchR中的偽批次重復(fù)處理(9)
scATAC分析神器ArchR初探-使用ArchR-peak-calling(10)
scATAC分析神器ArchR初探-使用ArchR識別標(biāo)記峰(11)
scATAC分析神器ArchR初探-使用ArchR進(jìn)行主題和功能豐富(12)
scATAC分析神器ArchR初探-利用ArchR豐富ChromVAR偏差(13)
scATAC分析神器ArchR初探-使用ArchR進(jìn)行足跡(14)
scATAC分析神器ArchR初探-使用ArchR進(jìn)行整合分析(15)
scATAC分析神器ArchR初探-使用ArchR進(jìn)行軌跡分析(16)

6-單單元嵌入

在ArchR中衡招,嵌入(例如統(tǒng)一流形近似和投影(UMAP)或t分布的隨機(jī)鄰居嵌入(t-SNE))用于可視化縮小維度空間中的單個(gè)單元弧哎。這些嵌入都有各自的優(yōu)點(diǎn)和缺點(diǎn)。我們之所以稱它們?yōu)椤扒度搿蹦痈幔且驗(yàn)樗鼈儑?yán)格用于可視化集群岩喷,而不是用于識別集群(如前幾章所述)是在LSI子空間中完成的。UMAP和t-SNE之間的主要區(qū)別是細(xì)胞或簇之間距離的解釋蝇恶。t-SNE旨在保留數(shù)據(jù)中的本地結(jié)構(gòu)渤闷,而UMAP旨在保留本地和大部分全局?jǐn)?shù)據(jù)數(shù)據(jù)中的結(jié)構(gòu)。從理論上講含潘,這意味著兩個(gè)聚類之間的距離在t-SNE中不提供信息吊履,而在UMAP中提供信息。例如调鬓,基于觀察到群集A在t-SNE上比群集C更靠近群集B艇炎,因此t-SNE不允許您說群集A與群集B相比,群集A與群集B更相似腾窝。另一方面缀踪,UMAP旨在允許進(jìn)行這種類型的比較,盡管值得注意的是虹脯,UMAP是一種足夠新的方法驴娃,至今仍在文獻(xiàn)中被淘汰。
重要的是要注意循集,t-SNE和UMAP都不是自然確定性的(相同的輸入總是提供完全相同的輸出)唇敞。但是,與UMAP相比咒彤,t-SNE在同一輸入的多個(gè)重復(fù)之間顯示出更多的隨機(jī)性疆柔。此外,uwot當(dāng)使用相同的random時(shí)镶柱,在包中實(shí)現(xiàn)的UMAP 是有效的確定性seed旷档。選擇使用UMAP還是使用t-SNE的選擇很細(xì)微,但是在我們看來歇拆,UMAP對于各種應(yīng)用程序都非常有效鞋屈,這是我們針對scATAC-seq數(shù)據(jù)的標(biāo)準(zhǔn)選擇范咨。UMAP的性能也比t-SNE快。也許最重要的是厂庇,使用UMAP可以創(chuàng)建嵌入并將新樣本投影到該嵌入中渠啊,而t-SNE則無法實(shí)現(xiàn),因?yàn)閿?shù)據(jù)的擬合和預(yù)測同時(shí)發(fā)生权旷。
無論選擇哪種方法昭抒,輸入?yún)?shù)都可能對生成的嵌入產(chǎn)生巨大影響。因此炼杖,重要的是要了解各種輸入?yún)?shù),并進(jìn)行調(diào)整以最好地滿足您自己數(shù)據(jù)的需求盗迟。ArchR實(shí)現(xiàn)了適用于大多數(shù)應(yīng)用程序的默認(rèn)輸入?yún)?shù)集坤邪,但實(shí)際上,沒有單個(gè)參數(shù)集可以為單元格數(shù)量罚缕,復(fù)雜性和質(zhì)量差異很大的數(shù)據(jù)集產(chǎn)生所需的結(jié)果艇纺。

6.1均勻流形逼近和投影(UMAP)

要在ArchR中運(yùn)行UMAP,請使用以下addUMAP()功能:

projHeme2 <- addUMAP(
    ArchRProj = projHeme2, 
    reducedDims = "IterativeLSI", 
    name = "UMAP", 
    nNeighbors = 30, 
    minDist = 0.5, 
    metric = "cosine"
)

您可以使用插槽提取運(yùn)算符embeddings在中列出可用的對象:ArchRProject``@

為了繪制UMAP結(jié)果邮弹,我們使用plotEmbedding()函數(shù)并傳遞剛剛生成的UMAP嵌入的名稱(“ UMAP”)黔衡。我們可以通過結(jié)合使用colorBy哪種組合來告訴ArchR如何使用哪種矩陣來查找提供給的指定元數(shù)據(jù)列,從而告訴ArchR如何為單元著色name腌乡。

p1 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "UMAP")

代替上面的“樣本”進(jìn)行著色盟劫,我們可以使用上一章中確定的“簇”進(jìn)行著色。

p2 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Clusters", embedding = "UMAP")

我們可以使用ggAlignPlots()函數(shù)并排顯示這兩個(gè)圖与纽,并使用指定水平方向type = "h"侣签。

ggAlignPlots(p1, p2, type = "h")

plotPDF(p1,p2, name = "Plot-UMAP-Sample-Clusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)

我們還可以使用plotEmbedding()來可視化聚類的結(jié)果scran

p1 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "UMAP")
p2 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "ScranClusters", embedding = "UMAP")
ggAlignPlots(p1, p2, type = "h")

要保存此圖的可編輯矢量化版本,請使用plotPDF()急迂。

plotPDF(p1,p2, name = "Plot-UMAP-Sample-ScranClusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)
6.2 t-Stocastic鄰居嵌入(t-SNE)

要在ArchR中運(yùn)行t-SNE影所,請使用以下addTSNE()功能:

projHeme2 <- addTSNE(
    ArchRProj = projHeme2, 
    reducedDims = "IterativeLSI", 
    name = "TSNE", 
    perplexity = 30
)

與UMAP類似,我們可以使用繪制t-SNE嵌入plotEmbedding()僚碎。相同的參數(shù)適用于colorByname正在被使用的包埋的類型而不管哪個(gè)猴娩。

p1 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "TSNE")
p2 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Clusters", embedding = "TSNE")
ggAlignPlots(p1, p2, type = "h")

要保存此圖的可編輯矢量化版本,請使用plotPDF()勺阐。

plotPDF(p1,p2, name = "Plot-TSNE-Sample-Clusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)

就像我們使用UMAP一樣卷中,我們可以將的聚類結(jié)果Seurat::FindClusters()與clusering的結(jié)果進(jìn)行比較scran

p1 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "TSNE")
p2 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "ScranClusters", embedding = "TSNE")
ggAlignPlots(p1, p2, type = "h")

要保存此圖的可編輯矢量化版本,請使用plotPDF()渊抽。

plotPDF(p1,p2, name = "Plot-tSNE-Sample-ScranClusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)
6.3調(diào)和后的降維

在上一章中仓坞,我們通過addHarmony()函數(shù)使用Harmony進(jìn)行了批量校正,創(chuàng)建了一個(gè)reducedDims名為“ Harmony” 的對象腰吟。我們可以通過使用UMAP或t-SNE可視化嵌入并將其與之前的LSI迭代可視化嵌入進(jìn)行比較无埃,從而評估Harmony的效果徙瓶。

重復(fù)使用相同參數(shù)但針對“ Harmony” reducedDims對象的UMAP嵌入:

projHeme2 <- addUMAP(
    ArchRProj = projHeme2, 
    reducedDims = "Harmony", 
    name = "UMAPHarmony", 
    nNeighbors = 30, 
    minDist = 0.5, 
    metric = "cosine"
)
p3 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "UMAPHarmony")
p4 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Clusters", embedding = "UMAPHarmony")
ggAlignPlots(p3, p4, type = "h")

要保存此圖的可編輯矢量化版本,請使用plotPDF()嫉称。

plotPDF(p1,p2,p3,p4, name = "Plot-UMAP2Harmony-Sample-Clusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)

對于t-SNE同樣如此:

projHeme2 <- addTSNE(
    ArchRProj = projHeme2, 
    reducedDims = "Harmony", 
    name = "TSNEHarmony", 
    perplexity = 30
)
p3 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Sample", embedding = "TSNEHarmony")
p4 <- plotEmbedding(ArchRProj = projHeme2, colorBy = "cellColData", name = "Clusters", embedding = "TSNEHarmony")
ggAlignPlots(p3, p4, type = "h")

要保存此圖的可編輯矢量化版本侦镇,請使用plotPDF()

plotPDF(p1,p2,p3,p4, name = "Plot-TSNE2Harmony-Sample-Clusters.pdf", ArchRProj = projHeme2, addDOC = FALSE, width = 5, height = 5)
參考材料:

https://www.archrproject.com/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末织阅,一起剝皮案震驚了整個(gè)濱河市壳繁,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荔棉,老刑警劉巖闹炉,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異润樱,居然都是意外死亡渣触,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門壹若,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嗅钻,“玉大人,你說我怎么就攤上這事店展⊙ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵赂蕴,是天一觀的道長柳弄。 經(jīng)常有香客問我,道長概说,這世上最難降的妖魔是什么语御? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮席怪,結(jié)果婚禮上应闯,老公的妹妹穿的比我還像新娘。我一直安慰自己挂捻,他們只是感情好碉纺,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刻撒,像睡著了一般骨田。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上声怔,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天态贤,我揣著相機(jī)與錄音,去河邊找鬼醋火。 笑死悠汽,一個(gè)胖子當(dāng)著我的面吹牛箱吕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播柿冲,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼茬高,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了假抄?” 一聲冷哼從身側(cè)響起怎栽,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宿饱,沒想到半個(gè)月后熏瞄,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡谬以,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年强饮,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蛉签。...
    茶點(diǎn)故事閱讀 38,117評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖沥寥,靈堂內(nèi)的尸體忽然破棺而出碍舍,到底是詐尸還是另有隱情,我是刑警寧澤邑雅,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布片橡,位于F島的核電站,受9級特大地震影響淮野,放射性物質(zhì)發(fā)生泄漏捧书。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一骤星、第九天 我趴在偏房一處隱蔽的房頂上張望经瓷。 院中可真熱鬧,春花似錦洞难、人聲如沸舆吮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽色冀。三九已至,卻和暖如春柱嫌,著一層夾襖步出監(jiān)牢的瞬間锋恬,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工编丘, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留与学,地道東北人彤悔。 一個(gè)月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像癣防,于是被迫代替她去往敵國和親蜗巧。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評論 2 345