細(xì)胞類型識別對于單細(xì)胞RNA測序(scRNA-seq)研究至關(guān)重要控嗜,目前正改變著生命科學(xué)颇蜡。CHETAH(分級分類輔助的細(xì)胞類型表征,CHaracterization of cEll Types Aided by Hierarchical classification)是一種精確的細(xì)胞類型識別算法,具有快速和選擇性面哼,包括中間或未分配類別的可能性牧愁。分配的證據(jù)基于以前可用的scRNA-seq參考數(shù)據(jù)的分類樹援所,并包括基于每個細(xì)胞類型的基因表達(dá)差異的信心評分。
對于參考數(shù)據(jù)中表示的細(xì)胞類型队贱,CHETAH的精度與現(xiàn)有方法一樣好色冀。當(dāng)遇到未知類型的細(xì)胞時,如腫瘤樣本中的惡性細(xì)胞柱嫌,其特異性更強(qiáng)锋恬。雖然是專門為腫瘤樣本設(shè)計的,但未指定和中間類型的使用在其他探索性研究中也很有價值编丘。在胰腺數(shù)據(jù)集中与学,CHETAH強(qiáng)調(diào)了參考數(shù)據(jù)集中沒有很好地表示的細(xì)胞群彤悔,包括位于腺泡和導(dǎo)管細(xì)胞類型之間連續(xù)統(tǒng)一體上的輪廓細(xì)胞。具有未分配和中間細(xì)胞類型的可能性是防止錯誤分類索守,可以為以前未探索的組織提供重要的生物信息晕窑。
對scRNA-seq數(shù)據(jù)的分析方法正在迅速發(fā)展。最近增加的是SuperCT卵佛,它將監(jiān)督分類納入細(xì)胞類型分類框架杨赤。雖然在應(yīng)用范圍上是互補(bǔ)的(參考數(shù)據(jù)集是固定的),但我們?nèi)匀槐容^了準(zhǔn)確性级遭,在SuperCT研究中望拖,通過交叉驗證方法分析,CHETAH的一致性水平達(dá)到了92%挫鸽,盡管在不同的數(shù)據(jù)集上進(jìn)行了必要的測試说敏。CHETAH不局限于使用scRNA-seq,還可以與其他定量單細(xì)胞數(shù)據(jù)一起使用丢郊,如使用DNA可達(dá)性盔沫、染色質(zhì)狀態(tài)、甲基化組枫匾、表位或RNA velocity測序方法獲得的數(shù)據(jù)架诞,只要有足夠豐富的參考數(shù)據(jù)可用。盡管在不久的將來干茉,全范圍的單細(xì)胞全基因組方法有望進(jìn)一步增加谴忧,但是,對于CHETAH等方法的需求是顯而易見的角虫,這些方法可以提高結(jié)果數(shù)據(jù)分析的簡便性和準(zhǔn)確性沾谓。
CHETAH: a selective, hierarchical cell type identification method for single-cell RNA sequencing
Introduction to the CHETAH package