Week3— 對混合細胞類型的轉(zhuǎn)錄組數(shù)據(jù)去卷積 (綜述)

原文: Computational deconvolution of transcriptomics data from mixed cell populations,Bioinformatics,2018 Jun 1;34(11):1969-1979.
doi: 10.1093/bioinformatics/bty019

概述

這是2018年新發(fā)表在Bioinformatics的一篇綜述碟刺,分別從以下9個方面對混合細胞類型的轉(zhuǎn)錄組數(shù)據(jù)去卷積的相關(guān)問題和方法進行總結(jié)和討論伐蒂。

  • 去卷積問題的定義
  • 解決去卷積問題的數(shù)學(xué)方法
  • 選擇特定細胞類型的標記基因的方法
  • 影響去卷積效果的因素
  • 低比例的細胞類型也可以被檢測的方法
  • 評估去卷積效果
  • 傳統(tǒng)線性模型的局限性
  • 網(wǎng)頁版的去卷積方法
  • 其他數(shù)據(jù)類型的去卷積方法

去卷積問題的定義

去卷積的目的是從bulk-sample 中推測不同單一細胞類型的表達譜绞惦。它的原理是假設(shè)每種細胞類型在不同樣品中具有相似的表達水平飒箭,可以將異質(zhì)樣品中給定基因的表達模型化為混合物中存在的每種細胞類型的表達值的加權(quán)和(=線性組合)。
有點繞口贿衍,以數(shù)學(xué)形式表示如下:
T = 異質(zhì)樣品的表達值
C = 特定細胞的表達值
P = 不同細胞的混合比例
T = C·P
根據(jù)已知的數(shù)據(jù)類型,去卷積有不同的形式:

T = matrix containing the observed (measured) expression values from heterogeneous (tissue/tumor) samples (M genes, N samples);
C = matrix consisting of cell type- specific average expression values (M genes, K cell types);
P = matrix containing the mixing proportions (=relative composition) (K cell types, N samples)

  1. 只有T是已知, C和P都是預(yù)測的(深灰色箭頭所示)救恨;
  2. T和C是已知的贸辈,P是預(yù)測的 (粉色虛線箭頭和灰色熱圖所示);
    這種情況是通過T和C以富集值(代替細胞比例)表示組織異質(zhì)性的相對評估肠槽,如ESTIMATE和xCell等工具包擎淤。細胞比例值必須是0-100之間的正值,可以直接解釋秸仙;富集值是無限的嘴拢,有時是負值,使得它們更難解釋寂纪。
  3. T和P是已知席吴,C是預(yù)測的(虛線藍色箭頭所示)

解決去卷積問題的數(shù)學(xué)方法

  1. 最常用的一組方法稱為普通最小二乘法(OLS),線性最小二乘法(LLS)或簡單最小二乘法(LS)捞蛋,其目標是最小化平方和孝冒。
  2. 第二組方法是線性核(n-SVR)支持向量回歸方法,包括CIBERSORT 和 ImmuCC拟杉。
  3. 第三組無監(jiān)督降維迈倍,如主成分分析(PCA)。
  4. 第四組完全無監(jiān)督方法捣域,包括無監(jiān)督的非負矩陣分解(NMF或NNMF)和不同的貝葉斯方法啼染。

選擇特定細胞類型的標記基因的方法

標記基因選擇一是基于這個基因的在特定細胞中的表達顯著高于其他類型的細胞,另一個是根據(jù)差異基因焕梅,即在某個類型的細胞中表達迹鹅,在其他細胞類型不表達。

鑒定標記基因的方法:

  • HECS (highly expressed, cell specific)基因數(shù)據(jù)庫包含來自于芯片的84個人類細胞和96個小鼠細胞和組織贞言。(available at http://www.influenza- x.org/~jshoemaker/cten/f/HECS%20database.zip )
  • The F- statistic (measure of their fit in the multiple linear regression model) (Wang et al., 2010),
  • the Gini index (Zhang et al., 2017),
  • the Jensen-Shan- non divergence (Cabili et al., 2011) ,
  • the components from PCA, ICA or NMF analyses (Zinovyev et al., 2013)
  • CellMapper (Nelms et al., 2016), Nanodissection 1.0 (Ju et al., 2013), - - UNDO (Wang et al., 2015)
  • CAM (Wang et al., 2016). Assuming

影響去卷積效果的因素

基于監(jiān)督去卷積的方法斜棚,依賴于參考集,樣本間、樣本內(nèi)本身的異質(zhì)性將會對結(jié)果產(chǎn)生影響弟蚀,除此之外還有其他因素蚤霞,例如:

  • 前處理和標準化
  • 對數(shù)與線性
    對芯片數(shù)據(jù)取對數(shù)后會破壞線性假設(shè),進而影響去卷積效果义钉;RNA-seq數(shù)據(jù)的去卷積也需要符合線性假設(shè)昧绣,TPM , RSEM 或者Kallisto 可以得到更精確的細胞比例。
  • 多重共線性:混合物中相關(guān)細胞類型的存在
  • 矩陣的條件數(shù)目
  • 細胞周期
  • ...

低比例的細胞類型也可以被檢測的方法

PERT (Qiao et al., 2012) 和 DeconRNAseq (Gong and Szustakowski, 2013) 可以檢測到的細胞比例最小可以至2% 捶闸,CIBERSORT (Newman et al., 2015) 可以至 0.5% 夜畴。

評估去卷積效果

  • 原位雜交(in-situ hybridization,ISH) (Kuhn et al., 2011, 2012) 或免疫組織染色 (IHC) (Ju et al., 2013)
  • 細胞分選 (Qiao et al., 2012);
  • 顯微鏡和FACS分析相結(jié)合 (Wang et al., 2016);
  • 相關(guān)性分析删壮,即實驗方法細胞計數(shù)的結(jié)果與計算方法預(yù)計結(jié)果相比 (Li et al., 2016; ?enbabao?lu et al., 2016)贪绘,(?enbabao?lu et al., 2016).

傳統(tǒng)線性模型的局限性

  • 混合物中應(yīng)該存在的所有細胞類型的參考概況或每種細胞類型至少有一個標記;
  • 由于真實的組成是未知的央碟,一些細胞類型可能被忽略税灌;
  • 一些方法假設(shè)給定的異質(zhì)性組織內(nèi)的細胞類型是穩(wěn)定組成的;
  • 大多數(shù)方法沒有考慮到這樣一個事實亿虽,即參考表達譜通常受微環(huán)境或發(fā)育影響的干擾垄琐,或者只是在不同的條件下或不同的技術(shù)或平臺下獲得;

去卷積的網(wǎng)頁版工具

其他數(shù)據(jù)類型的去卷積方法

根據(jù)甲基化數(shù)據(jù)進行去卷積的淳附,目前的方法有:

  • EpiDISH (Teschendorff et al., 2017)
  • MeDeCom (Lutsik et al., 2017)
  • eFORGE (Breeze et al., 2016)
  • EDec (Onuchic et al., 2016)

根據(jù)拷貝數(shù)變異:

  • BACOM 2.0 (Fu et al., 2015)
  • ABSOLUTE (Carter et al., 2012)
  • CloneCNA (Yu et al., 2016)
  • CPE (Aran et al., 2015)

公布于 2018— 06.11
第三周 2018— 06.04-06.10

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末议慰,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子奴曙,更是在濱河造成了極大的恐慌别凹,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件洽糟,死亡現(xiàn)場離奇詭異炉菲,居然都是意外死亡堕战,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門拍霜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘱丢,“玉大人,你說我怎么就攤上這事祠饺≡阶ぃ” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵吠裆,是天一觀的道長。 經(jīng)常有香客問我烂完,道長试疙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任抠蚣,我火速辦了婚禮祝旷,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘嘶窄。我一直安慰自己怀跛,他們只是感情好,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布柄冲。 她就那樣靜靜地躺著吻谋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪现横。 梳的紋絲不亂的頭發(fā)上漓拾,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機與錄音戒祠,去河邊找鬼骇两。 笑死,一個胖子當著我的面吹牛姜盈,可吹牛的內(nèi)容都是我干的低千。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼馏颂,長吁一口氣:“原來是場噩夢啊……” “哼示血!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起救拉,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤矾芙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后近上,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體剔宪,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了葱绒。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片感帅。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖地淀,靈堂內(nèi)的尸體忽然破棺而出失球,到底是詐尸還是另有隱情,我是刑警寧澤帮毁,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布实苞,位于F島的核電站,受9級特大地震影響烈疚,放射性物質(zhì)發(fā)生泄漏黔牵。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一爷肝、第九天 我趴在偏房一處隱蔽的房頂上張望猾浦。 院中可真熱鬧,春花似錦灯抛、人聲如沸金赦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽夹抗。三九已至,卻和暖如春纵竖,著一層夾襖步出監(jiān)牢的瞬間兔朦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工磨确, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留沽甥,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓乏奥,卻偏偏與公主長得像摆舟,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子邓了,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容