下面介紹一下基因功能富集分析的研究進展:
基因功能富集分析中的基因功能指的是眾多代表一定的基因功能特征和生物過程的基因功能集,由這些基因功能集構(gòu)成的常用基因功能數(shù)據(jù)庫有GO炸卑, 生物學通路, 包含生化反應、代謝或信號通路的KEGG统诺,Reactome速梗,Biocarta等, 整合數(shù)據(jù)庫, 如MsigDB等.
基于算法分類的富集分析方法:
1.過代表分析法(ORA);2.功能集打分法(FCS)逾一;3.基于拓撲結(jié)構(gòu)(NT)的方法;4.基于網(wǎng)絡拓撲結(jié)構(gòu)(NT)的方法肮雨。下圖是方法的大致介紹:
4種方法的評估:
?????? 由于ORA 方法計算簡便, 耗時少, 并且僅需要輸入一組基因, 因此應用范圍最廣, 比較適合研究人員簡單初步地分析結(jié)果. FCS 方法則要求輸入基因的表達譜信息, 其靈敏度遵堵、精確度均優(yōu)于ORA, 更容易檢測出發(fā)生細微改變的信號。
???????PT 方法考慮了通路間的拓撲結(jié)構(gòu), 但是由于目前數(shù)據(jù)庫中通路的拓撲結(jié)構(gòu)信息不夠完整, 總在不斷更新, 同時不同通路的拓撲結(jié)構(gòu)在不同的物種怨规、細胞陌宿、組織、實驗條件均不相同, 處理起來較為復雜, 導致PT 方法不夠靈活, 并且評估結(jié)果顯示, PT 方法并不顯著優(yōu)于FCS 方法, 因此實用度不高. 導致這種結(jié)果的原因是由于通路本身存在一定的冗余性問題波丰。
???????NT 方法考慮了基因在生物學網(wǎng)絡中的重要性及相互關(guān)系, 可以富集出在統(tǒng)計學上顯著壳坪、且具有真正生物學意義的基因集, 是目前最新且主流的富集分析方法. 評估結(jié)果顯示, NT 方法綜合表現(xiàn)(靈敏度、精確度掰烟、特異度)較好, 因此在有合適的生物學網(wǎng)絡時, 推薦使用NT 方法爽蝴。
PS:本章有些命令使用的比較深入沐批,故發(fā)鏈接可以學習一下: