文獻(xiàn)時(shí)間
2015
摘要
DO以疾病的形式來(lái)對(duì)人類的基因進(jìn)行注釋,對(duì)于聯(lián)系高通量數(shù)據(jù)與臨床數(shù)據(jù)有很重要的作用策治。DOSE是一個(gè)R包拐云,提供基因和DO術(shù)語(yǔ)之間的語(yǔ)義相似度計(jì)算田炭,使生物學(xué)家能夠探索疾病之間的相關(guān)性以及從疾病角度探索基因功能查吊。此包提供超幾何模型谐区,基因集富集分析,基因類之間的對(duì)比等功能逻卖。
介紹
通過(guò)理解疾病之間宋列,基因和疾病之間的聯(lián)系,就能夠從高通量數(shù)據(jù)中挖掘出疾病的一些相關(guān)分子機(jī)制评也。疾病方面利于早期診斷炼杖,藥物研發(fā)〉脸伲基因方面利于解決生物問(wèn)題坤邪,以及發(fā)現(xiàn)意外的功能。
DO提供了基因在疾病角度一致的注釋罚缕。為了便于使用著了解疾病的相關(guān)知識(shí)艇纺,DO數(shù)據(jù)庫(kù)提供了一個(gè)頁(yè)面瀏覽器來(lái)了解DO術(shù)語(yǔ),疾病和基因注釋數(shù)據(jù)庫(kù)提供了一個(gè)頁(yè)面接口來(lái)比對(duì)基因和疾病怕磨。DO使用有向非循環(huán)結(jié)構(gòu)作為疾病知識(shí)語(yǔ)義相關(guān)性算法的基礎(chǔ)喂饥。有很多遺傳學(xué)工具庫(kù)例如SML,SimPack肠鲫,SemMF,OWLSim和Similarity或粮,這些都可以用來(lái)計(jì)算語(yǔ)義相關(guān)性导饲。DOSim是特定為DO設(shè)計(jì)的,但是作者并沒(méi)有持續(xù)更新。FunDO提供假設(shè)性檢驗(yàn)來(lái)檢驗(yàn)一個(gè)基因集的DO術(shù)語(yǔ)渣锦,但是并不允許提供北京基因硝岗,因此結(jié)果會(huì)有偏移。
因此袋毙,我們搞了一個(gè)DOSE型檀。為了研究基因組和蛋白組的相關(guān)性功能,DOSE提供假設(shè)性檢驗(yàn)和GSEA分析听盖。同時(shí)提供了多種可視化的工具胀溺。
實(shí)施
DOSE使用doSim函數(shù)來(lái)計(jì)算DO術(shù)語(yǔ)的語(yǔ)義相似度,使用四種基于信息內(nèi)容的算法和一種基于圖形的算法皆看。
這些算法從GOSemSim繼承得來(lái)仓坞。gengSim通過(guò)將基因?qū)?yīng)到DO術(shù)語(yǔ)上來(lái)計(jì)算基因之間的語(yǔ)義相似度。DOSE中有四種合并語(yǔ)義相似得分的方法:
- max:所有DO術(shù)語(yǔ)對(duì)中最高的語(yǔ)義相似得分
- avg:所有DO術(shù)語(yǔ)對(duì)中平均的語(yǔ)義相似得分
- rcmax:每行(列)的平均語(yǔ)義相似得分中的最大值
- best-match average:每行(列)語(yǔ)義相似得分
DOSE提供解設(shè)性檢驗(yàn)來(lái)評(píng)估疾病和差異性基因之間的聯(lián)系腰吟。enrichGO提供背景基因功能无埃。gseAnalyzer函數(shù)支持高通量數(shù)據(jù)的GSEA分析。這些功能可以同來(lái)判斷生物實(shí)驗(yàn)得到的基因是否和特定的疾病相關(guān)毛雇。多重假設(shè)檢驗(yàn)的矯正方法包括Bonferroni嫉称,Benjamini,F(xiàn)alse Discovery Rate和q-values灵疮。不同條件形成的基因簇與疾病之間的聯(lián)系可以通過(guò)clusterProfiler包進(jìn)行比較织阅。各種圖形化函數(shù)可以通過(guò)包的文檔查看。
結(jié)果和討論
DOSE是通過(guò)R語(yǔ)言開(kāi)發(fā)的始藕,并在Bioconductor項(xiàng)目上發(fā)布蒲稳。它提供了5種用于DO和語(yǔ)義相關(guān)性計(jì)算的算法;用于鑒定與疾病顯著相關(guān)基因集的假設(shè)性檢驗(yàn)伍派;GSEA來(lái)將各種組學(xué)文件轉(zhuǎn)化為對(duì)應(yīng)的疾病內(nèi)容江耀,以及比對(duì)不同基因集之間的疾病相關(guān)性的顯著性。相關(guān)的R腳本在附錄文件中诉植。
DOSE使用語(yǔ)義相關(guān)性途徑和富集分析來(lái)方便人們對(duì)大基因集的分析祥国。而且,還能夠?qū)Ψ治鼋Y(jié)果進(jìn)行可視化晾腔。