GO富集分析(中)

一睛约、基本內(nèi)容回顧:

1哭尝、基因本體論(GO)主要用于幫助我們理解高通量組學(xué)實(shí)驗(yàn)結(jié)果哥攘,把那些差異表達(dá)的基因整理成一組具有相似功能的基因。然而,GO本身是分層次的逝淹,這就導(dǎo)致我們得到的富集結(jié)果往往會(huì)重復(fù)耕姊,有時(shí)很難理解。為了讓這些結(jié)果更簡(jiǎn)潔清晰栅葡,我們可以通過比較術(shù)語之間的語義相似性茉兰,把相似的術(shù)語歸為一組,從而減少冗余并更容易解釋欣簇,實(shí)現(xiàn)GO功能降維聚類规脸。

2、GO圖是用有向無環(huán)圖表示生物學(xué)術(shù)語之間的層次關(guān)系熊咽,節(jié)點(diǎn)代表術(shù)語莫鸭,邊表示術(shù)語之間的不同關(guān)系,計(jì)算術(shù)語相似性則是衡量基因功能相似性的基礎(chǔ)横殴。

4被因、計(jì)算GO術(shù)語相似性的方法最早借鑒了文本分析中的語義相似性度量。2003年衫仑,Lord等人首次使用Resnik方法計(jì)算GO術(shù)語的相似性梨与。經(jīng)過多年的發(fā)展,學(xué)者們提出了四種主要的計(jì)算方法:基于路徑距離文狱、基于信息量粥鞋、基于向量空間和基于融合的方法。

二瞄崇、上手操作

1呻粹、接下來,我們通過兩種R語言方法包實(shí)現(xiàn)基因功能相似性分析苏研,并進(jìn)行功能聚類或術(shù)語概括尚猿。

不用準(zhǔn)備數(shù)據(jù),本次用內(nèi)置數(shù)據(jù)操作楣富。

(1) 基于ClusterProfiler包

以下是出圖以及完整的R代碼,包含了數(shù)據(jù)加載伴榔、GO富集分析纹蝴、術(shù)語相似性計(jì)算、聚類和可視化的步驟踪少√涟玻可以使用它來進(jìn)行基因功能相似性分析,并將結(jié)果保存為PNG和PDF文件援奢。

PNG
ClusterProfiler包

注:

在ClusterProfiler包中兼犯,`treeplot()`函數(shù)可以用來執(zhí)行GO富集術(shù)語的層次聚類。它依賴于`pairwise_termsim()`函數(shù)計(jì)算GO術(shù)語的成對(duì)相似性,默認(rèn)使用Jaccard相似性指數(shù)(JC)切黔,但也可以選擇使用語義相似度值砸脊。?

`treeplot()`的默認(rèn)聚類方法是`ward.D`,用戶可以通過`hclust_method`參數(shù)選擇其他方法纬霞,如“average”凌埂、“complete”、“median”诗芜、“centroid”等瞳抓。?

`treeplot()`函數(shù)將聚類結(jié)果以樹狀圖的形式展示,并可以通過`nCluster`參數(shù)(默認(rèn)值為5)將樹切割成多個(gè)子樹伏恐,并為每個(gè)子樹標(biāo)記高頻詞組孩哑,從而減少GO富集結(jié)果的復(fù)雜性。

(2) 基于rrvgo包

rrvgo包可以像ClusterProfiler包一樣進(jìn)行GO功能富集分析的聚類翠桦,關(guān)鍵是它使用GO術(shù)語而不是基因來進(jìn)行分析横蜒。

首先,從一個(gè)富含感興趣基因的列表開始秤掌,使用GO術(shù)語進(jìn)行富集分析愁铺。rrvgo處理的輸入是GO術(shù)語和(可選的)分?jǐn)?shù)。如果沒有分?jǐn)?shù)闻鉴,rrvgo會(huì)用術(shù)語大小作為默認(rèn)分?jǐn)?shù)茵乱。然后,它會(huì)計(jì)算術(shù)語之間的相似度矩陣孟岛,并通過降維方法來簡(jiǎn)化分析瓶竭。

目前,rrvgo支持20個(gè)物種的分析渠羞。如果Bioconductor不支持該物種斤贰,可以使用AnnotationForge包構(gòu)建自己的OrgDb對(duì)象,并使用GOSemSim包渲染語義相似性所需的數(shù)據(jù)次询。

2荧恍、進(jìn)行可視化分析

熱圖可視化
熱圖可視化。將相似性矩陣?yán)L制為熱圖屯吊,默認(rèn)情況下啟用行列的聚類(從而將相似的術(shù)語排列在一起)送巡。該函數(shù)內(nèi)部使用pheatmap,并且可以將其他參數(shù)傳遞給此函數(shù)盒卸。


散點(diǎn)圖
散點(diǎn)圖描繪了組和術(shù)語之間的距離骗爆。將GO術(shù)語繪制為散點(diǎn)。點(diǎn)之間的距離表示術(shù)語之間的相似性蔽介。點(diǎn)的大小表示提供的分?jǐn)?shù)摘投,或者在沒有分?jǐn)?shù)的情況下煮寡,表示GO術(shù)語包含的基因數(shù)量。


樹狀圖
樹狀圖(Treemap plot)犀呼。樹狀圖是層次結(jié)構(gòu)的空間填充可視化幸撕。這些術(shù)語根據(jù)其父級(jí)進(jìn)行分組(著色),術(shù)語使用的空間與分?jǐn)?shù)成正比圆凰。樹狀圖可以幫助解釋總結(jié)的結(jié)果杈帐,也可以比較不同的GO術(shù)語集。該函數(shù)內(nèi)部使用樹映射专钉,可以將其他參數(shù)傳遞給此函數(shù)挑童。


詞云
詞云。詞云是再現(xiàn)文本的可視化跃须,強(qiáng)調(diào)文本中頻繁出現(xiàn)的單詞站叼。它們可以幫助識(shí)別在一組富集的GO術(shù)語中更常見的過程和功能,以及在不同集合之間進(jìn)行比較菇民。該函數(shù)內(nèi)部使用wrodcloud尽楔,并且可以將其他參數(shù)傳遞給此函數(shù)。

生物信息學(xué)領(lǐng)域非常廣泛第练,難以一次說盡阔馋。我們下次繼續(xù)更新,一起深入學(xué)習(xí)生物信息學(xué)的內(nèi)容娇掏!

喜歡的寶子們點(diǎn)個(gè)贊吧~碼字不易呕寝,且行且珍惜~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過簡(jiǎn)信或評(píng)論聯(lián)系作者婴梧。
  • 序言:七十年代末下梢,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子塞蹭,更是在濱河造成了極大的恐慌孽江,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件番电,死亡現(xiàn)場(chǎng)離奇詭異岗屏,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)漱办,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門担汤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人洼冻,你說我怎么就攤上這事∮绾埽” “怎么了撞牢?”我有些...
    開封第一講書人閱讀 168,814評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵率碾,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我屋彪,道長(zhǎng)所宰,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,869評(píng)論 1 299
  • 正文 為了忘掉前任畜挥,我火速辦了婚禮仔粥,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蟹但。我一直安慰自己躯泰,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評(píng)論 6 398
  • 文/花漫 我一把揭開白布华糖。 她就那樣靜靜地躺著麦向,像睡著了一般。 火紅的嫁衣襯著肌膚如雪客叉。 梳的紋絲不亂的頭發(fā)上诵竭,一...
    開封第一講書人閱讀 52,475評(píng)論 1 312
  • 那天,我揣著相機(jī)與錄音兼搏,去河邊找鬼卵慰。 笑死,一個(gè)胖子當(dāng)著我的面吹牛佛呻,可吹牛的內(nèi)容都是我干的裳朋。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼件相,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼再扭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起夜矗,我...
    開封第一講書人閱讀 39,924評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤泛范,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后紊撕,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罢荡,經(jīng)...
    沈念sama閱讀 46,469評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評(píng)論 3 342
  • 正文 我和宋清朗相戀三年对扶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了区赵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,680評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡浪南,死狀恐怖笼才,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情络凿,我是刑警寧澤骡送,帶...
    沈念sama閱讀 36,362評(píng)論 5 351
  • 正文 年R本政府宣布昂羡,位于F島的核電站,受9級(jí)特大地震影響摔踱,放射性物質(zhì)發(fā)生泄漏虐先。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評(píng)論 3 335
  • 文/蒙蒙 一派敷、第九天 我趴在偏房一處隱蔽的房頂上張望蛹批。 院中可真熱鬧,春花似錦篮愉、人聲如沸腐芍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽甸赃。三九已至,卻和暖如春冗酿,著一層夾襖步出監(jiān)牢的瞬間埠对,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評(píng)論 1 274
  • 我被黑心中介騙來泰國打工裁替, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留项玛,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,099評(píng)論 3 378
  • 正文 我出身青樓弱判,卻偏偏與公主長(zhǎng)得像襟沮,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子昌腰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容