在上一篇文章《GEO數(shù)據(jù)挖掘:(一)尋找共同差異基因》中我們通過(guò)兩個(gè)實(shí)驗(yàn)的數(shù)據(jù)尋找到了一些差異基因失尖,本篇文章將對(duì)這些差異基因的互作關(guān)系進(jìn)行簡(jiǎn)單的分析,用到的工具主要有String和Cytoscape.
1贿条、利用String進(jìn)行蛋白互作網(wǎng)絡(luò)分析
STRING是蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)雹仿,可用來(lái)分析已知蛋白之間和預(yù)測(cè)蛋白質(zhì)之間相互作用增热。
這里我們是分析多個(gè)蛋白質(zhì)之間的互作關(guān)系整以,如上圖依次進(jìn)行操作:
(1)選擇輸入選項(xiàng)--Multiple proteins;
(2)選擇輸入文件,也可復(fù)制所有基因粘貼到上面的輸入框中峻仇;
(3)選擇物種公黑,這里選擇人類(lèi);
(4)點(diǎn)擊SEARCH進(jìn)行搜索分析摄咆。
進(jìn)入主頁(yè)凡蚜,如下圖,這里既可以輸入一個(gè)蛋白分析其與已知蛋白質(zhì)之間的聯(lián)系吭从,還可以輸入多個(gè)蛋白分析他們之間的互作關(guān)系朝蜘。
搜索分析后會(huì)出現(xiàn)多個(gè)結(jié)果,一般選擇默認(rèn)的直接點(diǎn)擊continue即可涩金,如下:
最后便會(huì)出現(xiàn)我們輸入基因的檢索結(jié)果:
上面展示了默認(rèn)的蛋白互作網(wǎng)絡(luò)圖谱醇,通過(guò)下方的settings選項(xiàng),我們可以設(shè)置建立互作關(guān)系的閾值以及網(wǎng)絡(luò)圖中邊線表示的意義:
(1)evidence:不同顏色的線表示不同證據(jù)步做;
(2)confidence:兩個(gè)蛋白質(zhì)相互作用越強(qiáng)連線越粗副渴;
(3)actions:不同顏色和形狀的線表示不同的作用。
其中各種不同邊線表示的意思可以在Legend中進(jìn)行查看全度。
在Analysis中可以查看GO和KEGG通路分析結(jié)果煮剧,但在這里沒(méi)有發(fā)現(xiàn)KEGG分析結(jié)果:
點(diǎn)擊下方的download下載GO分析結(jié)果。
在Exports選項(xiàng)中可以根據(jù)自己的需要導(dǎo)出網(wǎng)絡(luò)圖以及表示網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)關(guān)系的文本文件。
這里我們導(dǎo)出存有各基因關(guān)系的tsv文件和互作網(wǎng)絡(luò)圖勉盅。
2佑颇、利用cytoscape繪制蛋白互作網(wǎng)絡(luò)
利用從String中導(dǎo)出的蛋白互作關(guān)系文件在cytoscape中繪制網(wǎng)絡(luò)圖。
2.1 簡(jiǎn)介
先簡(jiǎn)單的介紹一下cytoscape的界面:
其中較為值得注意的是菜單欄的select和網(wǎng)絡(luò)處理面板草娜。select可用來(lái)簡(jiǎn)單的挑選子網(wǎng)絡(luò)漩符,而網(wǎng)絡(luò)處理面板則是對(duì)網(wǎng)絡(luò)進(jìn)行相關(guān)的設(shè)置:
(1)network:包括所有創(chuàng)建的網(wǎng)絡(luò),可以選擇相應(yīng)的網(wǎng)絡(luò)進(jìn)行操作
(2)style:屬性(node/edge/network)
- Node:對(duì)點(diǎn)進(jìn)行設(shè)置驱还,包括:點(diǎn)的形狀嗜暴、顏色、大幸轶 闷沥;點(diǎn)邊界線的類(lèi)型、顏色咐容、寬度;點(diǎn)標(biāo)簽的顏色戳粒、大小奄妨;點(diǎn)背景色的透明度等
- Edge:對(duì)邊進(jìn)行設(shè)置,包括:邊的類(lèi)型苹祟、顏色、寬度树枫;目標(biāo)處箭頭類(lèi)型等。
- Network:對(duì)網(wǎng)絡(luò)整體屬性進(jìn)行設(shè)置砂轻,包括:背景標(biāo)題等
(3) Select:面板用于篩選符合特定標(biāo)準(zhǔn)的邊
2.2 生成初始網(wǎng)絡(luò)互作圖
導(dǎo)入tab分隔文件(這里為string中導(dǎo)出的tsv文件)奔誓,生成網(wǎng)絡(luò)互作圖:
選擇好文件打開(kāi)后,會(huì)出現(xiàn)下面的界面厨喂,表示哪些列的信息會(huì)在我們繪圖中用到体谒。第一列一般表示source gene抒痒,第二列則表示target gene,表示關(guān)系則為source與target相連。后面的多列可用來(lái)表示相關(guān)的一些附加信息颁独,映射(map)到網(wǎng)絡(luò)圖形元素(如形狀大小伪冰、線條粗細(xì)、顏色等)靠柑,非必須信息吓懈。這里我們只用前兩列耻警,因此需要把后面的多列都給禁用掉。
最后點(diǎn)擊ok便會(huì)生出網(wǎng)絡(luò)圖:
可以看到這個(gè)網(wǎng)絡(luò)圖與string中生成的網(wǎng)絡(luò)圖是一致的腮恩。
可以用鼠標(biāo)選擇節(jié)點(diǎn)移動(dòng)温兼,還可以通過(guò)ctrl+鼠標(biāo)進(jìn)行選擇多個(gè)節(jié)點(diǎn)一起移動(dòng)使網(wǎng)絡(luò)圖看起來(lái)更美觀妨托。
2.3 網(wǎng)絡(luò)圖美化以附加信息的可視化
美化網(wǎng)絡(luò)主要在style選項(xiàng)吝羞,如下:
style中各個(gè)圖形參數(shù)除了可以直接指定外還可以進(jìn)行映射(map)钧排,也就是將附加信息在各個(gè)圖形元素上反映出來(lái),下面將先會(huì)先對(duì)網(wǎng)絡(luò)圖進(jìn)行分析符衔,然后將node degree映射到節(jié)點(diǎn)大小上糟袁。
Degree:指的是有多少節(jié)點(diǎn)與我直接相連,也就是與我距離為1形帮,有一條邊直接相連的鄰居,對(duì)于有向圖中要分為出度和入度界斜,從名字就可以看出差別合冀,出度數(shù)是從我這個(gè)節(jié)點(diǎn)指向別的節(jié)點(diǎn)邊的條數(shù),入度數(shù)指的鄰居節(jié)點(diǎn)有邊與我相連峭判,并且方向是指向我這個(gè)節(jié)點(diǎn)的邊的條數(shù)棕叫。
Betweenness centrality:指的是圖中有路勁相連的兩個(gè)節(jié)點(diǎn)這樣的邊中有多少條邊經(jīng)過(guò)本節(jié)點(diǎn)谍珊,也就是說(shuō)這個(gè)計(jì)算的是它處在其他節(jié)點(diǎn)相連路勁中間的比例。
closeness:計(jì)算的是到圖中其他節(jié)點(diǎn)的距離總和比較小侮邀,這個(gè)更接近與中心度贝润,計(jì)算的是這個(gè)節(jié)點(diǎn)處于圖中間位置的程度。作者:lemondy
鏈接:https://www.zhihu.com/question/22610633/answer/89577479
來(lái)源:知乎
先對(duì)網(wǎng)絡(luò)圖進(jìn)行分析华畏,依次點(diǎn)擊Tools->NetworkAnalyzer->Network Analysis->Analyze Network,生成統(tǒng)計(jì)分析結(jié)果如下:
接下來(lái)我們將亡笑,Node degree統(tǒng)計(jì)結(jié)果映射到節(jié)點(diǎn)大小上面:
除了大小外仑乌,顏色也可進(jìn)行映射琴锭。另一個(gè)較為有用的映射是蛋白間上調(diào)、抑制關(guān)系的映射厕九,這種一般需要提前將信息放在輸入文件中地回。
2.5 提取子網(wǎng)絡(luò)
對(duì)于做好的網(wǎng)絡(luò)圖提取子網(wǎng)絡(luò)既可以直接通過(guò)工具欄中的select選項(xiàng)來(lái)進(jìn)行選擇所需節(jié)點(diǎn),還可以使用插件MCODE來(lái)分析得到子網(wǎng)絡(luò)穿香。在Apps中可直接安裝MCODE皮获。
這個(gè)分析主要能夠幫我們發(fā)現(xiàn)在network中聯(lián)系更緊密的群組或者基因。安裝好后在Apps中打開(kāi)MCODE购公,一般使用默認(rèn)參數(shù)來(lái)生成子網(wǎng)絡(luò)即可:
在結(jié)果框中可以看到我們的分析結(jié)果宏浩,包括得分以及其他信息靠瞎。
3、GO佳窑、KEGG富集分析
最后父能,我們?cè)偈褂肈avid來(lái)對(duì)差異基因做個(gè)富集分析。網(wǎng)址:https://david.ncifcrf.gov/summary.jsp
提交后溉委,會(huì)轉(zhuǎn)到list項(xiàng)頁(yè)面瓣喊,選擇物種進(jìn)行分析:
下載通路注釋文件:
最后型宝,看看下載的文件是什么樣子把:
可以看到對(duì)每個(gè)基因都有相關(guān)通路的詳細(xì)注釋。