Step by step
3鑒定一系列感興趣的基因。
典型的是波材,這些基因是對你的實驗調(diào)節(jié)反應(yīng)比較強烈的基因(也就是差異基因)。下面講描述三種和這些基因相關(guān)的輸入網(wǎng)絡(luò)數(shù)據(jù)到cytoscape的方法:
A:querying相互作用數(shù)據(jù)庫
B:通過文本挖掘計數(shù)建立關(guān)系網(wǎng)絡(luò)
C:加載自己的網(wǎng)絡(luò)數(shù)據(jù)(從text tile)
究竟選取哪一種方式基于那種是最適合你的案例的却舀。想跟從下面步驟的話下載galFiltered.sif文件敛熬,繼續(xù)步驟。這個文件中,最有效的網(wǎng)絡(luò)的建立至少有250個interacitons丁稀。為了獲取這樣的一個網(wǎng)絡(luò)吼拥,至少得有25個gene,也可以增加更多的基因和更多的關(guān)系獲取最理想的size线衫。
(A)從cPath獲取蛋白相互作用數(shù)據(jù)
(i)cPath允許用戶從很多數(shù)據(jù)庫獲取蛋白相互作用數(shù)據(jù)凿可,包括intAct和MINT.通過選擇File-new-network-construct network using cPath來激活cPath。
(ii)在cpath插件對話框的左上角輸入框中輸入一個或多個感興趣的基因
關(guān)鍵步驟:對這個功能才開始熟悉的新用戶或許希望一次只輸入一個基因名字授账。而有經(jīng)驗的用戶則希望輸入一串基因枯跑,就像sample.input.genes.txt中的內(nèi)容
(iii)在speciees下拉菜單選擇species,默認是所有生物白热,對于樣例sample.input.genes.txt則選擇釀酒酵母
(iv)記錄的最大數(shù)目默認值是10敛助,把這個數(shù)值改為500.如果感興趣的基因是一個的話,默認設(shè)置對你探尋需要的列表還可以棘捣,但如果你有很多個感興趣的基因的話辜腺,就會獲取更多的記錄來建立連接。許多數(shù)據(jù)庫記錄里包含了一個蛋白的多個關(guān)系乍恐,因此所獲取的連接會比限制的大评疗。為了獲取基因列表的所有相互作用,選擇No limit茵烈,不過要知道百匆,limit數(shù)越高,載入需要的時間越長呜投。
(v)點擊search button加匈。稍等一會,cytoscape畫布就會顯示蛋白質(zhì)(nodes)之間的相互作用網(wǎng)絡(luò)仑荐,并且以grid形式排列雕拼,連接方式是獲取的interacitons(edges)。默認情況下粘招,cytoscape顯示網(wǎng)絡(luò)10啥寇,000或稍少的節(jié)點,而對于更大的網(wǎng)絡(luò)洒扎,用戶或許需要在network tree viewer的network lable上 右擊辑甜,然后在出現(xiàn)的create view上查看
(vi)在network tree viewer上注意你的網(wǎng)絡(luò)entry,并且要看下nodes和edges的數(shù)目
(B)產(chǎn)生關(guān)聯(lián)網(wǎng)絡(luò)
(i)在插件菜單下袍冷,選擇Agilent literature search
關(guān)鍵步驟:這個插件第一次執(zhí)行的時候磷醋,會讓用戶選擇接受許可協(xié)議。接下來胡诗,Agilent literature search窗口會出現(xiàn)邓线。
(ii)窗口左上部的terms panel里苍蔬,輸入你感興趣的基因的最多100個基因或蛋白
關(guān)鍵步驟:為了達到最好的效果圆兵,搜索的時候最好使用HUGO gene symbol或其他合適的官方基因名稱话告。這個搜索過程大概每個基因需要3s搀军,為了符合pubmed使用限制,我們建議從一個短列表開始(10或更少的基因)缩歪。注意归薛,查詢編輯面板和基因列表相似,panel中的每一行代表將會被發(fā)往pubmed的one query匪蝙。
(iii)在提取控制下主籍,轉(zhuǎn)到concept lexicon(概念詞典) 下拉菜單,選擇物種species逛球。對于樣本數(shù)據(jù)千元,選擇saccharomyces cerevisiae。保留相互作用詞典設(shè)置limited颤绕,句子選擇的要提取文本的物種之間更容易發(fā)生相互作用幸海,并且這是一個推薦設(shè)置,除非你的案例文獻很少奥务。
(iv)通過設(shè)置Max engine mathes可以提高每次查詢獲得的出版物的數(shù)量物独,fileld,up to 1氯葬,000查詢may be issued in total挡篓,可以符合pubmed對用戶的限制。對于樣本例子帚称,max engine matche 可以提高的50.總體來說官研,每個搜索條目需要更多的出版文獻比更多的搜索條目效率更高。
(v)點擊use aliase按鈕闯睹。會看到query editor區(qū)域變化了
(vi)在contex區(qū)域設(shè)置可以精簡搜索戏羽,這里可以添加額外的描述,比如組織或疾病類型楼吃,點擊use context復(fù)選框始花。對于樣本數(shù)據(jù),可以輸入galactose所刀,如果描述文字大于一個單詞,要用”捞挥。比如(”transcriptional regulation”)浮创。注意,query editor區(qū)域會陪陪你contet中的term砌函,用AND連接斩披。這會限制pubmed搜尋范圍溜族,當(dāng)然是和search terms 和context term 相關(guān)的。
(viii)檢查query mathes面板的文章列表棒仍,右擊鏈接選擇delete match即可刪除文件,同時network中的相應(yīng)nodes和edges也會被移除臭胜,當(dāng)然如果他們被其他文章也支持的話莫其,這些nodes和edge就不會被移除了。
(ix)這個功能使得用戶得以查看參考文獻耸三。具體是(i)用鼠標(biāo)選擇網(wǎng)絡(luò)中的一個或多個節(jié)點和邊乱陡,(ii)在select菜單,選擇evidence from literature-show sentences from the literature吕晌。
這會顯示一個有從文獻來的帶句子列表的窗口蛋褥,當(dāng)然都和nodes和edges有關(guān),搜索條目會以黑體顯示睛驳。如果別名匹配烙心,那么正式名字會以方括號顯示。如果用戶選擇了多個nodes或edges乏沸,這個列表會包含所有選擇nodes和edges的句子淫茵。鼠標(biāo)點擊任何一個句子,都會在用戶默認瀏覽器下有摘要蹬跃。通過右擊delete可以刪除句子匙瘪。如果所有的支持一個edge的句子都被刪除,這個edge也會從網(wǎng)絡(luò)中被刪除蝶缀。
(x)用戶可以通過右擊node來擴充網(wǎng)絡(luò)丹喻。右擊 select-evidence from litreatrue-extended network from the literature。這會有一個新的node翁都。如果新搜索產(chǎn)生任何新nodes碍论,edges或句子,就會被假如已經(jīng)存在的網(wǎng)絡(luò)中柄慰。對nodes來說鳍悠,如果這個node沒有包含在list中税娜,這是非常有效的
(c)從text file輸入網(wǎng)絡(luò)數(shù)據(jù)
(i)按樣本sif文件,組織你的數(shù)據(jù)
(ii)file-import-network
4探索網(wǎng)絡(luò)并展示
通過layout才看可以重新組織網(wǎng)絡(luò)藏研,yfles-organic敬矩。這種算法執(zhí)行的算法是force-directed paradigm,其中nodes被當(dāng)作相互排斥的力蠢挡,edges在他們連接的nodes之間產(chǎn)生吸引的力弧岳。Nodes被排放的原則是使得這些力的總和最小。這種layout會揭露網(wǎng)絡(luò)中的內(nèi)含結(jié)構(gòu)袒哥。具體來說缩筛,它有助于緊密連接點的識別,這往往意味著功能模塊堡称,還有揭示hub nodes瞎抛,也就是被參與了很多相互關(guān)系,往往代表功能非常重要的蛋白却紧。注意桐臊,cytoscape提供了非常多的layout方式,包括登記晓殊,環(huán)形断凶,基于屬性的輸出∥装常可以多體驗认烁。
5布局設(shè)置
為了讓網(wǎng)絡(luò)畫布產(chǎn)生更大的空間,可以讓control面板和data面板漂浮介汹,方式是點擊float window control圖標(biāo)却嗡,它在每個面板的右下部。這會把panel玻璃成單獨的窗口嘹承。通過拖曳network 畫布的邊緣可以進行縮放窗价。
6.鼠標(biāo)左鍵可以選擇任何node。
注意叹卷,選擇的node會變成黃色撼港。摁住鼠標(biāo)左鍵不放進行唾液可以定義一個矩形區(qū)域進行選擇。
7.注意骤竹,data panel列表了所有選擇的nodes的“身份”帝牡。
這也會顯示node屬性。從cpath獲得的nodes有一下屬性蒙揣,‘FULL-NAME’,描述性蛋白名字靶溜。從Agilent literature search插件來的nodes有一下屬性比如’Nbrconnections‘,node的度鸣奔。
8.點擊select attributes 按鈕
可以選擇屬性中的一個展示墨技,它在data panel 工具欄的最左邊。這會展示可獲得的屬性的列表挎狸,并且選擇的屬性會高亮顯示扣汪。選擇或去選擇一個屬性,都是通過點擊name锨匆。鼠標(biāo)右擊退出
9.可以拖曳矩形區(qū)域來選擇一個或多個edges崭别。
從cpath獲得的edges有以下屬性,包括‘EXPERIMENTAL-SYSTEM-NAME’,支持這個關(guān)系的實驗證據(jù)恐锣。從Agilent Literature Search 插件獲得的Edges有包括Nbrsentences的屬性茅主,支持這個關(guān)系的不同的句子的數(shù)目。
10.data panel 同樣可以看edge屬性土榴。和第8步差不多
11.工具欄的zoom in 按鈕
可以放大網(wǎng)絡(luò)诀姚,符號是放大鏡符號+。注意到control panel玷禽,網(wǎng)絡(luò)總覽中的藍色的方框會收縮面會網(wǎng)絡(luò)的部分赫段。移動這個框可以尋找整個網(wǎng)絡(luò)。其他控制有zoom out(縮惺噶蕖)糯笙。
12確定網(wǎng)絡(luò)中的node的ID name,
比如在galFiltered.sif文件中的YPL248C撩银。具體是给涕,在畫布右上方有個搜索按鈕,輸入名字额获,當(dāng)都輸入的時候一個下來菜單會顯示匹配node ID的列表够庙。這里可以搜索任何屬性(不僅僅是ID)通過點擊“configure search options)按鈕
13.cytoscape儲存用戶數(shù)據(jù)為session file,
包含所有網(wǎng)絡(luò)咪啡,layout首启,屬性數(shù)據(jù)等。通過save current session as來進行儲存撤摸。一旦被儲存毅桃,就可以在file下被加載。
14.注釋屬性和表達數(shù)據(jù)
可選擇的步驟:額外的node和edge屬性文件可以被整合進你的網(wǎng)絡(luò)准夷。(box3)
15表達數(shù)據(jù)文件有一定的格式钥飞。
具體看galExpData.pvals,這種格式文件可以用text編輯器查看詳細內(nèi)容衫嵌。如果表達文件的第一列與cytoscape網(wǎng)絡(luò)中nodes精確匹配(case-sensitive大小寫之分)读宙,那就直接看下面的16.)15適合樣本文件。否則楔绞,依然遵從box3也就是14.下面詳細說下這種屬性文件的建立方法
為了輸入屬性文件和表達數(shù)據(jù)文件到cytoscape结闸,基因或蛋白的標(biāo)識符必須和cytoscape中的nodeID(或其他cytoscape屬性已經(jīng)被加載的)精確匹配唇兑。如果沒有匹配標(biāo)識,可以通過加載另外的標(biāo)識文件作為新的node屬性¤氤現(xiàn)在介紹一種方法來建立和加載標(biāo)識匹配屬性扎附。我們將使用一個教Synergizer的外部ID匹配服務(wù),這是有哈佛大學(xué)Roth實驗室提供的结耀。也可以見http://baderlab.org/IdentifierMapping/
1)在cytoscape畫布留夜,選擇所有節(jié)點,快捷鍵是CTRL-A
2)在node屬性瀏覽窗口图甜,選擇所有nodes的ID column內(nèi)容碍粥,有個快捷鍵是選中第一個nodeID,然后摁CTRL-SHIFT-END
3)轉(zhuǎn)到synergize identifier翻譯服務(wù)http://baderlab.org/IdentifierMapping/
4)轉(zhuǎn)到box(IDS to translate)粘貼標(biāo)識列表
5)選擇物種,Set Select FROM namespace: to
ANY. In the field labeled Select TO namespace:, select the
identifier used in your expression data file. For the sample data,
select systematic. Click the box labeled Output as Spreadsheet: and
click Submit.
6.)Theidentifiermappingwillbedownloadedtoyourcomputerinan
Excel file named ‘translate’. Open the file with a spreadsheet viewer
such as Excel. The first column contains the original identifier list.
The second columncontains the identifiers that these mapto inthe
chosen namespace. Note the label given to this column in the first
line.
7). Save this file in the comma-separated (CSV) format.
m CRITICAL STEP There are system-dependent issues in producing
and reading EXCEL files. This step guards against such issues.
8). Import these data into Cytoscape.
a.GototheFilemenu,thenImportandthenAttributefromTable
(Text/MS Excel). This will bring up the Import Annotation File
window.
b. Click the Select File button and specify your ‘translated’ CSV
file.
c. Select Show Text File Import Options and select Transfer first
line as attribute names.
d. Click on the Import button.
e. Verify that the new attribute is loaded byre turning to the Node
Attribute Browser and click on the Select Attribute button.
16加載表達數(shù)據(jù)黑毅。
File-table
17 檢查下右下角data panel面板node attributes列表嚼摩。
每個實驗應(yīng)該有兩個特征,分別含有“xexp”和“xsig”矿瘦,其中x代表實驗水平的名字低斋。表達數(shù)據(jù)是xexp,如果表達數(shù)據(jù)有p-values匪凡,那么有xsig的那列就是膊畴。否則,xsig會是空白病游。如果使用樣本文件唇跨,會看到gal1RG,gal4RG,gal80R,表達FC值分別是衬衬,gal1RGexp,gal4RGexp,gal80Rexp..通過選擇一個或幾個實驗的屬性买猖,可以在畫布顯示不一樣。
設(shè)置可視化的node 特征
18.左邊面板控制節(jié)點和邊的可視化特征滋尉。
Network右邊有個style玉控,點開,node和edge和network屬性選項卡狮惜,位于control panel的底部高诺。
使用紅色到綠色漸變改變nodes顏色
19 顏色
想根據(jù)FC值來定義node顏色的第一步是定位在“node color property”,初始是灰色碾篡,雙擊它
20.節(jié)點屬性
node顏色挨著的是虱而,是please select an attribute,點擊這個信息,會產(chǎn)生一個節(jié)點屬性列表开泽。滾動滾輪到你的expression data value牡拇,例如例子中就是gal4Rexp
21.mapping type
node顏色下,是mapping type 入口,點擊右列惠呼,就在表達數(shù)據(jù)下面导俘,有個下拉菜單,選擇continuous mapping
22.標(biāo)簽可視化
mapping type下面剔蹋,可以看到標(biāo)簽可視化趟畏,graphical view,就是個空矩形滩租。這會有一個窗口對node顏色進行梯度編輯,這會根據(jù)你的表達數(shù)據(jù)屬性一直利朵,兩端顯示最小和最大值律想。
23.add button
在這個節(jié)點顏色的梯度編輯器里,點擊add button2次绍弟。會看到表達數(shù)據(jù)的屬性分成兩半技即,低的黑色,高的白色樟遣。
24.
雙擊白色的中間的下三角而叼,會出現(xiàn)顏色選擇窗口,選擇綠色”現(xiàn)在看到range bar分為了兩半葵陵,左邊黑色,右邊是梯度顏色瞻佛,綠色到白色
25
滑動綠色的三角往左邊去脱篙,留下一個端的黑色部分,像下圖d伤柄。在cytoscape畫布上绊困,你會單獨一些節(jié)點成黑色了(表達值低的),大多數(shù)節(jié)點都是黑色或淡綠色有一些是白色(表達值高的)
26
點擊右端的下三角适刀,也會產(chǎn)生一個顏色選擇窗口秤朗,選擇紅色。這回產(chǎn)生一個梯度笔喉,是白色到紅色的取视,看下圖f。在畫布上你會發(fā)現(xiàn)有些表達值高的節(jié)點現(xiàn)在是粉色或紅色常挚。更深的顏色代表更高的表達值贫途。
28滑動紅色的三角往左邊挪動一小段距離,雙擊白色右三角(在右端)待侵,選擇藍色丢早,見g
29
在cytoscape畫布上,你會發(fā)現(xiàn),節(jié)點顏色紅色到綠色分布
(i)低表達值怨酝,綠色傀缩。高表達值紅色,中間的白色
(ii)相對淡的顏色接近中間的那些农猬,黑色表示range的末端
(iii)你會發(fā)現(xiàn)當(dāng)你設(shè)置顏色的時候赡艰,畫布顏色會即時改變
(iv)關(guān)閉梯度編輯窗口。
Figure 4 | The steps in creating a green-to-red node color gradient. (a) Specify a new attribute-based gradient; (b) add two range selector end points;
(c) change the color at the lower end point to green; (d) move this end point to the bottom of the range; (e) add another new range selector end point;
(f) change the color at the top of the range to red; (g) change the color at the top of the range to blue; and (h) a network with the nodes rendered with a
red–green color map
30
默認情況下斤葱,節(jié)點是粉色慷垮。相應(yīng)的粉色的節(jié)點顏色暗含著表達值比range中間的值稍微高點。也可能意味著這個節(jié)點無表達揍堕。為了移除這種不確定性料身,改變默認節(jié)點顏色為灰色,步驟是
(i)還是在剛才的control panel衩茸,定位default panel芹血,顯示默認節(jié)點和邊渲染
(ii)點擊這個面板里的node,會顯示一個默認node屬性設(shè)置
(iii)在窗口中楞慈,點擊node fill color按鈕幔烛,選擇灰色,click apply囊蓝。