轉(zhuǎn)載自Cytoscape NetworkAnalyzer Online Help
https://med.bioinf.mpi-inf.mpg.de/netanalyzer/help/2.7/index.html#complex
將節(jié)點(diǎn)(nodes)/邊緣(edge)參數(shù)存儲(chǔ)在節(jié)點(diǎn)/邊緣屬性中
????對(duì)于網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn),Network Analyzer都會(huì)計(jì)算其度(定向網(wǎng)絡(luò)的入度和出度in- and out-degrees)蹋岩,聚類系數(shù)clustering coefficient补箍,自環(huán)數(shù)self-loops以及各種其他參數(shù)。 Network Analyzer還為網(wǎng)絡(luò)中的每個(gè)邊緣計(jì)算邊緣中間度瘪吏。 如果啟用了各個(gè)選項(xiàng)蔑祟,則Network Analyzer會(huì)將計(jì)算出的值存儲(chǔ)為相應(yīng)節(jié)點(diǎn)和邊的屬性晌区。 這使用戶可以應(yīng)用不同的可視化效果,或者根據(jù)計(jì)算出的屬性的值過濾節(jié)點(diǎn)或邊屁置。 有關(guān)計(jì)算的節(jié)點(diǎn)和邊屬性的完整列表焊夸,請(qǐng)參見“屬性”部分section Attributes。
將可擴(kuò)展界面用于顯示分析結(jié)果的對(duì)話框
????如果啟用此選項(xiàng)蓝角,分析結(jié)果將顯示在一個(gè)窗口中阱穗,在該窗口中,所有圖表都在可展開的框中彼此下方放置使鹅。 如果禁用此選項(xiàng)揪阶,分析結(jié)果將顯示在一個(gè)窗口中,該窗口包含用于簡(jiǎn)單參數(shù)組和每個(gè)復(fù)雜參數(shù)的選項(xiàng)卡患朱。 希望同時(shí)查看一個(gè)網(wǎng)絡(luò)的兩個(gè)或更多個(gè)復(fù)雜參數(shù)的用戶鲁僚,應(yīng)啟用此選項(xiàng)。
網(wǎng)絡(luò)解釋
圖1(a)Directed network
圖1(b)Undirected network
????NetworkAnalyzer可以對(duì)有向網(wǎng)絡(luò)Directed network(僅包含有向邊緣)以及無向網(wǎng)絡(luò)Undirected network(僅包含無向邊緣)執(zhí)行拓?fù)浞治霾锰S邢蚓W(wǎng)絡(luò)和無向網(wǎng)絡(luò)的示例分別在圖(a)和圖(b)中給出冰沙。在Cytoscape中,即使網(wǎng)絡(luò)在生物學(xué)環(huán)境中是無向的执虹,網(wǎng)絡(luò)也可能僅包含有向邊緣拓挥。????此外,如果通過合并來自不同來源的數(shù)據(jù)來編譯網(wǎng)絡(luò)袋励,則一個(gè)網(wǎng)絡(luò)可能包含有向邊和無向邊侥啤。????在上述情況下当叭,NetworkAnalyzer需要用戶輸入如何解釋邊緣。圖2描繪了Cytoscape中小型網(wǎng)絡(luò)的兩個(gè)示例及其解釋盖灸。
圖2(a)Network with directed paired edges and its three possible interpretations.
圖2(b)Network containing both directed and undirected edges and its interpretation as undirected.
? ??圖2?(a) 具有定向成對(duì)邊緣的網(wǎng)絡(luò)及其三種可能的解釋蚁鳖。(b)既包含有向邊又包含無向邊的網(wǎng)絡(luò),其解釋為無向的赁炎。在(a)中才睹,網(wǎng)絡(luò)僅包含有向邊。在此甘邀,NetworkAnalyzer提供了網(wǎng)絡(luò)中邊緣方向的三種可能的解釋。用戶必須選擇一種解釋以進(jìn)一步處理網(wǎng)絡(luò)垮庐。在(b)中松邪,網(wǎng)絡(luò)包含無向和有向邊。請(qǐng)注意哨查,無方向的邊緣不能明確轉(zhuǎn)換為有方向的邊緣逗抑。因此,具有混合邊緣的網(wǎng)絡(luò)將被視為無向網(wǎng)絡(luò)寒亥。
簡(jiǎn)單網(wǎng)絡(luò)參數(shù)Simple Network Parameters
連接組件數(shù)(Number of connected components)
????在無向網(wǎng)絡(luò)中邮府,如果兩個(gè)節(jié)點(diǎn)之間存在邊沿路徑,則它們是連接的溉奕。在網(wǎng)絡(luò)內(nèi)褂傀,成對(duì)連接的所有節(jié)點(diǎn)均形成連接的組件。已連接組件的數(shù)量表示網(wǎng)絡(luò)的連通性——所連接組件的數(shù)量越少加勤,表明連通性越強(qiáng)仙辟。
與最短路徑有關(guān)的參數(shù)
????路徑(path)的長(zhǎng)度是形成路徑的邊數(shù)■罚可能有多個(gè)路徑連接兩個(gè)給定節(jié)點(diǎn)叠国。兩個(gè)節(jié)點(diǎn)n和m之間的最短路徑長(zhǎng)度(也稱為距離)用L(n,m)表示戴尸。網(wǎng)絡(luò)直徑(network diameter)是兩個(gè)節(jié)點(diǎn)之間的最大距離粟焊。如果網(wǎng)絡(luò)斷開連接,則其直徑為其連接的組件的所有直徑中的最大值孙蒙。直徑也可以描述為最大節(jié)點(diǎn)偏心率(maximum node eccentricity)项棠。另一方面,網(wǎng)絡(luò)半徑(network radius)是網(wǎng)絡(luò)中節(jié)點(diǎn)的非零偏心率中的最小值马篮。平均最短路徑長(zhǎng)度(average shortest path length沾乘,也稱為特征路徑長(zhǎng)度characteristic path length)給出了兩個(gè)連接節(jié)點(diǎn)之間的預(yù)期距離。
與鄰域(neighborhood)相關(guān)的參數(shù)
????給定節(jié)點(diǎn)n的鄰域是其鄰居(neighbors)的集合浑测。 n的連通性用kn表示翅阵,是其鄰域的大小歪玲。鄰居的平均數(shù)量(average number of neighbors)表示網(wǎng)絡(luò)中節(jié)點(diǎn)的平均連接性。此參數(shù)的歸一化版本是網(wǎng)絡(luò)密度(network density)掷匠。密度是一個(gè)介于0到1之間的值滥崩。它顯示了網(wǎng)絡(luò)邊緣填充的密度(忽略自環(huán)self-loops和重復(fù)邊緣duplicated edges)。不包含邊且僅隔離節(jié)點(diǎn)的網(wǎng)絡(luò)的密度為0讹语。相反钙皮,團(tuán)(clique)的密度為1。
????隔離節(jié)點(diǎn)(isolated nodes)的數(shù)量可以提供有關(guān)網(wǎng)絡(luò)密度如何分布的見解顽决。另一個(gè)相關(guān)參數(shù)是網(wǎng)絡(luò)集中化(network centralization)短条。拓?fù)漕愃朴谛切蔚木W(wǎng)絡(luò)的集中度接近1,而分散網(wǎng)絡(luò)的特征是集中度接近0才菠。網(wǎng)絡(luò)異質(zhì)性(network heterogeneity)反映了網(wǎng)絡(luò)包含集線器節(jié)點(diǎn)(hub nodes)的趨勢(shì)茸时。另外,多邊緣節(jié)點(diǎn)對(duì)(multi-edge node)的數(shù)量表示相鄰節(jié)點(diǎn)被一個(gè)以上的邊緣連接的頻率赋访。
聚類系數(shù)(Clustering coefficient)
????在無向網(wǎng)絡(luò)中可都,節(jié)點(diǎn)n的聚類系數(shù)Cn定義為Cn = 2en / [kn(kn-1)],其中kn是n的鄰居數(shù)蚓耽,en是n的所有鄰居之間的連接對(duì)數(shù)渠牲。在定向網(wǎng)絡(luò)中,定義略有不同:Cn = en / [kn(kn-1)]步悠。在這兩種情況下签杈,聚類系數(shù)均為N / M,其中N是n個(gè)鄰居之間的邊的數(shù)量贤徒,M是n個(gè)鄰居之間可能存在的最大邊的數(shù)量芹壕。節(jié)點(diǎn)的聚類系數(shù)始終為0到1之間的數(shù)字。網(wǎng)絡(luò)聚類系數(shù)是網(wǎng)絡(luò)中所有節(jié)點(diǎn)的聚類系數(shù)的平均值接奈。在此踢涌,假設(shè)鄰居少于兩個(gè)的節(jié)點(diǎn)的聚類系數(shù)為0。 ????在這兩種情況下序宦,聚類系數(shù)均為N / M睁壁,其中N是n個(gè)鄰居之間的邊的數(shù)量,M是n個(gè)鄰居之間可能存在的最大邊的數(shù)量互捌。節(jié)點(diǎn)的聚類系數(shù)始終為0到1之間的數(shù)字潘明。????網(wǎng)絡(luò)聚類系數(shù)( network clustering coefficient)是網(wǎng)絡(luò)中所有節(jié)點(diǎn)的聚類系數(shù)的平均值。在此秕噪,假設(shè)鄰居少于兩個(gè)的節(jié)點(diǎn)的聚類系數(shù)為0钳降。?
復(fù)雜的網(wǎng)絡(luò)參數(shù)(Complex Network Parameters)
度分布
????在無向網(wǎng)絡(luò)中,節(jié)點(diǎn)n的節(jié)點(diǎn)度是鏈接到n的邊數(shù)腌巾。節(jié)點(diǎn)的自環(huán)像兩個(gè)邊緣一樣被計(jì)算為節(jié)點(diǎn)度遂填。 節(jié)點(diǎn)度數(shù)分布(node degree distribution)給出k = 0,1铲觉,…時(shí)度為k的節(jié)點(diǎn)數(shù)。?????在有向網(wǎng)絡(luò)中吓坚,節(jié)點(diǎn)n的入度(in-degree)是指向一個(gè)節(jié)點(diǎn)的邊的數(shù)量撵幽,出度(out-degree)是從該節(jié)點(diǎn)出發(fā)指向其他節(jié)點(diǎn)的邊的數(shù)量。 類似于無向網(wǎng)絡(luò)礁击,存在度內(nèi)分布( in-degree distribution )和度外分布(out-degree distribution)盐杂。
鄰域連通性(Neighborhood connectivity)
????節(jié)點(diǎn)的連通性(connectivity)是指該點(diǎn)的鄰居數(shù)。 節(jié)點(diǎn)n的鄰域連通性(neighborhood connectivity)定義為n的所有鄰居的平均連通性哆窿。 鄰域連通性分布(neighborhood connectivity distribution )給出了k = 0,1链烈,…時(shí)具有k個(gè)鄰居的所有節(jié)點(diǎn)n的鄰域連通性的平均值。 圖3顯示了圖1(b)中所示網(wǎng)絡(luò)的鄰域連通性分布挚躯。????NetworkAnalyzer計(jì)算定向網(wǎng)絡(luò)的類似參數(shù)测垛。 類似于入度和出度,定向網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)n都具有入度和出度連通性秧均。 因此,在定向網(wǎng)絡(luò)中号涯,節(jié)點(diǎn)具有以下類型的鄰居連接:1目胡,僅在-n個(gè)鄰居的平均外連接性;2链快,僅出-n的所有鄰居的平均不連通性誉己;3,輸入和輸出-n的所有鄰居的平均連接性(忽略邊的方向)域蜗【匏基于以上給出的三個(gè)定義,存在三種鄰域連通性分布-“僅輸入”霉祸,“僅輸出”和“輸入和輸出”筑累。?
圖3 圖1(b)中所示的網(wǎng)絡(luò)的鄰居連接分布
????如果鄰域連接分布是k的遞減函數(shù),則網(wǎng)絡(luò)中低連接節(jié)點(diǎn)和高連接節(jié)點(diǎn)之間的邊緣占優(yōu)勢(shì) 丝蹭。
最短路徑(Short path)
????兩個(gè)節(jié)點(diǎn)n和m之間的最短路徑(shortest path)的長(zhǎng)度為L(zhǎng)(n慢宗,m)。最短路徑長(zhǎng)度分布(shortest path length?distribution)給出了節(jié)點(diǎn)對(duì)(n奔穿,m)的數(shù)量镜沽,其中k(1,2,…)為L(zhǎng)(n贱田,m)= k缅茉。網(wǎng)絡(luò)直徑(network diameter)是兩個(gè)節(jié)點(diǎn)之間最短路徑的最大長(zhǎng)度。如果網(wǎng)絡(luò)斷開連接男摧,則其直徑為其連接的組件的所有直徑的最大值蔬墩。網(wǎng)絡(luò)直徑和最短路徑長(zhǎng)度分布可能表明所分析網(wǎng)絡(luò)的小世界特性译打。
聚類系數(shù)(Clustering coefficients)
????在無向網(wǎng)絡(luò)中,節(jié)點(diǎn)n的聚類系數(shù)(clustering coefficient)Cn定義為Cn = 2en /(kn(kn-1))筹我,其中kn是n的鄰居數(shù)扶平,en是n的所有鄰居之間的連接對(duì)數(shù)。在定向網(wǎng)絡(luò)中蔬蕊,定義略有不同:Cn = en /(kn(kn-1))结澄。????在這兩種情況下,聚類系數(shù)均為N / M岸夯,其中N是n個(gè)鄰居之間的邊的數(shù)量麻献,M是n個(gè)鄰居之間可能存在的最大邊的數(shù)量。節(jié)點(diǎn)的聚類系數(shù)始終為0到1之間的數(shù)字猜扮。????平均聚類系數(shù)分布(average clustering coefficient distribution)給出了k = 2勉吻,…,k個(gè)鄰居的所有節(jié)點(diǎn)n的聚類系數(shù)的平均值旅赢。 NetworkAnalyzer還計(jì)算網(wǎng)絡(luò)聚類系數(shù)(network clustering coefficient)齿桃,該系數(shù)是網(wǎng)絡(luò)中所有節(jié)點(diǎn)的聚類系數(shù)的平均值。????節(jié)點(diǎn)的聚類系數(shù)是通過該節(jié)點(diǎn)的三角形(triangles, 3-loops)的數(shù)量煮盼,相對(duì)于可以通過該節(jié)點(diǎn)的3-loops的最大數(shù)量短纵。
圖4?Example network with four nodes and four edges.
????例如,在圖4中僵控,有一個(gè)三角形穿過節(jié)點(diǎn)b(三角形bcd)香到。 可以通過b的三角形的最大數(shù)量為3(在這種情況下,(a报破,c)和(a悠就,d)將進(jìn)行額外的連接 )。 這樣得出的聚類系數(shù)為Cb = 1/3充易。
共同鄰居(Shared neighbors)
????P(n梗脾,m)是節(jié)點(diǎn)n和m之間共享的伙伴數(shù),也就是說盹靴,節(jié)點(diǎn)是n和m的鄰居藐唠。 對(duì)于k = 1,…鹉究,共享鄰居分布(shared neighbors distribution)給出節(jié)點(diǎn)對(duì)(n宇立,m)的數(shù)量,其中P(n自赔,m)= k妈嘹。如果像圖5所示的模板在網(wǎng)絡(luò)中被過度代表,則可以從共享鄰居分布中推斷出這一點(diǎn)绍妨。
圖5?Motif of two nodes sharing exactly four neighbors.
拓?fù)湎禂?shù)(Topological coefficients)
????具有kn個(gè)鄰居的節(jié)點(diǎn)n的拓?fù)湎禂?shù)Tn計(jì)算如下:Tn =avg(J(n润脸,m))/ kn柬脸。在此,將J(n毙驯,m)定義為與n共享至少一個(gè)鄰居的所有節(jié)點(diǎn)m倒堕。值J(n,m)是節(jié)點(diǎn)n和m之間共享的鄰居數(shù)爆价,如果n和m之間存在直接鏈接垦巴,則加1。例如铭段,在圖6中骤宣,J(b,c)= J(b序愚,d)= J(b憔披,e)=2。因此爸吮,Tb = 2/3芬膝。拓?fù)湎禂?shù)(topological coefficient)是一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)共享鄰居的程度的相對(duì)度量。拓?fù)湎禂?shù)圖可用于估計(jì)網(wǎng)絡(luò)中節(jié)點(diǎn)具有共享鄰居的趨勢(shì)形娇。NetworkAnalyzer計(jì)算網(wǎng)絡(luò)中具有多個(gè)鄰居的所有節(jié)點(diǎn)的拓?fù)湎禂?shù)蔗候。具有一個(gè)或沒有鄰居的節(jié)點(diǎn)的拓?fù)湎禂?shù)分配為0。
圖6??Example network with five nodes and six edges.
應(yīng)力中心性(Stress centrality)
????節(jié)點(diǎn)n的應(yīng)力中心性(stress centrality)是通過n的最短路徑的數(shù)量埂软。如果一個(gè)節(jié)點(diǎn)被大量的最短路徑穿過,則其應(yīng)力較高纫事。僅對(duì)于沒有多個(gè)邊緣的網(wǎng)絡(luò)定義此參數(shù)勘畔。????應(yīng)力中心性分布給出了不同s值下應(yīng)力為s的節(jié)點(diǎn)數(shù)。應(yīng)力值被分組為大小為10的指數(shù)增長(zhǎng)的倉丽惶。用于此分布的倉為{0}炫七;此倉為{0}。[1钾唬,10);[10万哪,100);...
中介中心性(Betweenness centrality)
? ??計(jì)算網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)的所有最短路徑,如果這些最短路徑中有很多條都經(jīng)過了某個(gè)節(jié)點(diǎn)抡秆,那么就認(rèn)為這個(gè)節(jié)點(diǎn)的中介中心性高奕巍。????計(jì)算經(jīng)過一個(gè)點(diǎn)的最短路徑的數(shù)量。經(jīng)過一個(gè)點(diǎn)的最短路徑的數(shù)量越多儒士,就說明它的中介中心性越高的止。
????節(jié)點(diǎn)n的中介中心性Cb(n)計(jì)算如下:Cb(n)= ∑s≠n≠t(σst(n)/σst),其中s和t是網(wǎng)絡(luò)中不同于n的節(jié)點(diǎn)着撩,σst表示從s到t的最短路徑的數(shù)量诅福,σst(n)是n所在的從s到t的最短路徑的數(shù)量匾委。中間性中心度僅針對(duì)不包含多個(gè)邊的網(wǎng)絡(luò)計(jì)算。 通過除以除n以外的節(jié)點(diǎn)對(duì)的數(shù)目來對(duì)每個(gè)節(jié)點(diǎn)n的中間值進(jìn)行歸一化:(N-1)(N-2)/ 2氓润,其中N是n所屬于的連接組件中節(jié)點(diǎn)的總數(shù)赂乐。 因此,每個(gè)節(jié)點(diǎn)的中介性中心是一個(gè)介于0和1之間的數(shù)字咖气。????節(jié)點(diǎn)之間的中心性反映了該節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)中其他節(jié)點(diǎn)的交互施加的控制量挨措。此措施有利于加入社區(qū)(密集子網(wǎng))的節(jié)點(diǎn),而不是位于社區(qū)內(nèi)部的節(jié)點(diǎn)采章。NetworkAnlayzer使用Brandes的快速算法來計(jì)算節(jié)點(diǎn)之間的中心性运嗜。該算法的復(fù)雜度為O(NM),N為節(jié)點(diǎn)數(shù)悯舟,M為網(wǎng)絡(luò)中的邊緣數(shù)担租。?
緊密中心性(Closeness centrality)
????如果節(jié)點(diǎn)到圖中其它節(jié)點(diǎn)的最短距離都很小,那么我們認(rèn)為該節(jié)點(diǎn)的緊密中心性高抵怎。????節(jié)點(diǎn)n的緊密中心性Cc(n)定義為平均最短路徑長(zhǎng)度的倒數(shù)奋救,其計(jì)算公式如下:Cc(n)= 1 / avg(L(n,m))反惕,其中L(n尝艘,m)是兩個(gè)節(jié)點(diǎn)n和m之間的最短路徑的長(zhǎng)度。 每個(gè)節(jié)點(diǎn)的緊密中心性為0到1之間的數(shù)字姿染。NetworkAnalyzer計(jì)算所有節(jié)點(diǎn)的接近度中心度并將其相對(duì)于鄰居數(shù)進(jìn)行繪制背亥。 孤立節(jié)點(diǎn)的緊密中心性等于0。緊密中心性是衡量信息從網(wǎng)絡(luò)中的給定節(jié)點(diǎn)到其他可達(dá)節(jié)點(diǎn)的傳播速度的方法悬赏。
節(jié)點(diǎn)屬性Node Attributes
在迭代網(wǎng)絡(luò)的連接組件時(shí)狡汉,NetworkAnalyzer為每個(gè)節(jié)點(diǎn)n計(jì)算以下拓?fù)涠攘浚?/p>
平均最短路徑長(zhǎng)度(AverageShortestPathLength)Average length of a shortest path between?n?and any other node. If?n?is an isolated node, the value of this attribute is zero.
中介中心性BetweennessCentrality?Centrality of?n?as explained in the section?Betweenness centrality.
緊密中心性ClosenessCentrality?of?n?as described in the section?Closeness centrality.
聚類系數(shù)ClusteringCoefficient?This numerical attribute stores the clustering coefficient of?n, as defined in [2]. Nodes with less than 2 neighbors have a clustering coefficient of zero.
度Degree?The degree of?n?as explained in the section?Degree Distributions.
偏心率Eccentricity?The maximum non-infinite length of a shortest path between?n?and another node in the network. If?n?is an isolated node, the value of this attribute is zero.
IsSingleNode?This boolean attribute indicates if?n?is an isolated node, that is, if?n?has no neighbors.
NeighborhoodConnectivity?The neighborhood connectivity of?n?as explained in the section?Neighborhood Connectivity.
NumberOfDirectedEdges?This attribute counts the number of directed edges that are connected to?n.
NumberOfUndirectedEdges?This attribute counts the number of undirected edges that are connected to?n.
PartnerOfMultiEdgedNodePairs?This attribute indicates if?n?is a partner of node pairs with multiple edges.
Radiality?This attribute is a node centrality index computed by subtracting the average shortest path length of a node?n?from the diameter of the connected component plus 1. The radiality of each node is divided by the diameter of the connected component. Thus it is a number between 0 and 1.
SelfLoops?This attribute counts the number of self-loops at?n.
Stress?This attribute counts the number of shortest paths passing through a node.
拓?fù)湎禂?shù) TopologicalCoefficient?This numerical attribute stores the topological coefficient of?n, as defined in. Nodes with less than 2 neighbors have a topological coefficient of zero.