- 圖直徑
定義為max d(u,v),其中u吊奢,v是兩個頂點键耕。也就是圖中距離最遠(yuǎn)的兩個點。 -
度中心性
-
特征向量中心性(Eigenvector Centrality)
-
中介中心性 (Betweenness Centrality)
-
連接中心性 (Closeness)
代碼:
import numpy as np
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
edges = pd.DataFrame()
edges['sources'] = [0,1,2,3,4,4,6,7,7,9,1,4,4,4,6,7,5,8,9,8]
edges['targets'] = [1,4,4,4,6,7,5,8,9,8,0,1,2,3,4,4,6,7,7,9]
#edges['weights'] = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
G = nx.from_pandas_edgelist(edges, source='sources',target='targets')
#畫圖
nx.draw_networkx(G)
plt.show()
# degree
print(nx.degree(G))
# 連通分量
print(list(nx.connected_components(G)))
# 圖直徑
print(nx.diameter(G))
# 度中心性
print('度中心性',nx.degree_centrality(G))
# 特征向量中心性
print('特征向量中心性',nx.eigenvector_centrality(G))
# betweenness
print('betweenness',nx.betweenness_centrality((G)))
# closeness
print('closeness',nx.closeness_centrality(G))
# pagerank
print('pagerank',nx.pagerank(G))
# HITS
print('HITS',nx.hits(G,tol=0.00001))
結(jié)果
[(0, 1), (1, 2), (4, 5), (2, 1), (3, 1), (6, 2), (7, 3), (5, 1), (8, 2), (9, 2)]
[{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}]
4
度中心性 {0: 0.1111111111111111, 1: 0.2222222222222222, 4: 0.5555555555555556, 2: 0.1111111111111111, 3: 0.1111111111111111, 6: 0.2222222222222222, 7: 0.3333333333333333, 5: 0.1111111111111111, 8: 0.2222222222222222, 9: 0.2222222222222222}
特征向量中心性 {0: 0.105811214865129, 1: 0.26822822377524, 4: 0.5741403289553503, 2: 0.22648750077754073, 3: 0.22648750077754073, 6: 0.26822822377524, 7: 0.4660017030178054, 5: 0.10581121486512898, 8: 0.30358469410769445, 9: 0.30358469410769445}
betweenness {0: 0.0, 1: 0.2222222222222222, 4: 0.861111111111111, 2: 0.0, 3: 0.0, 6: 0.2222222222222222, 7: 0.38888888888888884, 5: 0.0, 8: 0.0, 9: 0.0}
closeness {0: 0.3333333333333333, 1: 0.47368421052631576, 4: 0.6923076923076923, 2: 0.42857142857142855, 3: 0.42857142857142855, 6: 0.47368421052631576, 7: 0.5294117647058824, 5: 0.3333333333333333, 8: 0.375, 9: 0.375}
Pagerank
# pagerank
print('pagerank',nx.pagerank(G))
HITS
按照HITS算法斑鼻,用戶輸入關(guān)鍵詞后,算法對返回的匹配頁面計算兩種值猎荠,一種是樞紐值(Hub Scores)坚弱,另一種是權(quán)威值(Authority Scores),這兩種值是互相依存、互相影響的关摇。所謂樞紐值荒叶,指的是頁面上所有導(dǎo)出鏈接指向頁面的權(quán)威值之和。權(quán)威值是指所有導(dǎo)入鏈接所在的頁面中樞紐之和拒垃。
一個網(wǎng)頁重要性的分析的算法停撞。
通常HITS算法是作用在一定范圍的瓷蛙,比如一個以程序開發(fā)為主題網(wǎng)頁悼瓮,指向另一個以程序開發(fā)為主題的網(wǎng)頁,則另一個網(wǎng)頁的重要性就可能比較高艰猬,但是指向另一個購物類的網(wǎng)頁則不一定横堡。
在限定范圍之后根據(jù)網(wǎng)頁的出度和入度建立一個矩陣,通過矩陣的迭代運算和定義收斂的閾值不斷對兩個向量Authority和Hub值進行更新直至收斂冠桃。
# HITS
print('HITS',nx.hits(G,tol=0.00001))