一、社會(huì)網(wǎng)絡(luò)
“社會(huì)網(wǎng)絡(luò)”指的是社會(huì)成員及其相互關(guān)系的集合。社會(huì)網(wǎng)絡(luò)中所說的“點(diǎn)”是各個(gè)社會(huì)成員贯要,而社會(huì)網(wǎng)絡(luò)中的“邊”指的是成員之間的各種社會(huì)關(guān)系。成員間的關(guān)系可以是有向的椭住,也可以是無向的崇渗。同時(shí),社會(huì)關(guān)系可以表現(xiàn)為多種形式京郑,如人與人之間的朋友關(guān)系宅广、上下級(jí)關(guān)系、科研合作關(guān)系等些举,組織成員之間的溝通關(guān)系跟狱,國(guó)家之間的貿(mào)易關(guān)系等。社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis)就是要對(duì)社會(huì)網(wǎng)絡(luò)中行為者之間的關(guān)系進(jìn)行量化研究户魏,是社會(huì)網(wǎng)絡(luò)理論中的一個(gè)具體工具驶臊。
因此,社會(huì)網(wǎng)絡(luò)分析關(guān)注的焦點(diǎn)是關(guān)系和關(guān)系的模式叼丑,采用的方式和方法從概念上有別于傳統(tǒng)的統(tǒng)計(jì)分析和數(shù)據(jù)處理方法资铡。
社會(huì)網(wǎng)絡(luò)通常表達(dá)人類的個(gè)體通過各種關(guān)系連接起來,比如朋友幢码、婚姻、商業(yè)等尖飞,這些連接宏觀上呈現(xiàn)出一定的模式症副。很早的時(shí)候店雅,一些社會(huì)學(xué)家開始關(guān)注人們交往的模式。Ebel等進(jìn)行了一個(gè)電子郵件版的小世界問題的實(shí)驗(yàn)贞铣,完成了Kiel大學(xué)的5000個(gè)學(xué)生的112天電子郵件連接數(shù)據(jù)闹啦,節(jié)點(diǎn)為電子郵件地址,連接為消息的傳遞辕坝,得到帶指數(shù)截?cái)嗟膬缏啥确植记戏埽笖?shù)為r=1.18。同時(shí)證明酱畅,該網(wǎng)絡(luò)是小世界的琳袄,平均分隔為4.94。
1.2 應(yīng)用場(chǎng)景
社會(huì)網(wǎng)絡(luò)分析纺酸,可以解決或可以嘗試解決下列問題:
- 人際傳播問題窖逗,發(fā)現(xiàn)輿論領(lǐng)袖,創(chuàng)新擴(kuò)散過程餐蔬;
- 小世界理論碎紊,六度空間分割理論;
- Web分析樊诺,數(shù)據(jù)挖掘中的關(guān)聯(lián)分析仗考,形成交叉銷售,增量銷售词爬,也就是啤酒和尿布的故事秃嗜;
- 社會(huì)資本,產(chǎn)業(yè)鏈與價(jià)值鏈缸夹;
- 文本的意義輸出痪寻,通過追問調(diào)查研究文本的關(guān)聯(lián)和意義;
- 恐怖分子網(wǎng)絡(luò)
- 知識(shí)管理與知識(shí)的傳遞虽惭,弱關(guān)系的力量;
- 引文和共引分析橡类;
二、分析方法
2.1 中心性分析
“中心性”是社會(huì)網(wǎng)絡(luò)分析的重點(diǎn)之一芽唇,用于分析個(gè)人或組織在其社會(huì)網(wǎng)絡(luò)中具有怎樣的權(quán)力顾画,或者說居于怎樣的中心地位,這一思想是社會(huì)網(wǎng)絡(luò)分析者最早探討的內(nèi)容之一匆笤。
點(diǎn)度中心度表示與該點(diǎn)直接相連的點(diǎn)的個(gè)數(shù)研侣,無向圖為(n-1),有向圖為(入度炮捧,出度)庶诡。
個(gè)體的中心度(Centrality)測(cè)量個(gè)體處于網(wǎng)絡(luò)中心的程度,反映了該點(diǎn)在網(wǎng)絡(luò)中的重要性程度咆课。網(wǎng)絡(luò)中每個(gè)個(gè)體都有一個(gè)中心度末誓,刻畫了個(gè)體特性扯俱。除了計(jì)算網(wǎng)絡(luò)中個(gè)體的中心度外,還可以計(jì)算整個(gè)網(wǎng)絡(luò)的集中趨勢(shì)(可簡(jiǎn)稱為中心勢(shì)喇澡,Centralization)迅栅。網(wǎng)絡(luò)中心勢(shì)刻畫的是整個(gè)網(wǎng)絡(luò)中各個(gè)點(diǎn)的差異性程度,一個(gè)網(wǎng)絡(luò)只有一個(gè)中心勢(shì)晴玖。
根據(jù)計(jì)算方法的不同读存,中心度和中心勢(shì)都可以分為3種:點(diǎn)度中心度/點(diǎn)度中心勢(shì)、中間中心度/中間中心勢(shì)呕屎、接近中心度/接近中心勢(shì)让簿。
2.1.1 點(diǎn)度中心性
在一個(gè)社會(huì)網(wǎng)絡(luò)中,如果一個(gè)個(gè)體與其他個(gè)體之間存在大量的直接聯(lián)系榨惰,那么該個(gè)體就居于中心地位拜英,在該網(wǎng)絡(luò)中擁有較大的“權(quán)力”。在這種思想的指導(dǎo)下琅催,網(wǎng)絡(luò)中一個(gè)點(diǎn)的點(diǎn)度中心性就可以用網(wǎng)絡(luò)中與該點(diǎn)之間有聯(lián)系的點(diǎn)的數(shù)目來衡量居凶,這就是點(diǎn)度中心度。
網(wǎng)絡(luò)中心勢(shì)指的是網(wǎng)絡(luò)中點(diǎn)的集中趨勢(shì)藤抡,其計(jì)算依據(jù)如下步驟:首先找到圖中的最大點(diǎn)度中心度的數(shù)值侠碧,然后計(jì)算該值與任何其他點(diǎn)的中心度的差值,再計(jì)算這些“差值”的總和缠黍,最后用這個(gè)總和除以各個(gè)“差值”總和的最大可能值弄兜。
2.1.2 中間中心性
在網(wǎng)絡(luò)中,如果一個(gè)個(gè)體位于許多其他兩個(gè)個(gè)體之間的路徑上瓷式,可以認(rèn)為該個(gè)體居于重要地位替饿,因?yàn)樗哂锌刂破渌麅蓚€(gè)個(gè)體之間的交往能力,這種特性用中間中心度描述贸典,它測(cè)量的是個(gè)體對(duì)資源控制的程度视卢。一個(gè)個(gè)體在網(wǎng)絡(luò)中占據(jù)這樣的位置越多,代表它具有很高的中間中心性廊驼,就有越多的個(gè)體需要通過它才能發(fā)生聯(lián)系据过。
中間中心勢(shì)定義為網(wǎng)絡(luò)中 中間中心性最高的節(jié)點(diǎn)的中間中心性與其他節(jié)點(diǎn)的中間中心性的差距,用于分析網(wǎng)絡(luò)整體結(jié)構(gòu)妒挎。中間中心勢(shì)越高绳锅,表示該網(wǎng)絡(luò)中的節(jié)點(diǎn)可能分為多個(gè)小團(tuán)體,而且過于依賴某一個(gè)節(jié)點(diǎn)傳遞關(guān)系酝掩,說明該節(jié)點(diǎn)在網(wǎng)絡(luò)中處于極其重要的地位鳞芙。
2.1.3 接近中心性
接近中心性用來描述網(wǎng)絡(luò)中的個(gè)體不受他人“控制”的能力。在計(jì)算接近中心度的時(shí)候,我們關(guān)注的是捷徑积蜻,而不是直接關(guān)系闯割。如果一個(gè)點(diǎn)通過比較短的路徑與許多其他點(diǎn)相連,我們就說該點(diǎn)具有較高的接近中心性竿拆。
對(duì)一個(gè)社會(huì)網(wǎng)絡(luò)來說,接近中心勢(shì)越高宾尚,表明網(wǎng)絡(luò)中節(jié)點(diǎn)的差異性越大丙笋;反之,則表明網(wǎng)絡(luò)中節(jié)點(diǎn)間的差異越小煌贴。
水電費(fèi) | 度數(shù)中心性 | 中間中心性 | 接近中心性 |
---|---|---|---|
絕對(duì)點(diǎn)度中心度 | image
|
image
|
image
|
相對(duì)點(diǎn)度中心度(標(biāo)準(zhǔn)化) | image
|
image
|
image
|
圖的中心勢(shì) | image
|
image
|
image
|
注:以上公式都是針對(duì)無向圖御板,如果是有向圖則根據(jù)定義相應(yīng)修改公式即可
2.2 凝聚子群分析
2.2.1 凝聚子群(community detection)
當(dāng)網(wǎng)絡(luò)中某些個(gè)體之間的關(guān)系特別緊密,以至于結(jié)合成一個(gè)次級(jí)團(tuán)體時(shí)牛郑,這樣的團(tuán)體在社會(huì)網(wǎng)絡(luò)分析中被稱為凝聚子群怠肋。分析網(wǎng)絡(luò)中存在多少個(gè)這樣的子群,子群內(nèi)部成員之間關(guān)系的特點(diǎn)淹朋,子群之間關(guān)系特點(diǎn)笙各,一個(gè)子群的成員與另一個(gè)子群成員之間的關(guān)系特點(diǎn)等就是凝聚子群分析。
由于凝聚子群成員之間的關(guān)系十分緊密础芍,因此有的學(xué)者也將凝聚子群分析形象地稱為“小團(tuán)體分析”或“社區(qū)現(xiàn)象”杈抢。
常用的社區(qū)檢測(cè)方法主要有如下幾種:
(1)基于圖分割的方法,如Kernighan-Lin算法仑性,譜平分法等惶楼;
(2)基于層次聚類的方法,如GN算法诊杆、Newman快速算法等歼捐;
(3)基于模塊度優(yōu)化的方法,如貪婪算法晨汹、模擬退火算法豹储、Memetic算法、PSO算法宰缤、進(jìn)化多目標(biāo)優(yōu)化算法等颂翼。
2.2.2.凝聚子群密度(External-Internallndex)
凝聚子群密度(External-Internallndex,E-IIndex)主要用來衡量一個(gè)大的網(wǎng)絡(luò)中小團(tuán)體現(xiàn)象是否十分嚴(yán)重慨灭,在分析組織管理等問題時(shí)非常有效朦乏。
最差的情形是大團(tuán)體很散漫,核心小團(tuán)體卻有高度內(nèi)聚力氧骤。另外一種情況是呻疹,大團(tuán)體中有許多內(nèi)聚力很高的小團(tuán)體,很可能就會(huì)出現(xiàn)小團(tuán)體間相互斗爭(zhēng)的現(xiàn)象筹陵。凝聚子群密度的取值范圍為[-1刽锤,+1]镊尺。該值越向1靠近,意味著派系林立的程度越大并思;該值越接近-1庐氮,意味著派系林立的程度越小宋彼;該值越接近0弄砍,表明關(guān)系越趨向于隨機(jī)分布,未出現(xiàn)派系林立的情形输涕。
E-I Index可以說是企業(yè)管理者的一個(gè)重要的危機(jī)指數(shù)音婶。當(dāng)一個(gè)企業(yè)的E-I Index過高時(shí),就表示該企業(yè)中的小團(tuán)體有可能結(jié)合緊密而開始圖謀小團(tuán)體私利莱坎,從而傷害到整個(gè)企業(yè)的利益衣式。其實(shí)E-I Index不僅僅可以應(yīng)用到企業(yè)管理領(lǐng)域,也可以應(yīng)用到其他領(lǐng)域檐什,比如用來研究某一學(xué)科領(lǐng)域?qū)W者之間的關(guān)系碴卧。如果該網(wǎng)絡(luò)存在凝聚子群,并且凝聚子群的密度較高厢汹,說明處于這個(gè)凝聚子群內(nèi)部的這部分學(xué)者之間聯(lián)系緊密螟深,在信息分享和科研合作方面交往頻繁,而處于子群外部的成員則不能得到足夠的信息和科研合作機(jī)會(huì)烫葬。從一定程度上來說界弧,這種情況也是不利于該學(xué)科領(lǐng)域發(fā)展的。
2.2 3 核心-緣結(jié)構(gòu)分析
核心-邊緣(Core-Periphery)結(jié)構(gòu)分析的目的是研究社會(huì)網(wǎng)絡(luò)中哪些節(jié)點(diǎn)處于核心地位搭综,哪些節(jié)點(diǎn)處于邊緣地位垢箕。核心-邊緣結(jié)構(gòu)分析具有較廣的應(yīng)用性,可用于分析精英網(wǎng)絡(luò)兑巾、論文引用關(guān)系網(wǎng)絡(luò)以及組織關(guān)系網(wǎng)絡(luò)等多種社會(huì)現(xiàn)象条获。
根據(jù)關(guān)系數(shù)據(jù)的類型(定類數(shù)據(jù)和定比數(shù)據(jù)),核心—邊緣結(jié)構(gòu)有不同的形式蒋歌。定類數(shù)據(jù)和定比數(shù)據(jù)是統(tǒng)計(jì)學(xué)中的基本概念帅掘,一般來說,定類數(shù)據(jù)是用類別來表示的堂油,通常用數(shù)字表示這些類別修档,但是這些數(shù)值不能用來進(jìn)行數(shù)學(xué)計(jì)算;定比數(shù)據(jù)是用數(shù)值來表示的府框,可以用來進(jìn)行數(shù)學(xué)計(jì)算吱窝。如果數(shù)據(jù)是定類數(shù)據(jù),可以構(gòu)建離散的核心-邊緣模型;如果數(shù)據(jù)是定比數(shù)據(jù)院峡,可以構(gòu)建連續(xù)的核心-邊緣模型兴使。
離散的核心-邊緣模型,根據(jù)核心成員和邊緣成員之間關(guān)系的有無及緊密程度照激,又可分為3種:核心-邊緣全關(guān)聯(lián)模型发魄、核心-邊緣局部關(guān)聯(lián)模型、核心-邊緣關(guān)系缺失模型俩垃。如果把核心和邊緣之間的關(guān)系看成是缺失值欠母,就構(gòu)成了核心-邊緣關(guān)系缺失模型。
這里介紹適用于定類數(shù)據(jù)的4種離散的核心-邊緣模型:
- 核心-邊緣全關(guān)聯(lián)模型吆寨。網(wǎng)絡(luò)中的所有節(jié)點(diǎn)分為兩組,其中一組的成員之間聯(lián)系緊密踩寇,可以看成是一個(gè)凝聚子群(核心)啄清,另外一組的成員之間沒有聯(lián)系,但該組成員與核心組的所有成員之間都存在關(guān)系俺孙。
- 核心-邊緣無關(guān)模型辣卒。網(wǎng)絡(luò)中的所有節(jié)點(diǎn)分為兩組,其中一組的成員之間聯(lián)系緊密睛榄,可以看成是一個(gè)凝聚子群(核心)荣茫,而另外一組成員之間則沒有任何聯(lián)系,并且同核心組成員之間也沒有聯(lián)系场靴。
- 核心-邊緣局部關(guān)聯(lián)模型啡莉。網(wǎng)絡(luò)中的所有節(jié)點(diǎn)分為兩組,其中一組的成員之間聯(lián)系緊密旨剥,可以看成是一個(gè)凝聚子群(核心)咧欣,而另外一組成員之間則沒有任何聯(lián)系,但是它們同核心組的部分成員之間存在聯(lián)系轨帜。
- 核心-邊緣關(guān)系缺失模型魄咕。網(wǎng)絡(luò)中的所有節(jié)點(diǎn)分為兩組,其中一組的成員之間的密度達(dá)到最大值蚌父,可以看成是一個(gè)凝聚子群(核心)哮兰,另外一組成員之間的密度達(dá)到最小值,但是并不考慮這兩組成員之間關(guān)系密度苟弛,而是把它看作缺失值喝滞。
參考