知識(shí)圖譜在圖情領(lǐng)域被稱(chēng)為“科學(xué)知識(shí)圖譜”瞧剖,雖然有的學(xué)者認(rèn)為圖情領(lǐng)域的“科學(xué)知識(shí)圖譜”與業(yè)界所稱(chēng)的“知識(shí)圖譜”不是一個(gè)東西厢蒜,但個(gè)人認(rèn)為科學(xué)知識(shí)圖譜屬于知識(shí)圖譜葛菇,只是科學(xué)知識(shí)圖譜中的實(shí)體壶辜、邊痹扇、屬性等都是“最簡(jiǎn)化”的铛漓,例如科學(xué)知識(shí)圖譜中的“實(shí)體”可能直接用科技文獻(xiàn)中已經(jīng)結(jié)構(gòu)化了的著錄信息,但這并不阻擋其是知識(shí)圖譜的本質(zhì)鲫构。下文是個(gè)人梳理的圖情領(lǐng)域知識(shí)圖譜的構(gòu)建方法和常用工具浓恶,對(duì)于我們后續(xù)深入了解知識(shí)圖譜應(yīng)該會(huì)有一定的意義。
1? 引言
共現(xiàn)科學(xué)知識(shí)圖譜是對(duì)科學(xué)文獻(xiàn)系統(tǒng)中知識(shí)單元間的共現(xiàn)模式進(jìn)行抽取结笨、簡(jiǎn)化和可視化的結(jié)果包晰,即通過(guò)科學(xué)文獻(xiàn)所承載學(xué)科及研究領(lǐng)域的概念、知識(shí)和社會(huì)結(jié)構(gòu)間的相互聯(lián)系炕吸,構(gòu)建知識(shí)單元共現(xiàn)網(wǎng)絡(luò)伐憾,以圖譜方式揭示科學(xué)研究知識(shí)單元和知識(shí)群體的網(wǎng)絡(luò)結(jié)構(gòu)與動(dòng)態(tài)演變。從1964年加菲爾德等人基于引文數(shù)據(jù)手工繪制完成DNA領(lǐng)域歷史發(fā)展圖譜赫模,1965年P(guān)rice[1]基于相同數(shù)據(jù)完成經(jīng)典論文《科學(xué)引文網(wǎng)絡(luò)》树肃,到1973年Small[2]提出基于共被引關(guān)系研究科學(xué)知識(shí)結(jié)構(gòu),1983年Callon等人[3]將共詞網(wǎng)絡(luò)引入科學(xué)知識(shí)圖譜嘴瓤,再到1991年P(guān)eters等人[4]建立合作網(wǎng)絡(luò)發(fā)現(xiàn)科學(xué)研究中的社會(huì)合作結(jié)構(gòu)扫外,以及2005年劉則淵[5]正式引入“知識(shí)圖譜”指代計(jì)量學(xué)新興研究主題“MappingKnowledgeDomains”,無(wú)不展現(xiàn)出共現(xiàn)科學(xué)知識(shí)圖譜循序漸進(jìn)的研究過(guò)程廓脆。
科學(xué)研究規(guī)模蔓延生長(zhǎng)、不斷演化和科技成果指數(shù)級(jí)增長(zhǎng)的趨勢(shì)磁玉,使得歷經(jīng)50多年發(fā)展并日趨成熟的共現(xiàn)科學(xué)知識(shí)圖譜在洞察科研動(dòng)向中扮演的角色愈加重要停忿,成為圖書(shū)情報(bào)學(xué)科的主要研究領(lǐng)域之一,并在其它學(xué)科得到快速滲透和廣泛擴(kuò)散蚊伞,如教育學(xué)席赂、醫(yī)學(xué)吮铭、計(jì)算機(jī)科學(xué)、管理學(xué)與經(jīng)濟(jì)學(xué)等[6]颅停,是學(xué)者洞察領(lǐng)域熱點(diǎn)與趨勢(shì)谓晌、發(fā)現(xiàn)學(xué)術(shù)共同體、對(duì)學(xué)科交叉及融合進(jìn)行測(cè)度與可視化的重要方法和有效工具癞揉,特別是近幾年層出不窮的新技術(shù)(如大數(shù)據(jù)纸肉、物聯(lián)網(wǎng)、人工智能喊熟、區(qū)塊鏈)更為共現(xiàn)科學(xué)知識(shí)圖譜的應(yīng)用增添了新活力[7-8]柏肪。面對(duì)該領(lǐng)域快速興起和發(fā)展的趨勢(shì),已有學(xué)者通過(guò)統(tǒng)計(jì)計(jì)量與理論思辨等方法對(duì)其進(jìn)行研究現(xiàn)狀梳理和知識(shí)體系構(gòu)建[9-11]芥牌,以期厘清其發(fā)展脈絡(luò)烦味、理論基礎(chǔ)、實(shí)現(xiàn)工具和應(yīng)用概貌壁拉。
共現(xiàn)科學(xué)知識(shí)圖譜在支撐理論和應(yīng)用成果方面都取得長(zhǎng)足發(fā)展谬俄,但對(duì)于一個(gè)正處在從夯實(shí)理論基礎(chǔ)向多學(xué)科融合發(fā)展和轉(zhuǎn)變的領(lǐng)域來(lái)說(shuō),筆者認(rèn)為有必要對(duì)其實(shí)現(xiàn)原理和流程進(jìn)行梳理弃理,歸納構(gòu)建共現(xiàn)科學(xué)知識(shí)圖譜的關(guān)鍵技術(shù)和集成工具凤瘦,探索共現(xiàn)科學(xué)知識(shí)圖譜的發(fā)展趨勢(shì)和主要挑戰(zhàn),從而幫助科研人員更好地理解案铺、掌握和運(yùn)用共現(xiàn)科學(xué)知識(shí)圖譜蔬芥,選擇適合的繪制方法和工具,提高圖譜運(yùn)用控汉、解讀與轉(zhuǎn)化能力笔诵,也可為共現(xiàn)科學(xué)知識(shí)圖譜工具的進(jìn)一步優(yōu)化提供借鑒路徑。
2? 實(shí)現(xiàn)原理與流程
2.1? 基礎(chǔ)原理
文獻(xiàn)組件指科學(xué)文獻(xiàn)中的任一邏輯組成部分姑子,包括文獻(xiàn)題名乎婿、摘要、關(guān)鍵詞街佑、作者谢翎、機(jī)構(gòu)等以元數(shù)據(jù)形式予以標(biāo)注和存儲(chǔ)的外部特征,也包括正文中的段落沐旨、句子森逮、詞組、關(guān)鍵概念和術(shù)語(yǔ)等反映內(nèi)在語(yǔ)義的部件[12-13]磁携,這些基礎(chǔ)組件可被視為科學(xué)文獻(xiàn)邏輯內(nèi)容及外在形式的重要表征褒侧,它們構(gòu)成了特定文獻(xiàn)的知識(shí)單元集合。不同知識(shí)單元間由于某種聯(lián)系(如詞共現(xiàn)、作者合作闷供、共被引等)而被組合成具有意義的實(shí)體對(duì)烟央,作為有指示價(jià)值的概念或主體被人們理解,這些知識(shí)單元高頻率的共現(xiàn)說(shuō)明其指示的概念或主體間關(guān)聯(lián)的可能性更大歪脏,在此基礎(chǔ)上構(gòu)建的網(wǎng)絡(luò)一定程度上能建立起對(duì)特定領(lǐng)域知識(shí)結(jié)構(gòu)的描述疑俭,進(jìn)而反映特定學(xué)科或領(lǐng)域的研究熱點(diǎn)、發(fā)展過(guò)程和結(jié)構(gòu)演化婿失。
共現(xiàn)科學(xué)知識(shí)圖譜可看做是一張由科學(xué)文獻(xiàn)知識(shí)單元集合構(gòu)成的網(wǎng)絡(luò)钞艇,網(wǎng)絡(luò)中的節(jié)點(diǎn)代表文獻(xiàn)知識(shí)單元,節(jié)點(diǎn)間的連線(xiàn)代表知識(shí)單元之間的共現(xiàn)關(guān)系[14]移怯,我們可以將這種共現(xiàn)關(guān)系稱(chēng)為“共現(xiàn)大家庭”[15]或“大共現(xiàn)”[16]香璃。共現(xiàn)圖譜繪制的基本原理就是對(duì)樣本文獻(xiàn)集進(jìn)行解構(gòu),提取出待分析的知識(shí)單元舟误,然后根據(jù)知識(shí)單元間的共現(xiàn)類(lèi)型和強(qiáng)度進(jìn)行重構(gòu)葡秒,形成不同意義的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的測(cè)度和可視化嵌溢,發(fā)現(xiàn)特定學(xué)科和領(lǐng)域知識(shí)結(jié)構(gòu)的隱含模式和規(guī)律(如圖1)眯牧。
2.2? 構(gòu)造流程與關(guān)鍵技術(shù)
B?rner等人[17]將科學(xué)知識(shí)圖譜繪制歸結(jié)為數(shù)據(jù)提取、分析單元確定赖草、方法選擇学少、相似度計(jì)算、布局秧骑、可視化展現(xiàn)與圖譜解讀六個(gè)階段版确;楊思洛等人[18]認(rèn)為知識(shí)圖譜繪制由樣本數(shù)據(jù)獲取、數(shù)據(jù)清洗乎折、選擇分析單元绒疗、構(gòu)建單元關(guān)系、數(shù)據(jù)標(biāo)準(zhǔn)化骂澄、數(shù)據(jù)簡(jiǎn)化吓蘑、知識(shí)可視化、圖譜解讀八部分組成坟冲;Cobo等人[19]則將其劃分為數(shù)據(jù)檢索磨镶、數(shù)據(jù)清洗與處理、網(wǎng)絡(luò)提取健提、標(biāo)準(zhǔn)化處理琳猫、圖譜繪制、統(tǒng)計(jì)分析矩桂、可視化沸移、圖譜解讀痪伦。筆者認(rèn)為侄榴,共現(xiàn)科學(xué)知識(shí)圖譜的實(shí)現(xiàn)可看做三個(gè)層次:知識(shí)單元抽取層雹锣、知識(shí)網(wǎng)絡(luò)構(gòu)建層、知識(shí)發(fā)現(xiàn)與可視化層癞蚕,其中蕊爵,知識(shí)單元抽取是圖譜構(gòu)建的第一步,主要解決如何從數(shù)據(jù)源中抽取待分析的知識(shí)單元這一問(wèn)題桦山;知識(shí)網(wǎng)絡(luò)構(gòu)建層則對(duì)知識(shí)單元間的共現(xiàn)類(lèi)型和強(qiáng)度進(jìn)行抽取攒射,建立關(guān)系網(wǎng)絡(luò);知識(shí)發(fā)現(xiàn)與可視化層基于前期構(gòu)建的知識(shí)單元網(wǎng)絡(luò)恒水,利用聚類(lèi)技術(shù)会放、社會(huì)網(wǎng)絡(luò)分析、多維尺度分析等方法對(duì)知識(shí)單元間的共現(xiàn)關(guān)系和潛在規(guī)律進(jìn)行挖掘钉凌,并通過(guò)可視化手段將數(shù)據(jù)及統(tǒng)計(jì)分析結(jié)果映射到圖形屬性咧最。圖2結(jié)合共現(xiàn)圖譜繪制軟件VOSviewer中涉及的關(guān)鍵技術(shù),對(duì)共現(xiàn)科學(xué)知識(shí)圖譜的一般處理流程進(jìn)行了歸納御雕,以便讀者進(jìn)一步理解和掌握?qǐng)D譜實(shí)現(xiàn)技術(shù)和流程矢沿。
2.2.1?知識(shí)單元抽取層
文獻(xiàn)數(shù)據(jù)獲取與整理。共現(xiàn)科學(xué)知識(shí)圖譜的數(shù)據(jù)來(lái)源是科學(xué)知識(shí)域(Knowledge
Domains)酸纲,其載體主要是某一主題相關(guān)的科學(xué)文獻(xiàn)樣本數(shù)據(jù)[20]捣鲸,因此,圖譜繪制的質(zhì)量闽坡、合理性與可靠性很大程度上依賴(lài)于文獻(xiàn)樣本數(shù)據(jù)的準(zhǔn)確性和全面性栽惶。國(guó)際層面研究中Web of Science、Scopus疾嗅、Google Scholar是較為常用的數(shù)據(jù)獲取來(lái)源外厂,國(guó)內(nèi)研究則主要集中于中國(guó)知網(wǎng)、萬(wàn)方或中文社會(huì)科學(xué)引文索引(CSSCI)宪迟,不同數(shù)據(jù)源在收錄范圍酣衷、計(jì)量指標(biāo)、領(lǐng)域分類(lèi)標(biāo)準(zhǔn)等方面各有不同次泽,研究者需立足其優(yōu)劣穿仪,根據(jù)研究目的選擇合適的樣本數(shù)據(jù)[21]。其次意荤,獲取特定學(xué)科或領(lǐng)域的樣本文獻(xiàn)集時(shí)常采用基于關(guān)鍵詞組合[22]啊片、主流期刊[23]、特定作者/機(jī)構(gòu)/國(guó)家[24]玖像、相關(guān)領(lǐng)域/學(xué)科分類(lèi)[25]的檢索式紫谷。在獲取樣本文獻(xiàn)集后,對(duì)不同格式和質(zhì)量的數(shù)據(jù)進(jìn)行預(yù)處理和清洗也是必要的,共現(xiàn)圖譜繪制可能涉及的數(shù)據(jù)清洗類(lèi)型有[26]:重復(fù)數(shù)據(jù)笤昨、拼寫(xiě)錯(cuò)誤或不完整數(shù)據(jù)祖驱、同形異義、同義異形瞒窒、通用性強(qiáng)或無(wú)意義的詞等捺僻。
知識(shí)單元提取與篩選。知識(shí)單元是共現(xiàn)圖譜構(gòu)建的基本元素崇裁,其來(lái)源可分為兩類(lèi):一是直接利用作者匕坯、機(jī)構(gòu)、被引文獻(xiàn)和關(guān)鍵詞等文獻(xiàn)著錄項(xiàng)拔稳;二是從標(biāo)題葛峻、摘要和全文中提取詞源(術(shù)語(yǔ)),由于詞源(術(shù)語(yǔ))提取更具復(fù)雜性巴比,現(xiàn)有研究日益將共詞分析的詞源選擇問(wèn)題納入深入研究范圍[27]术奖。此外,受研究工具匿辩、統(tǒng)計(jì)分析過(guò)程限制及出于提高結(jié)果分析與可視化效用的目的腰耙,研究者通常選擇部分知識(shí)單元繪制共現(xiàn)圖譜,這使得知識(shí)單元篩選也成為一個(gè)難以解決的問(wèn)題铲球,當(dāng)前研究大多根據(jù)相關(guān)指標(biāo)或方法篩選出核心知識(shí)單元(如表1)挺庞,但對(duì)其篩選標(biāo)準(zhǔn)并沒(méi)有達(dá)成統(tǒng)一見(jiàn)解,很大程度上放大了知識(shí)單元過(guò)濾的主觀(guān)性和不確定性稼病。
2.2.2 知識(shí)網(wǎng)絡(luò)構(gòu)建
傳統(tǒng)共現(xiàn)矩陣構(gòu)建选侨。網(wǎng)絡(luò)是對(duì)復(fù)雜系統(tǒng)的簡(jiǎn)化表示然走,通過(guò)抽取復(fù)雜系統(tǒng)中的關(guān)系模式,利用點(diǎn)和連線(xiàn)可建立抽象網(wǎng)絡(luò)結(jié)構(gòu)晨仑,共現(xiàn)科學(xué)知識(shí)圖譜構(gòu)建主要基于共現(xiàn)矩陣形式所表現(xiàn)的網(wǎng)絡(luò)拆檬。為有效提取樣本文獻(xiàn)集中的知識(shí)單元關(guān)系矩陣,通常先構(gòu)造一個(gè)行動(dòng)者集合*事件集合形式的M*N維屬性矩陣O(occurancematrix)(M指行動(dòng)者集合的數(shù)量答捕,N指行動(dòng)者集合中所有或部分知識(shí)單元的個(gè)數(shù)屑那,Okj表示第k個(gè)行動(dòng)者與第j個(gè)知識(shí)單元的數(shù)量關(guān)系)[28]艘款,其中沃琅,“行動(dòng)者”可以是文獻(xiàn)哗咆、作者、期刊阵难、機(jī)構(gòu)等主體岳枷,“事件”指不同類(lèi)型的知識(shí)單元芒填,如作者呜叫、關(guān)鍵詞、參考文獻(xiàn)殿衰,若行動(dòng)者集合為文獻(xiàn)朱庆,事件集合為該文獻(xiàn)集所包含的關(guān)鍵詞,得到的屬性矩陣O表示某篇文獻(xiàn)k是否包含或包含關(guān)鍵詞j的數(shù)量闷祥。?
基于屬性矩陣O進(jìn)行變換可得到的一個(gè)N階對(duì)稱(chēng)方陣娱颊,即共現(xiàn)矩陣C(co-occurrencematrix),其中凯砍,對(duì)屬性矩陣O的轉(zhuǎn)換方式可分為基于事件轉(zhuǎn)換和基于行動(dòng)者轉(zhuǎn)換兩種(表2)箱硕,基于事件轉(zhuǎn)換可構(gòu)建詞共現(xiàn)、合作悟衩、共被引等共現(xiàn)矩陣剧罩,基于行動(dòng)者轉(zhuǎn)換可構(gòu)建起耦合形式的共現(xiàn)矩陣,若屬性矩陣O表示樣本文獻(xiàn)集*被引文獻(xiàn)的關(guān)系座泳,基于事件轉(zhuǎn)換的結(jié)果是文獻(xiàn)共被引矩陣惠昔,基于行動(dòng)者轉(zhuǎn)換的結(jié)果為文獻(xiàn)耦合網(wǎng)絡(luò)。筆者以事件集合(x軸)挑势、行動(dòng)者集合(y軸)镇防、轉(zhuǎn)換方式(z軸)建立三維坐標(biāo)系,構(gòu)建起如圖3所示的具有廣泛適用性的共現(xiàn)矩陣實(shí)現(xiàn)模型啦扬。
共現(xiàn)矩陣構(gòu)建的另一關(guān)鍵問(wèn)題是通過(guò)對(duì)共現(xiàn)矩陣的相似度度量消除量綱數(shù)量級(jí)差異造成的不可比性考传,通常采用相似度計(jì)算對(duì)共現(xiàn)矩陣進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換勤晚,形成相似矩陣(similarity
matrix)赐写,共現(xiàn)數(shù)據(jù)相似性計(jì)算有兩種方式[29],一是根據(jù)共現(xiàn)次數(shù)這一單一指標(biāo)來(lái)計(jì)算端铛,如Pearson相關(guān)系數(shù)禾蚕;二是根據(jù)兩個(gè)節(jié)點(diǎn)的共現(xiàn)次數(shù)、兩個(gè)節(jié)點(diǎn)各自出現(xiàn)的次數(shù)這三個(gè)指標(biāo)來(lái)計(jì)算倍试,如cosine县习、Jaccard index、association攘已、strength样勃,他們的數(shù)學(xué)原理不同會(huì)給計(jì)算結(jié)果造成顯著影響,但目前學(xué)術(shù)界尚未就不同相似度測(cè)度算法達(dá)成共識(shí)辫樱。
傳統(tǒng)共現(xiàn)矩陣的改進(jìn)鸡挠。傳統(tǒng)關(guān)系矩陣以知識(shí)單元的共現(xiàn)頻次為基礎(chǔ)衡量知識(shí)單元之間的相關(guān)性,這不可避免會(huì)存在“共現(xiàn)即相關(guān)”备埃、“同量即同質(zhì)”等缺陷按脚,因此,越來(lái)越多學(xué)者開(kāi)始注重對(duì)知識(shí)單元矩陣的優(yōu)化,試圖引進(jìn)更優(yōu)的相關(guān)性計(jì)算方法測(cè)度知識(shí)單元間的相關(guān)關(guān)系夯缺。其一是進(jìn)行差異化(加權(quán))處理,突出核心知識(shí)單元或共現(xiàn)邊的主導(dǎo)作用,如吳清強(qiáng)等人[30]根據(jù)文獻(xiàn)來(lái)源期刊的重要程度對(duì)關(guān)鍵詞賦予權(quán)重垫言,朱麗娟等人[31]提出將作者貢獻(xiàn)、作者之間人際關(guān)系凛捏、作者的學(xué)科及機(jī)構(gòu)等因素引入合作網(wǎng)絡(luò)邊權(quán)計(jì)算坯癣;其二是考慮語(yǔ)義相關(guān)性示罗,如唐曉波等人[32]引入領(lǐng)域本體計(jì)算高頻關(guān)鍵詞間的語(yǔ)義相似度帆锋,王玉林等人[33]則提出借助RDF三元組對(duì)知識(shí)單元進(jìn)行語(yǔ)義關(guān)聯(lián)化。
2.2.3 知識(shí)發(fā)現(xiàn)與可視化層
關(guān)系矩陣并不能直觀(guān)的傳遞有價(jià)值的信息实辑,需要借助統(tǒng)計(jì)分析方法和可視化技術(shù)構(gòu)建知識(shí)圖譜[34]剪撬,進(jìn)一步揭示知識(shí)單元間的潛在規(guī)律,實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)±嫠現(xiàn)有共現(xiàn)科學(xué)知識(shí)圖譜工具主要提供兩種類(lèi)型的知識(shí)發(fā)現(xiàn)與可視化方式:其一是直接將知識(shí)單元間的關(guān)系轉(zhuǎn)換為圖疫诽,即引入布局算法,按照特定方式將知識(shí)單元排列于圖中摩钙,從知識(shí)單元的位置對(duì)圖譜進(jìn)行解讀腺律;其二是利用統(tǒng)計(jì)算法對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)度,包括網(wǎng)絡(luò)總體特征之斯、網(wǎng)絡(luò)模塊化佑刷、節(jié)點(diǎn)中心度涨冀、節(jié)點(diǎn)路徑特征鹿鳖、節(jié)點(diǎn)、動(dòng)態(tài)度等涝滴,當(dāng)然,對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)及關(guān)系的測(cè)度值也會(huì)在外觀(guān)上作用于節(jié)點(diǎn)和邊腋妙,并映射到圖形屬性[35]。
網(wǎng)絡(luò)布局愚屁。筆者參照Eck和Waltman等人[36]提出的網(wǎng)絡(luò)布局分類(lèi),將目前應(yīng)用于共現(xiàn)科學(xué)知識(shí)圖譜的布局算法分為三類(lèi)(表3):基于距離法丘跌、基于圖法和基于時(shí)間線(xiàn)法闭树,基于距離的布局利用節(jié)點(diǎn)間的距離揭示節(jié)點(diǎn)間的共現(xiàn)強(qiáng)度,典型算法包括多維尺度法碍现、VOS布局昼接、VxOrd逐工、DrL钻弄、OpenOrd等;基于圖的布局也將節(jié)點(diǎn)布局在二維或多維空間中瘤泪,但節(jié)點(diǎn)間的距離不代表二者關(guān)系的強(qiáng)弱对途,而是用連線(xiàn)表示,典型算法有Kamada-Kawai膳犹、Fruchterman-Reingold等须床,這些算法通常與尋徑網(wǎng)絡(luò)、最小生成樹(shù)算法結(jié)合使用族阅,以達(dá)到修剪網(wǎng)絡(luò)的目的耘分;而基于時(shí)間線(xiàn)的布局則包括兩個(gè)維度央渣,一個(gè)維度用來(lái)反映時(shí)序關(guān)系,另一個(gè)用來(lái)揭示節(jié)點(diǎn)之間的聯(lián)系拔第,其通常與前兩種布局算法結(jié)合使用蚊俺∮锯總體來(lái)說(shuō),現(xiàn)有布局算法均針對(duì)速度和美觀(guān)方面進(jìn)行優(yōu)化忙上,主要目的體現(xiàn)在減少重疊疫粥、統(tǒng)一邊長(zhǎng)度手形、實(shí)現(xiàn)對(duì)稱(chēng)等伙狐。
統(tǒng)計(jì)分析罢防。在網(wǎng)絡(luò)統(tǒng)計(jì)分析方面咒吐,對(duì)網(wǎng)絡(luò)個(gè)體(節(jié)點(diǎn)和連線(xiàn))候生、模塊化(小團(tuán)體)、主干骨架及整體特性的測(cè)度是當(dāng)前的主流方式(表4)目溉。對(duì)網(wǎng)絡(luò)個(gè)體的測(cè)度目的是探討某一知識(shí)單元在網(wǎng)絡(luò)中的權(quán)力缭付,而當(dāng)網(wǎng)絡(luò)中某些知識(shí)單元間的關(guān)系特別緊密陷猫,以至于結(jié)合成一個(gè)次級(jí)子網(wǎng)絡(luò)時(shí),這樣的子網(wǎng)絡(luò)通常被稱(chēng)為“小團(tuán)體”河咽,通過(guò)網(wǎng)絡(luò)模塊化的方法可進(jìn)行知識(shí)單元小團(tuán)體發(fā)現(xiàn)。此外媚值,由于特定領(lǐng)域或?qū)W科的產(chǎn)生及發(fā)展取決于為數(shù)不多的關(guān)鍵文獻(xiàn)褥芒,也有學(xué)者將主路徑分析引入共現(xiàn)圖譜中锰扶,用以識(shí)別關(guān)鍵文獻(xiàn)、關(guān)鍵人物和關(guān)鍵事件京闰,從而更好地刻畫(huà)領(lǐng)域發(fā)展脈絡(luò)和知識(shí)演化過(guò)程蹂楣。
可視化映射乾翔。網(wǎng)絡(luò)布局和統(tǒng)計(jì)算法從量化的角度進(jìn)行圖譜測(cè)度反浓,而可視化手段則將測(cè)度結(jié)果反映到圖形屬性上。Wilkinson在2005年創(chuàng)建了一套描述統(tǒng)計(jì)圖形深層特性的語(yǔ)法規(guī)則[37]月劈,指出統(tǒng)計(jì)圖形是從數(shù)據(jù)到幾何對(duì)象(如點(diǎn)猜揪、線(xiàn)、條形等)的圖形屬性(如顏色拴念、大小、形狀等)的映射公般,這其中包含數(shù)據(jù)統(tǒng)計(jì)變換俐载,最后繪制在某個(gè)特定坐標(biāo)系中[38]揽浙。反映到共現(xiàn)圖譜上膛虫,知識(shí)網(wǎng)絡(luò)中知識(shí)單元稍刀、連線(xiàn)的出現(xiàn)及共現(xiàn)頻次、時(shí)間澳迫、所屬類(lèi)團(tuán)及其他統(tǒng)計(jì)測(cè)度值均可映射到圖譜屬性抓歼,如節(jié)點(diǎn)大小反映知識(shí)單元出現(xiàn)頻次,節(jié)點(diǎn)顏色代表出現(xiàn)時(shí)間蹋半,連線(xiàn)粗細(xì)反映知識(shí)單元對(duì)之間的共現(xiàn)強(qiáng)度湃窍。在此基礎(chǔ)上,布局算法與圖譜屬性進(jìn)一步融合茵休,形成多種類(lèi)型的可視化圖譜,如反映單元模塊化和結(jié)構(gòu)性的聚類(lèi)視圖手蝎,展現(xiàn)類(lèi)團(tuán)發(fā)展演化的時(shí)間線(xiàn)圖和時(shí)區(qū)圖榕莺,反映密度關(guān)系的熱力圖等,筆者借鑒Ognyanova[39]提出的網(wǎng)絡(luò)可視化框架棵介,將共現(xiàn)圖譜從知識(shí)單元到圖形屬性的映射歸結(jié)為四大要素:映射主體钉鸯、映射中介、映射結(jié)果和可視化目標(biāo)(圖4)邮辽,其中贸营,“映射主體”指知識(shí)單元、連線(xiàn)、類(lèi)團(tuán)的統(tǒng)計(jì)屬性蒲拉,如出現(xiàn)頻次猛蔽、共現(xiàn)頻次和時(shí)間;“映射中介”指用以進(jìn)行可視化的圖形屬性,如顏色挠蛉、位置、大小和形狀;“映射結(jié)果”指從統(tǒng)計(jì)屬性到圖形屬性的最終視圖恢口,如聚類(lèi)視圖婚被、熱力圖禀挫、弧圖和時(shí)間線(xiàn)圖画拾,這三者共同實(shí)現(xiàn)共現(xiàn)圖譜“可視化目標(biāo)”,即突出關(guān)鍵節(jié)點(diǎn)和連線(xiàn)汽畴、反映關(guān)系強(qiáng)度、展示網(wǎng)絡(luò)結(jié)構(gòu)痹仙、發(fā)現(xiàn)小團(tuán)體隔箍、洞察知識(shí)擴(kuò)散及演化規(guī)律捡遍。
3 共現(xiàn)科學(xué)知識(shí)圖譜繪制工具
根據(jù)可處理數(shù)據(jù)類(lèi)型的不同,將目前主流的共現(xiàn)圖譜軟件分為兩類(lèi)(表5):第一類(lèi)是以Pajek脖含、Gephi归露、UCINET為代表的通用網(wǎng)絡(luò)分析工具馍迄,第二類(lèi)是以CiteSpace幌缝、VOSviewer為代表的文獻(xiàn)專(zhuān)用圖譜繪制工具萝玷,筆者分別從可分析的圖譜類(lèi)型相味、數(shù)據(jù)格式要求凛辣、統(tǒng)計(jì)分析功能贱纠、可視化及優(yōu)勢(shì)等方面對(duì)當(dāng)前主流共現(xiàn)圖譜繪制軟件進(jìn)行歸納和對(duì)比。
表5表明纪隙,共現(xiàn)圖譜繪制工具在統(tǒng)計(jì)分析和可視化等方面存在很大不同,目前尚缺乏較完備的工具能將共現(xiàn)科學(xué)知識(shí)圖譜繪制過(guò)程中所涉及的技術(shù)和功能囊括在內(nèi)架曹,要進(jìn)行深入分析需借助多種不同工具覆旱,而這其中涉及的一個(gè)關(guān)鍵問(wèn)題是如何實(shí)現(xiàn)不同數(shù)據(jù)格式的轉(zhuǎn)換。通常來(lái)講,共現(xiàn)科學(xué)知識(shí)圖譜繪制常見(jiàn)的數(shù)據(jù)處理方式包括四種:一是從特定數(shù)據(jù)庫(kù)中下載不同格式的文獻(xiàn)題錄信息直接導(dǎo)入相應(yīng)軟件术幔;二是借助bibexcel、SATI肛鹏、bicomb等工具抽取文獻(xiàn)記錄的字段信息裹芝,在進(jìn)行頻次統(tǒng)計(jì)和生成共現(xiàn)矩陣(表)后導(dǎo)入支持的科學(xué)知識(shí)圖譜軟件;三是利用自編程序提取共現(xiàn)數(shù)據(jù)導(dǎo)入特定軟件好爬;四是借助科學(xué)知識(shí)圖譜軟件提供的數(shù)據(jù)互操作功能(表6)局雄,其中,CiteSpace導(dǎo)出的矩陣數(shù)據(jù)支持的工具類(lèi)型較多存炮,但沒(méi)有可接受的知識(shí)圖譜類(lèi)軟件數(shù)據(jù)格式炬搭,而Pajek、UCINET相對(duì)更具開(kāi)放性穆桂。
4 發(fā)展趨勢(shì)和挑戰(zhàn)
根據(jù)前文對(duì)共現(xiàn)科學(xué)知識(shí)圖譜構(gòu)建技術(shù)與工具的梳理, 我們可以對(duì)當(dāng)前挑戰(zhàn)和研究趨勢(shì)做一些回顧和預(yù)測(cè)(圖5)宫盔。
4.1 知識(shí)單元選擇的客觀(guān)性、細(xì)粒度與多源性
繪制共現(xiàn)知識(shí)圖譜的基礎(chǔ)性工作是選擇知識(shí)單元享完,而知識(shí)單元的過(guò)多或過(guò)少都會(huì)對(duì)共現(xiàn)圖譜效果產(chǎn)生直接影響灼芭,這突出體現(xiàn)在:
知識(shí)單元選擇的客觀(guān)性與細(xì)粒度。合作般又、共被引等共現(xiàn)圖譜的知識(shí)單元相對(duì)明確彼绷,在篩選過(guò)程中所要解決的是選擇“何種篩選標(biāo)準(zhǔn)”以及選取“多少節(jié)點(diǎn)”的問(wèn)題,而對(duì)于共詞圖譜來(lái)說(shuō)茴迁,元數(shù)據(jù)描述取詞或全文自動(dòng)標(biāo)引取詞的詞源選擇問(wèn)題寄悯,以及自然語(yǔ)言的不可控性所帶來(lái)的詞匯規(guī)范化[40]使其繪制更具復(fù)雜性和主觀(guān)性,雖然部分學(xué)者對(duì)共詞分析的詞源選擇問(wèn)題進(jìn)行了探索性或?qū)Ρ刃苑治龆橐澹ú煌~源選擇的應(yīng)用對(duì)比猜旬、術(shù)語(yǔ)規(guī)范化的必要性和規(guī)范方法研究以及詞匯抽取的細(xì)粒度探究,但在研究結(jié)果上依然存在分歧倦卖。如何尋求更為科學(xué)有效的知識(shí)單元篩選方法洒擦,減少知識(shí)單元過(guò)濾的主觀(guān)性和不確定性?如何突破單純基于“元數(shù)據(jù)描述單元”的統(tǒng)計(jì)怕膛,研究有效算法提取粒度更細(xì)的“知識(shí)單元”熟嫩?這些問(wèn)題的解決都需要在未來(lái)研究中不斷探索。
知識(shí)單元選擇的多源性褐捻。科學(xué)交流系統(tǒng)不僅局限在科學(xué)技術(shù)文獻(xiàn)等正式交流渠道邦危,數(shù)字化與網(wǎng)絡(luò)化語(yǔ)境推動(dòng)下網(wǎng)絡(luò)計(jì)量學(xué)與替代計(jì)量學(xué)的興起洋侨,為共現(xiàn)圖譜的繪制帶來(lái)了更具創(chuàng)新性、可計(jì)量非正式交流特征的節(jié)點(diǎn)類(lèi)型倦蚪,如學(xué)術(shù)社區(qū)中知識(shí)主體的互動(dòng)希坚、網(wǎng)絡(luò)環(huán)境下知識(shí)單元的提及等,這種綜合多源知識(shí)單元的共現(xiàn)圖譜能更好反映知識(shí)類(lèi)別界限陵且、所構(gòu)建的知識(shí)網(wǎng)絡(luò)更為緊密[41]裁僧,如何挖掘存在于傳統(tǒng)科學(xué)文獻(xiàn)之外的新興知識(shí)單元,并將其有效融入共現(xiàn)知識(shí)圖譜中[42]慕购,更加全面反映學(xué)術(shù)景觀(guān)自然成為一個(gè)具有挑戰(zhàn)性的課題聊疲。
4.2 知識(shí)網(wǎng)絡(luò)構(gòu)建的差異化、語(yǔ)義化與多維性
傳統(tǒng)共現(xiàn)圖譜的實(shí)現(xiàn)有兩大基本假設(shè)沪悲,一是“共現(xiàn)即相關(guān)”假設(shè)获洲,即假設(shè)節(jié)點(diǎn)共現(xiàn)便意味著節(jié)點(diǎn)相關(guān),但事實(shí)上知識(shí)單元間是存在直接共現(xiàn)關(guān)系和間接語(yǔ)義關(guān)聯(lián)的殿如,這種研究假設(shè)缺乏對(duì)知識(shí)單元間語(yǔ)義關(guān)系的揭示贡珊,一定程度上簡(jiǎn)化了網(wǎng)絡(luò)復(fù)雜性,未能有效揭示整體網(wǎng)絡(luò)的結(jié)構(gòu)和特征信息[43]涉馁。二是“同量即同質(zhì)”假設(shè)门岔,即假設(shè)頻次相等,則重要性和相關(guān)性強(qiáng)度也相等烤送,但從信息理論學(xué)寒随、語(yǔ)言學(xué)及科研貢獻(xiàn)度的觀(guān)點(diǎn)來(lái)看,不同詞性帮坚、位置等要素的詞匯對(duì)文獻(xiàn)表達(dá)的貢獻(xiàn)程度是存在差異的妻往,不同學(xué)者在網(wǎng)絡(luò)中的地位也是不一樣的,有效區(qū)分節(jié)點(diǎn)的差異性试和,考慮“同量不同質(zhì)”讯泣,能更加客觀(guān)、真實(shí)反映科學(xué)交流系統(tǒng)內(nèi)部要素的關(guān)聯(lián)灰署。針對(duì)“共現(xiàn)不一定相關(guān)”、“同量不一定同質(zhì)”這兩大問(wèn)題局嘁,已有學(xué)者探索對(duì)知識(shí)單元及邊進(jìn)行加權(quán)處理溉箕,以及研究有效測(cè)度節(jié)點(diǎn)間語(yǔ)義關(guān)系的算法[44],但大多處于探索性階段悦昵,現(xiàn)成知識(shí)圖譜繪制軟件中也僅有VOSviewer[45]將節(jié)點(diǎn)差異化算法嵌入肴茄。
此外,共現(xiàn)科學(xué)知識(shí)圖譜將抽象的計(jì)量信息表征為可視化的網(wǎng)絡(luò)但指,本質(zhì)是對(duì)網(wǎng)絡(luò)的分析與可視化寡痰,已有研究表明抗楔,將多模網(wǎng)絡(luò)、多節(jié)點(diǎn)共現(xiàn)引入共現(xiàn)圖譜有利于增強(qiáng)圖譜信息揭示能力拦坠,將網(wǎng)絡(luò)動(dòng)態(tài)演化機(jī)制應(yīng)用于共現(xiàn)圖譜能更加真實(shí)的模擬網(wǎng)絡(luò)演化特征[46]连躏,探討如何將網(wǎng)絡(luò)結(jié)構(gòu)維度上的異構(gòu)、多模特征及時(shí)間維度上的演化特征引入共現(xiàn)圖譜是當(dāng)前面臨的一個(gè)重要問(wèn)題贞滨。
4.3 知識(shí)發(fā)現(xiàn)方法優(yōu)化與計(jì)算能力提高
學(xué)術(shù)領(lǐng)域?qū)铂F(xiàn)圖譜的知識(shí)發(fā)現(xiàn)基本遵循“相似性測(cè)度+統(tǒng)計(jì)分析”的思路入热,在節(jié)點(diǎn)相似度計(jì)算方面,主要基于共現(xiàn)頻次這一基本指標(biāo)衍生晓铆,包括互信息度算法勺良、association strength、inclusion index骄噪、Jaccard’s coefficient尚困、Salton’s cosine(Ochiia系數(shù)),如文獻(xiàn)共被引代表者Small主張采用Salton’s cosine或Jaccard’s coefficient測(cè)度[47]链蕊,作者共被引代表者White傾向于Pearson相關(guān)系數(shù)[48]事甜,Leydesdorff則認(rèn)為Pearson相關(guān)系數(shù)和cosine測(cè)度只適用于非對(duì)稱(chēng)矩陣而不適用于對(duì)稱(chēng)矩陣[49],在當(dāng)前相似度計(jì)算算法眾說(shuō)紛紜的情形下示弓,有必要對(duì)不同算法應(yīng)用于不同共現(xiàn)圖譜的效果進(jìn)行對(duì)比研究讳侨,分析各類(lèi)測(cè)度算法間的內(nèi)在聯(lián)系及適用場(chǎng)景,提高后期統(tǒng)計(jì)分析的準(zhǔn)確性和針對(duì)性奏属。
在統(tǒng)計(jì)分析層面跨跨,突現(xiàn)檢測(cè)、聚類(lèi)分析囱皿、多維尺度分析勇婴、社會(huì)網(wǎng)絡(luò)分析和主路徑分析一直占據(jù)主導(dǎo)地位,突現(xiàn)檢測(cè)用于提取突發(fā)術(shù)語(yǔ)嘱腥,適用于識(shí)別研究前沿耕渴,聚類(lèi)分析可識(shí)別不同類(lèi)團(tuán),使得類(lèi)團(tuán)內(nèi)節(jié)點(diǎn)具有高相似度齿兔、類(lèi)團(tuán)間存在較大差異橱脸,多維尺度分析則對(duì)聚類(lèi)分析起進(jìn)一步矯正作用,不僅可識(shí)別具有高相似度的類(lèi)團(tuán)分苇,還可判定各節(jié)點(diǎn)在網(wǎng)絡(luò)中的相對(duì)位置和核心程度添诉,社會(huì)網(wǎng)絡(luò)分析常用于探索學(xué)者、機(jī)構(gòu)等主體間的合作關(guān)系医寿,主路徑分析則在演化脈絡(luò)栏赴、關(guān)鍵節(jié)點(diǎn)識(shí)別方面更具優(yōu)勢(shì),各類(lèi)統(tǒng)計(jì)分析方法的應(yīng)用場(chǎng)景存在一定區(qū)別靖秩,需要對(duì)各類(lèi)方法的優(yōu)劣勢(shì)和適用性作進(jìn)一步對(duì)比和梳理须眷。另外竖瘾,現(xiàn)有統(tǒng)計(jì)分析方法在參數(shù)選擇、分析過(guò)程等方面也存在一定模糊性花颗,如聚類(lèi)分析中類(lèi)團(tuán)數(shù)量的選擇捕传、類(lèi)間距離的選擇、類(lèi)團(tuán)標(biāo)簽的確定等捎稚,這些懸而未決的問(wèn)題使得共現(xiàn)圖譜的繪制充滿(mǎn)主觀(guān)性乐横,進(jìn)而導(dǎo)致研究人員對(duì)統(tǒng)計(jì)結(jié)果的解讀缺乏準(zhǔn)確性與科學(xué)性。
在計(jì)算能力層面今野,大數(shù)據(jù)環(huán)境下共現(xiàn)圖譜的規(guī)模急劇擴(kuò)大葡公,這對(duì)計(jì)算機(jī)硬件及數(shù)據(jù)分析算法的性能提出更高的要求,探索能高效處理大規(guī)模条霜、復(fù)雜化數(shù)據(jù)集的統(tǒng)計(jì)分析算法催什、尋求基于分布式計(jì)算機(jī)集群的云處理技術(shù)將更加清晰、快速的展示和發(fā)現(xiàn)海量知識(shí)單元間的復(fù)雜關(guān)系宰睡。
4.4 圖譜解讀的科學(xué)性與規(guī)范性
知識(shí)單元間的關(guān)系表現(xiàn)在多個(gè)層面和多種類(lèi)型蒲凶,其原理既有相似性又存在差別,進(jìn)而繪制的知識(shí)圖譜在科學(xué)研究結(jié)構(gòu)的揭示能力上具有相似性但又各具獨(dú)特性拆内,知識(shí)基礎(chǔ)旋圆、研究熱點(diǎn)、研究前沿麸恍、演進(jìn)脈絡(luò)等不同分析目標(biāo)需要借助與之對(duì)應(yīng)的圖譜類(lèi)型灵巧,如基于共詞網(wǎng)絡(luò)的研究熱點(diǎn)識(shí)別、基于共被引網(wǎng)絡(luò)的知識(shí)基礎(chǔ)研究等抹沪,當(dāng)前對(duì)不同網(wǎng)絡(luò)結(jié)構(gòu)信息揭示能力的比較和內(nèi)在機(jī)理研究相對(duì)缺乏刻肄,使得研究結(jié)果千差萬(wàn)別,圖譜解讀欠缺科學(xué)性與規(guī)范性[50-51]融欧。
5 結(jié)語(yǔ)
作為一種將各類(lèi)信息載體中的共現(xiàn)現(xiàn)象定量化的有效手段和方法[52]敏弃,幾十年來(lái)共現(xiàn)分析一直廣受圖情領(lǐng)域研究者青睞,并跨學(xué)科延伸至多領(lǐng)域噪馏,而融合圖形學(xué)麦到、認(rèn)知科學(xué)及可視化等技術(shù)的共現(xiàn)科學(xué)知識(shí)圖譜更有利推動(dòng)了共現(xiàn)分析的快速發(fā)展與革新,并在基礎(chǔ)理論欠肾、方法研究和應(yīng)用實(shí)踐方面取得顯著成果瓶颠,無(wú)數(shù)研究表明,在可預(yù)見(jiàn)的未來(lái)董济,共現(xiàn)科學(xué)知識(shí)圖譜的“知識(shí)圖形可視化”與“知識(shí)譜系序列化”特征[53-54]及知識(shí)單元提取步清、網(wǎng)絡(luò)構(gòu)建要门、知識(shí)發(fā)現(xiàn)與可視化等各環(huán)節(jié)的優(yōu)化將進(jìn)一步拓寬和深化基于海量數(shù)據(jù)的知識(shí)組織與發(fā)現(xiàn)虏肾,促進(jìn)研究范式的變革與更迭廓啊。
參考文獻(xiàn):
[1]? Price D J. NETWORKS OF SCIENTIFIC PAPERS[J].Science, 1965, 149(3683):510-515.
[2]? Small H. Co‐citation in the scientific literature:A new measure of the relationship between two documents[J]. Journal of theAmerican Society for Information Science & Technology, 1973, 24(4):265-269.
[3]? Callon M,Courtial J J P, Turner W A, et al. From translations to problematic networks - anintroduction to co-word analysis. Soc Sci Inf Sur Les Sci Soc[J]. SocialScience Information, 1983, 22(2):191-235.
[4]? Peters H PF, Raan A F J V. Structuring scientific activities by co-author analysis[J].Scientometrics, 1991, 20(1):235-255.
[5]? 陳悅, 劉則淵. 悄然興起的科學(xué)知識(shí)圖譜[J]. 科學(xué)學(xué)研究, 2005, 23(2):149-154.
[6]? 李明鑫, 王松. 近十年國(guó)內(nèi)知識(shí)圖譜研究脈絡(luò)及主題分析[J]. 圖書(shū)情報(bào)知識(shí), 2016(4):93-101.
[7]? 王發(fā)明, 朱美娟. 國(guó)內(nèi)區(qū)塊鏈研究熱點(diǎn)的文獻(xiàn)計(jì)量分析[J]. 情報(bào)雜志, 2017(12):69-74.
[8]? 趙蓉英, 魏明坤. 基于可視化圖譜的國(guó)內(nèi)外大數(shù)據(jù)研究[J]. 情報(bào)科學(xué), 2016, V34(12):3-10.
[9]? Shiffrin RM, B?rner K. Mapping knowledge domains.[J]. Proc Natl Acad Sci U S A, 2004, 101Suppl 1(Supplement 1):5183-5185.
[10] 曹樹(shù)金, 吳育冰, 韋景竹,等. 知識(shí)圖譜研究的脈絡(luò)、流派與趨勢(shì)——基于SSCI與CSSCI期刊論文的計(jì)量與可視化[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2015, 41(5):16-34.
[11] Chen C. Science Mapping:A Systematic Review ofthe Literature[J]. Journal of Data and Information Science, 2017, 2(2):1-40.
[12] Bishop A P.Digital libraries and knowledge disaggregation:the use of journal articlecomponents[C]// ACM Conference on Digital Libraries. ACM, 1998:29-39.
[13] 曹樹(shù)金, 李潔娜, 王志紅. 面向網(wǎng)絡(luò)信息資源聚合搜索的細(xì)粒度聚合單元元數(shù)據(jù)研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2017, 43(4):74-92.
[14] Sugimoto CR, Mccain K W. Visualizing changes over time: A history of informationretrieval through the lens of descriptor tri-occurrence mapping.[J]. Journal ofInformation Science, 2010, 36(4):481-493.
[15] 楊立英. 科技論文共現(xiàn)理論研究與應(yīng)用[D]. 中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心, 2007.
[16] 張超星, 劉小玲, 譚宗穎. 圖情領(lǐng)域的大共現(xiàn)及其發(fā)展現(xiàn)狀[J]. 情報(bào)資料工作, 2016, 37(1):27-33.
[17] B?rner K,Chen C, Boyack K W. Visualizing knowledge domains[J]. Annual Review ofInformation Science & Technology, 2003, 37(1):179-255.
[18] 楊思洛, 韓瑞珍. 國(guó)外知識(shí)圖譜繪制的方法與工具分析[J]. 圖書(shū)情報(bào)知識(shí), 2012(6):101-109.
[19] Cobo M J,Herrera-Viedma E, Herrera F. Science mapping software tools: Review, analysis,and cooperative study among tools[J]. Journal of the Association forInformation Science & Technology, 2014, 62(7):1382-1402.
[20] 楊萌, 張?jiān)浦? 知識(shí)地圖封豪、科學(xué)知識(shí)圖譜和谷歌知識(shí)圖譜的分歧和交互[J]. 情報(bào)理論與實(shí)踐, 2017, 40(5):122-126.
[21] Harzing A W, Alakangas S.Google Scholar, Scopus and the Web of Science: A longitudinal andcross-disciplinary comparison[J]. Scientometrics, 2016, 106(2):787-804
[22] 孫建軍. 鏈接分析:知識(shí)基礎(chǔ)谴轮、研究主體、研究熱點(diǎn)與前沿綜述——基于科學(xué)知識(shí)圖譜的途徑[J]. 情報(bào)學(xué)報(bào), 2014, 33(6):659-672.
[23] 邱均平, 溫芳芳. 近五年來(lái)圖書(shū)情報(bào)學(xué)研究熱點(diǎn)與前沿的可視化分析——基于13種高影響力外文源刊的計(jì)量研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2011, 37(2):51-60.
[24] 潘有能, 譚健. 普賴(lài)斯獎(jiǎng)得主的科學(xué)合作網(wǎng)絡(luò)研究[J]. 圖書(shū)情報(bào)工作, 2012, 56(16):80-84.
[25] Zhu Y, YanE. Dynamic subfield analysis of disciplines: an examination of the tradingimpact and knowledge diffusion patterns of computer science[J]. Scientometrics,2015, 104(1):335-359.
[26] 潘瑋, 牟冬梅, 李茵,等. 關(guān)鍵詞共現(xiàn)方法識(shí)別領(lǐng)域研究熱點(diǎn)過(guò)程中的數(shù)據(jù)清洗方法[J]. 圖書(shū)情報(bào)工作, 2017, 61(7):111-117.
[27] 李綱, 巴志超. 共詞分析過(guò)程中的若干問(wèn)題研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2017, 43(4):93-113.
[28] Aria M,Cuccurullo C. bibliometrix : An R-tool for comprehensive science mappinganalysis[J]. Journal of Informetrics, 2017, 11(4):959-975.
[29] Eck N J V,Waltman L. How to normalize cooccurrence data? An analysis of some well‐known similarity measures[J].Journal of the Association for Information Science & Technology, 2010,60(8):1635-1651.
[30] 吳清強(qiáng), 趙亞娟. 基于論文屬性的加權(quán)共詞模型探討[J]. 情報(bào)學(xué)報(bào), 2008, 27(1):89-92.
[31] 朱麗娟, 于建榮. 合著關(guān)系網(wǎng)絡(luò)的加權(quán)模式研究[J]. 圖書(shū)情報(bào)工作, 2010, 54(12):69-73.
[32] 唐曉波, 肖璐. 融合關(guān)鍵詞增補(bǔ)與領(lǐng)域本體的共詞分析方法研究[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù), 2013, 29(11):60-67.
[33] 王玉林, 王忠義. 細(xì)粒度語(yǔ)義共詞分析方法研究[J]. 圖書(shū)情報(bào)工作, 2014, 58(21):73-80.
[34] 徐碩, 喬曉東, 朱禮軍,等. 共現(xiàn)聚類(lèi)分析的新方法:最大頻繁項(xiàng)集挖掘[J]. 情報(bào)學(xué)報(bào), 2012, 31(2):143-150.
[35] 劉勇, 杜一. 網(wǎng)絡(luò)數(shù)據(jù)可視化與分析利器: Gephi中文教程[M]. 北京: 電子工業(yè)出版社, 2017:3-4
[36] Eck N J V,Waltman L. Visualizing Bibliometric Networks[M]// Measuring Scholarly Impact.Springer International Publishing, 2014:285-320.
[37] Wilkinson L. The grammar of graphics[M]. Springer, 2005:85-356
[38] 哈德利?威克姆. ggplot2:數(shù)據(jù)分析與圖形藝術(shù)[M]. 西安交通大學(xué)出版社, 2013:3-4
[39] Ognyanova,K. Network visualization with R. Retrieved from www.kateto.net/network-visualization.2017
[40] 傅柱, 王曰芬. 共詞分析中術(shù)語(yǔ)收集階段的若干問(wèn)題研究[J]. 情報(bào)學(xué)報(bào), 2016, 35(7):704-713.
[41] 張洋, 謝卓力. 基于多源網(wǎng)絡(luò)學(xué)術(shù)信息聚合的知識(shí)圖譜構(gòu)建研究[J]. 圖書(shū)情報(bào)工作, 2014, 58(22):84-94.
[42] 商憲麗, 王學(xué)東, 張煜軒. 基于標(biāo)簽共現(xiàn)的學(xué)術(shù)博客知識(shí)資源聚合研究[J]. 情報(bào)科學(xué), 2016, V34(5):125-129.
[43] 巴志超, 李綱, 朱世偉. 共現(xiàn)分析中的關(guān)鍵詞選擇與語(yǔ)義度量方法研究[J]. 情報(bào)學(xué)報(bào), 2016, 35(2):197-207.
[44] 王忠義, 譚旭, 夏立新. 共詞分析方法的細(xì)粒度化與語(yǔ)義化研究[J]. 情報(bào)學(xué)報(bào), 2014(9):969-978.
[45] Perianes-RodriguezA, Waltman L, Eck N J V. Constructing bibliometric networks: A comparisonbetween full and fractional counting [J]. Journal of Informetrics, 2016,10(4):1178-1195.
[46] 黨永杰, 邱均平, 鄭世玨. 基于改進(jìn)BA模型的作者合作加權(quán)網(wǎng)絡(luò)動(dòng)態(tài)演化研究[J]. 情報(bào)學(xué)報(bào), 2017, 36(1):28-38.
[47] Small H .Tracking and predicting growth areas in science[J]. Scientometrics, 2006,68(3):595-610.
[48] White H D .Author cocitation analysis and Pearson's r[M]. John Wiley & Sons, Inc.2003.
[49] LeydesdorffL , Vaughan L . Co-occurrence matrices and their applications in informationscience: Extending ACA to the Web environment[M]. John Wiley & Sons, Inc.2006.
[50] 崔雷, 隋明爽. 共現(xiàn)聚類(lèi)分析結(jié)果表達(dá)方法的研究[J]. 情報(bào)學(xué)報(bào), 2015, 34(12):1270-1277.
[51] 邱均平, 董克. 作者共現(xiàn)網(wǎng)絡(luò)的科學(xué)研究結(jié)構(gòu)揭示能力比較研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2014, 40(1):15-24.
[52] Kostoff RN. Multidisciplinary research thrusts from co-word analysis[C]// TechnologyManagement : the New International Language. IEEE, 2002.
[53] 劉則淵, 陳悅, 侯海燕. 科學(xué)知識(shí)圖譜:方法與應(yīng)用[M]. 人民出版社, 2008:3-5
[54] 劉則淵, 陳超美, 侯海燕,等. 邁向科學(xué)學(xué)大變革的時(shí)代[J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理, 2009, 30(7):5-12.