最近計劃給師弟師妹講citespace帖族,由于沒怎么用武契,忘了不少。找出一年前的筆記,做個簡單整理順下思路咒唆。
一届垫、Citespace介紹
Citespace是一款基于Java語言開發(fā)的引文可視化分析軟件,它能幫助我們挖掘到熱門主題全释、關(guān)鍵性文獻(xiàn)装处,分析出某領(lǐng)域的發(fā)展歷程。其靈感來源于庫恩的《科學(xué)革命的結(jié)構(gòu)》“科學(xué)研究的重點隨著時間變化有時比較遲緩浸船,有時比較劇烈”妄迁。由于是通過可視化的手段呈現(xiàn)科學(xué)知識的結(jié)構(gòu)、規(guī)律和分布情況李命,因此最后得到的可視化圖形被稱為“科學(xué)知識圖譜”登淘。
中文博客-陳超美教授:http://blog.sciencenet.cn/u/ChaomeiChen
學(xué)術(shù)主頁-陳超美教授:http://www.pages.drexel.edu/~cc345/
二、界面簡介
Project:新項目的建立封字、編輯黔州、刪除
Time Slicing:對將要分析的數(shù)據(jù)進(jìn)行時區(qū)分隔,其中years per slice 指按多少年進(jìn)行切割阔籽。對于參考文獻(xiàn)和施引文獻(xiàn)流妻,前者的時間段和時間切片的設(shè)置要比后者更加豐富,時間切片的不同會影響到突發(fā)性探測的結(jié)果笆制,顯著性較強(qiáng)的節(jié)點受到的影響會比較小绅这。
Text processing:包含Text Source 和 Text Type,前者是用于選擇Term提取的位置在辆,包含標(biāo)題证薇、摘要、作者關(guān)鍵詞开缎、WoS的增補關(guān)鍵詞棕叫;后者是對共詞分析類型的補充選擇,選擇該功能就可以提取到名詞性術(shù)語(Noun Phrase)奕删,在此處也可以對主要的名詞術(shù)語進(jìn)行突發(fā)性探測(Burst Dectection)俺泣,在運行- - Noun Phrase生成共詞網(wǎng)絡(luò)后可以查看熵值(Entropy)
-
Node Types:網(wǎng)絡(luò)的類型
Author:作者合作網(wǎng)絡(luò)分析,包含了各個作者在網(wǎng)絡(luò)中的重要性指標(biāo)及網(wǎng)絡(luò)屬性完残。Ps該領(lǐng)域作者之間的合作關(guān)系伏钠,是否有合作
Institution:機(jī)構(gòu)合作網(wǎng)絡(luò)分析,可以得到各個研究領(lǐng)域中的研究力量分布
Contry :國家合作網(wǎng)絡(luò)分析
Term:主題共現(xiàn)分析谨设,term表示文章中的標(biāo)引詞熟掂,term來源可以來自文章標(biāo)題、摘要及關(guān)鍵詞部分扎拣,citespace軟件運行過程中如果采用了term詞標(biāo)示赴肚,需要在面板term source 模塊下選擇term 的來源素跺,可以選擇一個來源,也可以選擇多個來源誉券。使用term分析要比關(guān)鍵詞分析更深入到文本內(nèi)容指厌,反映出來的信息也更全面。
Keyword:關(guān)鍵詞共現(xiàn)分析踊跟,分析對象為文檔中的DE和ID字段踩验,得到結(jié)果為關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),此網(wǎng)絡(luò)可以反映出某一領(lǐng)域當(dāng)前研究熱點及過去產(chǎn)生過哪些熱點研究商玫。
Category:學(xué)科共現(xiàn)分析箕憾,用于交叉學(xué)科的分析,分析對象為文檔中的SC字段拳昌,通過構(gòu)建學(xué)科關(guān)聯(lián)網(wǎng)絡(luò)袭异,可以揭示出各個學(xué)科之間的內(nèi)在聯(lián)系。
Cited Reference:文獻(xiàn)的共被引分析地回,參考文獻(xiàn)共被引是指兩篇參考文獻(xiàn)被同一篇文獻(xiàn)引用的現(xiàn)象扁远,通過分析共被引網(wǎng)絡(luò)中的聚類及關(guān)鍵節(jié)點,可以揭示出某個研究領(lǐng)域的知識結(jié)構(gòu)刻像。
Cited Author:作者的共被引分析畅买,作者共被引是指兩個作者共同被其他文獻(xiàn)引用的現(xiàn)象。Citespace軟件計算作者共被引時只考慮第一作者共被引情況细睡,并且同一作者在同一篇文獻(xiàn)中被引用多次也按一次計算谷羞。通過計算共被引作者關(guān)系,可以得到作者共被引網(wǎng)絡(luò)圖溜徙,圖中可以揭示出某個研究領(lǐng)域的學(xué)術(shù)共同體
Cited Journal:期刊的共被引分析湃缎,期刊共被引是指兩本期刊被同一篇文獻(xiàn)引用的現(xiàn)象,期刊共被引所反映的是各類期刊及學(xué)科間的關(guān)聯(lián)性蠢壹。通過期刊共被引分析可以獲得某研究領(lǐng)域的知識基礎(chǔ)分部嗓违。
Paper:文獻(xiàn)耦合分析功能,分析施引文獻(xiàn)之間的耦合關(guān)系图贸,及兩篇文獻(xiàn)引用了相同的一篇或多篇參考文獻(xiàn)蹂季,得到的結(jié)果為文獻(xiàn)耦合網(wǎng)絡(luò)。
Grants:基金分析功能疏日,分析文獻(xiàn)的基金資助情況偿洁,得到的結(jié)果為資助基金的共現(xiàn)網(wǎng)絡(luò)。
Author沟优、Institute涕滋、Country用來進(jìn)行Co-authorship分析,它們之間的差異僅僅是因為在分析合作上的主體粒度不同而已挠阁。Term:主要對文獻(xiàn)中名詞性術(shù)語的提取宾肺,主要從文獻(xiàn)的標(biāo)題溯饵、摘要、關(guān)鍵詞和索引詞位置提取爱榕。Keyword 主要是對作者的原始關(guān)鍵詞的提取瓣喊。它們常常用來對文本主體進(jìn)行共詞的挖掘分析。Category是對文獻(xiàn)中標(biāo)引的科學(xué)領(lǐng)域的共現(xiàn)分析黔酥,這種分析有助于了解對象文本在科學(xué)領(lǐng)域中的分布情況。
三洪橘、常用數(shù)據(jù)庫
WOS跪者、Scopus的數(shù)據(jù)結(jié)構(gòu)是最完整的,Derwent熄求、CSSCI次之渣玲,CNKI的完整性最小。CNKI是以WOS數(shù)據(jù)為基礎(chǔ)的弟晚。通常收集的文獻(xiàn)題錄數(shù)據(jù)有:PT文獻(xiàn)類型忘衍,AU作者,SO期刊卿城,DE關(guān)鍵詞枚钓,AB摘要,CI機(jī)構(gòu)瑟押,CR參考文獻(xiàn)搀捷。
需要注意:基于CNKI下載文獻(xiàn)時使用Refworks格式,此外citespace對數(shù)據(jù)文本命名有特殊要求:download_xxx(Download有時不能識別)
四多望、術(shù)語知識
Betweenness centrality:測度節(jié)點在網(wǎng)絡(luò)中的重要性嫩舟,在citespace中它可以幫助我們發(fā)現(xiàn)和衡量文獻(xiàn)的重要性,并用紫色圓圈進(jìn)行標(biāo)注怀偷。
Burst檢測:突發(fā)主題家厌、文獻(xiàn)、作者及期刊印證信息椎工。
citation tree-rings:引文年環(huán)饭于,代表著某篇文獻(xiàn)的引文歷史,引文年輪的顏色代表相應(yīng)的引文時間晋渺,一個年輪厚度和相應(yīng)時間分區(qū)內(nèi)引文數(shù)量成正比镰绎。
Thresholds:閾值,其設(shè)定方式一共有4種:Top N木西、TopN%畴栖、ThresholdInterpolation、SelectCiters八千。
- Top N選取被引次數(shù)最高的N個引文
- TopN%先按被引次數(shù)排序再按百分比(N%)選取引文吗讶,這兩種方式各時間分區(qū)的閾值完全相同燎猛。
- 閾值插值(Threshold Interpolation)從被引頻次c(citation)、兩篇文獻(xiàn)的共被引頻次cc(cocitation)和共被引系數(shù)ccv(cosinecoefficient)三個層次設(shè)置閾值照皆,其中ccv計算公式為重绷,其中cc(i,j)是文獻(xiàn)i和文獻(xiàn)j的共被引次數(shù),c(i)和c(j)是各自的被引次數(shù)膜毁,例如在某個時間分區(qū)里昭卓,文獻(xiàn)i和文獻(xiàn)j共被引2次,文獻(xiàn)i被引4次瘟滨,文獻(xiàn)j被引3次候醒,則ccv=2/sqrt(4×3)≈0.577它在整個時間跨度的第一個、中間一個杂瘸、最后一個時間分區(qū)分別設(shè)定閾值錨點倒淫,其余時間分區(qū)的閾值利用線性插值算法來計算,實現(xiàn)了不同時間分區(qū)閾值的個性化败玉。
- 選擇施引文獻(xiàn)(Select Citers)先根據(jù)引文記錄中的TC字段值篩選施引文獻(xiàn)敌土,然后需再用Top N、TopN%运翼、ThresholdInterpolation中其中一種方法作為閾值篩選施引文獻(xiàn)中的參考文獻(xiàn)返干。Space Status文本框中space欄對應(yīng)數(shù)值為該時間分區(qū)內(nèi)引文的有效參考文獻(xiàn)數(shù)目,題錄字段缺失及重復(fù)的參考文獻(xiàn)不計入南蹂,nodes指滿足閾值條件的參考文獻(xiàn)數(shù)目犬金。Process Reports中Records withinthe chosen range的值指有效的引文數(shù)量,缺少參考文獻(xiàn)的引文不記數(shù)六剥。
施引晚顷、被引和來源文獻(xiàn)
- 施引文獻(xiàn):引用當(dāng)前文獻(xiàn)的后續(xù)文獻(xiàn),即新出版的引用當(dāng)前文獻(xiàn)的文章
- 被引文獻(xiàn):當(dāng)前文獻(xiàn)引用的文獻(xiàn)(引用的直接出處)
- 來源文獻(xiàn):當(dāng)前文獻(xiàn)引用的文獻(xiàn)(引用的原始出處)
比如論文A上一理論是原創(chuàng)的疗疟,被論文B轉(zhuǎn)載或摘抄了部分內(nèi)容该默,然后自己寫論文又用到了B里的相關(guān)內(nèi)容。那么B就是“被引文獻(xiàn)”(直接引用了內(nèi)容)策彤,A則是“來源文獻(xiàn)”(實際的內(nèi)容出處)栓袖。
五、關(guān)鍵所在
在操作前要運用盡可能廣泛的專業(yè)術(shù)語來確定所關(guān)注的知識領(lǐng)域店诗,一遍所得到的結(jié)果能盡可能地涵蓋所關(guān)注領(lǐng)域的全部內(nèi)容裹刮。在確定專業(yè)術(shù)語時,可以通過查看專業(yè)領(lǐng)域的主題詞表和通過咨詢領(lǐng)域的專家的方法庞瘸。確定好術(shù)語后捧弃,需要采用主題、標(biāo)題、關(guān)鍵詞進(jìn)行檢索违霞,在檢索過程中要注意剔除干擾信息嘴办,比如征稿之類。之后進(jìn)行提取研究前沿術(shù)語买鸽、時區(qū)分割涧郊、閾值選擇的操作。
六眼五、操作步驟
總的來說妆艘,使用citespace進(jìn)行文獻(xiàn)分析的關(guān)鍵步驟一共有9步:
- 確定研究主題及其相關(guān)術(shù)語
運用盡可能廣泛的專業(yè)術(shù)語來確定所關(guān)注的知識領(lǐng)域,這是為了所得到的結(jié)果盡可能地涵蓋所關(guān)注領(lǐng)域的全部內(nèi)容弹砚。 - 收集數(shù)據(jù)
對于WoS中下載的數(shù)據(jù)双仍,citespace可以直接讀取和分析,但是從其他數(shù)據(jù)庫所收集的數(shù)據(jù)需要轉(zhuǎn)化才可以進(jìn)行分析 - 提取研究前沿術(shù)語
從數(shù)據(jù)可文獻(xiàn)的題目桌吃,摘要,關(guān)鍵詞等中找到出現(xiàn)頻次增長率快速增加的專業(yè)術(shù)語苞轿,將其確定為研究前沿術(shù)語 - 進(jìn)行時區(qū)分割
明確要分析的時間跨度以及時間跨度的分段長度 - 設(shè)置閾值
CiteSpace在單個時間分區(qū)按閾值控制網(wǎng)絡(luò)節(jié)點數(shù)量茅诱,滿足閾值條件的引文才會被可視化,其設(shè)定方式一共有4種:Top N搬卒、TopN%瑟俭、ThresholdInterpolation、SelectCiters契邀。 - 網(wǎng)絡(luò)精簡和合并
在citespace中有兩種網(wǎng)絡(luò)精簡算法摆寄,pathfinder和MST,在對數(shù)據(jù)進(jìn)行初始分析時坯门,一般不做任何精簡微饥。通過初步得到的結(jié)果后,再決定采用哪一種精簡方法古戴。 - 可視化顯示
citespace的默認(rèn)視圖是網(wǎng)絡(luò)圖欠橘,除此外還有Timeline和Timezone視圖 - 可視化編輯和檢測
在得到圖譜后,可以通過可視化界面進(jìn)行編輯美化圖形现恼,也可以利用提供的網(wǎng)絡(luò)計算功能對網(wǎng)絡(luò)進(jìn)一步分析肃续。 - 分析結(jié)果的驗證
使用citespace后針對得到分析結(jié)果,要與熟悉領(lǐng)域叉袍、專業(yè)內(nèi)容的學(xué)者進(jìn)行溝通始锚,特別是對于網(wǎng)絡(luò)中突出的關(guān)鍵節(jié)點進(jìn)行咨詢溝通。
參考資料:
1.citespace學(xué)習(xí)摘要及心得(摘自《引文空間分析原理及應(yīng)用》)
2.Citespace1:我是誰喳逛,如何把我安放在你的電腦瞧捌?
3.《CiteSpace 科技文本挖掘及可視化》
整理了citespace最新版和java安裝包,可在公眾號回復(fù)"citespace安裝包"獲取艺配。