Citespace筆記大雜燴

最近計劃給師弟師妹講citespace帖族,由于沒怎么用武契,忘了不少。找出一年前的筆記,做個簡單整理順下思路咒唆。

一届垫、Citespace介紹

Citespace是一款基于Java語言開發(fā)的引文可視化分析軟件,它能幫助我們挖掘到熱門主題全释、關(guān)鍵性文獻(xiàn)装处,分析出某領(lǐng)域的發(fā)展歷程。其靈感來源于庫恩的《科學(xué)革命的結(jié)構(gòu)》“科學(xué)研究的重點隨著時間變化有時比較遲緩浸船,有時比較劇烈”妄迁。由于是通過可視化的手段呈現(xiàn)科學(xué)知識的結(jié)構(gòu)、規(guī)律和分布情況李命,因此最后得到的可視化圖形被稱為“科學(xué)知識圖譜”登淘。

中文博客-陳超美教授:http://blog.sciencenet.cn/u/ChaomeiChen

學(xué)術(shù)主頁-陳超美教授:http://www.pages.drexel.edu/~cc345/

二、界面簡介

image.png
  • Project:新項目的建立封字、編輯黔州、刪除

  • Time Slicing:對將要分析的數(shù)據(jù)進(jìn)行時區(qū)分隔,其中years per slice 指按多少年進(jìn)行切割阔籽。對于參考文獻(xiàn)和施引文獻(xiàn)流妻,前者的時間段和時間切片的設(shè)置要比后者更加豐富,時間切片的不同會影響到突發(fā)性探測的結(jié)果笆制,顯著性較強(qiáng)的節(jié)點受到的影響會比較小绅这。

  • Text processing:包含Text Source 和 Text Type,前者是用于選擇Term提取的位置在辆,包含標(biāo)題证薇、摘要、作者關(guān)鍵詞开缎、WoS的增補關(guān)鍵詞棕叫;后者是對共詞分析類型的補充選擇,選擇該功能就可以提取到名詞性術(shù)語(Noun Phrase)奕删,在此處也可以對主要的名詞術(shù)語進(jìn)行突發(fā)性探測(Burst Dectection)俺泣,在運行- - Noun Phrase生成共詞網(wǎng)絡(luò)后可以查看熵值(Entropy)

  • Node Types:網(wǎng)絡(luò)的類型


    1.png
  • Author:作者合作網(wǎng)絡(luò)分析,包含了各個作者在網(wǎng)絡(luò)中的重要性指標(biāo)及網(wǎng)絡(luò)屬性完残。Ps該領(lǐng)域作者之間的合作關(guān)系伏钠,是否有合作

  • Institution:機(jī)構(gòu)合作網(wǎng)絡(luò)分析,可以得到各個研究領(lǐng)域中的研究力量分布

  • Contry :國家合作網(wǎng)絡(luò)分析

  • Term:主題共現(xiàn)分析谨设,term表示文章中的標(biāo)引詞熟掂,term來源可以來自文章標(biāo)題、摘要及關(guān)鍵詞部分扎拣,citespace軟件運行過程中如果采用了term詞標(biāo)示赴肚,需要在面板term source 模塊下選擇term 的來源素跺,可以選擇一個來源,也可以選擇多個來源誉券。使用term分析要比關(guān)鍵詞分析更深入到文本內(nèi)容指厌,反映出來的信息也更全面。

  • Keyword:關(guān)鍵詞共現(xiàn)分析踊跟,分析對象為文檔中的DE和ID字段踩验,得到結(jié)果為關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),此網(wǎng)絡(luò)可以反映出某一領(lǐng)域當(dāng)前研究熱點及過去產(chǎn)生過哪些熱點研究商玫。

  • Category:學(xué)科共現(xiàn)分析箕憾,用于交叉學(xué)科的分析,分析對象為文檔中的SC字段拳昌,通過構(gòu)建學(xué)科關(guān)聯(lián)網(wǎng)絡(luò)袭异,可以揭示出各個學(xué)科之間的內(nèi)在聯(lián)系。

  • Cited Reference:文獻(xiàn)的共被引分析地回,參考文獻(xiàn)共被引是指兩篇參考文獻(xiàn)被同一篇文獻(xiàn)引用的現(xiàn)象扁远,通過分析共被引網(wǎng)絡(luò)中的聚類及關(guān)鍵節(jié)點,可以揭示出某個研究領(lǐng)域的知識結(jié)構(gòu)刻像。

  • Cited Author:作者的共被引分析畅买,作者共被引是指兩個作者共同被其他文獻(xiàn)引用的現(xiàn)象。Citespace軟件計算作者共被引時只考慮第一作者共被引情況细睡,并且同一作者在同一篇文獻(xiàn)中被引用多次也按一次計算谷羞。通過計算共被引作者關(guān)系,可以得到作者共被引網(wǎng)絡(luò)圖溜徙,圖中可以揭示出某個研究領(lǐng)域的學(xué)術(shù)共同體

  • Cited Journal:期刊的共被引分析湃缎,期刊共被引是指兩本期刊被同一篇文獻(xiàn)引用的現(xiàn)象,期刊共被引所反映的是各類期刊及學(xué)科間的關(guān)聯(lián)性蠢壹。通過期刊共被引分析可以獲得某研究領(lǐng)域的知識基礎(chǔ)分部嗓违。

  • Paper:文獻(xiàn)耦合分析功能,分析施引文獻(xiàn)之間的耦合關(guān)系图贸,及兩篇文獻(xiàn)引用了相同的一篇或多篇參考文獻(xiàn)蹂季,得到的結(jié)果為文獻(xiàn)耦合網(wǎng)絡(luò)。

  • Grants:基金分析功能疏日,分析文獻(xiàn)的基金資助情況偿洁,得到的結(jié)果為資助基金的共現(xiàn)網(wǎng)絡(luò)。

Author沟优、Institute涕滋、Country用來進(jìn)行Co-authorship分析,它們之間的差異僅僅是因為在分析合作上的主體粒度不同而已挠阁。Term:主要對文獻(xiàn)中名詞性術(shù)語的提取宾肺,主要從文獻(xiàn)的標(biāo)題溯饵、摘要、關(guān)鍵詞和索引詞位置提取爱榕。Keyword 主要是對作者的原始關(guān)鍵詞的提取瓣喊。它們常常用來對文本主體進(jìn)行共詞的挖掘分析。Category是對文獻(xiàn)中標(biāo)引的科學(xué)領(lǐng)域的共現(xiàn)分析黔酥,這種分析有助于了解對象文本在科學(xué)領(lǐng)域中的分布情況。

三洪橘、常用數(shù)據(jù)庫

WOS跪者、Scopus的數(shù)據(jù)結(jié)構(gòu)是最完整的,Derwent熄求、CSSCI次之渣玲,CNKI的完整性最小。CNKI是以WOS數(shù)據(jù)為基礎(chǔ)的弟晚。通常收集的文獻(xiàn)題錄數(shù)據(jù)有:PT文獻(xiàn)類型忘衍,AU作者,SO期刊卿城,DE關(guān)鍵詞枚钓,AB摘要,CI機(jī)構(gòu)瑟押,CR參考文獻(xiàn)搀捷。

需要注意:基于CNKI下載文獻(xiàn)時使用Refworks格式,此外citespace對數(shù)據(jù)文本命名有特殊要求:download_xxx(Download有時不能識別)

image.png

四多望、術(shù)語知識

Betweenness centrality:測度節(jié)點在網(wǎng)絡(luò)中的重要性嫩舟,在citespace中它可以幫助我們發(fā)現(xiàn)和衡量文獻(xiàn)的重要性,并用紫色圓圈進(jìn)行標(biāo)注怀偷。

Burst檢測:突發(fā)主題家厌、文獻(xiàn)、作者及期刊印證信息椎工。

citation tree-rings:引文年環(huán)饭于,代表著某篇文獻(xiàn)的引文歷史,引文年輪的顏色代表相應(yīng)的引文時間晋渺,一個年輪厚度和相應(yīng)時間分區(qū)內(nèi)引文數(shù)量成正比镰绎。

Thresholds:閾值,其設(shè)定方式一共有4種:Top N木西、TopN%畴栖、ThresholdInterpolation、SelectCiters八千。

  • Top N選取被引次數(shù)最高的N個引文
  • TopN%先按被引次數(shù)排序再按百分比(N%)選取引文吗讶,這兩種方式各時間分區(qū)的閾值完全相同燎猛。
  • 閾值插值(Threshold Interpolation)從被引頻次c(citation)、兩篇文獻(xiàn)的共被引頻次cc(cocitation)和共被引系數(shù)ccv(cosinecoefficient)三個層次設(shè)置閾值照皆,其中ccv計算公式為重绷,其中cc(i,j)是文獻(xiàn)i和文獻(xiàn)j的共被引次數(shù),c(i)和c(j)是各自的被引次數(shù)膜毁,例如在某個時間分區(qū)里昭卓,文獻(xiàn)i和文獻(xiàn)j共被引2次,文獻(xiàn)i被引4次瘟滨,文獻(xiàn)j被引3次候醒,則ccv=2/sqrt(4×3)≈0.577它在整個時間跨度的第一個、中間一個杂瘸、最后一個時間分區(qū)分別設(shè)定閾值錨點倒淫,其余時間分區(qū)的閾值利用線性插值算法來計算,實現(xiàn)了不同時間分區(qū)閾值的個性化败玉。
  • 選擇施引文獻(xiàn)(Select Citers)先根據(jù)引文記錄中的TC字段值篩選施引文獻(xiàn)敌土,然后需再用Top N、TopN%运翼、ThresholdInterpolation中其中一種方法作為閾值篩選施引文獻(xiàn)中的參考文獻(xiàn)返干。Space Status文本框中space欄對應(yīng)數(shù)值為該時間分區(qū)內(nèi)引文的有效參考文獻(xiàn)數(shù)目,題錄字段缺失及重復(fù)的參考文獻(xiàn)不計入南蹂,nodes指滿足閾值條件的參考文獻(xiàn)數(shù)目犬金。Process Reports中Records withinthe chosen range的值指有效的引文數(shù)量,缺少參考文獻(xiàn)的引文不記數(shù)六剥。

施引晚顷、被引和來源文獻(xiàn)

  • 施引文獻(xiàn):引用當(dāng)前文獻(xiàn)的后續(xù)文獻(xiàn),即新出版的引用當(dāng)前文獻(xiàn)的文章
  • 被引文獻(xiàn):當(dāng)前文獻(xiàn)引用的文獻(xiàn)(引用的直接出處)
  • 來源文獻(xiàn):當(dāng)前文獻(xiàn)引用的文獻(xiàn)(引用的原始出處)
    比如論文A上一理論是原創(chuàng)的疗疟,被論文B轉(zhuǎn)載或摘抄了部分內(nèi)容该默,然后自己寫論文又用到了B里的相關(guān)內(nèi)容。那么B就是“被引文獻(xiàn)”(直接引用了內(nèi)容)策彤,A則是“來源文獻(xiàn)”(實際的內(nèi)容出處)栓袖。

五、關(guān)鍵所在

在操作前要運用盡可能廣泛的專業(yè)術(shù)語來確定所關(guān)注的知識領(lǐng)域店诗,一遍所得到的結(jié)果能盡可能地涵蓋所關(guān)注領(lǐng)域的全部內(nèi)容裹刮。在確定專業(yè)術(shù)語時,可以通過查看專業(yè)領(lǐng)域的主題詞表和通過咨詢領(lǐng)域的專家的方法庞瘸。確定好術(shù)語后捧弃,需要采用主題、標(biāo)題、關(guān)鍵詞進(jìn)行檢索违霞,在檢索過程中要注意剔除干擾信息嘴办,比如征稿之類。之后進(jìn)行提取研究前沿術(shù)語买鸽、時區(qū)分割涧郊、閾值選擇的操作。

六眼五、操作步驟

總的來說妆艘,使用citespace進(jìn)行文獻(xiàn)分析的關(guān)鍵步驟一共有9步:

  1. 確定研究主題及其相關(guān)術(shù)語
    運用盡可能廣泛的專業(yè)術(shù)語來確定所關(guān)注的知識領(lǐng)域,這是為了所得到的結(jié)果盡可能地涵蓋所關(guān)注領(lǐng)域的全部內(nèi)容弹砚。
  2. 收集數(shù)據(jù)
    對于WoS中下載的數(shù)據(jù)双仍,citespace可以直接讀取和分析,但是從其他數(shù)據(jù)庫所收集的數(shù)據(jù)需要轉(zhuǎn)化才可以進(jìn)行分析
  3. 提取研究前沿術(shù)語
    從數(shù)據(jù)可文獻(xiàn)的題目桌吃,摘要,關(guān)鍵詞等中找到出現(xiàn)頻次增長率快速增加的專業(yè)術(shù)語苞轿,將其確定為研究前沿術(shù)語
  4. 進(jìn)行時區(qū)分割
    明確要分析的時間跨度以及時間跨度的分段長度
  5. 設(shè)置閾值
    CiteSpace在單個時間分區(qū)按閾值控制網(wǎng)絡(luò)節(jié)點數(shù)量茅诱,滿足閾值條件的引文才會被可視化,其設(shè)定方式一共有4種:Top N搬卒、TopN%瑟俭、ThresholdInterpolation、SelectCiters契邀。
  6. 網(wǎng)絡(luò)精簡和合并
    在citespace中有兩種網(wǎng)絡(luò)精簡算法摆寄,pathfinder和MST,在對數(shù)據(jù)進(jìn)行初始分析時坯门,一般不做任何精簡微饥。通過初步得到的結(jié)果后,再決定采用哪一種精簡方法古戴。
  7. 可視化顯示
    citespace的默認(rèn)視圖是網(wǎng)絡(luò)圖欠橘,除此外還有Timeline和Timezone視圖
  8. 可視化編輯和檢測
    在得到圖譜后,可以通過可視化界面進(jìn)行編輯美化圖形现恼,也可以利用提供的網(wǎng)絡(luò)計算功能對網(wǎng)絡(luò)進(jìn)一步分析肃续。
  9. 分析結(jié)果的驗證
    使用citespace后針對得到分析結(jié)果,要與熟悉領(lǐng)域叉袍、專業(yè)內(nèi)容的學(xué)者進(jìn)行溝通始锚,特別是對于網(wǎng)絡(luò)中突出的關(guān)鍵節(jié)點進(jìn)行咨詢溝通。

參考資料:

1.citespace學(xué)習(xí)摘要及心得(摘自《引文空間分析原理及應(yīng)用》)

2.Citespace1:我是誰喳逛,如何把我安放在你的電腦瞧捌?

3.《CiteSpace 科技文本挖掘及可視化》

整理了citespace最新版和java安裝包,可在公眾號回復(fù)"citespace安裝包"獲取艺配。

公眾號.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末察郁,一起剝皮案震驚了整個濱河市衍慎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌皮钠,老刑警劉巖稳捆,帶你破解...
    沈念sama閱讀 216,651評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異麦轰,居然都是意外死亡乔夯,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評論 3 392
  • 文/潘曉璐 我一進(jìn)店門款侵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來末荐,“玉大人,你說我怎么就攤上這事新锈〖自啵” “怎么了?”我有些...
    開封第一講書人閱讀 162,931評論 0 353
  • 文/不壞的土叔 我叫張陵妹笆,是天一觀的道長块请。 經(jīng)常有香客問我,道長拳缠,這世上最難降的妖魔是什么墩新? 我笑而不...
    開封第一講書人閱讀 58,218評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮窟坐,結(jié)果婚禮上海渊,老公的妹妹穿的比我還像新娘。我一直安慰自己哲鸳,他們只是感情好臣疑,可當(dāng)我...
    茶點故事閱讀 67,234評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著帕胆,像睡著了一般朝捆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上懒豹,一...
    開封第一講書人閱讀 51,198評論 1 299
  • 那天芙盘,我揣著相機(jī)與錄音,去河邊找鬼脸秽。 笑死儒老,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的记餐。 我是一名探鬼主播驮樊,決...
    沈念sama閱讀 40,084評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了囚衔?” 一聲冷哼從身側(cè)響起挖腰,我...
    開封第一講書人閱讀 38,926評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎练湿,沒想到半個月后猴仑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,341評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡肥哎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,563評論 2 333
  • 正文 我和宋清朗相戀三年辽俗,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片篡诽。...
    茶點故事閱讀 39,731評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡崖飘,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出杈女,到底是詐尸還是另有隱情朱浴,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評論 5 343
  • 正文 年R本政府宣布达椰,位于F島的核電站赊琳,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏砰碴。R本人自食惡果不足惜燎窘,卻給世界環(huán)境...
    茶點故事閱讀 41,036評論 3 326
  • 文/蒙蒙 一涝桅、第九天 我趴在偏房一處隱蔽的房頂上張望舔痕。 院中可真熱鬧辈末,春花似錦瓦呼、人聲如沸旅挤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽砚殿。三九已至啃憎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間似炎,已是汗流浹背辛萍。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留羡藐,地道東北人贩毕。 一個月前我還...
    沈念sama閱讀 47,743評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像仆嗦,于是被迫代替她去往敵國和親辉阶。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,629評論 2 354

推薦閱讀更多精彩內(nèi)容