?學(xué)術(shù)論文有一個(gè)必不可少的部分,
叫做“參考文獻(xiàn)(References)”,
在這個(gè)模塊里你要把你在本論文中引用觀點(diǎn)的來源標(biāo)注出來:
參考文獻(xiàn)作為論文的一個(gè)重要部分碎罚,一方面表示了該篇文章是基于什么樣的研究基礎(chǔ)展開的错洁;另一方面入撒,對(duì)于被引用的論文,被引量代表了該文章的影響力和價(jià)值先煎。
學(xué)術(shù)領(lǐng)域無人不知無人不曉的湯森路透基于文章的被引量會(huì)發(fā)布一個(gè)期刊引證報(bào)告贼涩,報(bào)告的核心指數(shù)稱之為影響因子。
影響因子(Impact Factor薯蝎,IF)是湯森路透(Thomson Reuters)出品的期刊引證報(bào)告(Journal Citation Reports遥倦,JCR)中的一項(xiàng)數(shù)據(jù)。即某期刊前兩年發(fā)表的論文在該報(bào)告年份(JCR year)中被引用總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)占锯。這是一個(gè)國際上通行的期刊評(píng)價(jià)指標(biāo)袒哥。
影響因子現(xiàn)已成為國際上通用的期刊評(píng)價(jià)指標(biāo),它不僅是一種測(cè)度期刊有用性和顯示度的指標(biāo)消略,而且也是測(cè)度期刊的學(xué)術(shù)水平堡称,乃至論文質(zhì)量的重要指標(biāo)。
谷歌學(xué)術(shù)也采用了相似的H指數(shù)作為學(xué)者和期刊評(píng)價(jià)的標(biāo)準(zhǔn):
所以我在想艺演,公眾號(hào)的文章可不可以引入這么一個(gè)“被引量”指標(biāo)粮呢,用以評(píng)價(jià)一篇文章或者一個(gè)公眾號(hào)的水平呢?
學(xué)術(shù)文章的被引量很容易計(jì)算钞艇,因?yàn)閲矣忻鞔_的法律法規(guī)和標(biāo)準(zhǔn)啄寡,只要有足夠全的學(xué)術(shù)文章便可以計(jì)算出某篇文章的被引量。
對(duì)于公眾號(hào)來說哩照,計(jì)算被引量所需要的數(shù)據(jù)也是完善的挺物。
首先,功能層面
2017年6月6日飘弧,公眾號(hào)開放了“插入全平臺(tái)已群發(fā)文章鏈接”的功能
這個(gè)功能的開放為添加“參考文獻(xiàn)”提供了可能识藤。
然后砚著,數(shù)據(jù)層面
目前內(nèi)容創(chuàng)業(yè)服務(wù)公司新榜保持每天對(duì)44.8萬個(gè)公眾號(hào)文章的采集工作,幾乎包含了所有活躍的公眾號(hào)痴昧。這部分公眾號(hào)的文章在新榜數(shù)據(jù)庫是可檢索的稽穆。
最后,技術(shù)層面
要獲取文章的“被引用”情況赶撰,首先需要知道文章的被引用的情況舌镶,然后需要知道文章的來源(即公眾號(hào))。
而這兩個(gè)數(shù)據(jù)豪娜,也是全部可以得到餐胀。
文章引用行為的獲取
我們打開一篇“引用了”其他文章的公眾號(hào)文章,F(xiàn)12檢查文章的源代碼可以看到瘤载,文章是以超鏈接的形式出現(xiàn)的:
所以在采集文章時(shí)否灾,如果在源代碼中采集到
文本
的字段,則可以認(rèn)為此處有“引用”行為鸣奔。
引用來源分析
找到了文章的引用行為墨技,我們需要對(duì)被引用的文章進(jìn)行分析,分析的核心在就于這篇文章的鏈接挎狸,也就是剛才herf后面的那一串健提。
幸運(yùn)的是,微信在鏈接里保存了我們需要的所有數(shù)據(jù)伟叛。
以剛才那篇文章的鏈接為例:
http://mp.weixin.qq.com/s?__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
我們把鏈接分為三部分:
http://
mp.weixin.qq.com/s?
__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
了解鏈接組成的同學(xué)們應(yīng)該知道私痹,前兩部分是鏈接的主題,每個(gè)文章的鏈接都是一樣的统刮。關(guān)鍵信息在于“紊遵?”后面的部分。
在鏈接里侥蒙,“暗膜?”后面的部分是鏈接的傳參,顧名思義鞭衩,就是向服務(wù)器傳遞的參數(shù)学搜,是對(duì)鏈接的解釋(或者叫備注)。
觀察鏈接里的參數(shù)论衍,有五個(gè):
__biz
mid
idx
sn
chksm
我們這里只用到前兩個(gè)參數(shù):
__biz可以認(rèn)為是微信公眾平臺(tái)對(duì)外公布的公眾帳號(hào)的唯一
idmid是圖文消息id
通過__biz參數(shù)可以獲得公眾號(hào)的ID數(shù)據(jù)瑞佩,是唯一識(shí)別的,目前技術(shù)上可以轉(zhuǎn)化成賬號(hào)的坯台;
通過mid參數(shù)炬丸,我們則可以定位到文章的ID,也是唯一識(shí)別的蜒蕾。
到此,對(duì)于文章引用行為技術(shù)層面的問題都已經(jīng)解決。
“被引量”的使用
和學(xué)術(shù)領(lǐng)域相同舔株,一篇文章被引用一次,則代表該文章影響力+1暮屡,被引量越多,文章影響力就越高毅桃。
對(duì)于公眾號(hào)而言褒纲,可以使用賬號(hào)所有文章的被引量計(jì)算賬號(hào)的“影響因子”,可以使用SCI的計(jì)算方法疾嗅,也可以使用GoogleScholar的H-index的計(jì)算方法外厂。
和學(xué)術(shù)領(lǐng)域相同冕象,文章也存在”自引“和”負(fù)引用“的問題代承。
自引在學(xué)術(shù)領(lǐng)域是一個(gè)不怎么受待見的事情,因?yàn)椤氨灰俊边@個(gè)指標(biāo)已經(jīng)作為一種評(píng)價(jià)標(biāo)準(zhǔn)渐扮,引用自己的文章給自己+1這種行為不是很好看论悴。
負(fù)引用這件事在學(xué)術(shù)領(lǐng)域還不那么嚴(yán)重,一篇論文的結(jié)論不管對(duì)錯(cuò)墓律,學(xué)術(shù)層面的價(jià)值是存在的膀估。但是在媒體行業(yè)就不同了,畢竟媒體很多時(shí)候傳遞的是價(jià)值觀耻讽。比如某篇文章觀點(diǎn)偏激察纯,被全網(wǎng)噴,我們只能說那篇文章影響力高针肥,但是價(jià)值就沒多少了饼记。
這里我們就不深入討論了。
最后說點(diǎn)啥
目前的內(nèi)容行業(yè)慰枕,充斥著營銷號(hào)具则、流量號(hào),一群自媒體人聚在一起不是討論什么樣的文章有價(jià)值具帮、什么樣的內(nèi)容有深度博肋,而是討論今天的收益如何、多少閱讀量才能開通流量主蜂厅。
我們每天僅有的幾分鐘閱讀時(shí)間里匪凡,有一半浪費(fèi)在那些“聳人聽聞”但毫無營養(yǎng)的標(biāo)題黨上,反而那些報(bào)道事實(shí)掘猿、傳遞價(jià)值的深度內(nèi)容或因?yàn)槲淖痔L锹雏、或因?yàn)闃?biāo)題不夠吸睛,被淹沒在這爆炸的信息海洋中术奖。
是時(shí)候該有人站出來做點(diǎn)什么了礁遵,比如給內(nèi)容行業(yè)加入一個(gè)已經(jīng)害死學(xué)術(shù)圈的“影響因子”轻绞。
本文首發(fā)自我的個(gè)人公眾號(hào)喜新(ID:noyanjiu),請(qǐng)隨便轉(zhuǎn)載佣耐,不用告訴我政勃。