學(xué)術(shù)領(lǐng)域無人不知無人不曉的湯森路透基于文章的被引量會發(fā)布一個期刊引證報告,報告的核心指數(shù)稱之為影響因子。
影響因子(Impact Factor,IF)是湯森路透(Thomson Reuters)出品的期刊引證報告(Journal Citation Reports,JCR)中的一項數(shù)據(jù)。 即某期刊前兩年發(fā)表的論文在該報告年份(JCR year)中被引用總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)。這是一個國際上通行的期刊評價指標(biāo)。
影響因子現(xiàn)已成為國際上通用的期刊評價指標(biāo),它不僅是一種測度期刊有用性和顯示度的指標(biāo),而且也是測度期刊的學(xué)術(shù)水平,乃至論文質(zhì)量的重要指標(biāo)。
谷歌學(xué)術(shù)也采用了相似的H指數(shù)作為學(xué)者和期刊評價的標(biāo)準(zhǔn):
所以我在想,公眾號的文章可不可以引入這么一個“被引量”指標(biāo),用以評價一篇文章或者一個公眾號的水平呢?
學(xué)術(shù)文章的被引量很容易計算,因為國家有明確的法律法規(guī)和標(biāo)準(zhǔn),只要有足夠全的學(xué)術(shù)文章便可以計算出某篇文章的被引量。
對于公眾號來說,計算被引量所需要的數(shù)據(jù)也是完善的。
首先,功能層面
2017年6月6日,公眾號開放了“插入全平臺已群發(fā)文章鏈接”的功能
這個功能的開放為添加“參考文獻”提供了可能。
然后,數(shù)據(jù)層面
目前內(nèi)容創(chuàng)業(yè)服務(wù)公司新榜保持每天對44.8萬個公眾號文章的采集工作,幾乎包含了所有活躍的公眾號。這部分公眾號的文章在新榜數(shù)據(jù)庫是可檢索的。
最后,技術(shù)層面
要獲取文章的“被引用”情況,首先需要知道文章的被引用的情況,然后需要知道文章的來源(即公眾號)。
而這兩個數(shù)據(jù),也是全部可以得到。
文章引用行為的獲取
我們打開一篇“引用了”其他文章的公眾號文章,F(xiàn)12檢查文章的源代碼可以看到,文章是以超鏈接的形式出現(xiàn)的:
所以在采集文章時,如果在源代碼中采集到
<a herf = “http://mp.weixin.qq.com/s?__biz********************* “>文本</a>的字段,則可以認(rèn)為此處有“引用”行為。
引用來源分析
找到了文章的引用行為,我們需要對被引用的文章進行分析,分析的核心在就于這篇文章的鏈接,也就是剛才herf后面的那一串。
幸運的是,微信在鏈接里保存了我們需要的所有數(shù)據(jù)。
以剛才那篇文章的鏈接為例:
http://mp.weixin.qq.com/s?__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
我們把鏈接分為三部分:
http://
mp.weixin.qq.com/s
__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
了解鏈接組成的同學(xué)們應(yīng)該知道,前兩部分是鏈接的主題,每個文章的鏈接都是一樣的。關(guān)鍵信息在于“?”后面的部分。
在鏈接里,“?”后面的部分是鏈接的傳參,顧名思義,就是向服務(wù)器傳遞的參數(shù),是對鏈接的解釋(或者叫備注)。
觀察鏈接里的參數(shù),有五個:
__biz
mid
idx
sn
chksm
我們這里只用到前兩個參數(shù):
__biz可以認(rèn)為是微信公眾平臺對外公布的公眾帳號的唯一
idmid是圖文消息id
通過__biz參數(shù)可以獲得公眾號的ID數(shù)據(jù),是唯一識別的,目前技術(shù)上可以轉(zhuǎn)化成賬號的;
通過mid參數(shù),我們則可以定位到文章的ID,也是唯一識別的。
到此,對于文章引用行為技術(shù)層面的問題都已經(jīng)解決。
“被引量”的使用
和學(xué)術(shù)領(lǐng)域相同,一篇文章被引用一次,則代表該文章影響力+1,被引量越多,文章影響力就越高。
對于公眾號而言,可以使用賬號所有文章的被引量計算賬號的“影響因子”,可以使用SCI的計算方法,也可以使用GoogleScholar的H-index的計算方法。
和學(xué)術(shù)領(lǐng)域相同,文章也存在”自引“和”負(fù)引用“的問題。
自引在學(xué)術(shù)領(lǐng)域是一個不怎么受待見的事情,因為“被引量”這個指標(biāo)已經(jīng)作為一種評價標(biāo)準(zhǔn),引用自己的文章給自己+1這種行為不是很好看。
負(fù)引用這件事在學(xué)術(shù)領(lǐng)域還不那么嚴(yán)重,一篇論文的結(jié)論不管對錯,學(xué)術(shù)層面的價值是存在的。但是在媒體行業(yè)就不同了,畢竟媒體很多時候傳遞的是價值觀。比如某篇文章觀點偏激,被全網(wǎng)噴,我們只能說那篇文章影響力高,但是價值就沒多少了。
這里我們就不深入討論了。
最后說點啥
目前的內(nèi)容行業(yè),充斥著營銷號、流量號,一群自媒體人聚在一起不是討論什么樣的文章有價值、什么樣的內(nèi)容有深度,而是討論今天的收益如何、多少閱讀量才能開通流量主。
我們每天僅有的幾分鐘閱讀時間里,有一半浪費在那些“聳人聽聞”但毫無營養(yǎng)的標(biāo)題黨上,反而那些報道事實、傳遞價值的深度內(nèi)容或因為文字太長、或因為標(biāo)題不夠吸睛,被淹沒在這爆炸的信息海洋中。
是時候該有人站出來做點什么了,比如給內(nèi)容行業(yè)也加入一個讓死學(xué)術(shù)圈欲仙欲死的“影響因子”。
本文地址:http://www.khwajamoinuddinchishty.com//article/2020/0708/18527.html