DBLP-AI論文分析

在經(jīng)過(guò)對(duì)數(shù)據(jù)的采集、清理、存儲(chǔ)以及計(jì)算分析后凡泣,就到了將其可視化的階段。我們?cè)?眾多的可視化工具選擇了 echarts,并且找到與 python 結(jié)合的可直接使用包—pyecharts鞋拟,它 易于使用骂维,且效果圖美觀,為數(shù)據(jù)的可視化提供了很大的方便贺纲。具體使用方法請(qǐng)參考官網(wǎng): http://pyecharts.org/#/航闺。
我們從論文所屬國(guó)家、機(jī)構(gòu)猴誊、關(guān)鍵字潦刃、作者合作關(guān)系四個(gè)角度出發(fā),準(zhǔn)備對(duì)數(shù)據(jù)進(jìn)行分 析懈叹。其中包括柱狀圖福铅、折線圖、餅圖项阴、詞云圖滑黔、關(guān)系圖,對(duì)應(yīng)的名為 Bar环揽、Line略荡、Pie、WordCloud歉胶、 Graph汛兜。

可視化圖表思路

在此介紹一下多圖表Page類,在創(chuàng)建一個(gè) page 實(shí)例后通今,可以將想要列在同一頁(yè)的圖 表實(shí)例添加到該實(shí)例中粥谬。

    # 創(chuàng)建 page 實(shí)例
    page = Page("AAAI 會(huì)議國(guó)家論文數(shù)據(jù)分析 ") 
    Bar, Line, Pie = ......
    # 添加圖表 Bar, Line, Pie 到 page 中
    page.add(Bar)
    page.add(Line)
    page.add(Pie)
    # 將 page 保存為 html 文件
    page.render(path='Country_analysis.html')

對(duì)于作圖,要考慮的問(wèn)題是傳入數(shù)據(jù)格式與對(duì)應(yīng)圖表要求的配置相同辫塌。需要將從數(shù)據(jù)庫(kù) 導(dǎo)出的數(shù)據(jù)進(jìn)行計(jì)算以及轉(zhuǎn)換為需要的格式漏策。例如,制作“2010-2017 年發(fā)表論文總數(shù)前 12名國(guó)家 ”柱狀圖時(shí)臼氨,需要數(shù)據(jù)格式為: country = ["國(guó)家 1","國(guó)家 2", ...], 對(duì)應(yīng)的論文總 數(shù) article_num = [1, 2, ...];作者合作關(guān)系圖需要的數(shù)據(jù)格式較為復(fù)雜:
每個(gè)作者的節(jié)點(diǎn)數(shù)據(jù)nodedata=[("作者名字", 貢獻(xiàn)因子,"國(guó)家",(合作者數(shù)據(jù))),...] 其中 合作者數(shù)據(jù) = ("合作者 1", 合作次數(shù)), ("合作者 2", 合作次數(shù)),... 例如:nodedata = [
("Sun", 3, (("Zhao", 2), ("Qian", 3), ("Li", 9))),
("Li", 4, (("Wu", 4), ("Wang", 5), ("Huang", 7), ("Qian", 3))), ("Zhao", 2),
("Qian", 1),
("Wu", 1),
("Wang", 2),
("Huang", 2)
]
在獲得需要的數(shù)據(jù)后掺喻,我們首先對(duì)各國(guó) 2010-2017 年發(fā)表的論文數(shù)進(jìn)行統(tǒng)計(jì)。從下面 三張圖中我們可以看到美國(guó)在AAAI會(huì)議上發(fā)表人工智能方面的論文數(shù)一直處于遙遙領(lǐng)先的 狀態(tài)储矩,我國(guó)則緊隨其后感耙,是發(fā)展勢(shì)頭最猛的第二國(guó)家。


image.png

image.png

image.png

再次持隧,我們將所有論文的第一作者歸屬為其所在機(jī)構(gòu)即硼,分析獲得了以下兩圖÷挪Γ可以看到 我們國(guó)家高等高校及組織對(duì)研究人工智能方向的熱情只酥,有 5 名高校及組織的第一作者發(fā)表論 文數(shù)已經(jīng)躋身世界前列题诵。


image.png

image.png

聚焦到國(guó)內(nèi)的狀況,我們統(tǒng)計(jì)了各大高校及組織所有發(fā)表的論文數(shù)层皱,并排名選取了前十 名,南京大學(xué)已入圍前四赠潦,可喜可賀叫胖。
image.png

再來(lái)對(duì)我南京大學(xué)分析一波。經(jīng)過(guò)篩選統(tǒng)計(jì)她奥,我校在 2010-2017 年間在 AAAI 會(huì)議上發(fā) 表關(guān)于人工智能論文的作者共有 49 位瓮增。我們將 49 位作者選取了前 30 位權(quán)重最高的,并把 他們的合作者(包括校外以及國(guó)外作者)畫入到關(guān)系圖中哩俭。我校貢獻(xiàn)因子最高的兩位是周志 華老師绷跑、李武軍老師。
image.png

image.png

image.png

除此之外凡资,我們對(duì)收集到的關(guān)鍵詞進(jìn)行了統(tǒng)計(jì)分析砸捏,選取了頻次最高的 100 個(gè)詞做成 了一下的詞云圖,字體越大表示出現(xiàn)的頻次越高隙赁】巡兀可以看到最主要的熱詞有 Machine learning (機(jī)器學(xué)習(xí))、Reinforcement learning(強(qiáng)化學(xué)習(xí))伞访、Game theory(博弈論)掂骏、Deep learning (深度學(xué)習(xí))等。
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末厚掷,一起剝皮案震驚了整個(gè)濱河市弟灼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌冒黑,老刑警劉巖田绑,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異抡爹,居然都是意外死亡辛馆,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門豁延,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)昙篙,“玉大人,你說(shuō)我怎么就攤上這事诱咏√桑” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵袋狞,是天一觀的道長(zhǎng)焚辅。 經(jīng)常有香客問(wèn)我映屋,道長(zhǎng),這世上最難降的妖魔是什么同蜻? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任棚点,我火速辦了婚禮,結(jié)果婚禮上湾蔓,老公的妹妹穿的比我還像新娘瘫析。我一直安慰自己,他們只是感情好默责,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布贬循。 她就那樣靜靜地躺著,像睡著了一般桃序。 火紅的嫁衣襯著肌膚如雪杖虾。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,521評(píng)論 1 304
  • 那天媒熊,我揣著相機(jī)與錄音奇适,去河邊找鬼。 笑死芦鳍,一個(gè)胖子當(dāng)著我的面吹牛滤愕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播怜校,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼间影,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了茄茁?” 一聲冷哼從身側(cè)響起魂贬,我...
    開(kāi)封第一講書(shū)人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎裙顽,沒(méi)想到半個(gè)月后付燥,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡愈犹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年键科,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片漩怎。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡勋颖,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出勋锤,到底是詐尸還是另有隱情饭玲,我是刑警寧澤,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布叁执,位于F島的核電站茄厘,受9級(jí)特大地震影響矮冬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜次哈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一胎署、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧窑滞,春花似錦琼牧、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)滋恬。三九已至聊训,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間恢氯,已是汗流浹背带斑。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留勋拟,地道東北人勋磕。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像敢靡,于是被迫代替她去往敵國(guó)和親挂滓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容