話說手里有個錘子,看什么都像釘子尝艘。上午一邊聽著政府工作報告湿镀,一邊看著手里好像有好幾把小錘子,就在想伐憾,除了一堆給力的數(shù)據(jù)勉痴,怎么用數(shù)據(jù)分析的方式從不同角度看報告。
晚上回家树肃,開工:
先找到官方全文:https://baijiahao.baidu.com/s?id=1623778868224158198&wfr=spider&for=pc
第一把錘子:emeditor蒸矛,全文復(fù)制粘貼:
Ctrl+H 調(diào)出替換窗口,用\n替換[^\x{4e00}-\x{9fa5}]胸嘴,分句雏掠,這里用到一把萬能螺絲刀-正則表達(dá)式:
再用\n替換掉\n\n,多點幾遍替換全部劣像,去掉空行:
保存到桌面乡话,命名“gzbg.txt”
第二把錘子,python:
屏幕一閃耳奕,結(jié)果出來了:
第三把錘子蚊伞,Excel,copy過去吮铭,排序整理时迫,取前50高頻詞
最后上第四把錘子,echarts的詞云工具wordcloud.js:
高頻詞串成不重詞一句話谓晌,就是:加快推進發(fā)展綜合服務(wù)建設(shè)掠拳,全面加強實施城市管理改革
閑著的錘子,還可以試試中央政府和各省市區(qū)的政府工作報告纸肉,高頻詞關(guān)聯(lián)分析下溺欧,看看哪家與總報告的關(guān)聯(lián)度最高。