![240](https://cdn2.jianshu.io/assets/default_avatar/1-04bbeead395d74921af6a4e8214b4f61.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
今天看到的一個(gè)統(tǒng)計(jì)傅事,統(tǒng)計(jì)的金庸小說(shuō)里面的高頻詞語(yǔ)缕允。想著看了一周python,試試看能不能統(tǒng)計(jì)蹭越。網(wǎng)上找的代碼障本,調(diào)整順序拼接了一下,分詞庫(kù)是結(jié)巴分詞响鹃。解決了python2.7中字...
Python是一種面向?qū)ο笙〔ⅰ⒅弊g式計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言甸箱,由Guido van Rossum于1989年底發(fā)明。由于他簡(jiǎn)單脊阴、易學(xué)煮纵、免費(fèi)開(kāi)源机错、可移植性褐捻、可擴(kuò)展性等特點(diǎn)掸茅,Python...
利用python統(tǒng)計(jì)《十九大報(bào)告》中的關(guān)鍵詞、報(bào)告摘要和詞頻牙丽。引用snowNLP简卧。得到的結(jié)果: 1、關(guān)鍵詞:前五個(gè)關(guān)鍵詞為 ['發(fā)展', '人民', '中國(guó)', '黨', ...
jieba分詞 是一款開(kāi)源的中文分詞包构罗,同時(shí)它還帶有分析模塊铜涉,可以用TF-IDF等算法進(jìn)行關(guān)鍵詞分析jieba下面的小程序的基本思路是:通過(guò)jieba從 保存好的txt文本中...