![240](https://cdn2.jianshu.io/assets/default_avatar/1-04bbeead395d74921af6a4e8214b4f61.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
今天看到的一個統(tǒng)計呛梆,統(tǒng)計的金庸小說里面的高頻詞語挑格。想著看了一周python膘婶,試試看能不能統(tǒng)計恒水。網(wǎng)上找的代碼倔幼,調(diào)整順序拼接了一下,分詞庫是結(jié)巴分詞修壕。解決了python2.7中字...
Python是一種面向?qū)ο舐簟⒅弊g式計算機程序設(shè)計語言,由Guido van Rossum于1989年底發(fā)明娃肿。由于他簡單咕缎、易學(xué)、免費開源料扰、可移植性凭豪、可擴展性等特點,Python...
利用python統(tǒng)計《十九大報告》中的關(guān)鍵詞拘领、報告摘要和詞頻意乓。引用snowNLP。得到的結(jié)果: 1约素、關(guān)鍵詞:前五個關(guān)鍵詞為 ['發(fā)展', '人民', '中國', '黨', ...
jieba分詞 是一款開源的中文分詞包士葫,同時它還帶有分析模塊,可以用TF-IDF等算法進(jìn)行關(guān)鍵詞分析jieba下面的小程序的基本思路是:通過jieba從 保存好的txt文本中...