![240](https://cdn2.jianshu.io/assets/default_avatar/1-04bbeead395d74921af6a4e8214b4f61.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
今天看到的一個(gè)統(tǒng)計(jì)渣淳,統(tǒng)計(jì)的金庸小說里面的高頻詞語菩咨。想著看了一周python掠抬,試試看能不能統(tǒng)計(jì)卖词。網(wǎng)上找的代碼映企,調(diào)整順序拼接了一下割按,分詞庫是結(jié)巴分詞膨报。解決了python2.7中字...
Python是一種面向?qū)ο筇革⒅弊g式計(jì)算機(jī)程序設(shè)計(jì)語言,由Guido van Rossum于1989年底發(fā)明鱼鼓。由于他簡(jiǎn)單拟烫、易學(xué)、免費(fèi)開源迄本、可移植性硕淑、可擴(kuò)展性等特點(diǎn),Python...
利用python統(tǒng)計(jì)《十九大報(bào)告》中的關(guān)鍵詞太示、報(bào)告摘要和詞頻柠贤。引用snowNLP。得到的結(jié)果: 1类缤、關(guān)鍵詞:前五個(gè)關(guān)鍵詞為 ['發(fā)展', '人民', '中國', '黨', ...
jieba分詞 是一款開源的中文分詞包坚俗,同時(shí)它還帶有分析模塊,可以用TF-IDF等算法進(jìn)行關(guān)鍵詞分析jieba下面的小程序的基本思路是:通過jieba從 保存好的txt文本中...