Python筆記:熱詞分析2020-01-01

熱詞分析在公眾趨勢分析棋嘲、輿情分析有很寬廣的應(yīng)用,我們來看看怎么從一個TXT文件中分析出文章的熱詞出來按脚,我們采用流行的第三方“結(jié)巴”包來實現(xiàn)泵督。

首先安裝第三方包(matplotlib,jieba哥倔,wordcloud秸架,numpy)mmatplotlib主要來繪制熱力云圖,jieba來做熱詞分析,wordcloud詞云展示咆蒿,numpy做多維數(shù)組處理东抹。

網(wǎng)上弄段代碼:


import matplotlib

import matplotlib.pyplot as plt #數(shù)據(jù)可視化

import jieba #詞語切割

import wordcloud #分詞

from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #詞云,顏色生成器沃测,停止

import numpy as np #科學(xué)計算

from PIL import Image #處理圖片

def ciyun():

? ? #打開文本

? ? textfile = open('input.txt').read() #讀取文本內(nèi)容

? ? wordlist = jieba.cut_for_search(textfile)#切割詞語

? ? space_list = ' '.join(wordlist) # 鏈接詞語

? ? backgroud = np.array(Image.open('2.jpg')) #背景圖片缭黔,只有黑白圖才能按照形狀生成詞云

? ? mywordcloud = WordCloud(width=4200, height=3600,

? ? ? ? ? ? ? ? ? ? ? ? ? ? background_color= 'white',#背景顏色

? ? ? ? ? ? ? ? ? ? ? ? ? ? mask=backgroud, #寫字用的背景圖,從圖片中提取顏色

? ? ? ? ? ? ? ? ? ? ? ? ? ? max_words=500, #最大詞語數(shù)

? ? ? ? ? ? ? ? ? ? ? ? ? ? stopwords=STOPWORDS,#停止的默認(rèn)詞語

? ? ? ? ? ? ? ? ? ? ? ? ? ? font_path='simkai.ttf',#源碼自帶字體

? ? ? ? ? ? ? ? ? ? ? ? ? ? max_font_size=100,#最大字體尺寸

? ? ? ? ? ? ? ? ? ? ? ? ? ? random_state=50,#隨機角度

? ? ? ? ? ? ? ? ? ? ? ? ? ? scale=1).generate(space_list) #生成詞云

? ? image_color = ImageColorGenerator(backgroud)#生成詞云的顏色

? ? plt.imshow(mywordcloud) #顯示詞云

? ? plt.axis('off') #關(guān)閉坐標(biāo)(x,y軸)

? ? plt.savefig('output.png') #保存圖片

? ? plt.show()#顯示

def main():

? ? ciyun()

if __name__ == '__main__':

? ? main()


還是很順利蒂破,沒太多坑馏谨,文章放在input.txt里面,結(jié)果輸出output.png附迷,這段代碼的主要流程是惧互,先導(dǎo)入input.txt,然后用jieba分詞喇伯,提取首500個熱詞喊儡,然后調(diào)用mywordcloud 展示并輸出。下圖是輸出例子稻据。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末艾猜,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌箩朴,老刑警劉巖岗喉,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異炸庞,居然都是意外死亡钱床,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門埠居,熙熙樓的掌柜王于貴愁眉苦臉地迎上來查牌,“玉大人,你說我怎么就攤上這事滥壕≈窖眨” “怎么了?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵绎橘,是天一觀的道長胁孙。 經(jīng)常有香客問我,道長称鳞,這世上最難降的妖魔是什么涮较? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮冈止,結(jié)果婚禮上狂票,老公的妹妹穿的比我還像新娘。我一直安慰自己熙暴,他們只是感情好闺属,可當(dāng)我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著周霉,像睡著了一般掂器。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上诗眨,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天唉匾,我揣著相機與錄音,去河邊找鬼匠楚。 笑死巍膘,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的芋簿。 我是一名探鬼主播峡懈,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼与斤!你這毒婦竟也來了肪康?” 一聲冷哼從身側(cè)響起荚恶,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎磷支,沒想到半個月后谒撼,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡雾狈,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年廓潜,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片善榛。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡辩蛋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出移盆,到底是詐尸還是另有隱情悼院,我是刑警寧澤,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布咒循,位于F島的核電站据途,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏剑鞍。R本人自食惡果不足惜昨凡,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一爽醋、第九天 我趴在偏房一處隱蔽的房頂上張望蚁署。 院中可真熱鬧,春花似錦蚂四、人聲如沸光戈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽久妆。三九已至,卻和暖如春跷睦,著一層夾襖步出監(jiān)牢的瞬間筷弦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工抑诸, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留烂琴,地道東北人。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓蜕乡,卻偏偏與公主長得像奸绷,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子层玲,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,933評論 2 355