幾部電影的詞云

前段時(shí)間食拜,我們爬取了幾部熱門(mén)的電影,分別是《三生三世》勉吻,《戰(zhàn)狼》,《二十二》旅赢,我們今天 就以這幾部為例齿桃,進(jìn)行一個(gè)簡(jiǎn)單的詞云的制作。

我們主要以《二十二》為例煮盼,來(lái)制作一個(gè)評(píng)論的詞云短纵。

首先需要安裝幾個(gè)必要的工具庫(kù):

  • Pandas 用來(lái)實(shí)現(xiàn)文件讀取和存儲(chǔ),以及必要的數(shù)據(jù)轉(zhuǎn)換僵控。
  • jieba 一個(gè)強(qiáng)大的分詞工具香到,用來(lái)實(shí)現(xiàn)分詞,也是我們實(shí)現(xiàn)詞云的一個(gè)最重要的工具报破。
  • wordcloud 詞云工具悠就,用來(lái)實(shí)現(xiàn)最終的詞云的制作,也是必要的工具充易。

下面我們就開(kāi)始梗脾。

首先需要導(dǎo)入相應(yīng)的庫(kù),并讀取我們下載的csv文件盹靴。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df_ershier = pd.read_csv('ershier.csv', encoding='utf-8')
df_ershier.comment.fillna(' ')
df_ershier.comment = df_ershier.comment.astype(str)

下面就是實(shí)現(xiàn)詞云的主要步驟炸茧。

import jieba
from wordcloud import WordCloud
import PIL

result = []  # 用來(lái)存放切分的詞

def parse(raw_text):
    for word in jieba.cut(raw_text):  # raw_text是字符串,也就是我們獲取到的全部評(píng)論信息
        if len(word) > 1:
            result.append(word)
            

def wordcloudplot(data, file_name):   # data 是以空格分隔的字符串        
    path = 'msyh.ttf'
    alice_mask = np.array(PIL.Image.open('yuan.jpg'))
    stopwords = ['nan', '就是', '還是', '但是', '沒(méi)有','覺(jué)得', '三生三世', '三生', '三世',
                '還有', '演員', '怎么', '這么', '電影', '這部']

    wordcloud = WordCloud(font_path=path, background_color="white",
                          margin=5,
                          width=1000, height=800,
                          mask=alice_mask, max_words=1000, max_font_size=100,
                          stopwords = stopwords, random_state=0)
                    
    wordcloud = wordcloud.generate(data)
    wordcloud.to_file(file_name)
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()

下面是執(zhí)行部分

raw_text = ' '.join(list(df_ershier.comment))
parse(raw_text)
text = ' '.join(result)
wordcloudplot(text, 'ershier_.jpg')

最后生成如下的詞云

image

同樣的道理稿静,生成如下的《戰(zhàn)狼》梭冠,《三生三世》

image
image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市改备,隨后出現(xiàn)的幾起案子控漠,更是在濱河造成了極大的恐慌,老刑警劉巖悬钳,帶你破解...
    沈念sama閱讀 217,084評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件润脸,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡他去,警方通過(guò)查閱死者的電腦和手機(jī)毙驯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)灾测,“玉大人爆价,你說(shuō)我怎么就攤上這事垦巴。” “怎么了铭段?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,450評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵骤宣,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我序愚,道長(zhǎng)憔披,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,322評(píng)論 1 293
  • 正文 為了忘掉前任爸吮,我火速辦了婚禮芬膝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘形娇。我一直安慰自己锰霜,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布桐早。 她就那樣靜靜地躺著癣缅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪哄酝。 梳的紋絲不亂的頭發(fā)上友存,一...
    開(kāi)封第一講書(shū)人閱讀 51,274評(píng)論 1 300
  • 那天,我揣著相機(jī)與錄音陶衅,去河邊找鬼爬立。 笑死,一個(gè)胖子當(dāng)著我的面吹牛万哪,可吹牛的內(nèi)容都是我干的侠驯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼奕巍,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼吟策!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起的止,我...
    開(kāi)封第一講書(shū)人閱讀 38,980評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤檩坚,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后诅福,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體匾委,經(jīng)...
    沈念sama閱讀 45,414評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評(píng)論 3 334
  • 正文 我和宋清朗相戀三年氓润,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了赂乐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,773評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡咖气,死狀恐怖挨措,靈堂內(nèi)的尸體忽然破棺而出魏蔗,到底是詐尸還是另有隱情是嗜,我是刑警寧澤尾膊,帶...
    沈念sama閱讀 35,470評(píng)論 5 344
  • 正文 年R本政府宣布瞻凤,位于F島的核電站,受9級(jí)特大地震影響觉既,放射性物質(zhì)發(fā)生泄漏惧盹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評(píng)論 3 327
  • 文/蒙蒙 一瞪讼、第九天 我趴在偏房一處隱蔽的房頂上張望钧椰。 院中可真熱鬧,春花似錦尝艘、人聲如沸演侯。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,713評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至悬赏,卻和暖如春狡汉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背闽颇。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,852評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工盾戴, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人兵多。 一個(gè)月前我還...
    沈念sama閱讀 47,865評(píng)論 2 370
  • 正文 我出身青樓尖啡,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親剩膘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子衅斩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,095評(píng)論 25 707
  • 第一次見(jiàn)你 你只是站在花下 便觸動(dòng)了我的心弦 簡(jiǎn)單的歸途 因有你的陪伴 而變得不凡 你是一場(chǎng)風(fēng) 吹亂了我發(fā)梢 從此...
    白箋閱讀 256評(píng)論 5 5
  • 修羅星之阿爾法
    土網(wǎng)閱讀 136評(píng)論 0 0
  • 當(dāng)我以為寒冬凄冷時(shí), 不覺(jué)春天已悄然走近怠褐。 漫步鄉(xiāng)野小徑畏梆, 一株怒放的李子花映入眼簾, 或許不久后凋落奈懒,飄零奠涌,碾作...
    半遮面閱讀 356評(píng)論 3 1
  • 常見(jiàn)的淡入淡出動(dòng)畫(huà)。 1.創(chuàng)建baseView(子視圖)磷杏,位置設(shè)置為屏幕下邊 2.布局完成后溜畅,調(diào)用show方法 1...
    秋S寂S閱讀 519評(píng)論 0 0