一俗冻、數(shù)據(jù)獲取
就用之前 用Python爬取美團(tuán)外賣APP評(píng)論得到的文本
f=open("meituan_result.text",'r',encoding='utf-8').read()
二怨咪、數(shù)據(jù)清洗
import re
pattern = re.compile('[\u4e00-\u9fa5]+',re.S) #去除原始數(shù)據(jù)中的標(biāo)點(diǎn)符號(hào)、字母和特殊字符
a = re.findall(pattern,f)
f=str(a) #a是列表茵臭,我們要把他轉(zhuǎn)化成字符串
四、數(shù)據(jù)結(jié)構(gòu)化處理
from wordcloud import WordCloud,ImageColorGenerator
import matplotlib.pyplot as plt
from os import path
import jieba
g= " ".join(jieba.cut(f))
back_coloring = imread(path.join("logo.jpg")) #選取背景圖片
word_cloud = WordCloud(font_path='simsun.ttc', #設(shè)置字體
mask=back_coloring, #設(shè)置背景圖片
background_color="white", #背景顏色
max_words=900, #詞云顯示的最大詞數(shù)
max_font_size=70, #字體最大值
random_state=42)
my_wordcloud = word_cloud.generate(g) #生成詞云圖
image_colors = ImageColorGenerator(back_coloring) # ?從背景圖片生成顏色值
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
word_cloud.to_file(path.join( "meituan.png")) # 保存圖片
詞云圖.png