【技術(shù)流吃瓜】python可視化大屏輿情分析“張?zhí)鞇邸笆录W(wǎng)友評論

一、事件背景

大家好舶斧，我是馬哥python說。

演員張?zhí)鞇塾?022.8.25號在網(wǎng)上爆出一段音頻 "慣犯察皇，希望所以女孩擦亮眼睛茴厉。"

image.png

至今已有2.5億次觀看量，瞬間沖上熱搜什荣。

二呀忧、微熱點分析

以下數(shù)據(jù)來源：微熱點

從輿情分析網(wǎng)站上來看，從熱度指數(shù)的變化趨勢來看溃睹，"張?zhí)鞇?的熱度在08月25日22時達(dá)到了92.56的峰值而账。

張?zhí)鞇?熱度指數(shù)趨勢

"張?zhí)鞇?全網(wǎng)熱度：

張?zhí)鞇?熱度分析

"張?zhí)鞇?網(wǎng)絡(luò)媒體的評價指標(biāo)：

張?zhí)鞇?媒體分析

"張?zhí)鞇?關(guān)鍵詞分析：

張?zhí)鞇?關(guān)鍵詞分析

"張?zhí)鞇?地域分析：

張?zhí)鞇?地域分析

二、自開發(fā)Python輿情分析

2.1 Python爬蟲

從博文URL地址中找出id因篇。

目標(biāo)鏈接地址的id參數(shù)值就是id：

原文查看

把id帶入到我的Python爬蟲代碼中泞辐，下面展示部分爬蟲代碼。

關(guān)鍵邏輯竞滓，就是max_id的處理：

原文查看

如果是第一頁咐吼，不用傳max_id參數(shù)。

如果非第一頁商佑，需要傳max_id參數(shù)锯茄，它的值來自于上一頁的r.json()['data']['max_id']

首先，向頁面發(fā)送請求：

r = requests.get(url, headers=headers)  # 發(fā)送請求
print(r.status_code)  # 查看響應(yīng)碼
print(r.json())  # 查看響應(yīng)內(nèi)容

下面，是解析數(shù)據(jù)的處理邏輯：

datas = r.json()['data']['data']
for data in datas:
    page_list.append(page)
    id_list.append(data['id'])
    dr = re.compile(r'<[^>]+>', re.S)  # 用正則表達(dá)式清洗評論數(shù)據(jù)
    text2 = dr.sub('', data['text'])
    text_list.append(text2)  # 評論內(nèi)容
    time_list.append(trans_time(v_str=data['created_at']))  # 評論時間
    like_count_list.append(data['like_count'])  # 評論點贊數(shù)
    source_list.append(data['source'])  # 評論者IP歸屬地
    user_name_list.append(data['user']['screen_name'])  # 評論者姓名
    user_id_list.append(data['user']['id'])  # 評論者id
    user_gender_list.append(tran_gender(data['user']['gender']))  # 評論者性別
    follow_count_list.append(data['user']['follow_count'])  # 評論者關(guān)注數(shù)
    followers_count_list.append(data['user']['followers_count'])  # 評論者粉絲數(shù)

最后肌幽，是保存數(shù)據(jù)的處理邏輯：

df = pd.DataFrame(
    {
        'id': [weibo_id] * len(time_list),
        '評論頁碼': page_list,
        '評論id': id_list,
        '評論時間': time_list,
        '評論點贊數(shù)': like_count_list,
        '評論者IP歸屬地': source_list,
        '評論者姓名': user_name_list,
        '評論者id': user_id_list,
        '評論者性別': user_gender_list,
        '評論者關(guān)注數(shù)': follow_count_list,
        '評論者粉絲數(shù)': followers_count_list,
        '評論內(nèi)容': text_list,
    }
)
if os.path.exists(v_comment_file):  # 如果文件存在晚碾，不再設(shè)置表頭
    header = False
else:  # 否則，設(shè)置csv文件表頭
    header = True
# 保存csv文件
df.to_csv(v_comment_file, mode='a+', index=False, header=header, encoding='utf_8_sig')
print('結(jié)果保存成功:{}'.format(v_comment_file))

篇幅有限喂急，請求頭格嘁、cookie、循環(huán)頁碼廊移、數(shù)據(jù)清洗等其他細(xì)節(jié)不再贅述糕簿。

看下最終數(shù)據(jù)：

爬取結(jié)果

2.2 可視化大屏

首先，看下最終大屏交互效果：

這個大屏狡孔，包含了5個圖表：

大標(biāo)題-Line
詞云圖-Wordcloud
條形圖-Bar
餅圖-Pie
地圖-Map

下面懂诗，依次講解代碼實現(xiàn)。

2.2.1 大標(biāo)題

由于pyecharts組件沒有專門用作標(biāo)題的圖表苗膝，我決定靈活運用Line組件實現(xiàn)大標(biāo)題响禽。

line3 = (
    Line(init_opts=opts.InitOpts(width="1000px",  # 寬度
                                 height="625px",  # 高度
                                 bg_color={"type": "pattern", "image": JsCode("img"),
                                           "repeat": "repeat", }))  # 設(shè)置背景圖片
        .add_xaxis([None])  # 插入空數(shù)據(jù)
        .add_yaxis("", [None])  # 插入空數(shù)據(jù)
        .set_global_opts(
        title_opts=opts.TitleOpts(title=v_title,
                                  pos_left='center',
                                  title_textstyle_opts=opts.TextStyleOpts(font_size=45,
                                                                          color='#51c2d5',
                                                                          align='left'),
                                  pos_top='top'),
        yaxis_opts=opts.AxisOpts(is_show=False),  # 不顯示y軸
        xaxis_opts=opts.AxisOpts(is_show=False))  # 不顯示x軸
)
# 設(shè)置背景圖片
line3.add_js_funcs(
    """
    var img = new Image(); img.src = '大屏背景.jpg';
    """
)
line3.render('大標(biāo)題.html')
print('頁面渲染完畢:大標(biāo)題.html')

這里最關(guān)鍵的邏輯，就是背景圖片的處理荚醒。我找了一個張?zhí)鞇鄣膱D片：

大屏背景

然后用add_js_funcs代碼把此圖片設(shè)置為整個大屏的背景圖芋类。

大標(biāo)題效果：

大標(biāo)題

2.2.2 詞云圖

首先，把評論數(shù)據(jù)清洗出來：

cmt_list = df['評論內(nèi)容'].values.tolist()  # 轉(zhuǎn)換成列表
cmt_list = [str(i) for i in cmt_list]  # 數(shù)據(jù)清洗
cmt_str = ' '.join(cmt_list)  # 轉(zhuǎn)換成字符串

然后界阁，將清洗后的數(shù)據(jù)侯繁，帶入詞云圖函數(shù)，核心代碼：

wc = WordCloud(init_opts=opts.InitOpts(width=chart_width, height=chart_height, theme=theme_config, chart_id='wc1'))
wc.add(series_name="詞匯",
       data_pair=data,
       word_gap=1,
       word_size_range=[5, 30],
       mask_image='張?zhí)鞇郾尘皥D.png',
       )  # 增加數(shù)據(jù)
wc.set_global_opts(
    title_opts=opts.TitleOpts(pos_left='center',
                              title="張?zhí)鞇墼u論-詞云圖",
                              title_textstyle_opts=opts.TextStyleOpts(font_size=20)  # 設(shè)置標(biāo)題
                              ),
    tooltip_opts=opts.TooltipOpts(is_show=True),  # 不顯示工具箱
)
wc.render('張?zhí)鞇墼~云圖.html')  # 生成html文件
print('渲染完成:' + '張?zhí)鞇墼~云圖.html')

看下效果：

詞云圖

2.2.3 條形圖

針對評論數(shù)據(jù)的TOP10高頻詞泡躯，繪制出條形圖贮竟。
核心代碼：

bar = Bar(
    init_opts=opts.InitOpts(theme=theme_config, width=chart_width, height=chart_height,
                            chart_id='bar_cmt'))  # 初始化條形圖
bar.add_xaxis(x_data)  # 增加x軸數(shù)據(jù)
bar.add_yaxis("數(shù)量", y_data)  # 增加y軸數(shù)據(jù)
bar.reversal_axis()  # 設(shè)置水平方向
bar.set_series_opts(label_opts=opts.LabelOpts(position="right"))  # Label出現(xiàn)位置
bar.set_global_opts(
    legend_opts=opts.LegendOpts(pos_left='right'),
    title_opts=opts.TitleOpts(title=v_title, pos_left='center'),  # 標(biāo)題
    toolbox_opts=opts.ToolboxOpts(is_show=False, ),  # 不顯示工具箱
    xaxis_opts=opts.AxisOpts(name="數(shù)量", axislabel_opts={"rotate": 0}),  # x軸名稱
    yaxis_opts=opts.AxisOpts(name="關(guān)鍵詞",
                             axislabel_opts=opts.LabelOpts(font_size=9, rotate=0),  # y軸名稱
                             ))
bar.render(v_title + ".html")  # 生成html文件
print('渲染完成:' + v_title + '.html')

看下效果：

條形圖

2.2.4 餅圖（玫瑰圖）

首先，針對評論數(shù)據(jù)较剃，用snownlp庫做情感分析判定咕别。

for comment in v_cmt_list:
    tag = ''
    sentiments_score = SnowNLP(comment).sentiments
    if sentiments_score < 0.4:  # 情感分小于0.4判定為消極
        tag = '消極'
        neg_count += 1
    elif 0.4 <= sentiments_score <= 0.6:  # 情感分在[0.4,0.6]直接判定為中性
        tag = '中性'
        mid_count += 1
    else:  # 情感分大于0.6判定為積極
        tag = '積極'
        pos_count += 1
    score_list.append(sentiments_score)  # 得分值
    tag_list.append(tag)  # 判定結(jié)果
df['情感得分'] = score_list
df['分析結(jié)果'] = tag_list

然后，將統(tǒng)計數(shù)據(jù)帶入餅圖函數(shù)写穴，部分核心代碼：

# 畫餅圖
pie = (
    Pie(init_opts=opts.InitOpts(theme=theme_config, width=chart_width, height=chart_width, chart_id='pie1'))
        .add(series_name="情感分布",  # 系列名稱
             data_pair=[['正能量', pos_count],  # 添加數(shù)據(jù)
                        ['中性', mid_count],
                        ['負(fù)能量', neg_count]],
             rosetype="radius",  # 是否展示成南丁格爾圖
             radius=["30%", "55%"],  # 扇區(qū)圓心角展現(xiàn)數(shù)據(jù)的百分比惰拱，半徑展現(xiàn)數(shù)據(jù)的大小
             )  # 加入數(shù)據(jù)
        .set_global_opts(  # 全局設(shè)置項
        title_opts=opts.TitleOpts(title=v_title, pos_left='center'),  # 標(biāo)題
        legend_opts=opts.LegendOpts(pos_left='right', orient='vertical')  # 圖例設(shè)置項,靠右,豎向排列
    )
        .set_series_opts(label_opts=opts.LabelOpts(formatter=": {c}")))  # 樣式設(shè)置項
pie.render(v_title + '.html')  # 生成html文件
print('渲染完成:' + v_title + '.html')

看下效果：

餅圖

2.2.5 地圖

把評論者的IP歸屬地統(tǒng)計求和啊送，求和后的總數(shù)分布在地圖上偿短。

df['評論者IP歸屬地'] = df['評論者IP歸屬地'].astype(str).str.replace('來自', '')  # 數(shù)據(jù)清洗
loc_grp = df.groupby('評論者IP歸屬地').count()['評論內(nèi)容']
data_list = list(zip(loc_grp.index.tolist(), loc_grp.values.tolist()))

數(shù)據(jù)準(zhǔn)備好之后，帶入地圖函數(shù)馋没，部分核心代碼：

f_map = (
    Map(init_opts=opts.InitOpts(width=chart_width,
                                height=chart_height,
                                theme=theme_config,
                                page_title=v_title,
                                chart_id='map1',
                                bg_color=None))
        .add(series_name="評論數(shù)量",
             data_pair=v_data_list,
             maptype="china",  # 地圖類型
             is_map_symbol_show=False)
        .set_global_opts(
        title_opts=opts.TitleOpts(title=v_title,
                                  pos_left="center", ),
        legend_opts=opts.LegendOpts(  # 設(shè)置圖例
            is_show=True, pos_top="40px", pos_right="30px"),
        visualmap_opts=opts.VisualMapOpts(  # 設(shè)置視覺映射
            is_piecewise=True, range_text=['高', '低'], pieces=[  # 分段顯示
                # {"min": 10000, "color": "#751d0d"},
                {"min": 121, "max": 150, "color": "#37561a"},
                {"min": 91, "max": 120, "color": "#006400"},
                {"min": 61, "max": 90, "color": "#4d9116"},
                {"min": 31, "max": 60, "color": "#77bb40"},
                {"min": 11, "max": 30, "color": "#b8db9b"},
                {"min": 0, "max": 10, "color": "#e5edd6"}
            ]),
    )
        .set_series_opts(label_opts=opts.LabelOpts(is_show=True, font_size=8, ),
                         markpoint_opts=opts.MarkPointOpts(
                             symbol_size=[90, 90], symbol='circle'),
                         effect_opts=opts.EffectOpts(is_show='True', )
                         )
)
f_map.render(v_title + '.html')
print('渲染完成:' + v_title + '.html')

看下效果：

地圖

三昔逗、演示視頻

效果演示：
https://www.zhihu.com/zvideo/1546516025184866304

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末篷朵，一起剝皮案震驚了整個濱河市勾怒，隨后出現(xiàn)的幾起案子婆排，更是在濱河造成了極大的恐慌，老刑警劉巖笔链，帶你破解...
沈念sama閱讀 218,941評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件段只，死亡現(xiàn)場離奇詭異，居然都是意外死亡卡乾，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,397評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門缚够，熙熙樓的掌柜王于貴愁眉苦臉地迎上來幔妨，“玉大人，你說我怎么就攤上這事谍椅∥蟊ぃ” “怎么了？”我有些...
開封第一講書人閱讀 165,345評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵雏吭，是天一觀的道長锁施。經(jīng)常有香客問我，道長杖们，這世上最難降的妖魔是什么悉抵？我笑而不...
開封第一講書人閱讀 58,851評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮摘完，結(jié)果婚禮上姥饰，老公的妹妹穿的比我還像新娘。我一直安慰自己孝治，他們只是感情好列粪，可當(dāng)我...
茶點故事閱讀 67,868評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著谈飒，像睡著了一般岂座。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上杭措，一...
開封第一講書人閱讀 51,688評論 1贊 305
城市分裂傳說
那天费什，我揣著相機(jī)與錄音，去河邊找鬼手素。笑死吕喘，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的刑桑。我是一名探鬼主播氯质，決...
沈念sama閱讀 40,414評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼祠斧！你這毒婦竟也來了闻察？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,319評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎辕漂，沒想到半個月后呢灶，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,775評論 1贊 315
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡钉嘹，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,945評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年鸯乃，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片跋涣。...
茶點故事閱讀 40,096評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡缨睡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出陈辱，到底是詐尸還是另有隱情奖年，我是刑警寧澤，帶...
沈念sama閱讀 35,789評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布沛贪，位于F島的核電站陋守，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏利赋。R本人自食惡果不足惜水评，卻給世界環(huán)境...
茶點故事閱讀 41,437評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望媚送。院中可真熱鬧之碗，春花似錦、人聲如沸季希。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,993評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽式塌。三九已至博敬，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間峰尝，已是汗流浹背偏窝。一陣腳步聲響...
開封第一講書人閱讀 33,107評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留武学，地道東北人祭往。一個月前我還...
沈念sama閱讀 48,308評論 3贊 372
代替公主和親
正文我出身青樓，卻偏偏與公主長得像火窒，于是被迫代替她去往敵國和親硼补。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,037評論 2贊 355

【技術(shù)流吃瓜】python可視化大屏輿情分析“張?zhí)鞇邸笆录W(wǎng)友評論

一、事件背景

二呀忧、微熱點分析

二、自開發(fā)Python輿情分析

2.1 Python爬蟲

2.2 可視化大屏

2.2.1 大標(biāo)題

2.2.2 詞云圖

2.2.3 條形圖

2.2.4 餅圖（玫瑰圖）

2.2.5 地圖

三昔逗、演示視頻

推薦閱讀更多精彩內(nèi)容