深陷抄襲之名、訴訟糾紛的《愛情公寓》終于上映了弄诲。
情懷粉們的力量不容小覷愚战,截止到撰稿,《愛情公寓》票房已經(jīng)突破 3.72 億大關(guān)齐遵,穩(wěn)坐票房冠軍的寶座寂玲,院線排片占比高達 40.0%。
和超高票房背道而馳的梗摇,是各大社交平臺上一邊倒的差評拓哟。豆瓣萬人打分,九成觀眾果斷打了一星伶授,只無奈豆瓣沒有零星選項彰檬。
不知道有多少像我這樣的情懷粉絲們伸刃,滿懷期待地買了電影票,走進電影院逢倍,卻發(fā)現(xiàn)是交了智商稅捧颅。
豆瓣短評區(qū)里,觀眾們的狀態(tài)已經(jīng)出離憤怒较雕,近乎暴走的狀態(tài)碉哑。有人揭露電影掛羊頭賣狗肉,電影內(nèi)容和《愛情公寓》故事主線毫無關(guān)系亮蒋,是山寨電影扣典、詐騙電影、電影中的拼多多慎玖。
為了燃解我心頭之恨贮尖,筆者將會跟你一起用貓眼上萬條評論數(shù)據(jù)來分析,網(wǎng)友對這部電影的反響是否爛到刷新國產(chǎn)片不要臉的下限趁怔?
還是老規(guī)矩湿硝,整體思路將會從數(shù)據(jù)獲取、數(shù)據(jù)清洗润努、數(shù)據(jù)可視化三部曲來進行:
01:數(shù)據(jù)獲取清洗
整體思路與之前獲取《邪不壓正》評論一樣:
具體代碼如下:关斜、
import requests
import time
import random
import json
#獲取每一頁數(shù)據(jù)
def get_one_page(url):
response = requests.get(url=url)
if response.status_code == 200:
return response.text
return None
#解析每一頁數(shù)據(jù)
def parse_one_page(html):
data = json.loads(html)['cmts']#獲取評論內(nèi)容
for item in data:
yield{
'date':item['time'].split(' ')[0],
'nickname':item['nickName'],
'city':item['cityName'],
'rate':item['score'],
'conment':item['content']
}
#保存到文本文檔中
def save_to_txt():
for i in range(1,1001):
print("開始保存第%d頁" % i)
url = 'http://m.maoyan.com/mmdb/comments/movie/1175253.json?_v_=yes&offset=' + str(i)
html = get_one_page(url)
for item in parse_one_page(html):
with open('愛情公寓.txt','a',encoding='utf-8') as f:
f.write(item['date'] + ','+item['nickname'] +','+item['city'] +','
+str(item['rate']) +',' +item['conment']+' ')
#time.sleep(random.randint(1,100)/20)
time.sleep(2)
#去重重復的評論內(nèi)容
def delete_repeat(old,new):
oldfile = open(old,'r',encoding='utf-8')
newfile = open(new,'w',encoding='utf-8')
content_list = oldfile.readlines() #獲取所有評論數(shù)據(jù)集
content_alread = [] #存儲去重后的評論數(shù)據(jù)集
for line in content_list:
if line not in content_alread:
newfile.write(line+' ')
content_alread.append(line)
if __name__ == '__main__':
save_to_txt()
delete_repeat(r'愛情公寓_old.txt',r'愛情公寓_new.txt')
02:數(shù)據(jù)分析可視化
我們將用 Python 的兩個模塊 Pandas 與 pyecharts:
pyecharts 是一個用于生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數(shù)據(jù)可視化 JS 庫铺浇。用 Echarts 生成的圖可視化效果非常棒痢畜,pyecharts 是為了與 Python 進行對接,方便在 Python 中直接使用數(shù)據(jù)生成圖鳍侣。(詳情請看:http://pyecharts.org/)
Pandas 是基于 NumPy 的一個非常好用的庫丁稀,正如名字一樣,人見人愛倚聚。之所以如此二驰,就在于不論是讀取、處理數(shù)據(jù)秉沼,用它都非常簡單桶雀。Pandas 有兩種自己獨有的基本數(shù)據(jù)結(jié)構(gòu)。要使用 pandas唬复,首先就得熟悉它的兩個主要數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame矗积。其中 Series 的性質(zhì)和 Python 中原生的 dict 差不多,一個 key 對應一個 vaule敞咧,而且 key 必須是唯一的棘捣;DataFrame(以下簡稱 df)的性質(zhì)則和 SQL 中的 table 差不多(詳情請看:http://pandas.pydata.org/)。
真可謂電影界的“拼多多”休建。
我們把城市打分情況投射到地圖中乍恐,可以看出:
在熱力圖中评疗,白銀、綿陽茵烈、遵義等三四線城市熱度相對高點百匆,也可看出隨著人們消費水平的升級,去電影院看電影是娛樂首選呜投。在滿足普通人民精神娛樂需求方面加匈,但也不能掛羊頭賣狗肉,電影內(nèi)容和《愛情公寓》故事主線毫無關(guān)系仑荐。這難道不是電影界的拼多多么雕拼?
在學習中有迷茫不知如何學習的朋友小編推薦一個學Python的學習裙[663033228]無論你是大牛還是小白,是想轉(zhuǎn)行還是想入行都可以來了解一起進步一起學習粘招!裙內(nèi)有開發(fā)工具啥寇,很多干貨和技術(shù)資料分享!
評分清一色洒扎,均為 3 星級
圖為主要城市的評論數(shù)量與打分情況:
由圖中可看出辑甜,各大城市觀眾打分均為 3 星級左右,這與貓眼評分 6.6 基本吻合逊笆;打出最高分與最低分分別是哈爾濱與中山栈戳。同時也能看出岂傲,一二線城市觀眾對此很失望难裆。
有些人的良心被狗吃了?
看過了評分镊掖,我們看一下評論生成的詞云圖:
由詞云圖可以看出乃戈,愛情公寓、盜墓電影二詞顯目在列亩进,整部電影就 30 秒和《愛情公寓》有關(guān)症虑,所謂的集齊原班人馬回歸也只是個幌子,《愛情公寓》大電影完全是一部盜墓筆記归薛,真正毀了《愛情公寓》這個 IP谍憔,也毀了《盜墓筆記》這個 IP。
但即便是在這樣觀眾一致認為徹底失望的情況之下主籍,依然有一波忠實的『粉絲們』堅守陣地习贫。他們的手中依然緊握著情懷牌,打分也是一水的五星千元。
對于這些水軍以及說《愛情公寓》好看的人苫昌,大家可以絕交了;作為觀眾幸海,任何的關(guān)注都是助長《愛情公寓》的囂張氣焰祟身,我們也有責任自發(fā)抵制爛片奥务,決不讓詐騙電影多賺一分錢。
以上信息具體代碼為:
from wordcloud import WordCloud,STOPWORDS
import pandas as pd
import jieba
import matplotlib.pyplot as plt
#import seaborn as sns
from pyecharts import Geo,Style,Line,Bar,Overlap
f = open('愛情公寓_new.txt',encoding='utf-8')
data = pd.read_csv(f,sep=',',header=None,encoding='utf-8',names=['date','nickname','city','rate','comment'])
city = data.groupby(['city'])
rate_group = city['rate']
city_com = city['rate'].agg(['mean','count'])
#print(city_com)
city_com.reset_index(inplace=True)
city_com['mean'] = round(city_com['mean'],2)
#熱力圖分析
data_map = [(city_com['city'][i],city_com['count'][i]) for i in range(0,city_com.shape[0])]
#print(data_map)
style = Style(title_color="#fff",title_pos = "center",
width = 1200,height = 600,background_color = "#404a59")
geo = Geo("《愛情公墓》粉絲人群地理位置","數(shù)據(jù)來源:戀習Python",**style.init_style)
while True:
try:
attr,val = geo.cast(data_map)
geo.add("",attr,val,visual_range=[0,20],
visual_text_color="#fff",symbol_size=20,
is_visualmap=True,is_piecewise=True,
visual_split_number=4)
except ValueError as e:
e = str(e)
e = e.split("No coordinate is specified for ")[1]#獲取不支持的城市名
for i in range(0,len(data_map)):
if e in data_map[i]:
data_map.pop[i]
break
else:
break
geo.render('愛情公墓.html')
#折線+柱圖分析
city_main = city_com.sort_values('count',ascending=False)[0:20]
#print(city_main)
attr = city_main['city']
v1 = city_main['count']
v2 = city_main['mean']
#print(attr,v1,v2)
line = Line("主要城市評分")
line.add("城市",attr,v2,is_stack=True,xaxis_rotate=30,yaxix_min=4.2,
mark_point=['min','max'],xaxis_interval=0,line_color='lightblue',
line_width=4,mark_point_textcolor='black',mark_point_color='lightblue',
is_splitline_show=False)
bar = Bar("主要城市評論數(shù)")
bar.add("城市",attr,v1,is_stack=True,xaxis_rotate=30,yaxix_min=4.2,
xaxis_interval=0,is_splitline_show=False)
overlap = Overlap()
overlap.add(bar)
overlap.add(line,yaxis_index=1,is_add_yaxis=True)
overlap.render('主要城市評論數(shù)_平均分.html')
#詞云分析
#分詞
comment = jieba.cut(str(data['comment']),cut_all=False)
wl_space_split = " ".join(comment)
#導入背景圖
backgroud_Image = plt.imread('lan.jpg')
stopwords = STOPWORDS.copy()
#print("STOPWORDS.copy()",help(STOPWORDS.copy()))
wc = WordCloud(width=1024,height=768,background_color='white',
mask=backgroud_Image,font_path="C:simhei.ttf",
stopwords=stopwords,max_font_size=400,
random_state=50)
wc.generate_from_text(wl_space_split)
plt.imshow(wc)
plt.axis('off')#不顯示坐標軸
plt.show()
wc.to_file(r'laji.jpg')
最后袜硫,作為《愛情公寓》之前的鐵粉氯葬,只想評價一個字:爛。
爛在哪里父款?并不是爛在盜墓劇情溢谤,也不爛在演員特效。爛在它消費粉絲熱情和愛戴憨攒,玩弄觀眾世杀。
2.4 分我想更多是對韋正和汪遠的評價。為了賺錢肝集,上映前吹噓夸大瞻坝,不設(shè)點映;為了賺錢杏瞻,宣傳片預告片 MV 大量回憶殺所刀,關(guān)谷展博無限出鏡;為了賺錢捞挥,藏著掖著不見光不露臉浮创,以 9.9 分的保票“催”著粉絲買預售票。上映第一天 3 億砌函。賺的盆滿缽滿斩披。
反過來看觀眾,哭著臉走出影院的讹俊,多數(shù)是被結(jié)尾彩蛋感動垦沉,彩蛋才真正傳達了“愛情公寓精神”。主演們對著鏡頭的自白仍劈,說出了我們最想聽到的幾段話厕倍,才真正喚起了我們腦海里對愛情公寓的美好回憶。
電影結(jié)尾的彩蛋贩疙,小姨媽呼喚關(guān)谷的那一段讹弯,算是愛情公寓最感人的地方了吧。
但是这溅,一個彩蛋真的配 3 億票房嗎组民?
用近乎做作的猶抱琵琶半遮面的營銷手段,讓大家對它憧憬芍躏,希望它能給我們的記憶畫上一個圓滿的句號邪乍,可卻用一部近乎玩笑的垃圾影片嘲笑我們對它的喜愛。
打著情懷的旗號,將一個個劇版粉絲騙進電影院庇楞,將電影票錢裝進自己的腰包榜配。
這就是它最爛的地方。