豆瓣電影數(shù)據(jù)分析

概述之前(可以無視)

這篇報(bào)告是我轉(zhuǎn)行數(shù)據(jù)分析后的第一篇報(bào)告,當(dāng)時(shí)學(xué)完了Python淹冰,SQL,BI以為再做幾個(gè)項(xiàng)目就能找工作了巨柒,事實(shí)上……分析思維樱拴、業(yè)務(wù),這兩者遠(yuǎn)比工具重要的多洋满。一個(gè)多月后回過頭來看晶乔,這篇報(bào)告雖然寫得有模有樣,但和數(shù)據(jù)分析報(bào)告還是有挺大差別的牺勾,主要原因在于:a.只是針對豆瓣電影數(shù)據(jù)分析太過寬泛了正罢,具體關(guān)鍵指標(biāo)到底是哪些呢?驻民;b.沒有一個(gè)確切有效的分析模型/框架翻具,會有種東一塊西一塊的拼接感。
即便有著這些缺點(diǎn)回还,我還是想把它掛上來裆泳,主要是因?yàn)椋?.當(dāng)做Pandas與爬蟲(Selenium+Request)練手,總得留下些證明柠硕;2.以豆瓣電影進(jìn)行分析確實(shí)很難找到一條業(yè)務(wù)邏輯線支撐工禾,總體上還是描述統(tǒng)計(jì)為主;3.比起網(wǎng)上能搜到的其他豆瓣電影數(shù)據(jù)分析蝗柔,它更為詳細(xì)闻葵,可視化效果也不錯(cuò);

概述

本篇報(bào)告旨在針對豆瓣電影1990-2020的電影數(shù)據(jù)進(jìn)行分析癣丧,首先通過編寫Python網(wǎng)絡(luò)爬蟲爬取了51375條電影數(shù)據(jù)槽畔,采集對象包括:電影名稱、年份坎缭、導(dǎo)演竟痰、演員、類型掏呼、出品國家坏快、語言、時(shí)長憎夷、評分莽鸿、評論數(shù)、不同評價(jià)占比拾给、網(wǎng)址祥得。經(jīng)過去重、清洗蒋得,最后得到29033條有效電影數(shù)據(jù)级及。根據(jù)電影評分、時(shí)長额衙、地區(qū)饮焦、類型進(jìn)行分析,描述了評分與時(shí)長窍侧、類型的關(guān)系县踢,并統(tǒng)計(jì)了各個(gè)地區(qū)電影數(shù)量與評分。之后伟件,針對演員硼啤、導(dǎo)演對數(shù)據(jù)進(jìn)行聚合,給出產(chǎn)量與評分最高的名單斧账。在分析過程中谴返,還發(fā)現(xiàn)電影數(shù)量今年逐步增加,但評分下降其骄,主要原因是中國地區(qū)今年低質(zhì)量影視作品的增加亏镰。

另外,本篇報(bào)告還爬取了電影票房網(wǎng)(http://58921.com/)1995-2020年度國內(nèi)上映的影片票房拯爽,共采集4071條數(shù)據(jù)索抓,其中3484條有效。進(jìn)一步毯炮,本文分析了國內(nèi)院線電影票房年度變化趨勢逼肯,票房與評分、評價(jià)人數(shù)桃煎、時(shí)長篮幢、地區(qū)的關(guān)系,票房與電影類型的關(guān)聯(lián)为迈,并給出了票房最高的導(dǎo)演三椿、演員與電影排名缺菌。

基本框架

1.電影數(shù)據(jù)的評分、時(shí)長分析

1.1 電影數(shù)據(jù)總體描述
1.2 時(shí)長分布
1.3 評分分布
1.4 評分與時(shí)長搜锰、評論人數(shù)的關(guān)系

2.電影數(shù)據(jù)的地區(qū)分析

2.1 全球電影數(shù)量分布
2.2 各地區(qū)電影評分分布
2.3 各地區(qū)對整體均分的影響

3.電影數(shù)據(jù)的類型分析

3.1 不同類型電影的特點(diǎn)
3.2 電影類型對整體均分的影響
3.3 中美兩國各類型電影的均分變化

4.演員與導(dǎo)演分析

4.1 作品數(shù)量
4.2 導(dǎo)演與演員排名

5.電影票房分析

5.1 票房隨著年度變化趨勢
5.2 票房與評分伴郁、評價(jià)人數(shù)、時(shí)長蛋叼、地區(qū)的關(guān)系
5.3 不同類型電影的票房差異
5.4 導(dǎo)演焊傅、演員票房表現(xiàn)
5.5 影片票房排名

6.總結(jié)

1. 電影數(shù)據(jù)的評分、時(shí)長分析

1.1 電影數(shù)據(jù)總體描述

清洗狈涮、去重后狐胎,可以看到29033條數(shù)據(jù)長度、評分歌馍、評論數(shù)具有以下特點(diǎn):

  • a.平均電影時(shí)長為102.62分鐘握巢,最長的時(shí)間為826分鐘,最短時(shí)間為60分鐘骆姐;
  • b.最低評分為2分镜粤,最高評分為9.8分,平均分為6.50分玻褪;
  • c.最多的評分?jǐn)?shù)量為2091401條肉渴,最少的評分?jǐn)?shù)量為100條,平均每部電影評分人數(shù)為1765371條带射;
表格 1 電影數(shù)據(jù)總體描述

1.2 時(shí)長分布

結(jié)合圖1(a)(b)看同规,可以看到電影數(shù)據(jù)時(shí)長主要集中在90-120分鐘之間,向兩極呈現(xiàn)階梯狀遞減窟社,將數(shù)據(jù)按照短(60-90分鐘)券勺,中(90-120分鐘),長(120-150分鐘)灿里,特長(>150分鐘)劃分关炼,各部分占比為21.06%, 64.15%, 11.95%, 2.85%。

圖 1 時(shí)長分布圖:(a)時(shí)長分布柱狀圖匣吊,(b)各類時(shí)長占比

1.3 評分分布

結(jié)合圖2(a)看儒拂,可以看到我們采集到的電影數(shù)據(jù)評分主要集中在6.0-8.0之間,向兩極呈現(xiàn)階梯狀遞減色鸳,在此按照評分劃分區(qū)間:2.0-4.0為口碑極差社痛,4.0-6.0為口碑較差,6.0-7.0為口碑尚可命雀,7.0-8.0為口碑較好蒜哀,8.0-10.0為口碑極佳。

這5種電影數(shù)據(jù)的占比分別為:5.78%, 23.09%, 30.56%, 29.22%, 11.34%

圖 2 評分分布圖: (a)評分分布柱狀圖吏砂,(b)各類評分占比

再將評分?jǐn)?shù)據(jù)細(xì)化到每年進(jìn)行觀察撵儿,可以發(fā)現(xiàn)乘客,30年內(nèi)電影數(shù)量與年度電影均分呈反相關(guān),年度均分整體呈現(xiàn)下降趨勢淀歇,2016年電影均分最低寨典,電影數(shù)量最多。

進(jìn)一步做出每個(gè)年份下不同評級等級的電影數(shù)據(jù)占比房匆,可以發(fā)現(xiàn),近年來报亩,評分在[2.0,6.0)的電影數(shù)據(jù)占比有著明顯提升浴鸿,評分在[6.0,7.0)的數(shù)據(jù)占比不變,評分在[7.0,10.0)的數(shù)據(jù)占比減少弦追,可能原因有:

  • 1.幸存者偏差岳链,1990-2000年的劣質(zhì)作品少有人關(guān)注,數(shù)據(jù)保存困難劲件,豆瓣數(shù)據(jù)庫僅采集到了相對而言較為優(yōu)質(zhì)的作品掸哑。
  • 2.近年來有較多的低質(zhì)量影視作品,拉低了均分零远。
圖 3評分與電影數(shù)量隨年份的變化趨勢
圖 4評分占比隨年份的變化趨勢

1.4 評分與時(shí)長苗分、評論人數(shù)的關(guān)系

圖 5 評分與時(shí)長、評論人數(shù)的關(guān)系: (a)評分—人數(shù)牵辣,(b)評分—時(shí)長

對照圖5摔癣,可以發(fā)現(xiàn),評分與時(shí)長纬向、評論人數(shù)的分布大致呈現(xiàn)漏斗狀择浊,高分電影位于漏斗上部,低分電影位于漏斗下部逾条。這意味著琢岩,如果一部電影的評論人數(shù)很多(特別是超過30w人觀影),時(shí)長較長(大于120min)师脂,那么它大概率是一部好電影担孔。

2.電影數(shù)據(jù)的地區(qū)分析

2.1 全球電影數(shù)量分布

圖 6 各個(gè)地區(qū)電影數(shù)量分布
表格 2 電影數(shù)量前十的國家

根據(jù)各個(gè)國家的電影數(shù)量作圖,可以得到圖6危彩,列出電影數(shù)量前十的國家可得表格2攒磨,發(fā)現(xiàn)美國在電影數(shù)量上占第一,達(dá)到8490部汤徽,中國其次娩缰,達(dá)6222部。此外谒府,法國拼坎,英國浮毯,日本的電影數(shù)量也超過1000,其余各國電影數(shù)量相對較少泰鸡。這可以說明美國電影有著較大的流量輸入债蓝,在中國產(chǎn)生了較大的影響。

2.2 各地區(qū)電影評分分布

圖 7 各國電影評分箱線圖

進(jìn)一步分析各國電影的質(zhì)量盛龄,依據(jù)評分繪制評分箱線圖可得圖7饰迹,在電影數(shù)量排名前20的國家中:

  • a.歐洲國家,英國余舶、法國啊鸭、意大利、俄羅斯匿值、丹麥赠制、愛爾蘭、瑞典挟憔,評分普遍偏高钟些,均分超過了7分,箱體位置較高且下限較低绊谭,說明豆瓣收錄的歐洲電影口碑較好政恍。
  • b.相比之下,亞洲國家表現(xiàn)較差达传,中國抚垃、韓國、泰國的電影數(shù)據(jù)得分普遍較低趟大。其中鹤树,中國電影箱體較長,位置較低逊朽,有著最高的上下限罕伯。表現(xiàn)最好的日本、印度電影叽讳,均分勉強(qiáng)達(dá)到7分追他。
  • c.非洲國家沒有出現(xiàn)在圖7中,是由于豆瓣電影數(shù)據(jù)中非洲國家電影數(shù)量較少岛蚤,往往只有1部電影邑狸,最多的南非也只貢獻(xiàn)了34條數(shù)據(jù)。
  • d.美洲國家中涤妒,美國的電影產(chǎn)量位列第一单雾,評分有著較高的上限,但整體評價(jià)處于中游。

2.3 各地區(qū)對整體均分的影響

接著我們可以探索硅堆,哪個(gè)國家的電影對豆瓣評分隨年份下降的貢獻(xiàn)最大纹坐,考慮到電影數(shù)量對應(yīng)著評分的權(quán)重歇竟。根據(jù)上述各國的電影評分表現(xiàn)养篓,我們可以猜測電影數(shù)量較多的國家可能對年度均分的下降有較大影響烂完。于是,我們再計(jì)算出這些國家的年度電影均分茄菊,并與整體均分進(jìn)行比較分析疯潭。

  • 按照地區(qū)對數(shù)據(jù)進(jìn)行分組,計(jì)算各地區(qū)電影均分年度變化與整體均分年度變化的相關(guān)系數(shù)可得表格3面殖,看到評分的時(shí)間序列與中國電影評分的時(shí)間序列有著最強(qiáng)的相關(guān)性袁勺,R值達(dá)到0.970,美國電影也與均分下降有著強(qiáng)關(guān)聯(lián)畜普,R值達(dá)到0.967。由于其他國家電影數(shù)目不及中國群叶、美國吃挑,且相關(guān)性也較弱,在此我們推斷是由中美兩國的豆瓣電影數(shù)據(jù)引起了評分下降街立。
  • 兩國之中舶衬,美國電影數(shù)量要多于中國電影數(shù)量,數(shù)量決定對總分的權(quán)重貢獻(xiàn)赎离,中國電影相比美國電影權(quán)重更低逛犹。但觀察圖8可知,在相應(yīng)的年份數(shù)據(jù)下梁剔,中國電影均分要比美國電影均分低得多虽画,中國電影均分的變化趨勢與全球電影變化趨勢更接近,因此可以認(rèn)為均分的下降主要由中國電影均分下降造成荣病。
表格 3 各地區(qū)電影均分年度變化的相關(guān)系數(shù)
圖 8 全局與局部地區(qū)均分對比關(guān)系

再作出中國大陸码撰,中國臺灣,中國香港的均分箱線圖圖9(a)个盆,可以看到脖岛,大陸電影均分低于港臺電影,且存在大量低分電影拉低了箱體的位置颊亮。

分析相關(guān)性可得柴梆,大陸、香港终惑、臺灣電影年度均分與全部評分關(guān)聯(lián)度分別為R=0.979,0.919,0.822绍在,說明濾去臺灣和香港電影,大陸電影年度均分的變化趨勢與全部評分變化更接近。圖9(b)可以進(jìn)一步反映這一點(diǎn)揣苏。

圖 9 中國各地區(qū)與全部地區(qū)年度均分對比 : (a)中國各地區(qū)電影評分箱線圖悯嗓,(b) 全局與局部地區(qū)均分對比

3.電影數(shù)據(jù)的類型分析

3.1 不同類型電影的特點(diǎn)

圖 10 各類型電影評分、評論人數(shù)卸察、電影數(shù)目分布

可以看到脯厨,大部分類型集中在X×Y=[10000,30000]×[6.00,7.50]的區(qū)間范圍內(nèi),劇情坑质、喜劇合武、愛情、犯罪涡扼、動作類電影數(shù)量上較多稼跳,說明這些題材的電影是近三十年比較熱門的題材,其中劇情類電影占比最多吃沪,音樂汤善、傳記類電影平均得分更高,但在數(shù)量上較少票彪,動作红淡、驚悚類電影評論人數(shù)雖多,但評價(jià)普遍偏低降铸。

除此之外在旱,還有兩塊區(qū)域值得關(guān)注:

  • 一是繪圖區(qū)域左下角,恐怖片推掸、情色片觀影人數(shù)少桶蝎,評分低,可能是因?yàn)轭}材限制谅畅,影片質(zhì)量無法保證登渣。驚悚片也比較接近這一區(qū)域,可能說明驚悚毡泻、恐怖真的不太符合絕大多數(shù)人的口味绍豁。
  • 二是每部電影平均評論人數(shù)>40000的區(qū)域,這類電影雖然每部平均評論人數(shù)較多牙捉,但評價(jià)不高竹揍,電影數(shù)量也較少,以災(zāi)難片最為極端邪铲,推測原因可能是投入成本較高芬位,造成拍片成本較高。另一方面带到,由于題材關(guān)注重點(diǎn)原因昧碉,平均得分不高。

3.2 電影類型對整體均分的影響

根據(jù)類型對電影數(shù)據(jù)進(jìn)行聚合,整理得到各類型電影評分的時(shí)間序列被饿,計(jì)算它們與整體均分時(shí)間序列的相關(guān)性四康,可得表格4與圖11,可以看到劇情狭握,喜劇闪金,懸疑這三種類型片與總分趨勢變化相關(guān)性最強(qiáng),同時(shí)劇情论颅、喜劇類電影在電影數(shù)量上也最多哎垦,因此可以認(rèn)為這兩類電影對于下跌趨勢影響最大,但其余類別電影的相關(guān)性也達(dá)到了0.9以上恃疯,說明幾種熱門的電影得分的變化趨勢與總體均分趨勢一致漏设。

表格 4 各類型電影時(shí)間序列相關(guān)性
圖 11部分類型電影均分與全部均分關(guān)系

3.3 中美兩國各類型電影的均分變化

前面已經(jīng)得知,中美兩國電影占比最高今妄,且對于均分時(shí)間序列的影響最大郑口。在此,進(jìn)一步對兩國電影進(jìn)行類型分析盾鳞,選取幾種主要的類型(數(shù)量上較多犬性,且相關(guān)性較高)進(jìn)行分析,分別是劇情雁仲,喜劇,愛情琐脏,驚悚攒砖,動作,懸疑類電影日裙,繪制近年來幾類電影的數(shù)量變化柱狀圖與評分箱線圖可得圖12,13,14,15吹艇。

  • 分析圖12,13,可以發(fā)現(xiàn)昂拂,隨著年份變化受神,美國各類型電影在評分上整體水平保持穩(wěn)定。在數(shù)量上格侯,各類型電影變化趨勢接近鼻听,在2008年以前逐年增加,2008年達(dá)到高峰回落后联四,在14-18年間再度出現(xiàn)高峰撑碴。
  • 分析圖14,15可以發(fā)現(xiàn),國產(chǎn)各類型電影在90年代至20世紀(jì)初數(shù)量較少朝墩,近年來數(shù)量有著明顯增長醉拓,但在口碑評分上較低,這也導(dǎo)致了豆瓣收錄的國產(chǎn)電影,以及世界電影均分下滑亿卤。
圖 12 美國幾種主要類型電影的箱線圖
圖 13 美國幾種主要類型電影數(shù)量變化圖
圖 14 中國幾種主要類型電影的箱線圖
圖15 中國幾種主要類型電影數(shù)量變化圖

4. 演員與導(dǎo)演分析

4.1 作品數(shù)量

對導(dǎo)演與演員進(jìn)行聚合愤兵,得到數(shù)據(jù)中共有15011名導(dǎo)演,46223名演員排吴。按照作品數(shù)量在(0,2], (2,5], (5,10], (10,20], (20,999]進(jìn)行分組統(tǒng)計(jì)導(dǎo)演數(shù)量秆乳,可以發(fā)現(xiàn),15009名導(dǎo)演中有79.08%只拍過1-2部作品傍念,46220名演員中有75.93%只主演過1-2部作品矫夷。忽略那些客串、跑龍?zhí)椎难輪T憋槐,數(shù)據(jù)總體符合二八定律双藕,即20%的人占據(jù)了行業(yè)內(nèi)的大量資源。

圖16 導(dǎo)演阳仔、演員的作品數(shù)量分布

4.2 導(dǎo)演與演員排名

在此忧陪,可以通過電影得分、每部電影評論人數(shù)以及電影數(shù)目尋找優(yōu)秀的電影導(dǎo)演與演員近范。這三項(xiàng)指標(biāo)分別衡量了導(dǎo)演/演員的創(chuàng)作水平嘶摊,人氣以及產(chǎn)能∑谰兀考慮到電影數(shù)據(jù)集中可能有少量影視劇/劇場版動畫叶堆,且影視劇/劇場版動畫受眾少于電影,但得分普遍要高于電影斥杜,這里根據(jù)先根據(jù)每部電影評論數(shù)量虱颗、作品數(shù)量來篩選導(dǎo)演/演員,再根據(jù)電影得分進(jìn)行排名蔗喂,并取前30名進(jìn)行作圖忘渔,可得圖17,18。

  • 圖17中缰儿,左下角數(shù)據(jù)較為密集畦粮,右上角較為稀疏,這是因?yàn)樘幱趫D表右上角的導(dǎo)演作品不僅口碑極其優(yōu)秀乖阵,而且電影受眾廣泛宣赔。
  • 圖18給出的演員排名存在一定偏差,主要原因在于沒有考慮到演員在作品中是否是主演瞪浸、以及數(shù)據(jù)中可能混有一些電視劇等非電影類數(shù)據(jù)拉背。比如數(shù)據(jù)6所表示的演員,參演作品以電視劇為主默终,在其他電影中僅僅飾演配角椅棺,但卻排到了第6位犁罩。
圖 17 導(dǎo)演電影均分與評論人數(shù)分布圖

圖 18演員電影均分與評論人數(shù)分布圖

5. 電影票房分析

結(jié)合電影票房網(wǎng)(http://58921.com/)采集到的3353條票房數(shù)據(jù),與豆瓣數(shù)據(jù)按照電影名稱進(jìn)行匹配两疚,可以得到1995-2020年在中國大陸上映的電影信息床估,分別分析中國內(nèi)地電影的數(shù)量、票房變化趨勢诱渤,票房與評分丐巫、評價(jià)人數(shù)、時(shí)長勺美、地區(qū)以及類型的關(guān)系递胧,此外還給出了不同導(dǎo)演與演員的票房表現(xiàn)以及影片票房排名。

5.1 票房隨著年度變化趨勢

如圖19所示赡茸,國內(nèi)票房數(shù)據(jù)與上映的電影數(shù)量逐年遞增缎脾,2020年記錄的只是上半年的數(shù)據(jù),且由于受疫情影響占卧,票房與數(shù)量驟減遗菠。這說明在不發(fā)生重大事件的情況下,國內(nèi)電影市場規(guī)模正在不斷擴(kuò)大华蜒。

圖 19 1995-2020年國內(nèi)上映的電影數(shù)量與票房數(shù)據(jù)

5.2 票房與評分辙纬、評價(jià)人數(shù)、時(shí)長叭喜、地區(qū)的關(guān)系

  • 分析圖20(a)贺拣,可以看到,對于評分而言捂蕴,評分較高譬涡、較低的電影都不一定有好的票房,大部分高票房電影集中在5-8分的區(qū)間內(nèi)启绰;
  • 分析圖20(b)反映了昂儒,對于評價(jià)人數(shù)而言沟使,評價(jià)人數(shù)多的電影委可,票房未必高,說明網(wǎng)友中有很大一部分是白嫖黨腊嗡;
  • 分析圖20(c)可知着倾,對于時(shí)長而言,過長或過短的電影一般都不能取得好的票房燕少,一般90-130分鐘內(nèi)影片票房表現(xiàn)較好卡者,推測原因是適中的時(shí)長才能保證觀眾對電影質(zhì)量滿意,同時(shí)能夠保證排片量客们,創(chuàng)造更多營收崇决;
  • 分析圖20(d)材诽,可知,對于地區(qū)而言恒傻,可以看到脸侥,本土電影票房占據(jù)近6成,除此之外盈厘,美國電影也占據(jù)相當(dāng)大的比例睁枕,達(dá)36%。其他國家電影的票房收入則要少得多沸手,只有2.32%外遇,說明本土電影與美國電影占據(jù)著較大的市場份額。
(a)票房與評分關(guān)系契吉,(b) 票房與評價(jià)人數(shù)關(guān)系

圖20 票房與評分跳仿、評論人數(shù)、時(shí)長栅隐、地區(qū)關(guān)系: (c)票房與時(shí)長關(guān)系塔嬉,(d) 票房與地區(qū)關(guān)系

5.3 不同類型電影的票房差異

對電影數(shù)據(jù)根據(jù)類型進(jìn)行聚合,繪制散點(diǎn)圖21租悄,可以發(fā)現(xiàn):

  • a.動作谨究、冒險(xiǎn)、喜劇泣棋、劇情胶哲、奇幻、科幻潭辈、愛情類電影在票房總量上排在前列鸯屿,因?yàn)檫@幾類題材更為通俗,符合絕大多數(shù)觀眾的審美把敢。
  • b.傳記寄摆、音樂、歌舞類電影雖有著較好的口碑修赞,但吸金能力不比商業(yè)類影片婶恼。
  • c.災(zāi)難、戰(zhàn)爭柏副、古裝類電影數(shù)量雖少勾邦,但對票房總量的貢獻(xiàn)不低,可能原因是成片成本較高割择,投入產(chǎn)出比相對低眷篇,因此拍攝數(shù)量比熱門影片少。
  • d.恐怖荔泳、西部蕉饼、運(yùn)動虐杯、同性、情色類電影受題材影響比較冷門昧港,電影數(shù)量與整體票房貢獻(xiàn)都比較少厦幅。兒童類電影票房較少,但這一類別可能是動畫類電影的子類慨飘,并不具有代表性确憨。
圖 21 不同類型電影的數(shù)量、評價(jià)得分與票房表現(xiàn)

5.4 導(dǎo)演瓤的、演員票房表現(xiàn)

提取導(dǎo)演/演員姓名休弃,對導(dǎo)演/演員字段進(jìn)行聚合,計(jì)算每個(gè)導(dǎo)演/演員的票房總和圈膏,上映電影均分塔猾、以及執(zhí)導(dǎo)/參與電影數(shù)目進(jìn)行計(jì)算,作出票房總和前30名的導(dǎo)演/演員稽坤,可得圖22,23丈甸,圖中導(dǎo)演/演員標(biāo)號反映了票房排名,具體每位導(dǎo)演/演員的上映影片數(shù)量尿褪、均分睦擂、每部電影評價(jià)人數(shù)、平均時(shí)長與總票房在表5杖玲、表6中給出顿仇。

  • 圖22中有部分?jǐn)?shù)據(jù)重合,如數(shù)據(jù)點(diǎn)1與2重合摆马,23與24重合臼闻,是導(dǎo)演合作指導(dǎo)造成的,6與27重合則是導(dǎo)演指導(dǎo)作品數(shù)量與平均得分相近的結(jié)果囤采∈瞿牛可以看到,數(shù)據(jù)較為分散蕉毯,但存在一種趨勢乓搬,執(zhí)導(dǎo)電影數(shù)量多的導(dǎo)演均分往往偏低,說明影片產(chǎn)量與口碑難以達(dá)到均衡恕刘,電影數(shù)量在五部以內(nèi)的導(dǎo)演往往比十部以上的導(dǎo)演均分要高缤谎。
  • 同樣也可以發(fā)現(xiàn)抒倚,圖23中大部分演員位于圖形主對角線上褐着,出演作品數(shù)量較多時(shí),作品的平均質(zhì)量下滑托呕。也有部分演員位于圖形左下角含蓉,說明他們的作品雖然有限频敛、評價(jià)不高,但口味迎合大眾馅扣,取得了不錯(cuò)的票房斟赚。
圖 22 執(zhí)導(dǎo)電影總票房前30的導(dǎo)演分布情況
圖 23參與電影總票房前30的演員分布情況
表格 5 執(zhí)導(dǎo)電影總票房排名前30的導(dǎo)演
表格 6參演電影總票房排名前30的演員

5.5 影片票房排名

最后根據(jù)電影票房進(jìn)行排名,得到票房排名前20的電影如表格7所示差油,可以看到絕大部分上榜電影都是中國電影拗军,索引序號為3、10蓄喇、12发侵、14、18妆偏、19為美國電影刃鳄,這也反映了除國產(chǎn)電影之外,好萊塢大片占據(jù)較大的市場钱骂。

表格 7 內(nèi)地電影票房Top 20排名

6. 總結(jié)

本篇報(bào)告采集了1990-2020年間豆瓣電影29033組有效數(shù)據(jù)叔锐,從豆瓣電影的評分、時(shí)長见秽、地區(qū)愉烙、類型、演員解取、導(dǎo)演以及票房等信息進(jìn)行分析評價(jià)齿梁,主要有以下結(jié)論:

    1. 豆瓣電影影片時(shí)長主要集中在90-120分鐘,評分主要集中在6-8分肮蛹,評分高的電影往往時(shí)間更長勺择、評論人數(shù)更多。
    1. 數(shù)量上伦忠,美國電影最多省核,達(dá)8490部,中國其次昆码,達(dá)6222部气忠,其他國家相對少很多,非洲電影最少赋咽。分?jǐn)?shù)上旧噪,歐洲電影均分偏高,亞洲電影相對較低脓匿,中國低分電影尤其多淘钟,可能原因有:豆瓣電影對外國電影數(shù)據(jù)收錄不全;網(wǎng)友評分的地域性偏好陪毡;中國電影近年質(zhì)量偏低米母。
    1. 豆瓣影片年度均分呈現(xiàn)下降趨勢勾扭,主要由于中國大陸地區(qū)近年來低分電影增多,特別是熱門題材中的低分電影铁瞒,對整體造成了一定負(fù)面評價(jià)妙色。
    1. 類別上,劇情慧耍、喜劇身辨、愛情、犯罪芍碧、動作類較為熱門栅表,特別是劇情、喜劇师枣、懸疑這三種類型片對于整體均分的影響較大怪瓶。
    1. 針對導(dǎo)演演員的統(tǒng)計(jì),揭示出少部分導(dǎo)演與演員拍攝了大部分作品践美,符合二八定律洗贰,此外還根據(jù)作品評分、數(shù)量以及評價(jià)人數(shù)列舉了部分較為優(yōu)秀的導(dǎo)演/演員陨倡。
    1. 針對電影票房敛滋,發(fā)現(xiàn)電影票房逐年增加;大部分高票房電影集中在5-8分的區(qū)間內(nèi)兴革,時(shí)長在90-130分鐘間绎晃;動作、冒險(xiǎn)杂曲、喜劇庶艾、劇情、奇幻擎勘、科幻咱揍、愛情類電影在票房總量上排在前列,因?yàn)檫@幾類題材更為通俗棚饵,符合絕大多數(shù)觀眾的審美煤裙;國產(chǎn)與美國影片占據(jù)97%的市場份額。
    1. 此外噪漾,還列舉了票房排名前30的導(dǎo)演與演員硼砰,發(fā)現(xiàn)高票房導(dǎo)演與演員作品數(shù)量多的,評價(jià)往往較低欣硼。另外题翰,列舉了票房排名前20的電影,發(fā)現(xiàn)國產(chǎn)電影與好萊塢大片占據(jù)內(nèi)地電影市場的較大份額。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末遍愿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子耘斩,更是在濱河造成了極大的恐慌沼填,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件括授,死亡現(xiàn)場離奇詭異坞笙,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)荚虚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門薛夜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人版述,你說我怎么就攤上這事梯澜。” “怎么了渴析?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵晚伙,是天一觀的道長。 經(jīng)常有香客問我俭茧,道長咆疗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任母债,我火速辦了婚禮午磁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘毡们。我一直安慰自己迅皇,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布衙熔。 她就那樣靜靜地躺著喧半,像睡著了一般。 火紅的嫁衣襯著肌膚如雪青责。 梳的紋絲不亂的頭發(fā)上挺据,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音脖隶,去河邊找鬼扁耐。 笑死,一個(gè)胖子當(dāng)著我的面吹牛产阱,可吹牛的內(nèi)容都是我干的婉称。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼王暗!你這毒婦竟也來了悔据?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤科汗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后头滔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡坤检,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了早歇。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡缺前,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出衅码,到底是詐尸還是另有隱情,我是刑警寧澤脊岳,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站割捅,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏亿驾。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一莫瞬、第九天 我趴在偏房一處隱蔽的房頂上張望儡蔓。 院中可真熱鬧,春花似錦疼邀、人聲如沸喂江。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽获询。三九已至涨岁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間吉嚣,已是汗流浹背梢薪。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留尝哆,地道東北人秉撇。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像较解,于是被迫代替她去往敵國和親畜疾。 傳聞我的和親對象是個(gè)殘疾皇子赴邻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345