回歸案例--電影票房影響因素分析

回歸案例--電影票房影響因素分析

文章結(jié)構(gòu)

一熔任、問(wèn)題描述

二、調(diào)研

三唁情、建模

四疑苔、數(shù)據(jù)收集

五、數(shù)據(jù)處理

六甸鸟、描述分析

七惦费、相關(guān)性分析

八、回歸分析

九抢韭、不顯著變量檢驗(yàn)

十薪贫、回歸模型總結(jié)


一、問(wèn)題描述

近年來(lái)刻恭,我國(guó)電影產(chǎn)業(yè)發(fā)展迅猛瞧省,全產(chǎn)業(yè)鏈不斷完善,制作水平及營(yíng)銷發(fā)行能力不斷提高鳍贾,為票房的大幅增長(zhǎng)打下了堅(jiān)實(shí)的基礎(chǔ)鞍匾。同時(shí),政府制定扶持電影產(chǎn)業(yè)發(fā)展的政策以及快速發(fā)展的經(jīng)濟(jì)水平為電影產(chǎn)業(yè)創(chuàng)造了有利的發(fā)展環(huán)境贾漏。2012年中國(guó)電影年度票房總量首次超過(guò)日本候学,成為全球第二大電影市場(chǎng),僅次于美國(guó)纵散。但電影產(chǎn)業(yè)仍屬高風(fēng)險(xiǎn)行業(yè)梳码,投資虧損屢現(xiàn)不鮮。研究電影票房影響因素事關(guān)影視行業(yè)的繁榮發(fā)展伍掀,對(duì)擴(kuò)大中華文化國(guó)際競(jìng)爭(zhēng)力和影響力與增強(qiáng)國(guó)家文化軟實(shí)力也具有重要作用掰茶。

本文章利用SPSS等數(shù)據(jù)分析工具,在已有數(shù)據(jù)的基礎(chǔ)上進(jìn)行數(shù)據(jù)分析蜜笤,通過(guò)解析數(shù)據(jù)間的關(guān)聯(lián)性和影響程度濒蒋,進(jìn)行電影票房影響因素分析。


二把兔、調(diào)研

通過(guò)資料收集和組內(nèi)成員討論沪伙,在眾多影響電影票房的因素中,提煉出六個(gè)可能與電影票房有關(guān)聯(lián)的因子:

①上映前電影影響力:即電影上映前的宣發(fā)程度對(duì)電影票房的影響县好。通過(guò)對(duì)“燈塔專業(yè)版”中電影相關(guān)各類數(shù)據(jù)的衡量围橡,初步認(rèn)為“首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)”、“預(yù)告片播放量(淘票票)”缕贡、“想看人數(shù)(淘票票)”翁授、“爆米花指數(shù)”四個(gè)因子均在一定程度上體現(xiàn)電影宣發(fā)力度拣播。

②上映前期電影影響力:電影上映初期的一些數(shù)據(jù),在一定程度上可影響電影票房后續(xù)發(fā)展收擦,前期數(shù)據(jù)好贮配,往往能帶動(dòng)中后期票房穩(wěn)定∪福“電影首日票房”泪勒、“上映首周票房”可體現(xiàn)上映前期市場(chǎng)反應(yīng),“首映1月內(nèi)全網(wǎng)輿情有效評(píng)價(jià)條數(shù)”减途、“正面評(píng)論率”則反映網(wǎng)絡(luò)平臺(tái)對(duì)電影的評(píng)價(jià)風(fēng)向酣藻。

③電影IP影響力:如今市場(chǎng)是流量為王,在極短的時(shí)間內(nèi)讓大眾記住電影的名稱鳍置,往往需要一定的噱頭和演員/導(dǎo)演光環(huán)的加成。我國(guó)的電影創(chuàng)作基本實(shí)行導(dǎo)演中心制送淆,導(dǎo)演的質(zhì)量在一定程度上代表了電影的質(zhì)量税产;明星能吸引眾多注意力,具有票房影響力和保障投資安全的能力偷崩,其影響力表現(xiàn)為對(duì)手中的吸引程度辟拷;系列電影往往能借助上一部的品牌價(jià)值獲得較好的收入,而故事改編電影則能吸引一大批原有粉絲前往觀看阐斜。故擬從“導(dǎo)演影響力”衫冻、“演員影響力”、“是否續(xù)集谒出、翻拍”三個(gè)方面隅俘,綜合考慮電影的IP影響力。

④檔期:縱觀多部電影的上映時(shí)間笤喳,春節(jié)为居、勞動(dòng)節(jié)、國(guó)慶節(jié)等法定節(jié)假日杀狡,寒暑假之類的超長(zhǎng)節(jié)假日及情人節(jié)蒙畴、七夕等人流量巨大的紀(jì)念節(jié)日,一般會(huì)成為大多數(shù)電影的選擇呜象。

⑤題材:愛(ài)情/動(dòng)作/推理等題材的不同膳凝,吸引的受眾也會(huì)有差異,商業(yè)片往往比文藝片更受市場(chǎng)歡迎恭陡,即使是粗制濫造的快餐愛(ài)情片蹬音,票房數(shù)據(jù)往往也會(huì)高于同檔文藝片。

⑥口碑評(píng)分:電影口碑對(duì)電影的票房成績(jī)發(fā)揮著重要的作用子姜。如果一部電影能夠得到觀眾的肯定祟绊,就算沒(méi)有大規(guī)模的市場(chǎng)營(yíng)銷楼入,觀眾也會(huì)以“民間傳播”的形式為電影做宣傳,從而達(dá)到很高的觀影人次牧抽。2019年暑假上映的《哪吒》嘉熊,正是一大力證。


三扬舒、建模

通過(guò)調(diào)研阐肤,認(rèn)為以下14個(gè)因子將會(huì)影響電影票房。其中讲坎,檔期孕惜、題材、是否續(xù)集或翻拍為屬性變量晨炕,將通過(guò)單因素分析來(lái)判斷其是否對(duì)電影票房產(chǎn)生影響衫画。剩余的11個(gè)因子均為數(shù)值型變量,先通過(guò)相關(guān)性判斷每個(gè)因子對(duì)電影票房的影響程度瓮栗,再對(duì)11個(gè)因子逐步篩選削罩,建立線性回歸模型。最后费奸,再判斷篩掉的因子是否存在交互效應(yīng)弥激、中介效應(yīng)、調(diào)節(jié)效應(yīng)愿阐。

影響因素(自變量)選擇

四微服、數(shù)據(jù)收集

1、樣本選擇

選取2019年在中國(guó)大陸上映電影累計(jì)票房前100名缨历。

部分?jǐn)?shù)據(jù)展示
變量選擇

2以蕴、數(shù)據(jù)來(lái)源

①燈塔專業(yè)版——首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)、預(yù)告片播放量(淘票票)戈二、想看人數(shù)(淘票票)舒裤、爆米花指數(shù)、電影首日票房觉吭、上映首周票房

②八爪魚——首映1月內(nèi)全網(wǎng)輿情有效評(píng)價(jià)條數(shù)腾供、正面評(píng)論率

③豆瓣——評(píng)分、題材鲜滩、檔期

④微博伴鳖、ins、百度——演員影響力徙硅、導(dǎo)演影響力榜聂、是否續(xù)集/翻拍

3、部分?jǐn)?shù)據(jù)解釋

①全網(wǎng)輿情有效評(píng)價(jià)條數(shù)(首映1月內(nèi)):

數(shù)據(jù)來(lái)源于淘票票嗓蘑、優(yōu)酷等多平臺(tái)的有效評(píng)論须肆,本分析選取電影首映一個(gè)月內(nèi)的有效評(píng)論條數(shù)以及正面評(píng)論率匿乃。

②爆米花指數(shù):

上映前60天起,監(jiān)測(cè)全網(wǎng)用戶關(guān)注熱度豌汇,每天更新當(dāng)天熱度幢炸。綜合指數(shù)是根據(jù)想看熱度、新聞媒體熱度拒贱、微博熱度宛徊、微信熱度、搜索熱度以及預(yù)告片熱度來(lái)綜合打分逻澳。

爆米花指數(shù)解釋

③演員影響力:

選取每部電影中三位最主要的演員闸天,并通過(guò)查詢其微博粉絲數(shù)來(lái)確定其影響力,一般來(lái)說(shuō)粉絲數(shù)越多的演員斜做,其影響力越大苞氮。

④導(dǎo)演影響力:

上百度搜索導(dǎo)演的獲獎(jiǎng)情況,并按照下面的評(píng)分標(biāo)準(zhǔn)對(duì)導(dǎo)演進(jìn)行評(píng)分陨享。

導(dǎo)演影響力評(píng)分標(biāo)準(zhǔn)

五葱淳、數(shù)據(jù)處理

將數(shù)據(jù)整理成EXCEL表,導(dǎo)入SPSS數(shù)據(jù)集抛姑。

1、數(shù)據(jù)正態(tài)標(biāo)準(zhǔn)化

2艳狐、題材數(shù)據(jù)分類

以“題材”作為分類變量定硝,用序號(hào)代表類型。

題材數(shù)據(jù)處理

3毫目、檔期數(shù)據(jù)轉(zhuǎn)化

檔期數(shù)據(jù)處理


六蔬啡、描述分析

1、描述統(tǒng)計(jì)

①檔期

根據(jù)檔期對(duì)數(shù)據(jù)進(jìn)行拆分镀虐,然后再根據(jù)檔期對(duì)數(shù)據(jù)進(jìn)行分析箱蟆。從所選的100部電影數(shù)據(jù)可以看出,在檔期這一欄中刮便,大部分電影都集中在普通時(shí)段進(jìn)行上映空猜,暑期檔也相對(duì)較多,而剩余其他節(jié)日上映電影則只有16部恨旱。從均值可以看出春節(jié)檔平均票房最高辈毯,其他節(jié)日檔和暑假檔次之,普通檔則最少搜贤。如下圖:

檔期描述統(tǒng)計(jì)

②題材

其次谆沃,根據(jù)影片類型對(duì)數(shù)據(jù)進(jìn)行拆分,然后再根據(jù)類型對(duì)數(shù)據(jù)進(jìn)行分析仪芒。從題材的描述分析中可以看出唁影,劇情類電影占據(jù)42%耕陷,其次是動(dòng)作片和動(dòng)畫類型,占比31%据沈,而災(zāi)難哟沫、奇幻、科幻卓舵、懸疑則占比較少南用。其中,評(píng)分這一變量里掏湾,愛(ài)情類的影片評(píng)分最低裹虫,喜劇次之。票房這一欄里融击,災(zāi)難片平均票房最高筑公,但是因?yàn)橹挥幸徊繛?zāi)難片,所以不具有代表性尊浪。而平均票房最高的是科幻片匣屡,其次是動(dòng)畫類型的影片,票房最少的則是懸疑片拇涤。

題材描述統(tǒng)計(jì)

③是否續(xù)集或改編

對(duì)是否續(xù)集或改編這一因子進(jìn)行分析時(shí)可以看出捣作,大約50%的電影是根據(jù)原創(chuàng)劇本進(jìn)行拍攝,50%劇本是續(xù)集或者翻拍鹅士。而在淘票票想看人數(shù)這一欄中券躁,可以看出續(xù)集或改編的想看人數(shù)要多于原創(chuàng),說(shuō)明續(xù)集或改編的電影具有一定的粉絲基礎(chǔ)掉盅,因此平均票房也會(huì)比原創(chuàng)劇本多一些也拜。如下圖:

續(xù)集/改編描述統(tǒng)計(jì)

④評(píng)分

首先對(duì)評(píng)分?jǐn)?shù)據(jù)進(jìn)行重新編碼,將評(píng)分2.0-5.0的電影歸為1趾痘,評(píng)分5.1-7.5的電影歸為2慢哈,評(píng)分7.6-10.0的電影歸為3∮榔保可以看出卵贱,大部分電影集中在5.1-7.5這個(gè)區(qū)間,而較差或較好的電影則相對(duì)較少瓦侮,說(shuō)明電影的質(zhì)量大部分是中等水平艰赞,沒(méi)有極端爛片或者很好的影片。而在票房分析和想看人數(shù)分析中可以看出評(píng)分較高的影片票房則相對(duì)較高肚吏,想看人數(shù)也相對(duì)較多方妖,說(shuō)明影片的質(zhì)量對(duì)票房具有較大的影響。如下圖:

評(píng)分描述統(tǒng)計(jì)

2罚攀、屬性變量的方差分析

影響票房的影響因素中党觅,檔期雌澄、題材、是否續(xù)集或改編杯瞻,這三個(gè)變量屬于屬性變量镐牺,對(duì)這些變量進(jìn)行多因素方差分析,研究不同檔期魁莉、不同題材睬涧、是否續(xù)集或改編是如何影響電影票房的日川,結(jié)果如下:

主體間效應(yīng)檢驗(yàn)

該分析下累計(jì)票房變量的總差值SST被分解成8個(gè)部分包吝,分別是:由題材差異引起的變差SSA,由檔期差異引起的變差SSB张症,由是否改編或續(xù)集差異引起的變差SSC检疫,由題材和檔期交互作用引起的變差SSAB讶请,由題材和是否改編或續(xù)集交互作用引起的變差SSAC,由檔期和是否改編或續(xù)集交互作用引起的變差SSBC屎媳,由題材夺溢、檔期及是否改編或續(xù)集三個(gè)變量交互作用引起的變差SSABC,由隨機(jī)因素引起的變差SSE烛谊。這些變差除以各自的自由度后风响,得到各自的方差,并可計(jì)算出各F檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和在一定自由度下的概率P值丹禀。FX1钞诡,F(xiàn)X2,F(xiàn)X3湃崩,F(xiàn)X1*X2,F(xiàn)X1*X3接箫,F(xiàn)X2*X3攒读,F(xiàn)X1*X2*X3的概率P值分別為0.267,0.045辛友,0.632薄扁,0.002,0.143废累,0.276邓梅,0.004。

當(dāng)顯著性水平α為0.05邑滨,由于FX1日缨,F(xiàn)X3,F(xiàn)X1*X3掖看,F(xiàn)X2*X3的概率P值大于顯著性水平α匣距,可認(rèn)為不同題材對(duì)累計(jì)票房不產(chǎn)生顯著影響面哥,是否改編或續(xù)集對(duì)累計(jì)票房不產(chǎn)生顯著影響,不同題材和是否改編或續(xù)集對(duì)累計(jì)票房不產(chǎn)生顯著的交互作用毅待,不同檔期和是否改編或續(xù)集對(duì)累計(jì)票房不產(chǎn)生顯著的交互作用尚卫。由于FX2,F(xiàn)X1*X2尸红,F(xiàn)X1*X2*X3的概率P值小于顯著性水平α吱涉,可認(rèn)為檔期不同對(duì)累計(jì)票房產(chǎn)生顯著影響,不同題材類型時(shí)的不同檔期對(duì)累計(jì)票房產(chǎn)生顯著影響外里,且題材怎爵、檔期、是否改編或續(xù)集三個(gè)變量對(duì)累計(jì)票房產(chǎn)生顯著的交互作用级乐。

七疙咸、相關(guān)性分析

1、自變量與因變量的相關(guān)性

每個(gè)數(shù)值變量與電影總票房之間做相關(guān)性分析风科,得到以下結(jié)果:

單變量與因變量相關(guān)性分析

①總票房與首日票房

由下圖可知撒轮,p<0.05,即電影首日票房與累計(jì)票房有顯著相關(guān)關(guān)系,且相關(guān)系數(shù)高達(dá)0.728贼穆,為強(qiáng)相關(guān)题山,即電影首日票房對(duì)總票房的影響顯著。

說(shuō)明潛在消費(fèi)者很可能因?yàn)槭兹崭咂狈慷嗖A某一部自己并沒(méi)有做過(guò)攻略的電影故痊,體現(xiàn)了消費(fèi)者中的從眾效應(yīng)顶瞳。

首日票房與總票房的散點(diǎn)圖

②總票房與上映首周票房

由下圖可知,p<0.05,即電影首周票房與累計(jì)票房是有顯著相關(guān)關(guān)系愕秫,且相關(guān)系數(shù)高達(dá)0.881慨菱,為強(qiáng)相關(guān),即電影首周票房對(duì)總票房的影響顯著戴甩》龋可以說(shuō)明除個(gè)別電影外,首周票房占據(jù)了比較大的份額或者奠定了一部電影的社會(huì)口碑甜孤。

上映首周票房與總票房的散點(diǎn)圖

③總票房與電影評(píng)分

由下圖可知协饲,p=0.009<0.05,即電影豆瓣評(píng)分與累計(jì)票房有相關(guān)關(guān)系,但相關(guān)系數(shù)為0.263缴川,為較弱相關(guān)茉稠,即豆瓣評(píng)分對(duì)總票房的影響較弱。

評(píng)分與總票房的散點(diǎn)圖

④總票房與想看人數(shù)

由下圖可知把夸,p<0.05,即上映前“淘票票”想看人數(shù)與累計(jì)票房是有關(guān)系的而线,且相關(guān)系數(shù)高達(dá)0.709,為強(qiáng)相關(guān),即其對(duì)總票房的影響顯著吞获。說(shuō)明絕大部分消費(fèi)者通常會(huì)在電影上映前就對(duì)該電影抱有期待或者興趣况凉,而不是臨時(shí)起意。

想看人數(shù)與總票房的散點(diǎn)圖

⑤總票房與預(yù)告片播放量

由下圖可知各拷,上映前“淘票票”預(yù)告片播放量與累計(jì)票房是有相關(guān)關(guān)系的刁绒,且相關(guān)系數(shù)高達(dá)0.737,為強(qiáng)相關(guān)烤黍,即其對(duì)總票房的影響顯著知市。

預(yù)告片播放量與總票房的散點(diǎn)圖

⑥總票房與首映前事件累計(jì)關(guān)注人數(shù)

由下圖可知,上映前相關(guān)營(yíng)銷事件與累計(jì)票房是有關(guān)系的速蕊,相關(guān)系數(shù)為0.552嫂丙,為中等程度相關(guān),即其對(duì)總票房高低有影響规哲。說(shuō)明營(yíng)銷事件的合理運(yùn)用會(huì)對(duì)電影票房產(chǎn)生較大影響跟啤,兩者為正相關(guān)。

首映前營(yíng)銷事件與總票房的散點(diǎn)圖

⑦總票房與全網(wǎng)輿情有效評(píng)價(jià)條數(shù)

由下圖可知唉锌,全網(wǎng)輿情有效評(píng)價(jià)條數(shù)與累計(jì)票房是有關(guān)系的隅肥,且相關(guān)系數(shù)為0.852,為極高程度相關(guān)袄简,即其對(duì)總票房高低有顯著影響腥放。說(shuō)明上映前期,電影話題度越高绿语,關(guān)注的人越多秃症,其票房也會(huì)隨之受到正面影響。

有效評(píng)價(jià)數(shù)與總票房的散點(diǎn)圖

⑧總票房與正面評(píng)論率

由下圖可知吕粹,正面評(píng)價(jià)率(八爪魚)與累計(jì)票房的相關(guān)系數(shù)僅為0.247种柑,為較低程度相關(guān),即其對(duì)總票房高低有影響但程度不高匹耕。

正面評(píng)價(jià)率與總票房的散點(diǎn)圖

⑨總票房與上映前一天爆米花指數(shù)

由下圖可知莹规,上映前一天爆米花指數(shù)(綜合)與累計(jì)票房的相關(guān)系數(shù)為0.415,為中等程度相關(guān)泌神,即其對(duì)總票房高低有影響但程度不那么顯著。

爆米花指數(shù)與總票房的散點(diǎn)圖

⑩總票房與導(dǎo)演影響力/演員影響力

由下圖可知舞虱,一般認(rèn)為導(dǎo)演影響力欢际、演員影響力與累計(jì)票房是有關(guān)系的,但其相關(guān)系數(shù)分別為0.108矾兜、0.208损趋,為極低程度相關(guān),即導(dǎo)演影響力椅寺、演員影響力對(duì)總票房高低有影響但程度極弱浑槽。

同時(shí)可以看出導(dǎo)演影響力與演員影響力的相關(guān)系數(shù)僅為0.064蒋失,說(shuō)明兩者基本也沒(méi)有相關(guān)性,證明導(dǎo)演與演員的熱度并不會(huì)互相影響桐玻,人氣高的演員也有可能演“爛片”篙挽。

導(dǎo)演影響力與總票房的散點(diǎn)圖
演員影響力與總票房的散點(diǎn)圖


2、自變量間的相關(guān)性

以下是對(duì)所有自變量間相關(guān)關(guān)系的分析:

變量間的相關(guān)系數(shù)

由上圖可知镊靴,自變量間有顯著影響的有:

①首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)與想看人數(shù)铣卡,相關(guān)系數(shù)為0.953;

②上映首周票房與首日票房偏竟,相關(guān)系數(shù)為0.823煮落;

③想看人數(shù)與首日票房,相關(guān)系數(shù)為0.751踊谋;

④首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)與首日票房蝉仇,相關(guān)系數(shù)為0.745;

⑤想看人數(shù)與上映首周票房殖蚕,相關(guān)系數(shù)為0.706轿衔;

⑥輿情有效評(píng)價(jià)條數(shù)與預(yù)告片播放量,相關(guān)系數(shù)為0.686嫌褪;

⑦輿情有效評(píng)價(jià)條數(shù)與首映首周票房呀枢,相關(guān)系數(shù)為0.613。

根據(jù)分析笼痛,我們可以發(fā)現(xiàn)相互影響較大的自變量之間有較為明顯的因果關(guān)系裙秋,比如首日票房本身就是首周票房的組成部分;首映前的營(yíng)銷事件累計(jì)關(guān)注人數(shù)反映的是電影的宣傳過(guò)程缨伊,宣傳過(guò)程必然就影響了電影的想看人數(shù)摘刑,而造勢(shì)期的想看人數(shù)又進(jìn)一步影響了電影上映首日票房及首周票房。

通過(guò)輿情評(píng)論也可以看出電影的受關(guān)注程度刻坊,一定程度上反映了宣發(fā)期的效果枷恕,如預(yù)告片的播放量,與此同時(shí)輿情博得的關(guān)注度也影響電影上映后最開(kāi)始一段時(shí)間的票房谭胚。

八徐块、回歸分析

1、模型建立

由前面的自變量間相關(guān)性檢測(cè)灾而,發(fā)現(xiàn)想看人數(shù)胡控、首日票房與其他變量之間存在較強(qiáng)的相關(guān)性,故在線性建模時(shí)旁趟,排除這2個(gè)變量昼激,用剩余的9個(gè)變量建立回歸模型。因子選擇如下:

回歸方程自變量選擇

由于電影數(shù)據(jù)的特殊性,每個(gè)變量之間存在少數(shù)的離群值橙困。為了減少離群值的影響瞧掺,此處建模利用自動(dòng)線性建模的特點(diǎn),即自動(dòng)進(jìn)行離群值的處理凡傅。將9個(gè)預(yù)測(cè)變量輸入辟狈,模型選擇方法設(shè)置為“包括所有預(yù)測(cè)變量”,結(jié)果如下:

回歸結(jié)果圖

由上面的系數(shù)表可得像捶,上映前一天爆米花指數(shù)上陕、演員影響力、導(dǎo)演影響力拓春、正面評(píng)論率這四個(gè)變量的P值大于0.05释簿,即不可拒絕原假設(shè),即這些自變量與因變量總票房之間不存在顯著的線性關(guān)系硼莽。

2庶溶、模型重新建立

現(xiàn)將與因變量不存在顯著線性關(guān)系的4個(gè)變量剔除,剩余5個(gè)變量懂鸵,對(duì)這5個(gè)變量進(jìn)行上述操作偏螺,可得以下結(jié)果:

回歸結(jié)果圖

由上表的回歸系數(shù)顯著性檢驗(yàn)結(jié)果可得,上映首周票房匆光、全網(wǎng)輿情有效評(píng)價(jià)條數(shù)套像、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)、評(píng)分這四個(gè)變量t統(tǒng)計(jì)量所對(duì)應(yīng)的P值都小于0.05终息,而預(yù)告片播放量的P值大于0.05夺巩,故剔除預(yù)告片播放量。

3周崭、模型重新建立及效果評(píng)估

上面模型中再剔除預(yù)告片播放量柳譬,只剩下上映首周票房、輿情有效評(píng)價(jià)條數(shù)续镇、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)美澳、評(píng)分這四個(gè)自變量,對(duì)這四個(gè)變量進(jìn)行如上操作摸航,可得

模型效果評(píng)估

上圖展示了模型的擬合效果制跟,其模型準(zhǔn)確度為79.5%,大于70%酱虎,擬合效果較佳凫岖。

F檢驗(yàn)結(jié)果

上圖呈現(xiàn)的是多元線性回歸方程的顯著性檢驗(yàn)結(jié)果,F(xiàn)統(tǒng)計(jì)量的觀測(cè)值為96.992逢净,其對(duì)應(yīng)的P值近似于0。若顯著性水平為0.05,此處P<0.05爹土,即可拒絕原假設(shè)甥雕,認(rèn)為這4個(gè)變量全體與被解釋變量之間存在顯著的線性關(guān)系。

t檢驗(yàn)結(jié)果

由上表的回歸系數(shù)顯著性檢驗(yàn)結(jié)果可得胀茵,上映首周票房社露、全網(wǎng)輿情有效評(píng)價(jià)條數(shù)、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)琼娘、評(píng)分這四個(gè)變量t統(tǒng)計(jì)量所對(duì)應(yīng)的P值都小于0.05峭弟,故可保留在模型里面。

3脱拼、變量的多重共線性檢驗(yàn)

由于自動(dòng)線性回歸中沒(méi)有計(jì)算容忍度和方差膨脹因子的功能瞒瘸,為了判斷所選變量之間的共線性問(wèn)題,此處用普通的線性回歸來(lái)對(duì)這4個(gè)自變量進(jìn)行建模熄浓,得到其容差和VIF值情臭,如下:

共線性檢驗(yàn)

解釋變量間的多重共線性越弱,VIF值就越接近于1赌蔑。由上圖可得俯在,每個(gè)變量的VIF值都小于3.3,即可認(rèn)為各變量與方程中的其余解釋變量之間的多重共線性較弱娃惯。

4跷乐、殘差獨(dú)立性檢驗(yàn)

為了判斷殘差的獨(dú)立性,操作與上面相同趾浅,使用不做離群值處理的普通回歸方法得到DW值愕提,用之近似自動(dòng)線性建模的DW值。如下圖:

殘差獨(dú)立性檢驗(yàn)

如上圖潮孽,DW值為1.631揪荣,處于0到2之間,且偏向于2往史,故殘差序列存在較弱的正自相關(guān)性仗颈。

5、模型建立

綜上椎例,可認(rèn)為上映首周票房挨决、全網(wǎng)輿情有效評(píng)價(jià)條數(shù)、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)订歪、豆瓣評(píng)分對(duì)電影票房有所影響脖祈,且所構(gòu)建方程的擬合度較高,說(shuō)明這4個(gè)自變量能很好地解釋因變量刷晋。同時(shí)盖高,這4個(gè)變量之間的多重共線性較低慎陵,模型的殘差序列存在較弱的自相關(guān)性。從各方面可判斷模型是較為合適的喻奥,模型如下:

Y = 0.173 + 1.288X1 + 0.455X2 - 0.315X3 + 0.142X4

X1為上映首周票房席纽、X2為全網(wǎng)輿情有效評(píng)價(jià)條數(shù)、X3為首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)撞蚕、X4為豆瓣評(píng)分润梯、Y為電影總票房

九、不顯著變量的檢驗(yàn)

從上面分析中甥厦,可以得到預(yù)告片播放量纺铭、上映前一天爆米花指數(shù)、正面評(píng)價(jià)率刀疙、演員影響力舶赔、導(dǎo)演影響力這5個(gè)變量為不顯著變量。將進(jìn)一步檢驗(yàn)其是否為中介變量或者其他變量庙洼。

自變量


1顿痪、交互作用

為了確認(rèn)上面五個(gè)不顯著變量,是否存在兩個(gè)變量共同作用對(duì)因變量產(chǎn)生影響油够,故將這五個(gè)變量?jī)蓛上喑艘舷玫?0個(gè)交互項(xiàng),并將這些交互項(xiàng)進(jìn)行標(biāo)準(zhǔn)正態(tài)化石咬。

由于暫時(shí)無(wú)法確認(rèn)這5個(gè)不顯著的變量是否存在交互作用揩悄,故將這10個(gè)交互項(xiàng)與前面方程中的4個(gè)顯著自變量輸入到方程中,模型選擇方法為向前步進(jìn)鬼悠,篩選出對(duì)因變量顯著影響的變量删性。自變量輸入如下:

線性回歸自變量設(shè)置

線性回歸結(jié)果如下:

模型效果

由上面的模型摘要來(lái)看,調(diào)整后的R方為0.946焕窝,說(shuō)明擬合效果很好蹬挺。

F檢驗(yàn)

上圖呈現(xiàn)的是多元線性回歸方程的顯著性檢驗(yàn)結(jié)果,F(xiàn)統(tǒng)計(jì)量的觀測(cè)值為282.770它掂,其對(duì)應(yīng)的P值近似于0巴帮。若顯著性水平為0.05,此處P<0.05虐秋,即可拒絕原假設(shè)榕茧,認(rèn)為自變量全體與被解釋變量之間存在顯著的線性關(guān)系。

回歸方程自變量

由上表的回歸系數(shù)顯著性檢驗(yàn)結(jié)果可得客给,上映首周票房用押、全網(wǎng)輿情有效評(píng)價(jià)條數(shù)、導(dǎo)演影響力與演員影響力靶剑、評(píng)分蜻拨、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)這5個(gè)變量t統(tǒng)計(jì)量所對(duì)應(yīng)的P值都小于0.05池充,應(yīng)都保留在模型中。

模型如下:

Y = -0.046 + 0.691X1 + 0.141X2 - 0.064X3*X4 + 0.044X5 + 0.061X6

X1為上映首周票房缎讼、X2為全網(wǎng)輿情有效評(píng)價(jià)條數(shù)纵菌、X3為導(dǎo)演影響力、X4為演員影響力休涤、X5為豆瓣評(píng)分、X6為首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)笛辟、Y為電影總票房

綜上功氨,導(dǎo)演影響力與演員影響力的交互作用對(duì)因變量產(chǎn)生顯著的影響。

2手幢、中介效應(yīng)檢驗(yàn)

①中介檢驗(yàn)說(shuō)明:

中介作用是研究X對(duì)Y的影響時(shí)捷凄,是否會(huì)先通過(guò)中介變量M,再去影響Y围来;即是否有X->M->Y這樣的關(guān)系跺涤,如果存在此種關(guān)系,則說(shuō)明具有中介效應(yīng)监透。比如工作滿意度(X)會(huì)影響到創(chuàng)新氛圍(M),再影響最終工作績(jī)效(Y)桶错,此時(shí)創(chuàng)新氛圍就成為了這一因果鏈當(dāng)中的中介變量。

檢驗(yàn)?zāi)P?/div>

②檢驗(yàn)方法:

假如我們有三個(gè)變量分別是:自變量(X)胀蛮,因變量(Y)院刁,中介變量(M)。

Step1:檢測(cè)Y=cX+e1中的c是否顯著

Step2:檢測(cè)M=aX+e2中的a是否顯著

Step3:檢測(cè)Y=c'X+bM+e3中b和c'是否顯著

Step4:通過(guò)下面的檢測(cè)判斷是否存在中介效應(yīng)

溫忠麟中介效應(yīng)檢驗(yàn)程序

③中介檢驗(yàn)?zāi)P停?/p>

現(xiàn)需確認(rèn)上面所建影響電影票房的回歸模型中粪狼,對(duì)Y不顯著的變量是否為中介變量退腥。那么,則需假設(shè)對(duì)Y影響顯著的變量X(如:評(píng)分)再榄,先通過(guò)對(duì)Y不顯著的變量(如:正面評(píng)價(jià)率)狡刘,再去影響Y(即票房)。通過(guò)上面的檢測(cè)過(guò)程判斷假設(shè)是否成立困鸥。

本案例檢驗(yàn)?zāi)P?/div>

④中介檢驗(yàn)結(jié)果:

備注:此處未進(jìn)行sobel檢驗(yàn)嗅蔬,故未得到部分結(jié)果

由上表可得,預(yù)告片播放量窝革、上映前一天爆米花指數(shù)购城、正面評(píng)價(jià)率不存在完全中介效應(yīng)。

3虐译、調(diào)節(jié)作用檢驗(yàn)

①調(diào)節(jié)作用說(shuō)明:

調(diào)節(jié)作用是指X對(duì)于Y的影響過(guò)程中瘪板,調(diào)節(jié)變量M取值不同時(shí),X對(duì)于Y的影響程度是否會(huì)有明顯差異漆诽,如果M取值不同時(shí)侮攀,X對(duì)于Y的影響幅度并不一致锣枝,即說(shuō)明具有調(diào)節(jié)作用。比如研究員工組織信任對(duì)于離職意愿影響時(shí)兰英,不同性別時(shí)撇叁,影響幅度是否一致,如果不一致則說(shuō)明性別具有調(diào)節(jié)作用畦贸,反之則說(shuō)明性別沒(méi)有調(diào)節(jié)作用陨闹。

調(diào)節(jié)作用模型

②檢測(cè)方法:

Y是因變量,X是自變量薄坏,M是調(diào)節(jié)變量趋厉,MX是調(diào)節(jié)變量和自變量的交互項(xiàng)。我們可以檢驗(yàn)兩個(gè)方程的R方變化量胶坠,如果該變量顯著君账,說(shuō)明調(diào)節(jié)作用顯著。也可以直接檢驗(yàn)交互項(xiàng)系數(shù)c'的顯著性沈善,如果顯著也可以說(shuō)明調(diào)節(jié)作用顯著乡数。

Y=a+bX+cM+e1

Y=a+bX+cM+c'MX+e2

③調(diào)節(jié)檢驗(yàn)?zāi)P停?/p>

本案例模型

④檢驗(yàn)結(jié)果

1)爆米花指數(shù)的調(diào)節(jié)作用:

R方變化量的F檢驗(yàn)
交互項(xiàng)系數(shù)t檢驗(yàn)

由上圖可知,方程的R方變化顯著闻牡,方程中的交互項(xiàng)系數(shù)也顯著净赴,故可認(rèn)為評(píng)分對(duì)電影票房的影響過(guò)程中,爆米花指數(shù)取值不同時(shí)澈侠,評(píng)分對(duì)于電影票房的影響會(huì)有明顯差異劫侧,這說(shuō)明爆米花指數(shù)具有調(diào)節(jié)作用。

聯(lián)系現(xiàn)實(shí)哨啃,爆米花指數(shù)反應(yīng)了全網(wǎng)用戶關(guān)注熱度烧栋。當(dāng)關(guān)注熱度不同時(shí),評(píng)分對(duì)電影票房的影響幅度不一致拳球。例如审姓,當(dāng)關(guān)注熱度高的時(shí)候,評(píng)分更能影響電影票房祝峻。

爆米花指數(shù)具有調(diào)節(jié)作用

2)正面評(píng)價(jià)率的調(diào)節(jié)作用:

R方變化量的F檢驗(yàn)
交互項(xiàng)系數(shù)t檢驗(yàn)

由上圖可知魔吐,方程的R方變化顯著,方程中的交互項(xiàng)系數(shù)也顯著莱找,故可認(rèn)為評(píng)分對(duì)電影票房的影響過(guò)程中酬姆,正面評(píng)價(jià)率不同時(shí),全網(wǎng)輿情有效評(píng)價(jià)條數(shù)對(duì)于電影票房的影響會(huì)有明顯差異奥溺,這說(shuō)明正面評(píng)價(jià)率具有調(diào)節(jié)作用辞色。

聯(lián)系現(xiàn)實(shí),全網(wǎng)輿情有效評(píng)價(jià)條數(shù)體現(xiàn)的是話題熱度浮定。一般情況下相满,評(píng)價(jià)條數(shù)多层亿,但是正面評(píng)價(jià)率低,則評(píng)價(jià)條數(shù)對(duì)電影票房存在負(fù)面影響立美。評(píng)價(jià)條數(shù)多匿又,且正面評(píng)價(jià)率高,則評(píng)價(jià)條數(shù)對(duì)電影票房存在正面影響建蹄。

正面評(píng)價(jià)率具有調(diào)節(jié)作用


十碌更、回歸模型總結(jié)

1、最終的回歸方程

Y = -0.046 + 0.691X1 + 0.141X2 - 0.064X3*X4 + 0.044X5 + 0.061X6

X1為上映首周票房洞慎、X2為全網(wǎng)輿情有效評(píng)價(jià)條數(shù)针贬、X3為導(dǎo)演影響力、X4為演員影響力拢蛋、X5為豆瓣評(píng)分、X6為首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)蔫巩、Y為電影總票房

2谆棱、自變量對(duì)電影票房的作用

上映首周票房、全網(wǎng)輿情有效評(píng)價(jià)條數(shù)圆仔、首映前營(yíng)銷事件累計(jì)關(guān)注人數(shù)垃瞧、豆瓣評(píng)分顯著影響電影票房,演員影響力和導(dǎo)演影響力交互影響電影票房坪郭。上映前一天爆米花指數(shù)在評(píng)分對(duì)電影票房的影響中具有調(diào)節(jié)作用个从,正面評(píng)論率在全網(wǎng)輿情有效評(píng)價(jià)條數(shù)對(duì)電影票房的影響中具有調(diào)節(jié)作用。

自變量對(duì)電影票房的作用

備注:該文章成果由多人合作完成歪沃,轉(zhuǎn)載需注明出處嗦锐。筆者希望通過(guò)文章分享,與諸位讀者共同學(xué)習(xí)共同進(jìn)步沪曙。文章當(dāng)中可能會(huì)存在一些問(wèn)題奕污,歡迎讀者提出!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末液走,一起剝皮案震驚了整個(gè)濱河市碳默,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌缘眶,老刑警劉巖嘱根,帶你破解...
    沈念sama閱讀 216,843評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異巷懈,居然都是意外死亡该抒,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,538評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門砸喻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)柔逼,“玉大人蒋譬,你說(shuō)我怎么就攤上這事∮涫剩” “怎么了犯助?”我有些...
    開(kāi)封第一講書人閱讀 163,187評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)维咸。 經(jīng)常有香客問(wèn)我剂买,道長(zhǎng),這世上最難降的妖魔是什么癌蓖? 我笑而不...
    開(kāi)封第一講書人閱讀 58,264評(píng)論 1 292
  • 正文 為了忘掉前任瞬哼,我火速辦了婚禮,結(jié)果婚禮上租副,老公的妹妹穿的比我還像新娘坐慰。我一直安慰自己,他們只是感情好用僧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,289評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布结胀。 她就那樣靜靜地躺著,像睡著了一般责循。 火紅的嫁衣襯著肌膚如雪糟港。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,231評(píng)論 1 299
  • 那天院仿,我揣著相機(jī)與錄音秸抚,去河邊找鬼。 笑死歹垫,一個(gè)胖子當(dāng)著我的面吹牛剥汤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播排惨,決...
    沈念sama閱讀 40,116評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼秀姐,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了若贮?” 一聲冷哼從身側(cè)響起省有,我...
    開(kāi)封第一講書人閱讀 38,945評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎谴麦,沒(méi)想到半個(gè)月后蠢沿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,367評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡匾效,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,581評(píng)論 2 333
  • 正文 我和宋清朗相戀三年舷蟀,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,754評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡野宜,死狀恐怖扫步,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情匈子,我是刑警寧澤河胎,帶...
    沈念sama閱讀 35,458評(píng)論 5 344
  • 正文 年R本政府宣布,位于F島的核電站虎敦,受9級(jí)特大地震影響游岳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜其徙,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,068評(píng)論 3 327
  • 文/蒙蒙 一胚迫、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧唾那,春花似錦访锻、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,692評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至昌罩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間灾馒,已是汗流浹背茎用。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,842評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留睬罗,地道東北人轨功。 一個(gè)月前我還...
    沈念sama閱讀 47,797評(píng)論 2 369
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像容达,于是被迫代替她去往敵國(guó)和親古涧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,654評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 一. 簡(jiǎn)述 1. 票房數(shù)量頻率圖 在2016中國(guó)內(nèi)地票房總量排在前100名的電影中花盐,有10部電影票房超過(guò)10億羡滑,2...
    宋偲瑄閱讀 10,096評(píng)論 20 25
  • 久違的晴天,家長(zhǎng)會(huì)算芯。 家長(zhǎng)大會(huì)開(kāi)好到教室時(shí)柒昏,離放學(xué)已經(jīng)沒(méi)多少時(shí)間了。班主任說(shuō)已經(jīng)安排了三個(gè)家長(zhǎng)分享經(jīng)驗(yàn)熙揍。 放學(xué)鈴聲...
    飄雪兒5閱讀 7,523評(píng)論 16 22
  • 創(chuàng)業(yè)是很多人的夢(mèng)想职祷,多少人為了理想和不甘選擇了創(chuàng)業(yè)來(lái)實(shí)現(xiàn)自我價(jià)值,我就是其中一個(gè)。 創(chuàng)業(yè)后有梆,我由女人變成了超人统屈,什...
    亦寶寶閱讀 1,810評(píng)論 4 1
  • 今天感恩節(jié)哎珍手,感謝一直在我身邊的親朋好友。感恩相遇!感恩不離不棄窿侈。 中午開(kāi)了第一次的黨會(huì),身份的轉(zhuǎn)變要...
    迷月閃星情閱讀 10,564評(píng)論 0 11
  • 可愛(ài)進(jìn)取屿岂,孤獨(dú)成精坞琴。努力飛翔,天堂翱翔陨囊。戰(zhàn)爭(zhēng)美好弦疮,孤獨(dú)進(jìn)取。膽大飛翔蜘醋,成就輝煌胁塞。努力進(jìn)取,遙望压语,和諧家園啸罢。可愛(ài)游走...
    趙原野閱讀 2,726評(píng)論 1 1