商業(yè)分析python實(shí)戰(zhàn)(二):電影智能推薦

原文鏈接:商業(yè)分析python實(shí)戰(zhàn)(二):電影智能推薦


隨著企業(yè)經(jīng)營(yíng)水平的提高弯予,對(duì)應(yīng)網(wǎng)站的訪問(wèn)量逐步增加,數(shù)據(jù)信息也隨之大量增長(zhǎng),使得用戶(hù)面對(duì)海量信息時(shí)無(wú)法快速找到想要的內(nèi)容,降低了信息使用效率。這時(shí),可以利用相關(guān)數(shù)據(jù),研究用戶(hù)興趣偏好燕雁,分析用戶(hù)的需求和行為诞丽,引導(dǎo)用戶(hù)發(fā)現(xiàn)需求信息,將內(nèi)容準(zhǔn)確推薦給用戶(hù)拐格。

本例通過(guò)943名用戶(hù)對(duì)1664部電影的評(píng)分?jǐn)?shù)據(jù)僧免,構(gòu)建協(xié)同過(guò)濾模型,進(jìn)而推薦電影供用戶(hù)觀看捏浊。通過(guò)本例懂衩,可以了解協(xié)同過(guò)濾算法在電子商務(wù)智能推薦領(lǐng)域的應(yīng)用方法,幫助用戶(hù)更加便捷的獲取想要的信息金踪,進(jìn)而提升用戶(hù)體驗(yàn)浊洞、促進(jìn)推薦轉(zhuǎn)化。

步驟

1胡岔、獲取數(shù)據(jù)法希;

2、數(shù)據(jù)探索分析靶瘸;

3苫亦、構(gòu)建智能推薦模型;

4奕锌、評(píng)估推薦系統(tǒng)模型著觉。

NO.1 獲取數(shù)據(jù)

數(shù)據(jù)包含943名用戶(hù)對(duì)1664部電影的打分村生,評(píng)分在1-5分之間惊暴,超出規(guī)定范圍的算異常值。

NO.2 數(shù)據(jù)探索分析

導(dǎo)入的數(shù)據(jù)共有99416行趁桃,3列辽话,第一列為用戶(hù)id,第二列為電影名字卫病,第三列為打分油啤。

經(jīng)過(guò)基本的數(shù)據(jù)驗(yàn)證,發(fā)現(xiàn)三列數(shù)據(jù)均存在缺失的情況(取值為空)蟀苛,且根據(jù)打分列益咬,發(fā)現(xiàn)數(shù)據(jù)存在異常值(打分結(jié)果不在1-5范圍內(nèi)),因此將存在缺失值和異常值的行刪除帜平,刪除后幽告,數(shù)據(jù)剩下99392行。同時(shí)裆甩,為了進(jìn)行每部電影的打分?jǐn)?shù)據(jù)探索分析冗锁,將movie列中的電影名轉(zhuǎn)換為列名,轉(zhuǎn)換后嗤栓,可觀察每部電影的評(píng)分用戶(hù)數(shù)及分?jǐn)?shù)的基本分布冻河。

NO.3 構(gòu)建基于物品的協(xié)同過(guò)濾推薦模型

基于物品的協(xié)同過(guò)濾模型(ItemCF)通過(guò)分析群體用戶(hù)的歷史偏好箍邮,找到相似物品,然后根據(jù)個(gè)體用戶(hù)的歷史行為為其進(jìn)行推薦叨叙,主要分為計(jì)算物品間相似度和生成推薦列表兩個(gè)步驟锭弊。ItemCF可以離線計(jì)算,從而提高推薦效率擂错,且利用歷史行為進(jìn)行推薦解釋?zhuān)Y(jié)果更容易信服廷蓉,但是推薦精度相對(duì)有限,且對(duì)于用戶(hù)偏好的變化不敏感马昙,實(shí)時(shí)推薦能力較弱桃犬。關(guān)于ItemCF的更多介紹可參考往期文章推薦算法概述。在實(shí)際應(yīng)用時(shí)行楞,用戶(hù)的歷史行為包含是否瀏覽網(wǎng)頁(yè)攒暇、是否購(gòu)買(mǎi)、是否評(píng)論子房、是否轉(zhuǎn)發(fā)點(diǎn)贊等形用,本例中,僅涉及用戶(hù)對(duì)電影的打分证杭,因此不存在其他的行為田度。得到的電影相似度矩陣如下:

構(gòu)建ItemCF模型后,得到用戶(hù)1.0的推薦清單如下:

NO.4 評(píng)估推薦系統(tǒng)模型

模型結(jié)果評(píng)價(jià)主要有三種方式解愤,分別為離線測(cè)試镇饺、用戶(hù)調(diào)查和在線實(shí)驗(yàn)。

離線測(cè)試:通過(guò)從實(shí)際系統(tǒng)中提取數(shù)據(jù)送讲,采用各種推薦算法并計(jì)算各算法的測(cè)評(píng)指標(biāo)奸笤。該方法不需真實(shí)用戶(hù)參與,但結(jié)果與實(shí)際結(jié)果會(huì)存在偏差哼鬓。

用戶(hù)調(diào)查:利用測(cè)試的推薦系統(tǒng)調(diào)查真實(shí)用戶(hù)监右,觀察他們的行為并回答相關(guān)問(wèn)題,通過(guò)用戶(hù)行為及反饋判斷推薦系統(tǒng)好壞异希。

在線實(shí)驗(yàn):將推薦系統(tǒng)投入實(shí)際應(yīng)用健盒,通過(guò)應(yīng)用的轉(zhuǎn)化指標(biāo)評(píng)價(jià)推薦系統(tǒng)結(jié)果。

實(shí)現(xiàn)代碼

點(diǎn)擊原文()后臺(tái)回復(fù)“電影推薦”可得本例數(shù)據(jù)及代碼称簿。

參考內(nèi)容:

1扣癣、《R語(yǔ)言商務(wù)數(shù)據(jù)分析實(shí)戰(zhàn)》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市予跌,隨后出現(xiàn)的幾起案子搏色,更是在濱河造成了極大的恐慌,老刑警劉巖券册,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件频轿,死亡現(xiàn)場(chǎng)離奇詭異垂涯,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)航邢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)耕赘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人膳殷,你說(shuō)我怎么就攤上這事操骡。” “怎么了赚窃?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵册招,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我勒极,道長(zhǎng)是掰,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任辱匿,我火速辦了婚禮键痛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘匾七。我一直安慰自己絮短,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布昨忆。 她就那樣靜靜地躺著丁频,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扔嵌。 梳的紋絲不亂的頭發(fā)上限府,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天夺颤,我揣著相機(jī)與錄音痢缎,去河邊找鬼。 笑死世澜,一個(gè)胖子當(dāng)著我的面吹牛独旷,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播寥裂,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼嵌洼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了封恰?” 一聲冷哼從身側(cè)響起麻养,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎诺舔,沒(méi)想到半個(gè)月后鳖昌,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體备畦,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年许昨,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了懂盐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡糕档,死狀恐怖莉恼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情速那,我是刑警寧澤俐银,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站端仰,受9級(jí)特大地震影響悉患,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜榆俺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一售躁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧茴晋,春花似錦陪捷、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至烁涌,卻和暖如春苍碟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背撮执。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工微峰, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抒钱。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓蜓肆,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親谋币。 傳聞我的和親對(duì)象是個(gè)殘疾皇子仗扬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容