Apriori商品關(guān)聯(lián)分析

什么是購(gòu)物籃分析贺嫂?

購(gòu)物籃分析本質(zhì)其實(shí)就是商品之間的關(guān)聯(lián)分析弦追,因?yàn)樽畛踹@種關(guān)聯(lián)分析主要是在超市應(yīng)用廣泛毕骡,所以后來(lái)被人們稱為“購(gòu)物籃分析”驴娃。購(gòu)物籃分析的目的在于在一個(gè)數(shù)據(jù)集中找出項(xiàng)之間的關(guān)聯(lián)關(guān)系奏候。比如循集,購(gòu)買鞋的顧客唇敞,有10%的可能也會(huì)買襪子,60%的買面包的顧客咒彤,也會(huì)買牛奶疆柔。

購(gòu)物籃分析一般在電商和超市行業(yè)應(yīng)用的比較多,在金融服務(wù)業(yè)镶柱,保險(xiǎn)業(yè)也有應(yīng)用旷档,對(duì)于電商場(chǎng)景,一般應(yīng)用有這幾個(gè)部分:

個(gè)性化推薦:像我開頭的經(jīng)歷一樣歇拆,給用戶推一些相關(guān)商品

組合優(yōu)惠券:給購(gòu)買過的用戶發(fā)相關(guān)聯(lián)商品的優(yōu)惠券

捆綁銷售:將相關(guān)聯(lián)的商品組合起來(lái)銷售

Apriori算法的三個(gè)關(guān)鍵指標(biāo)

支持度(support):support(A\Rightarrow B)=P(A\bigcup_{}^{}B ),表示A和B同時(shí)出現(xiàn)的概率

置信度(confidence):confidence(A\Rightarrow B)=support(A\Rightarrow B)/support(A),表示A和B同時(shí)出現(xiàn)的概率占A出現(xiàn)概率的比值

提升度(Lift):提升度指當(dāng)銷售一個(gè)物品時(shí)鞋屈,另一個(gè)物品銷售率會(huì)增加多少,計(jì)算方式是:Lift(A\Rightarrow B)=confidence(A\Rightarrow B)/(support(B))

Lift=1,表示X與Y相互獨(dú)立

Lift>1,表示有效強(qiáng)關(guān)聯(lián)規(guī)則

Lift<1,表示無(wú)效強(qiáng)關(guān)聯(lián)規(guī)則

分析目標(biāo):找到集合中的頻繁元素故觅,發(fā)現(xiàn)顧客購(gòu)買的規(guī)律厂庇。如果從單個(gè)商品的出現(xiàn)頻率分析到多個(gè)商品的出現(xiàn)頻率,那么隨著商品數(shù)目的增多输吏,商品的組合數(shù)必定會(huì)飛速增長(zhǎng)权旷,運(yùn)算量極大,因此需要一種能夠快速剪枝的方法贯溅。

頻繁模式的剪枝原理為:如果某一項(xiàng)集是頻繁的拄氯,那么它的子集全都是頻繁的;如果某一項(xiàng)集是不頻繁的它浅,那么它的超集都是不頻繁的译柏,即如果項(xiàng)集CDE是頻繁的,那么它的子集C姐霍、D鄙麦、E、CD、CE黔衡、DE都是頻繁的蚓聘,反之,如果項(xiàng)集AB不頻繁盟劫,則它的超集ABC夜牡、ABD、ABE等也不頻繁

頻繁模式剪枝原理示意圖

python實(shí)現(xiàn)方法

由于每一個(gè)國(guó)家用戶群體對(duì)于商品購(gòu)買的偏好會(huì)有所偏差侣签,此處使用數(shù)據(jù)集中的美國(guó)銷售數(shù)據(jù)進(jìn)行分析

導(dǎo)入數(shù)據(jù)

檢查數(shù)據(jù)缺失值塘装、異常值、格式一致性影所,由于數(shù)據(jù)完整性較好蹦肴,無(wú)需做數(shù)據(jù)清洗

關(guān)聯(lián)分析

(1)提取國(guó)家為美國(guó)的數(shù)據(jù)

(2)提取所需關(guān)鍵字段

(3)商品列轉(zhuǎn)行:通過groupby把商品變成二級(jí)索引,通過聚合購(gòu)買數(shù)量猴娩,用unstack方法把二級(jí)轉(zhuǎn)換成行阴幌,對(duì)于無(wú)數(shù)據(jù)(無(wú)購(gòu)買記錄)的地方用fillna(0)填充

(4)為了防止僅一次購(gòu)買且同時(shí)購(gòu)買多件商品被誤判為高關(guān)聯(lián)商品,此處設(shè)置min_value = 3/basket.shape[0]卷中,用于后續(xù)判斷頻繁項(xiàng)集最少出現(xiàn)3次

(5)對(duì)數(shù)據(jù)框中商品是否出現(xiàn)變換為0-1關(guān)系

(6)計(jì)算頻繁項(xiàng)目集

頻繁項(xiàng)集

(7)生成相應(yīng)的支持度矛双、置信度和提升度規(guī)則

關(guān)聯(lián)分析

變量說(shuō)明

antecedent support:規(guī)則先導(dǎo)項(xiàng)支持度

consequent support:規(guī)則后繼項(xiàng)支持度

support:規(guī)則支持度 (前項(xiàng)后項(xiàng)并集的支持度)

confidence:規(guī)則置信度 (規(guī)則置信度:規(guī)則支持度support / 規(guī)則先導(dǎo)項(xiàng))

lift:規(guī)則提升度,表示含有先導(dǎo)項(xiàng)條件下同時(shí)含有后繼項(xiàng)的概率蟆豫,與后繼項(xiàng)總體發(fā)生的概率之比议忽。

結(jié)果分析:

實(shí)際上頻繁項(xiàng)集中只有少數(shù)是有意義的,很多時(shí)候很多商品存在互補(bǔ)關(guān)系(比如乒乓球和球拍)十减,即使不做購(gòu)物籃分析栈幸,運(yùn)營(yíng)人員也知道可以進(jìn)行捆綁銷售,這是common sense帮辟,因此數(shù)據(jù)分析師需要有一雙善于發(fā)現(xiàn)的眼睛速址,從沙子中挖掘金子。

本文中可以發(fā)現(xiàn)织阅,在辦公場(chǎng)景下壳繁,折疊椅、打印機(jī)荔棉、真空袋闹炉、信封、桌子與訂書釘存在著一定的關(guān)聯(lián)關(guān)系润樱,可以理解為新辦公室下相關(guān)辦公用品的配置中訂書釘是一個(gè)頻繁出現(xiàn)的購(gòu)置項(xiàng)目渣触。

進(jìn)一步,我們通過商品的銷量發(fā)現(xiàn)壹若,訂書釘?shù)男枨髲?qiáng)度較其他關(guān)聯(lián)產(chǎn)品更高嗅钻,可以嘗試通過捆綁銷售或贈(zèng)送訂書釘皂冰、購(gòu)買訂書釘贈(zèng)送其他產(chǎn)品優(yōu)惠券、個(gè)性化推薦等方法养篓,提高銷量秃流。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市柳弄,隨后出現(xiàn)的幾起案子舶胀,更是在濱河造成了極大的恐慌,老刑警劉巖碧注,帶你破解...
    沈念sama閱讀 217,657評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嚣伐,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡萍丐,警方通過查閱死者的電腦和手機(jī)轩端,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)逝变,“玉大人基茵,你說(shuō)我怎么就攤上這事」翘铮” “怎么了耿导?”我有些...
    開封第一講書人閱讀 164,057評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵声怔,是天一觀的道長(zhǎng)态贤。 經(jīng)常有香客問我,道長(zhǎng)醋火,這世上最難降的妖魔是什么悠汽? 我笑而不...
    開封第一講書人閱讀 58,509評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮芥驳,結(jié)果婚禮上柿冲,老公的妹妹穿的比我還像新娘。我一直安慰自己兆旬,他們只是感情好假抄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著丽猬,像睡著了一般宿饱。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上脚祟,一...
    開封第一講書人閱讀 51,443評(píng)論 1 302
  • 那天谬以,我揣著相機(jī)與錄音,去河邊找鬼由桌。 笑死为黎,一個(gè)胖子當(dāng)著我的面吹牛邮丰,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播铭乾,決...
    沈念sama閱讀 40,251評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼剪廉,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了炕檩?” 一聲冷哼從身側(cè)響起妈经,我...
    開封第一講書人閱讀 39,129評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎捧书,沒想到半個(gè)月后吹泡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡经瓷,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評(píng)論 3 335
  • 正文 我和宋清朗相戀三年爆哑,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舆吮。...
    茶點(diǎn)故事閱讀 39,902評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡揭朝,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出色冀,到底是詐尸還是另有隱情潭袱,我是刑警寧澤,帶...
    沈念sama閱讀 35,621評(píng)論 5 345
  • 正文 年R本政府宣布锋恬,位于F島的核電站屯换,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏与学。R本人自食惡果不足惜彤悔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望索守。 院中可真熱鬧晕窑,春花似錦、人聲如沸卵佛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)截汪。三九已至疾牲,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間挫鸽,已是汗流浹背说敏。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工丢郊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留盔沫,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,025評(píng)論 2 370
  • 正文 我出身青樓架诞,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親谴忧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子很泊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容