“把啤酒放在尿布旁炮温,有助于提升啤酒銷售量”是關(guān)聯(lián)規(guī)則推薦正文不含任何公式,保證PM弄懂牵舵。
一柒啤、概念
什么是關(guān)聯(lián)規(guī)則(Association Rules)?
答:關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中的概念畸颅,通過分析數(shù)據(jù)担巩,找到數(shù)據(jù)之間的關(guān)聯(lián)。電商中經(jīng)常用來分析購買物品之間的相關(guān)性没炒,例如涛癌,“購買尿布的用戶,有大概率購買啤酒”送火,這就是一個關(guān)聯(lián)規(guī)則拳话。
畫外音:如果把買尿布記作A,買啤酒記作B种吸。
“買尿布的用戶有較大概率買啤酒”這個關(guān)聯(lián)規(guī)則記作A -> B弃衍。
什么是關(guān)聯(lián)規(guī)則推薦(Association Rule Based Recommendaion)?
答:顧名思義坚俗,利用關(guān)聯(lián)規(guī)則镜盯,來實施推薦。關(guān)聯(lián)規(guī)則推薦的目標(biāo)猖败,是希望達(dá)到
“將尿布放入購物車之后速缆,再推薦啤酒”
比
“直接推薦啤酒”
獲取有更好的售賣效果拱礁。
畫外音:這個目標(biāo)非常非常重要鸟蜡,有些場景,或許直接推薦更有效累提。
關(guān)聯(lián)規(guī)則推薦的典型應(yīng)用:
線下,可以將尿布和啤酒放在一起
線上倦踢,可以在用戶將尿布放入購物車后送滞,立刻推薦啤酒
二侠草、如何實施
假設(shè)某電商會售賣ABCD四種商品辱挥,歷史上共5筆訂單,分別賣出{A,B,C}, {B,C,D}, {A,B,C,D}, {A,C}, {C}?如何來實施“關(guān)聯(lián)規(guī)則”推薦呢边涕?
第一步:數(shù)據(jù)準(zhǔn)備
如上圖晤碘,縱坐標(biāo)是所有歷史訂單,橫坐標(biāo)是每筆訂單售出的商品功蜓。
第二步:計算關(guān)聯(lián)規(guī)則(組合商品)的支持度
什么是支持度(support)园爷?
答:共5筆訂單,3筆包含商品A式撼,A的支持度是3/5童社。
很容易計算出,各個商品的支持度著隆。從支持度可以看出扰楼,Best Seller是商品C,100%的訂單中都包含商品C美浦,C的支持度是1弦赖。
除了單個商品,組合商品也有支持度浦辨。
共5筆訂單蹬竖,2筆同時包含AB,即A->B的支持度是2/5流酬。
畫外音:全局總共4種商品币厕,假設(shè)關(guān)聯(lián)規(guī)則只關(guān)聯(lián)2種商品,則一共需要計算C(4,2)共6種組合商品的支持度{AB,AC,AD,BC,BD,CD}芽腾。
支持度評估商品包含在訂單中的“概率”劈榨,一個訂單,有多大概率包含這個商品晦嵌。
畫外音:一般會先對支持度高的商品實施推薦同辣,如果先實優(yōu)化支持度低的商品,即使推薦效果翻倍惭载,總體訂單提升效果也會很有限旱函。
第三步:計算關(guān)聯(lián)規(guī)則的置信度
什么是置信度(confidence)?
答:已知購買了A描滔,有多大概率購買了B(即同時購買了AB)棒妨,稱A -> B的置信度。
可以看到,商品A有3次購買券腔,這3次中有2次購買了B伏穆,A->B的置信度是2/3。
畫外音:額纷纫,本來不想貼公式的
confidence(A->B) = support(A->B)/support(A)= (2/5)/(3/5) = 2/3
這也相對比較好理解枕扫,
分子:support(A->B)是同時購買AB的比例
分母:support(A)是只購買A的比例
二者相除,得到“購買了A辱魁,有多大概率購買B”烟瞧,置信度的本質(zhì)是條件概率。
這里需要注意的是染簇,X->Y與Y->X的置信度不一定相等参滴。
如上圖:
B->C的置信度是1,買商品B時锻弓,100%會買C砾赔,
C->B的置信度是3/5,買商品C時青灼,只有3/5買了B暴心。
畫外音:
support(B->C)=3/5
support(C->B)=3/5
confidence(B->C)=support(B->C)/support(B)=1
confidence(C->B)=support(C->B)/support(C)=3/5
公式是給程序看的,excel表格是給人看的聚至,結(jié)果都一樣酷勺。
第四步:計算關(guān)聯(lián)規(guī)則的提升度
上一個例子里,confidence(B->C)=1扳躬,即:如果用戶購買商品B脆诉,100%會買C,那是不是意味著贷币,如果用戶將商品B放入購物車击胜,就可以向用戶推薦商品C呢?
答:不是役纹。
“將尿布放入購物車之后偶摔,再推薦啤酒”
比
“直接推薦啤酒”
獲取有更好的售賣效果。
雖然購買商品B促脉,100%會買C
畫外音:confidence(B->C)=1
但直接推薦C辰斋,用戶也100%會買C
畫外音:support(C)=1
會發(fā)現(xiàn),購買B與購買C是獨立事件瘸味,用戶買不買C和用戶買不買B沒有直接關(guān)系宫仗。這里的關(guān)聯(lián)規(guī)則推薦,并沒有比直接推薦獲取更好的效果旁仿。
用什么指標(biāo)來評估關(guān)聯(lián)規(guī)則推薦的效果呢藕夫?
答:提升度。
什么是提升度(lift)?
大于1毅贮,說明有效办悟,在購買A時推薦B,比直接推薦B滩褥,效果更好
等于1病蛉,說明無關(guān),購買A與購買B铸题,是獨立事件
畫外音:又有公式了
lift(A->B) =confidence(A->B)/support(B)
這也相對比較好理解铡恕,
分子:confidence(A->B)琢感,購買A時丢间,有多大概率同時購買B
分母:support(B),有多大概率直接購買B
二者相除驹针,得到效果是否更好烘挫。
還是通過兩個直觀的例子來看。
來看看關(guān)聯(lián)規(guī)則A->B柬甥,與直接推薦B饮六,效果有沒有提升:
有3個訂單購買A,這3個訂單中有2個訂單購買了B苛蒲,所以A->B的置信度是2/3卤橄,即買了A有2/3的概率會買B
直接推薦B的話,5個訂單中有3個購買了B臂外,所以B的支持度是3/5窟扑,即有3/5的概率會直接買B
會發(fā)現(xiàn),關(guān)聯(lián)規(guī)則推薦的效果更好漏健。
畫外音:根據(jù)公式
confidence(A->B) =support(A->B)/support(A) = 2/3
support(B) = 3/5
lift(A->B) =confidence(A->B)/support(B) = 10/9
來看看關(guān)聯(lián)規(guī)則A->D嚎货,與直接推薦D,效果有沒有提升:
有3個訂單購買A蔫浆,這3個訂單中有1個訂單購買了D殖属,所以A->D的置信度是1/3,即買了A有1/3的概率會買D
直接推薦D的話瓦盛,5個訂單中有2個購買了B洗显,所以D的支持度是2/5,即有2/5的概率會直接買D
畫外音:根據(jù)公式
confidence(A->D) =support(A->D)/support(A) = 1/3
support(D) = 2/5
lift(A->D) = confidence(A->D)/support(D)= 5/6
lift(A->B) < 1原环,故關(guān)聯(lián)規(guī)則推薦是負(fù)相關(guān)的挠唆。
三、總結(jié)
關(guān)聯(lián)規(guī)則A->B推薦扮念,目標(biāo)是损搬,在“用戶將A放入購物車時,推薦B”比“單獨推薦B”獲取更好的效果
A->B的支持度,是用戶同時購買A和B概率
A->B的置信度巧勤,是用戶購買A的同時嵌灰,有多大概率購買B
A->B的提升度,是“用戶購買A的同時颅悉,有多大概率購買B”與“直接購買B的概率”的比值
(1)這個值大于1時沽瞭,說明A->B有正向效果
(2)這個值等于1時,說明A和B是獨立事件
(3)這個值小于1時剩瓶,說明A->B有負(fù)向效果
轉(zhuǎn)載自:https://www.sohu.com/a/227841704_178889