| 導語?“尊敬的XXX用戶,您的話費已不足10元沧奴。為了您的正常使用,請及時充值长窄√戏停” 一一移動公司 “溫馨提示:XXX先生/小姐,您的住房貸款將于11月5日扣款挠日,請在此賬號中存足款項疮绷。” 一一某家銀行 就算是在尊敬的稱謂嚣潜,就算是再溫馨的話語冬骚,還是感覺有些冷冰事故,千里追債懂算。
背景
“尊敬的XXX用戶只冻,您的話費已不足10元。為了您的正常使用计技,請及時充值喜德。”
一一移動公司
“溫馨提示:XXX先生/小姐垮媒,您的住房貸款將于11月5日扣款舍悯,請在此賬號中存足款項∷停”
一一某家銀行
就算是在尊敬的稱謂萌衬,就算是再溫馨的話語,還是感覺有些冷冰事故它抱,千里追債奄薇。
通信和金融業(yè)務(wù),算是每個現(xiàn)代人的“剛性”需求抗愁。收到催費通知尚且不爽馁蒂,何況是偏向娛樂的互聯(lián)網(wǎng)業(yè)務(wù)催費通知。如何能讓人覺得不突兀蜘腌,稍微有點打動人心的感覺沫屡?去年與QQ音樂一起合作的,針對增值業(yè)務(wù)綠鉆的個性化催費項目撮珠。拿來拋磚引玉沮脖,與各位一起討論催費可能優(yōu)化的點。
思考
l??和“傳統(tǒng)”壟斷行業(yè)相比,我們有哪些優(yōu)勢勺届?
有數(shù)字化的用戶數(shù)據(jù)驶俊。以計算機和網(wǎng)絡(luò)為框架的服務(wù)模式,天然將用戶屬性和行為數(shù)字化并記錄下來免姿,變成和營收一樣饼酿,公司最大的資產(chǎn)。
l??哪種服務(wù)是溫度的胚膊,能打動人心的故俐?
唯有高端私人定制。不管是葛大爺紊婉、白百何電影中的“圓夢方案”药版,還是大眾輝騰使館區(qū)的線下定制中心,均體現(xiàn)出濃濃的頂級個性化的感覺喻犁,紅塵萬千槽片,只為伊人。這不正是互聯(lián)網(wǎng)服務(wù)的終極嗎肢础?個性服務(wù)筐乳,千人千面。然而圓夢方案終究燈亮散場乔妈,低調(diào)輝騰亦低調(diào)隱退。為什么氓皱?粒度太細路召,難以形成規(guī)模效益,導致每一單的成本太高波材,整體盈利太少股淡。催費如果要做到真正千人千面,投入太高廷区,收益暫時難以評估唯灵。所以初期嘗試,我們化“點”為“面”隙轻,粒度不是每個人埠帕,而是某類人。既然是分類玖绿,在事先沒有預期目標的情況下敛瓷,稱手的工具就是聚類算法了。
行動
1?算法
聚類算法簡單來講斑匪,就是把全部對象按照其特征的距離遠近呐籽,劃分成若干簇。這些簇滿足以下條件:
類似于上圖顯示的效果,中心點為集群的核心狡蝶,圍繞中心點近的一批就是同一個簇庶橱。很容易分出來不同類別,不同業(yè)務(wù)特性的群體贪惹。分群體運營苏章,比較容易獲得更好的效果。
舉個例子馍乙,比如某個業(yè)務(wù)的特征包括以下幾類布近,具體應該如何應用聚類算法呢?
2?標準化
收集完上述行為數(shù)據(jù)后丝格,需要對數(shù)據(jù)做“標準化”處理撑瞧。
為什么要做標準化處理?這涉及到聚類算法K-means的實現(xiàn)原理显蝌。K-means是一種基于距離的迭代式算法预伺,它將n個觀察實例分類到k個聚類中,以使得每個觀察實例距離它所在的聚類的中心點比其他的聚類中心點的距離更小曼尊。其中酬诀,距離的計算方式可以是歐式距離(2-norm?distance),或者是曼哈頓距離(Manhattan?distance,1-norm?distance)或者其他骆撇。
其中為兩個對象的對應特征量瞒御,比如都是播放時長,單位為秒神郊。同理為周播放天數(shù)肴裙。秒的量綱遠遠大于周播放天數(shù),一首2分鐘的歌曲有120秒的播放時長涌乳,一周無休播放蜻懦,也只有7天的播放天數(shù)。最終導致播放天數(shù)對距離計算影響小夕晓,聚類特性偏向播放時長宛乃。其他常用的計算距離方法同樣存在類似問題,比如:
解決思路在于無量綱化蒸辆,方法就是標準化征炼。
我們這次采用的是Z-score標準化,公式如下:
其中x為某一具體分數(shù)躬贡,μ為平均數(shù)柒室,σ為標準差。
標準分數(shù)可以回答這樣一個問題:"一個給定分數(shù)距離平均數(shù)多少個標準差?"在平均數(shù)之上的分數(shù)會得到一個正的標準分數(shù)逗宜,在平均數(shù)之下的分數(shù)會得到一個負的標準分數(shù)雄右。
得到三個有業(yè)務(wù)意義的簇空骚,在三維空間上的投影如下:
可以看到,每種類別在空間中的位置和集中程度都有區(qū)別擂仍,我們就根據(jù)這些差異總結(jié)出上面三種類型的不同特點囤屹。接下來依據(jù)不同特點做不同的催費方式。
3?落地
其中綠色的三張是應用聚類結(jié)果的個性化催費逢渔,藍色的為原文案形式肋坚,作為對照組。
4?評估
7天流量灰度測試的結(jié)果如下:
指標:成功發(fā)送催費消息到支付成功轉(zhuǎn)化率均值
炫耀型:x1%???享受型:x2%???扮酷型:x3%???參照組:c1%
效果結(jié)論:x2 > x1 > x3 > c1
好了肃廓,看到實驗組的均值高于參照組智厌,說明有效果。擴大灰度盲赊、發(fā)郵件铣鹏、收工了?
那么問題來了哀蘑,如何知道上述效果是個性化文案導致的诚卸,還是環(huán)繞周圍的隨機性造成的?
將這個問題轉(zhuǎn)換為統(tǒng)計學的問題绘迁,實驗組和參照組的均值差異是顯著的合溺?
我們可以使用方差分析來嘗試解答。方差分析(Analysis of Variance缀台,簡稱ANOVA)棠赛,又稱“變異數(shù)分析”,是R.A.Fisher發(fā)明的膛腐,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗睛约。
由此我們可以大致認為,不同組的均值差異受不可控隨機因素影響的可能性小依疼,差異來自可控因素,基于用戶行為的個性化文本的影響而芥。
參考文獻
[1]. Z-score
http://baike.baidu.com/link?url=n2HbtKxAC_wAyGEJMN-D7wwZNg2B3-dFa-0W9W8sAFJWf5BTry5hIAG6RlFWl-zlWNUUJht85XhoLIy4Hg9Gj_
[2].?歸一化
http://baike.baidu.com/link?url=egN4K40qIsxRxknS6uvOlL63MFGx5LCUq12ojBI-3caMRCYAM5WihO_o2t6vHP0rQKfyei-LKVuN7kbg4HExRK
[3]. K-means
http://www.cnblogs.com/bourneli/p/3645049.html
[4].?方差分析
http://baike.baidu.com/link?url=-OkUo0mu0bfo9-F9PjvVXR5rdk02I16lJT3UHXDy0I66je4e0t2s-8dpAHW6FxYWf8m36hP-Bs69CJMH-MUJ-lyrRtqbKB9nFQZ0qregXmNvqO0deQNEOT4w_RJ9EaNw