【數(shù)據(jù)分析】基于客戶行為構(gòu)建客戶分群模型的分析(轉(zhuǎn)載)

摘要:摘要客戶分群是企業(yè)從大眾營銷向差異化營銷過渡的必由之路,也是未來保持競爭優(yōu)勢的基礎(chǔ)焦匈。隨著社會經(jīng)濟(jì)的發(fā)展和用戶需求的多元化德绿,企業(yè)需要把識別客戶特征作為一項(xiàng)核心的市場分析活動岔帽,關(guān)注如何保持和拓展現(xiàn)有的客戶價(jià)值。文章闡述了建立客戶分群模型的理論基礎(chǔ)和技術(shù)手段导绷,根據(jù)客戶行為數(shù)據(jù)采用聚類的數(shù)據(jù)挖掘方法構(gòu)建總體模型犀勒,并對數(shù)據(jù)規(guī)范性、聚類算法以及模型分析方法等進(jìn)行說明妥曲,提高客戶分群的有效性及應(yīng)用價(jià)值贾费。

在當(dāng)前不同行業(yè)領(lǐng)域競爭日益激烈的情況下,企業(yè)必須認(rèn)識到客戶才是最重要的資產(chǎn)檐盟,必須關(guān)注如何保持褂萧、拓展現(xiàn)有的客戶價(jià)值。識別客戶特征是一項(xiàng)核心分析活動葵萎,通過了解客戶的概貌可以指導(dǎo)如何制定合理有效的營銷策略导犹。

使用數(shù)據(jù)挖掘技術(shù)對客戶進(jìn)行細(xì)分就可以識別具有相似特征的客戶群唱凯,這樣就可以了解各種不同的 具有各自特征的客戶情況,從而基于客戶分群工作進(jìn)行進(jìn)一步的客戶分析和市場策略制訂谎痢。因此客戶分群模型建立的意義主要就是通過對客戶進(jìn)行分群磕昼,分析各種客戶群的特征來為企業(yè)管理層提供決策支持。

1客戶分群的理論闡述

就市場營銷的理論來說节猿,營銷手段可以分為幾個(gè)層次:首先是大眾營銷票从,對所有客戶進(jìn)行不考慮特性差異的宣傳;然后是基于市場細(xì)分的營銷,把客戶分為幾個(gè)群體滨嘱,對每個(gè)群體進(jìn)行針對性宣傳峰鄙,也就是所說的一對一精確營銷。

客戶細(xì)分的基本依據(jù)是每個(gè)客戶作為消費(fèi)者對同一產(chǎn)品的具體功能需求太雨,和關(guān)注點(diǎn)是不同的吟榴。作為服務(wù)提供者的運(yùn)營商必須盡可能地考慮這些差異,發(fā)現(xiàn)存在于客戶中的具有不同特征或消費(fèi)習(xí)慣的客戶群體躺彬,在此基礎(chǔ)之上面向不同群體執(zhí)行更具針對性的管理或營銷策略煤墙。

客戶分群總的來說有兩大類方法,一類是手工方法宪拥,一類是自動方法仿野。手工方法就是人為地進(jìn)行客戶劃分,即業(yè)務(wù)人員根據(jù)自己的業(yè)務(wù)知識以及對客戶的了解程度她君,出于某種管理或者營銷上的目的把客戶分為幾個(gè)群脚作。這種分群的劃分原則是預(yù)先已知的,比如按照客戶消費(fèi)額劃分成“高價(jià)值客戶”缔刹,“低價(jià)值客戶”:按照是否大客戶劃分為“普通用戶”球涛,“大客戶用戶”。這種手工進(jìn)行客戶細(xì)分的方法通常只能考慮少數(shù)幾個(gè)變量校镐,如果想多考慮一些變量亿扁,尤其是大部分連續(xù)型的行為變量,就必須使用自動分群方法了鸟廓。

自動分群是通過使用數(shù)據(jù)挖掘提供的聚類算法从祝,確定自己認(rèn)為會有價(jià)值的輸入變量,通常數(shù)量較多引谜,通過挖掘算法根據(jù)數(shù)據(jù)的特點(diǎn)決定把客戶分為不同群體牍陌,分出來的群與群之間差異盡可能大,群內(nèi)差異盡可能小员咽。

客戶分群的關(guān)鍵在于根據(jù)什么變量來進(jìn)行細(xì)分毒涧。在移動通信行業(yè),商家可以獲得的數(shù)據(jù)很多贝室,主要有客戶行為數(shù)據(jù)契讲、人口統(tǒng)計(jì)數(shù)據(jù)以及一些附加數(shù)據(jù)仿吞。其中客戶行為數(shù)據(jù)包括客戶通話清單數(shù)據(jù)、客戶賬務(wù)數(shù)據(jù)以及客戶撥打客服電話的記錄等怀泊,這些都是通過計(jì)算機(jī)采集到的茫藏,具有很好的數(shù)據(jù)質(zhì)量,同時(shí)也是最有價(jià)值的客戶信息霹琼,是了解客戶特征的最重要的數(shù)據(jù)务傲。因此,根據(jù)客戶行為數(shù)據(jù)進(jìn)行客戶分群會具有更高的可用性枣申。

2 客戶分群的技術(shù)分析

客戶分群模型的建立需要依靠數(shù)據(jù)挖掘技術(shù)售葡。通過客戶分群挖掘,企業(yè)能發(fā)現(xiàn)過去所不知道的客戶類型忠藤,對自己的客戶有更科學(xué)更全面的了解挟伙,這無疑會使客戶管理工作和營銷工作能夠更容易地進(jìn)行。比如模孩,通過客戶分群了解不同客戶群的詳細(xì)的尖阔,特有的需求,這樣就能夠發(fā)現(xiàn)新的營銷機(jī)會;通過客戶分群了解不同客戶群的特點(diǎn)榨咐,這樣就能有針對性地開展差異化客戶服務(wù)介却,增加客戶滿意度;還可以基于客戶分群進(jìn)行有針對性的營銷宣傳活動,這樣的宣傳會比無目標(biāo)的大眾宣傳更加有效;等等块茁。

數(shù)據(jù)挖掘技術(shù)可以分為兩種類型:預(yù)測型數(shù)據(jù)挖掘和描述型數(shù)據(jù)挖掘齿坷。

預(yù)測型數(shù)據(jù)挖掘是要從一系列數(shù)據(jù)中找出特定變量(稱為“目標(biāo)變量”)與其他變量(稱為“預(yù)測變量”)之間的關(guān)系,也就是掌握預(yù)測變量是如何影響目標(biāo)變量的数焊。

描述型數(shù)據(jù)挖掘是要在一系列預(yù)先不知道有任何關(guān)系的數(shù)據(jù)中查找關(guān)系的技術(shù)永淌。描述型數(shù)據(jù)挖掘常用的技術(shù)有聚類和關(guān)聯(lián)分析。

聚類是要把整個(gè)數(shù)據(jù)庫分成不同的群組佩耳。它的目的是要使群與群之間差別很明顯遂蛀,而同一個(gè)群內(nèi)的數(shù)據(jù)盡量相似。與預(yù)測型挖掘不同的是干厚,聚類是無指導(dǎo)的學(xué)習(xí)答恶,體現(xiàn)在方法上就是不用指定目標(biāo)變量。聚類算法有兩種:劃分聚類法和層次聚類法萍诱。其中劃分聚類法可以指定聚為幾類,層次聚類法由算法根據(jù)數(shù)據(jù)情況自動確定聚為幾類污呼。神經(jīng)元網(wǎng)絡(luò)和K-Means是比較常用的聚類算法裕坊。聚集之后最主要的是對分群的結(jié)果給出商業(yè)角度的解釋,這樣才有實(shí)際意義燕酷。

客戶分群就很適合使用聚類的方法籍凝。首先周瞎,通過聚類的數(shù)據(jù)挖掘把所有客戶按照特征分成幾群,建立客戶分群模型;其次饵蒂,分析各群客戶的特征声诸,主要是行為特征:再次,分析每一群客戶特征體現(xiàn)出來的信息有什么商業(yè)價(jià)值退盯,為管理和營銷人員提供制定管理或營銷計(jì)劃的依據(jù);最后彼乌,建立完善的分群模型維護(hù)流程以適應(yīng)市場的變化。還可以從客戶發(fā)展的角度考慮渊迁,根據(jù)客戶產(chǎn)生的收益慰照、客戶通話行為特征、客戶信用度風(fēng)險(xiǎn)等數(shù)據(jù)進(jìn)一步建立客戶價(jià)值評估模型琉朽,對客戶群進(jìn)行更深入的挖掘與分析毒租。

3客戶分群模型的構(gòu)建與探討

總體框架

(1)基于客戶行為數(shù)據(jù),使用各種聚類算法生成客戶分群模型:

(2)分析不同算法得到的分群結(jié)果箱叁,選取最好的模型墅垮,好模型的標(biāo)準(zhǔn)
是群與群之間差異盡量大而群內(nèi)差異盡量小;

(3)使用挖掘工具提供的數(shù)據(jù)探索工具分析各客戶群特征;

(4)建立客戶信用度風(fēng)險(xiǎn)評估模型,給出每個(gè)客戶的信用度風(fēng)險(xiǎn)指
標(biāo);

(5)建立客戶價(jià)值評估模型耕漱,根據(jù)客戶所產(chǎn)生的消費(fèi)額算色、客戶通話行
為以及客戶信用度風(fēng)險(xiǎn)指標(biāo)建立一個(gè)全面評估客戶價(jià)值的客戶價(jià)值函數(shù),更合理地評估每個(gè)客戶的價(jià)值孤个。

數(shù)據(jù)規(guī)范性

K-Means聚類算法是采用計(jì)算距離來度量記錄之間的差異大小剃允。這種
方法決定了聚類所輸入的數(shù)值大小不同對結(jié)果的影響是不一樣的。取值比較大的變量齐鲤,比如通話時(shí)長斥废,變量單位通常是秒,值都非常大给郊,這樣在計(jì)算對象差異性的時(shí)候牡肉,這個(gè)變量的影響就會很大;然而對于一些取值比較小的變量,比如通話次數(shù)淆九,取值就不會很大统锤,這樣計(jì)算差異的時(shí)候該變量的影響度就會減小。

在進(jìn)行聚類之前應(yīng)該對數(shù)據(jù)進(jìn)行規(guī)范化處理炭庙,這樣可以大大提高聚類的效果饲窿。常用的規(guī)范化方法有最大-最小規(guī)范化和Z-SCORE規(guī)范化。其中最大-最小規(guī)范化是把數(shù)據(jù)在指定的區(qū)間內(nèi)進(jìn)行等比縮放;Z-SCORE規(guī)范化是計(jì)算每一個(gè)變量與平均值之間的差異大小和平均差異(使用標(biāo)準(zhǔn)差或者平均絕對偏差)的比值焕蹄。本文采用的是Z-SCORE規(guī)范化方法逾雄,具體過程如下:

(1)計(jì)算平均絕對偏差(meanabsolutedeviation)Sf

sf=(x1f-mf+|x2f-mf+….+xnf-mf)(1)

式(1)中,x1f,…xnf是變量f的n個(gè)度量值鸦泳,mf是f的平均值银锻,即:
mf=(x1f+x2f+…+xnf)

(2)計(jì)算標(biāo)準(zhǔn)化的度量值Z-SCORE
zif=(2)

(3)計(jì)算斜率
slope=(3)

以上三步都是通過SQL在數(shù)據(jù)庫中進(jìn)行的,這樣經(jīng)過規(guī)范化后的數(shù)據(jù)
就可以用來進(jìn)行聚類了做鹰。

建立聚類模型

K-Means聚類算法對于處理大數(shù)據(jù)集情況的效率是很高的击纬,因此選擇使用K-Means算法進(jìn)行聚類。K-Means算法工作流程如下:

(1)任意選擇K個(gè)對象作為初始的簇中心(K預(yù)先指定)

(2)Repeat;

(3)根據(jù)簇中對象的平均值钾麸,將每個(gè)對象重新賦給最類似的簇;

(4)更新簇中的平均值更振,即計(jì)算每個(gè)簇中對象的平均值;

(5)Until不再發(fā)生變化,直到達(dá)到某個(gè)閾值喂走。

在實(shí)際的模型建立過程中殃饿,通過聚類共獲取到12個(gè)客戶群,這里不再進(jìn)行詳述芋肠。

模型分析

分析方法是把模型提供的各變量組內(nèi)均值做最大-最小規(guī)范化后乎芳,劃分出各類的優(yōu)勢特征和弱勢特征,從而給各組一個(gè)描述性的名字帖池。給出的名字反映的是該組最大特征奈惑,但并不是唯一特征。分析過程中把各變量規(guī)范化為0~10的公式如下:

VN=((V-MINV)/(MAXV-MIN V))*10(4)

式(4)中v是被規(guī)范化的值VN是被規(guī)范化后的值睡汹、MIN V是V值所在變量的最小值肴甸、MAXN是V值所在變量的最大值。

這樣變量的所有值將會被規(guī)范化為從0到10的區(qū)間囚巴,原值被等比縮放原在。這樣一個(gè)值在同一個(gè)變量中比其他值大還是小就很明顯了。各值只和同一個(gè)變量的其他值有可比性彤叉。在分析過程中庶柿,規(guī)范化后的值被標(biāo)上了不同顏色,這樣對各類進(jìn)行分析的時(shí)候?qū)ζ鋬?yōu)勢字段秽浇、弱勢字段就能一目了然

分析過程中判斷一個(gè)變量是否優(yōu)勢字段浮庐,不光看某類中這個(gè)變量大還是小,還要看其他類在該變量上的取值情況柬焕。例如审残,如果某類中一個(gè)變量取值很大,但是其它類在該變量上的取值同樣也很大斑举,那么這個(gè)變量就不是優(yōu)勢變量搅轿。

4結(jié)論與思考

以上僅是對客戶分群模型構(gòu)建的初步分析,通過模型可以得到各群用戶的顯著特性富玷,并針對各客戶群的特性給出一定的市場建議璧坟∶槐觯可能有些建議并不是很可行,但客戶分群的思想以及所獲取的客戶分群模型還是極有效的沸柔,未來基于該模型可以做很多事情,達(dá)到目標(biāo)明確铲敛、事半功倍的效果褐澎。

例如,通過了解各客戶群的優(yōu)勢特征和弱勢特征可以識別新的營銷機(jī)
會伐蒋,從而有針對性地進(jìn)行差異化套餐設(shè)計(jì);客服部門可以參考客戶分群的結(jié)果對不同類型的客戶進(jìn)行有針對性的差異化客戶服務(wù);市場部門再設(shè)計(jì)促銷活動的時(shí)候工三,可以參考客戶分群情況來選擇正確的宣傳目標(biāo)和途徑;客戶分群還可以與離網(wǎng)預(yù)測模型相結(jié)合,在進(jìn)行客戶挽留的時(shí)候了解挽留目標(biāo)的特征無疑是很有幫助的先鱼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末俭正,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子焙畔,更是在濱河造成了極大的恐慌掸读,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件宏多,死亡現(xiàn)場離奇詭異儿惫,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)伸但,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評論 3 392
  • 文/潘曉璐 我一進(jìn)店門肾请,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人更胖,你說我怎么就攤上這事铛铁。” “怎么了却妨?”我有些...
    開封第一講書人閱讀 162,764評論 0 353
  • 文/不壞的土叔 我叫張陵饵逐,是天一觀的道長。 經(jīng)常有香客問我管呵,道長梳毙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,193評論 1 292
  • 正文 為了忘掉前任捐下,我火速辦了婚禮账锹,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘坷襟。我一直安慰自己奸柬,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評論 6 388
  • 文/花漫 我一把揭開白布婴程。 她就那樣靜靜地躺著廓奕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上桌粉,一...
    開封第一講書人閱讀 51,182評論 1 299
  • 那天蒸绩,我揣著相機(jī)與錄音,去河邊找鬼铃肯。 笑死患亿,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的押逼。 我是一名探鬼主播步藕,決...
    沈念sama閱讀 40,063評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼挑格!你這毒婦竟也來了咙冗?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,917評論 0 274
  • 序言:老撾萬榮一對情侶失蹤漂彤,失蹤者是張志新(化名)和其女友劉穎雾消,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體显歧,經(jīng)...
    沈念sama閱讀 45,329評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡仪或,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了士骤。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片范删。...
    茶點(diǎn)故事閱讀 39,722評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖拷肌,靈堂內(nèi)的尸體忽然破棺而出到旦,到底是詐尸還是另有隱情,我是刑警寧澤巨缘,帶...
    沈念sama閱讀 35,425評論 5 343
  • 正文 年R本政府宣布添忘,位于F島的核電站,受9級特大地震影響若锁,放射性物質(zhì)發(fā)生泄漏搁骑。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評論 3 326
  • 文/蒙蒙 一又固、第九天 我趴在偏房一處隱蔽的房頂上張望仲器。 院中可真熱鬧,春花似錦仰冠、人聲如沸乏冀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽辆沦。三九已至昼捍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間肢扯,已是汗流浹背妒茬。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蔚晨,地道東北人郊闯。 一個(gè)月前我還...
    沈念sama閱讀 47,729評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像蛛株,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子育拨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評論 2 353

推薦閱讀更多精彩內(nèi)容

  • 項(xiàng)目描述 數(shù)據(jù)源是來自Kaggle的一個(gè)跨國數(shù)據(jù)集谨履,其中包含2010年12月12日至2011年12月9日期間發(fā)生的...
    Mukee閱讀 7,054評論 3 18
  • 寫在前面 1、RFM模型是用戶價(jià)值分析中最常見的模型熬丧,核心思想是用戶的消費(fèi)間隔(忠誠度)笋粟、消費(fèi)金額(付費(fèi)情況)、消...
    Saturday_tell閱讀 2,935評論 1 8
  • 基于K-means給客戶分群 一析蝴、背景描述 1害捕、我們的想要將客戶進(jìn)行分類,分類后是為了對不同的客戶進(jìn)行分類管理闷畸,給...
    Ryan96閱讀 1,025評論 0 0
  • | 導(dǎo)語在產(chǎn)品的增長分析當(dāng)中尝盼,想關(guān)注符合某些條件的一部分用戶,不僅想知道這些人的整體行為(訪問次數(shù)佑菩,訪問時(shí)長等)盾沫,...
    饅頭白魚閱讀 6,008評論 0 29
  • 一、什么是客戶分群殿漠? 將現(xiàn)有消費(fèi)群體按一定規(guī)則分成若干個(gè)特征鮮明的小群體赴精,從而使得: * 不同組別間特征差異明顯;...
    數(shù)據(jù)分析之路閱讀 2,994評論 1 2