淘寶APP用戶行為數(shù)據(jù)分析

淘寶APP用戶行為數(shù)據(jù)分析

(一)數(shù)據(jù)理解
1.數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1

本文從數(shù)據(jù)集中選取了2014年11月18日至2014年12月18日之間幢泼,共802758條行為數(shù)據(jù)夸楣,數(shù)據(jù)集中每一行代表一條用戶行為,共有6個(gè)字段。

2.列字段如下:

User_id 用戶ID

Item_id 商品ID

behavior_type

用戶行為類型(包含點(diǎn)擊,收藏,加購物車,購買4中行為,分別用1,2,3,4表示)

User_geohash 地理位置

Item_category 商品種類

Time 用戶行為發(fā)生時(shí)間

(二)提出問題

1刽漂、整體用戶的購物情況

pv(總訪問量)、日均訪問量冗懦、uv(用戶總數(shù))爽冕、有購買行為的用戶數(shù)量、用戶的購物情況披蕉、復(fù)購率分別是多少颈畸?

2、用戶行為轉(zhuǎn)化漏斗

點(diǎn)擊—加購物車—收藏—購買各環(huán)節(jié)轉(zhuǎn)化率如何没讲?購物車遺棄率是多少眯娱?

3、購買率高和購買率為 0 的人群有什么特征

4爬凑、基于時(shí)間維度了解用戶的行為習(xí)慣

5徙缴、基于RFM模型的用戶分析

(三)數(shù)據(jù)清洗

(三)數(shù)據(jù)清洗

1.缺失值處理

User_geohash字段表示地理位置信息,由于數(shù)據(jù)存在大量空值,且對數(shù)據(jù)分析意義不大于样,因此不對該列進(jìn)行處理(三)數(shù)據(jù)清洗

1.缺失值處理

User_geohash字段表示地理位置信息疏叨,由于數(shù)據(jù)存在大量空值,且對數(shù)據(jù)分析意義不大穿剖,因此不對該列進(jìn)行處理


2.數(shù)據(jù)一致化處理

字段time包含(年月日)和小時(shí)兩種屬性蚤蔓,為了方便分析,將該字段分成日期date和小時(shí)time 2列


由于behavior_type列的四種行為分別用1糊余,2秀又,3,4表示點(diǎn)擊贬芥,收藏吐辙,加購物車,購買四種行為蘸劈,為了方便查看數(shù)據(jù)昏苏,將1,2昵时,3捷雕,4替換為’pv’, ’fav’ ,’cart’ ,’buy’


查詢表結(jié)構(gòu)椒丧,發(fā)現(xiàn)date列不是日期類型壹甥,將其修改為date類型


(四)構(gòu)建模型和分析數(shù)據(jù)

1.總體用戶購物情況

(1)pv(總訪問量)


(2)日均訪問量


(3)uv(用戶總數(shù))


(4)有購買行為的用戶數(shù)量


(5)用戶的購物情況


(6)復(fù)購率:產(chǎn)生兩次或者兩次以上購買的用戶所占比列


2.用戶行為轉(zhuǎn)化漏斗

在購物環(huán)節(jié)中收藏和加購物車沒有先后之分,所以將這兩個(gè)環(huán)節(jié)放在一起作為購物環(huán)節(jié)的一步


3.購買率高和低的人群各有什么特征

購買率高的用戶特征:


? ? ? ?從結(jié)果可以看出壶熏,購買率高的用戶點(diǎn)擊率并不高句柠,他們一般點(diǎn)擊不超過5次就直接購買,由此可以推斷出這些用戶為理智型消費(fèi)者棒假,有明確的購物目標(biāo)溯职,很少會被商家廣告或者促銷吸引

購買率低的用戶特征:


? ? ? ?從結(jié)果可以看出,購買率低主要有2個(gè)因素帽哑,其一點(diǎn)擊次數(shù)少谜酒,可能原因是網(wǎng)購欲望不強(qiáng)烈,可以通過廣告等加以引導(dǎo)妻枕;其二是點(diǎn)擊收藏次數(shù)較多僻族,但是購買率低,這類用戶可能正在為促銷活動做準(zhǔn)備屡谐,價(jià)格敏感述么,購物難度較大

4.基于時(shí)間維度了解用戶的行為習(xí)慣

1.一周中用戶活躍時(shí)段分布

由于第一周和第五周數(shù)據(jù)不全。因此這兩周的數(shù)據(jù)不進(jìn)行分析



? ? ? ?從結(jié)果可以看出愕掏,每周用戶活躍穩(wěn)定度秘,每周五會有小幅降低,但是周末逐漸回升饵撑。其中周五用戶活躍度突增剑梳,這是有雙十二電商活動引起的

2.一天中用戶的活躍時(shí)段分布


? ? ? ?可以看出唆貌,每日0點(diǎn)到5點(diǎn)用戶活躍度快速降低,降到一天中的活躍量最低值垢乙,6點(diǎn)到10點(diǎn)用戶活躍度快速上升挠锥,10點(diǎn)到18點(diǎn)用戶活躍度較平穩(wěn),17點(diǎn)到23點(diǎn)用戶活躍度快速上升侨赡,達(dá)到一天中的最高值蓖租。

5.基于RFM模型找出最有價(jià)值客戶

RFM模型是衡量客戶價(jià)值和客戶創(chuàng)造力的重要工具和手段

R-Recency(最近一次購買時(shí)間)

F-Frequency(消費(fèi)頻率)

M-Money(消費(fèi)金額)

但由于沒有相關(guān)金額數(shù)據(jù),只能通過R羊壹,F(xiàn)對客戶價(jià)值打分

(1)R-Rcency

? ? ? ?統(tǒng)計(jì)客戶最近發(fā)生購買行為的日期距離2014-12-19間隔幾天蓖宦,再對間隔進(jìn)行排名,間隔越少油猫,客戶價(jià)值越大

(2)計(jì)算F-Frequency

先統(tǒng)計(jì)每位用戶的購買頻率稠茂,再對購買頻率進(jìn)行排名,頻率越大情妖,客戶價(jià)值越大睬关,排名就越靠前


(3)對用戶進(jìn)行評分

查詢有購買行為的用戶的數(shù)量


? ? ? ?對3326名有購買行為的用戶按照排名進(jìn)行分組,共劃分為四組毡证,對排在前四分之一的用戶打4分电爹,排在前四分之一到四分之二(即二分之一)的用戶打3分,排在前四分之二到前四分之三的用戶打2分料睛,剩余的用戶打1分丐箩,按照這個(gè)規(guī)則分別對用戶時(shí)間間隔排名打分和購買頻率排名打分,最后把兩個(gè)分?jǐn)?shù)合并在一起作為該名用戶的最終評分


? ? ? ?通過打分可以了解每位顧客的特性恤煞,從而實(shí)現(xiàn)差異化營銷屎勘。比如對于?user_value?=?44?的用戶,為重點(diǎn)用戶需要關(guān)注居扒;對于user_value?=?41?這類忠誠度高而購買能力不足的概漱,可以可以適當(dāng)給點(diǎn)折扣或捆綁銷售來增加用戶的購買頻率。對于?user_value?=?14?這類忠誠度不高而購買能力強(qiáng)的喜喂,需要關(guān)注他們的購物習(xí)性做精準(zhǔn)化營銷瓤摧。還可以通過每個(gè)月對用戶的評分變化,推測客戶消費(fèi)的異動狀況夜惭,對于即將流失的客戶姻灶,通過電話問候、贈送禮品诈茧、加大折扣力度等有效的方式挽回客戶产喉。

(五)結(jié)論及建議

1、總體轉(zhuǎn)化率只有 1%,用戶點(diǎn)擊后收藏和加購物車的轉(zhuǎn)化率在 5% 曾沈,需要提高用戶的購買意愿这嚣,可通過活動促銷、精準(zhǔn)營銷等方式塞俱。

2姐帚、購買率高且點(diǎn)擊量少的用戶屬于理智型購物者,有明確購物目標(biāo)障涯,受促銷和廣告影響少罐旗;而購買率低的用戶可以認(rèn)為是等待型或克制型用戶群體,下單欲望較少且自制力較強(qiáng)唯蝶,購物難度較大九秀。

3、大部分用戶的主要活躍時(shí)間在10點(diǎn)到23點(diǎn)粘我,在19點(diǎn)到23點(diǎn)達(dá)到一天的頂峰鼓蜒。每周五的活躍度有所下降,但周末開始回升征字《嫉可以根據(jù)用戶的活躍時(shí)間段精準(zhǔn)推送商家的折扣優(yōu)惠或促銷活動,提高購買率匙姜。

4畅厢、通過 R 和 F 的數(shù)據(jù)對用戶行為進(jìn)行打分,對每位用戶進(jìn)行精準(zhǔn)化營銷搁料,還可以通過對R 和 F 的數(shù)據(jù)監(jiān)測或详,推測客戶消費(fèi)的異動狀況,挽回流失客戶郭计。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市椒振,隨后出現(xiàn)的幾起案子昭伸,更是在濱河造成了極大的恐慌,老刑警劉巖澎迎,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件庐杨,死亡現(xiàn)場離奇詭異,居然都是意外死亡夹供,警方通過查閱死者的電腦和手機(jī)灵份,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哮洽,“玉大人填渠,你說我怎么就攤上這事。” “怎么了氛什?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵莺葫,是天一觀的道長。 經(jīng)常有香客問我枪眉,道長捺檬,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任贸铜,我火速辦了婚禮堡纬,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蒿秦。我一直安慰自己隐轩,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布渤早。 她就那樣靜靜地躺著职车,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鹊杖。 梳的紋絲不亂的頭發(fā)上悴灵,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天,我揣著相機(jī)與錄音骂蓖,去河邊找鬼积瞒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛登下,可吹牛的內(nèi)容都是我干的茫孔。 我是一名探鬼主播,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼被芳,長吁一口氣:“原來是場噩夢啊……” “哼缰贝!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起畔濒,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤剩晴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后侵状,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赞弥,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年趣兄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了绽左。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,498評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡艇潭,死狀恐怖拼窥,靈堂內(nèi)的尸體忽然破棺而出戏蔑,到底是詐尸還是另有隱情,我是刑警寧澤闯团,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布辛臊,位于F島的核電站,受9級特大地震影響房交,放射性物質(zhì)發(fā)生泄漏彻舰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一候味、第九天 我趴在偏房一處隱蔽的房頂上張望刃唤。 院中可真熱鬧,春花似錦白群、人聲如沸尚胞。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽笼裳。三九已至,卻和暖如春粱玲,著一層夾襖步出監(jiān)牢的瞬間躬柬,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工抽减, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留允青,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓卵沉,卻偏偏與公主長得像颠锉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子史汗,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評論 2 359