一镊辕、?分析背景與目的
1.?背景
愛彼迎(Airbnb)是全球領(lǐng)先的民宿預(yù)訂平臺耿眉,用戶可通過網(wǎng)絡(luò)或手機(jī)應(yīng)用程序發(fā)布、搜索度假房屋租賃信息并完成在線預(yù)定程序须眷。自成立以來竖瘾,其業(yè)務(wù)已遍布191個國家、65,000個城市花颗,重塑了傳統(tǒng)酒店行業(yè)捕传,為旅行者們提供了特別的入住選擇與體驗。
2.?分析目的
作為一家國際化且發(fā)展迅速的新興企業(yè)扩劝,愛彼迎成功的背后是否仍存在可以提升與改進(jìn)的空間庸论?根據(jù)AARRR模型职辅,我們將主要從用戶畫像,渠道推廣聂示,以及各環(huán)節(jié)轉(zhuǎn)化率三個方面對問題進(jìn)行分析與改進(jìn)域携。
針對分析目的,我們提出以下三個目標(biāo):
1.?構(gòu)建愛彼迎新注冊用戶群體畫像鱼喉。
2.?評估愛彼迎現(xiàn)有的各個推廣渠道的效果秀鞭。
3.?分析訂單各個環(huán)節(jié)的轉(zhuǎn)化率與流失率從而發(fā)現(xiàn)整體流程中的薄弱點并對此進(jìn)行改進(jìn)。
二蒲凶、?分析思路
1.?用戶畫像分析
·?用戶性別
·?用戶年齡
·?用戶語言(所在地)
·?用戶目的地偏好
?2.?推廣渠道分析
·?每月新增用戶及新增訂單量
·?不同推廣渠道的注冊量及轉(zhuǎn)化率
·?不同設(shè)備的注冊量及轉(zhuǎn)化率
·?不同推廣內(nèi)容的注冊量及轉(zhuǎn)化率
3.?訂單轉(zhuǎn)化漏斗分析
·?活躍用戶占比
·?下單用戶占比
·?支付用戶占比
·?復(fù)購用戶占比
三气筋、數(shù)據(jù)概覽
1.?數(shù)據(jù)來源
數(shù)據(jù)集名稱: Airbnb New User Bookings
數(shù)據(jù)來源: https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data
數(shù)據(jù)集中包含兩張數(shù)據(jù)表,?其中user表包含新注冊用戶數(shù)據(jù), sessions表中包含用戶行為數(shù)據(jù)。
2.?數(shù)據(jù)理解
數(shù)據(jù)表一:user
id:?用戶ID
date_account_created:帳戶創(chuàng)建日期
date_first_booking:首次預(yù)訂日期
gender:性別
age:年齡
signup_method:注冊方式
language:語言偏好
affiliate_channel:營銷方式(SEM等)
affiliate_provider:營銷來源旋圆,例如google,craigslist
first_affiliate_tracked:在注冊之前麸恍,用戶與之交互的第一個營銷內(nèi)容
signup_app:注冊來源
first_device_type:注冊時設(shè)備的類型
first_browser:注冊時使用的瀏覽器名稱
country_destination:訂房國家
?數(shù)據(jù)表二:sessions
user_id:客戶id灵巧,與users表中的“id”連接
action:用戶行為
action_type:用戶行為類型
action_detail:用戶行為具體
device_type:用戶使用的設(shè)備
四、數(shù)據(jù)清洗
1.?找出并刪除重復(fù)值
user表中id應(yīng)為主鍵抹沪,因此需要確保主鍵的唯一性刻肄,刪除重復(fù)id。
此代碼返回213451行數(shù)據(jù)融欧,和原始數(shù)據(jù)行數(shù)相等敏弃,所以沒有重復(fù)值。
2.缺失值處理
通過查詢發(fā)現(xiàn)每列缺失值分別為
date_first_booking: 124543個
gender: 95688個
age: 87990個
first_affiliate_tracked: 6065個
first_browser: 27266個
action_type: 721679個
action_detail: 721679個
對于date_first_booking(首次預(yù)定日期)列的缺失值結(jié)合業(yè)務(wù)理解為用戶注冊賬號后并未進(jìn)行過預(yù)定噪馏,gender(性別)以及age(年齡)列的缺失值推測是由于用戶在注冊時選擇不填寫這兩項信息麦到,其他列的空值推測是由于前端未統(tǒng)計到數(shù)據(jù)。
處理方法:?在進(jìn)行查詢時通過where子句篩選欠肾。
3.異常值處理
有29條數(shù)據(jù)中預(yù)定日期早于賬戶創(chuàng)建日期瓶颠,刪除這些數(shù)據(jù)。
age列中最大值為2014刺桃,最小值為1粹淋,原因可能是用戶未真實填寫信息造成的,將年齡范圍不在5~85歲間的數(shù)據(jù)更新為0瑟慈。
五桃移、用戶畫像分析
????1.?用戶性別分布
女性用戶數(shù)量為63026,男性為54429葛碧。
從整體性別分布上來看借杰,男女用戶性別比例差別不大,女性用戶占比比男性用戶多8%左右吹埠。
2.用戶年齡分布
從年齡分布來看第步,25-45的中青年為主要群體疮装,這部分群體有更多精力與興趣旅游出行,隨著年齡的增加粘都,用戶人數(shù)逐漸變少廓推,符合正常規(guī)律。
3.?用戶語言分布(所在地分布)
絕大部分用戶群體為說英語的國家翩隧,說明主要用戶群體集中在歐美地區(qū)樊展,其次為中國地區(qū)。
4.?用戶目的地分布
從圖中可以看出堆生,美國作為最吸引人的旅游目的地吸引了80%左右的用戶专缠,其次是德國。
六淑仆、推廣渠道分析
1.?每月新增用戶以及新增訂單量分析
從圖中可以看出:
1. 2011年以前涝婉,由于處于成立初期,愛彼迎用戶增長速度較為緩慢蔗怠。從2012年開始用戶增長速度顯著提高墩弯。
?2.?新增用戶以及新增訂單數(shù)在每年的7-9月迎來增長高峰,在9-12月有下降趨勢寞射。推測原因為7-9月夏季為旅游旺季渔工,大部分用戶選擇這個時間出行,除此以外桥温,大部分學(xué)校會在這個時候放假引矩,而9-12月隨著天氣變冷和開學(xué),出行計劃減少侵浸。
?3. 2013年底至2014年開始旺韭,愛彼迎新用戶數(shù)大幅度增加,訂單數(shù)也呈明顯上升趨勢通惫。推測原因為2014年一月愛彼迎通過分析及預(yù)測用戶的使用行為和留存情況上線了全新的用戶推薦系統(tǒng)茂翔,吸引了更多新用戶。
?2.?不同推廣渠道用戶質(zhì)量
?從圖中可以看出:
1. direct渠道來源的用戶數(shù)量最多履腋,推測用戶從不同渠道了解到信息后根據(jù)需求直接搜索或到應(yīng)用商店直接下載珊燎。
?2.?除了direct渠道外,google渠道的用戶數(shù)量最多遵湖,其中sem營銷方式的用戶數(shù)最多悔政。
?3.?總體來看seo營銷方式轉(zhuǎn)化率最好,facebook_seo和google_seo轉(zhuǎn)化率都有不錯的表現(xiàn)延旧。
?4. google content的轉(zhuǎn)化率表現(xiàn)低于平均水平谋国,應(yīng)額外注意。
3.不同推廣內(nèi)容用戶質(zhì)量
從圖中可以看出:
1. linked注冊用戶數(shù)最多迁沫,其次是omg芦瘾。
2.除去注冊量很少的marketing捌蚊,linked的轉(zhuǎn)化率是最高的,其次是omg
4.?不同注冊設(shè)備用戶質(zhì)量以及時間趨勢
從圖中可以看出:
1. 2014年以前近弟,使用pc端注冊的用戶遠(yuǎn)多于移動端缅糟。推測是由于2014年以前智能手機(jī)的普及程度還不高。
2. PC端注冊的用戶中Mac系統(tǒng)多于微軟系統(tǒng)祷愉,且Mac系統(tǒng)用戶轉(zhuǎn)化率也高于微軟系統(tǒng)窗宦,移動端中蘋果注冊用戶多于安卓注冊用戶。
3.?蘋果移動端中ipad注冊用戶轉(zhuǎn)化率高于iPhone二鳄,安卓移動端中Android Tablet?轉(zhuǎn)化率高于Android phone赴涵。Android phone?注冊的用戶是移動端中轉(zhuǎn)化率最低的,需要額外注意订讼。
4.2010-2014期間髓窜,隨著智能手機(jī)的普及和發(fā)展,移動端注冊用戶占比逐年增加欺殿。
七纱烘、訂單轉(zhuǎn)化漏斗分析
此部分主要通過對sessions表中的用戶行為進(jìn)行漏斗轉(zhuǎn)化分析,從而找出訂單轉(zhuǎn)化過程中的薄弱環(huán)節(jié)祈餐。
1.?有行為的用戶總數(shù)
對sessions表中不同的user_id進(jìn)行統(tǒng)計,得到有行為的用戶總數(shù)哄陶。
??
????查詢結(jié)果為:86053
2.?活躍用戶總數(shù)
對sessions表中行為數(shù)超過或等于10次的user_id進(jìn)行統(tǒng)計帆阳。
查詢結(jié)果:70593?占比:82%
3.?下單用戶總數(shù)
對sessions表中action_type為reservations的用戶數(shù)進(jìn)行統(tǒng)計。
查詢結(jié)果:5935?占比:8.4%
4.支付用戶總數(shù)
對sessions表中action_type為payment_instruments的用戶數(shù)進(jìn)行統(tǒng)計屋吨。
查詢結(jié)果:4888?占比:82.4%
5.復(fù)購用戶總數(shù)
對sessions表中action_type為payment_instruments且次數(shù)超過一次的用戶數(shù)進(jìn)行統(tǒng)計蜒谤。
查詢結(jié)果: 2313?占比:47.3%
從圖中可以看出:
活躍用戶到下單用戶這一環(huán)節(jié)轉(zhuǎn)化率最低,僅為8.4%至扰。需要分析是否由于推薦房源無法滿足用戶的需求鳍徽,或是有同類競爭產(chǎn)品上線造成了客戶流失,并對運營策略做出調(diào)整與改進(jìn)敢课。
八阶祭、結(jié)論與建議
1.結(jié)論
用戶畫像:
1.?從用戶性別分布來看,男性與女性用戶人數(shù)差別不大直秆,女性略多于男性濒募。
2.?從用戶年齡分布來看,主要用戶群體為中青年圾结,年齡集中在?25-45歲之間瑰剃。
3.?從用戶語言分布來看,大部分用戶集中在歐美國家筝野,其次是中國晌姚。
4.?從用戶目的地分布來看粤剧,80%的用戶選擇美國作為出行目的地,其次是德國挥唠。
推廣渠道:
1.?用戶數(shù)在2011年以前增長速度較為平緩抵恋,2011年后增長速度顯著提高。
2.?新增用戶數(shù)和訂單數(shù)呈現(xiàn)季節(jié)規(guī)律猛遍,每年7-9月為增長高峰
3.?除用戶直接從應(yīng)用商店下載app外馋记,google為用戶的最大來源平臺,其中除content方式用戶轉(zhuǎn)化表現(xiàn)較差外懊烤,seo和sem都有不錯的用戶轉(zhuǎn)化率梯醒。
4. seo營銷方式轉(zhuǎn)化率在所有營銷方式中最好,轉(zhuǎn)化率可達(dá)到45-50%腌紧。
5.?從推廣內(nèi)容分析來看茸习,linked用戶數(shù)和轉(zhuǎn)化率都是最高。
6.?不同設(shè)備注冊的用戶中壁肋,蘋果系統(tǒng)注冊的用戶數(shù)量以及轉(zhuǎn)化率都高于安卓系統(tǒng)号胚。
7.?隨著智能手機(jī)的普及,移動端用戶占比越來越高浸遗。
轉(zhuǎn)化漏斗:
活躍到下單環(huán)節(jié)轉(zhuǎn)化率最低猫胁,僅有8.4%的活躍用戶最終選擇下單。
2.建議
用戶畫像:
1.?對于25-45歲群體進(jìn)行精細(xì)化運營跛锌,通過不同維度分群弃秆,滿足不同用戶的需求,因而提高精準(zhǔn)度與用戶轉(zhuǎn)化率髓帽。
2.?擴(kuò)展不同國家的市場菠赚,通過改善運營內(nèi)容滿足不同國家用戶的需求。
推廣渠道:
1.?每年7-9月為出行預(yù)訂高峰郑藏,在這段時間應(yīng)加大推廣力度與投入衡查。
2.?Google除content方式轉(zhuǎn)化表現(xiàn)較差外,其他方式都較為理想必盖,后期可以增加google平臺的推廣力度拌牲,同時也應(yīng)調(diào)整content方式的質(zhì)量。
3.?seo方式轉(zhuǎn)化率最好筑悴,可考慮適當(dāng)增加該方式的推廣投入或占比们拙。
4.?推廣內(nèi)容來說,linked和omg在用戶數(shù)目和轉(zhuǎn)化率方面表現(xiàn)都較好阁吝,應(yīng)考慮增加這兩種營銷內(nèi)容占比砚婆。
5.?針對安卓系統(tǒng)用戶數(shù)和用戶轉(zhuǎn)化率都較低的情況來說,建議調(diào)查此現(xiàn)象是否由于安卓客戶端app質(zhì)量不穩(wěn)定或運行速度慢等其他原因?qū)е掠脩趔w驗感較差。
6.?由于越來越多用戶選擇移動端app装盯,因此后期應(yīng)更注重移動端app的質(zhì)量坷虑,不斷提高用戶體驗感受。
轉(zhuǎn)化漏斗:
針對活躍用戶到下單用戶這一環(huán)節(jié)用戶流失嚴(yán)重的情況埂奈,應(yīng)對房源推薦系統(tǒng)進(jìn)行完善迄损,針對不用的用戶群體推薦不通的房源以滿足需求,同時可增加更多優(yōu)質(zhì)房源為用戶提供更多選擇账磺。除此以外芹敌,對網(wǎng)站的交互體驗,界面內(nèi)容等做出一定程度的改善與優(yōu)化垮抗,從而提高下單率氏捞。