本篇數(shù)據(jù)分析報告全文約3900字态秧,閱讀大約需要10分鐘
一、分析背景及目的
數(shù)據(jù)源:Ad Display/Click Data on Taobao.com
這是一份淘寶平臺的廣告展示/點擊數(shù)據(jù),本次分析需要從這些數(shù)據(jù)中發(fā)現(xiàn)某些規(guī)律或者異常券躁,進而給運營團隊提出建議
評價一個廣告效果的指標就是廣告的點擊人數(shù),可以反映一個廣告有多少人愿意點擊查看廣告的內(nèi)容掉盅,只有廣告被點擊也拜,后續(xù)轉(zhuǎn)化為購買行為才會發(fā)生。
把廣告的點擊人數(shù)指標拆分:
廣告點擊人數(shù)=廣告展示數(shù) x 點擊率
而廣告展示數(shù)又由廣告商品的價格趾痘、類別影響慢哈;不同人群對不同類別商品有著不同的喜好,從而影響廣告的點擊率永票。
在廣告展示數(shù)一定的條件下卵贱,點擊率的高低就是決定一個廣告能否被更多人看到的因素。
因此本次分析就針對【點擊率】這一因素進行分析
二瓦侮、分析思路
從“廣告”和“用戶”兩個角度進行分析:
1.廣告角度
- 分析不同廣告的商品價格對點擊率的影響
- 分析哪些類別的廣告點擊率更高艰赞,哪些類別的點擊率低
2.用戶角度
- 分析性別和廣告點擊率有什么關(guān)系
- 結(jié)合聚類分析與RFM模型分析用戶群體對廣告點擊率有什么關(guān)系
三、分析過程
1.數(shù)據(jù)清洗
(1)數(shù)據(jù)概覽
原始的數(shù)據(jù)集中包括三類數(shù)據(jù)肚吏,具體數(shù)據(jù)對應屬性如下:
為了方便分析方妖,抽取其中的部分字段作為分析。
從raw_sample數(shù)據(jù)集中抽确E省:用戶ID党觅、廣告ID、是否點擊
從ad_feature數(shù)據(jù)集中抽日埂:廣告ID杯瞻、類目ID、廣告商品價格
從user_profile數(shù)據(jù)集中抽褥牌:用戶ID魁莉、年齡層、性別、購物層次
(2)數(shù)據(jù)組合
將三張數(shù)據(jù)表旗唁,組合到一張表中
a=raw_sample.merge(right=ad_feature,on='ad_id',how='left')
b=a.merge(right=user_profile,on='user_id',how='left')
得到一張記錄了用戶-廣告信息表
(3)缺失值處理
1检疫、源數(shù)據(jù)中還有許多的缺失值屎媳,將性別和年齡層字段中為空值的記錄刪去
2风响、查看數(shù)據(jù)中的異常值钞诡,并將異常值刪去
查看廣告商品價格字段的屬性值范圍:
發(fā)現(xiàn)最大值為100000000.0元,價格過大接箫,屬于異常值辛友,刪去
再次查看價格字段的屬性值范圍:
還是存在數(shù)據(jù)值過大的異常值
為了方便分析對價格字段進行切分邓梅,選取更貼近日常生活的價格在1000元以內(nèi)的廣告記錄進行分析
切片之后仍保留了751570條記錄
(4)數(shù)據(jù)字段整合
對于廣告商品價格字段日缨,每個廣告的商品都有各自的價格掖看,根據(jù)價格字段不便于進行統(tǒng)計哎壳。新增一個字段“price_class”代表價格的區(qū)間归榕。
(0-價格在0-100元外里、1-100-200元级乐、2-200-300元...)
2.結(jié)合圖表分析
(1)分析不同廣告商品價格對點擊率的影響
①將廣告商品價格分類
將廣告按價格分為100元以下风科、200元以下贼穆、300元以下等10類故痊,并計算不同價格區(qū)間中廣告的點擊率情況愕秫。
從圖中發(fā)現(xiàn)符喝,所有價格區(qū)間商品的點擊率都在5%左右协饲,其中廣告商品價格在100元以下的廣告點擊率最高茉稠,為5.92%而线;
看到價格較低的廣告商品點擊率更高吞获,我們一般認為是對價格敏感的淺層用戶(免費用戶)在這方面的點擊率更高各拷,而擁有一定消費行為和消費意識的中層烤黍、深層用戶(付費用戶)則更在意購物時的體驗以及商品的質(zhì)量。
為了驗證以上說法嫂丙,我們先假設(shè)100元以內(nèi)的廣告商品主要的點擊對象是淺層用戶跟啤,再通過數(shù)據(jù)驗證隅肥。
② 分析100元以內(nèi)廣告商品點擊率的用戶組成
查看點擊了100元以內(nèi)的廣告商品的用戶的用戶組成
從用戶分布可以看出腥放,在點擊了100元以內(nèi)廣告商品的用戶中秃症,深度用戶的比例更高种柑,占比81.6%莹规,而淺層用戶的占比則相對少很多泌神。這推翻了我們原來的假設(shè)欢际。
小結(jié):
- 17年5月6日至17年5月12日這8天里的廣告點擊率理想损趋,但由于缺乏去年同期浑槽、今年上月的數(shù)據(jù)桐玻,不足以判斷5%左右的廣告點擊率是否是一個正常水平镊靴,有待更多數(shù)據(jù)驗證偏竟。
- 低價廣告商品點擊率更高,且點擊用戶中絕大多數(shù)是深度用戶蝉仇。建議:可以把這個數(shù)據(jù)反應給廣告投放部門量淌,在這個區(qū)域優(yōu)先投放廣告,既可以對淺層用戶進行流量變現(xiàn)又能讓廣告讓更多具有消費意愿的中笼痛、深層用戶看見缨伊。
(2)分析哪些類別的廣告點擊率更高,哪些類別的點擊率低
由于廣告的類別數(shù)量眾多嫂易,大部分類別的廣告只有1-2次的展示徐块,數(shù)據(jù)樣本太小,因此選取展示數(shù)量最多的7個類別進行分析旁趟。
① 找出展示數(shù)、點擊數(shù)橙困、點擊率最高的廣告類別
可以看出類別6261廣告的展示數(shù)、點擊數(shù)像捶、點擊率均為最高,而類別4385廣告的展示數(shù)雖然有10000+释簿,但是點擊數(shù)庶溶、點擊率卻是最低的偏螺。
② 分析類別4385廣告效果最差的原因:
a.先按【廣告商品價格】來分析
計算沒有被點擊的類別4385廣告的商品的平均價格
而點擊了類別4385廣告的商品的平均價格為:
兩者平均價格都在200-300區(qū)間、差異不大夺巩。結(jié)合分析(1)柳譬,價格區(qū)間在200-300的廣告商品點擊率平均是在5.29%美澳,而類別4385則只有3.61%制跟。
這說明:廣告商品價格不是影響類別4385廣告點擊率的因素
b.再按【性別】來分析
先來看看類別4385被哪些用戶看到了
可以看出,類別4385的廣告逢净,主要是被推薦給了男性用戶,而男性用戶對這類商品的興趣大于女性踩身。
并且女性對這類商品的廣告興趣不高挟阻,點擊率只有2.75%,是造成類別4385廣告點擊率低的主要原因脱拼。
c.最后按【用戶年齡】來分析
來看看不同年齡段、不同性別的用戶點擊率有什么差異
(年齡字段含義:0:10歲以下情臭、1:10-20歲俯在、2:20-30歲跷乐、3:30-40歲劈猿、4:40-50歲揪荣、5:50-60歲、6:60歲以上)
從統(tǒng)計的數(shù)據(jù)可以看出往史,類別4385廣告的商品主要點擊群體是30歲以上男性用戶仗颈,尤其是60歲以上男性興趣最高,而女性用戶對這類廣告商品興趣低椎例。
結(jié)合a挨决、b的分析,受30歲以上男性歡迎订歪、價格在200-300的商品脖祈,推測是西裝、皮鞋類或者煙酒類又或者是家用電器類商品
③ 小結(jié)
- 類別6261廣告效果最好刷晋,有最高的點擊率喻奥、展示數(shù)和點擊人數(shù)过牙〔芭猓可以加大對該類別廣告的資源投入油够,擴大廣告推廣效果鬼悠。
- 類別4385廣告點擊率的原因是它掂,這類商品對女性用戶而言興趣不大,女性用戶點擊率低,導致了整體的點擊率低。可以在該廣告的廣告詞中加入“父親笛辟、爺爺”等宣傳詞,引導女性消費者將該類別商品作為一種禮物送給男性用戶,從而提高點擊率
- 類別4385的主要受眾群體是30歲以上男性,為了提高點擊率可以重點推薦給30歲以上男性用戶。對于該類別廣告商品的受眾,可以適當增加產(chǎn)品折扣、降低商品價格,吸引點擊廣告的用戶轉(zhuǎn)換成購買用戶
(3)分析性別和廣告點擊率有什么關(guān)系
① 計算男女人數(shù)比例
男女比例約為:1:1.6
② 計算男女各自的點擊數(shù)
男女廣告點擊數(shù)的比例約為:1:1.7
因此漆诽,總體上女性的點擊數(shù)要多于男性供鸠,但兩者的點擊率基本一致。
③ 比較各類別廣告點擊率-男女差異
可以看出,大部分類別中,女性的廣告點擊數(shù)都要明顯大于男性的點擊人數(shù)劫侧。
只有類別4385拳球、類別4505酬姆,這兩個類別的廣告浮定,男性的點擊人數(shù)要超過女性的點擊人數(shù)。
男女之間的主要差異是由類型6261的廣告造成的击费,女性的點擊數(shù)大約是男性的4倍。
④ 小結(jié)
- 總體上看圆仔,女性的廣告點擊人數(shù)明顯大于男性奕污,但兩者的點擊率卻是差不多的。
- 類別4385割岛、4505廣告,男性的點擊人數(shù)要多于女性租副。這類廣告可能是男士服飾结胀、汽車秸抚、煙酒這類商品
(4)分析用戶群體對廣告點擊率有什么關(guān)系
不同的用戶群體之間用戶價值與消費習慣具有一定的差異若贮,對于不同用戶群體的廣告投放的策略也不同。通過分析不同用戶群體對廣告點擊率有什么關(guān)系,來制定不同的投放策略其徙。
這里的分析通過K-Means算法來對用戶進行聚類胚迫,并基于RFM模型來對用戶價值進行劃分。
①用K-Means算法對用戶進行聚類
這里選取用戶的購物層次唾那、廣告點擊率访锻、瀏覽廣告的商品平均價格,這3個指標來作為判斷用戶價值的標準
- 用戶的購物層次——體現(xiàn)用戶在平臺上的持續(xù)購物深度
- 廣告點擊率——體現(xiàn)用戶對廣告的接受程度
- 瀏覽廣告的商品平均價格——體現(xiàn)用戶通過廣告推廣能帶來的潛在收益
對用戶進行聚類分析:
這里將所有用戶分成5類通贞,來代表用戶價值的高低朗若。
注:三個特征在聚類時都進行了特征的標準化
從不同群體的特征分布可以得出:
- 群體5在點擊率方面最大
- 群體2在瀏覽廣告的商品平均價格最大
- 所有群體的用戶在購物層次上基本沒有差異
因此,我們可以出:群體5對廣告的接受程度最高昌罩,非常愿意點擊廣告。群體2更喜好高價格的商品灾馒,對購買高價商品抱有極大興趣茎用。
② 用RFM模型對用戶進行劃分
根據(jù)用戶在購物深度、點擊率睬罗、觀看廣告商品的平均價格3個維度的表現(xiàn)轨功,將用戶劃分為5類客戶。
(1)重要保持用戶
- 這類用戶有著高點擊率容达,有更大的可能將用戶的點擊率轉(zhuǎn)換為實際的購買行為古涧。并且喜歡在平臺上進行購物,是最理想的客戶花盐。
- 應優(yōu)先將廣告資源投放給他們身上羡滑,維持這類客戶的點擊率
(2)重要發(fā)展用戶
- 這類用戶點擊率中等、也喜歡在平臺上進行購物算芯,并且對廣告商品的價格適中柒昏。具有很大的發(fā)展?jié)摿?/li>
- 應加強與這類用戶的聯(lián)系,培養(yǎng)其點擊廣告的習慣熙揍,使他們成為高點擊率的用戶
(3)重要挽留用戶
- 這類用戶點擊率偏低职祷,但是其瀏覽的廣告商品的價格很高,對該類用戶進行挽回届囚,能提高廣告轉(zhuǎn)化為實際購買行為的價值
- 應加強與這類用戶的互動有梆,延長這類用戶的生命周期
(4)一般用戶
- 這類用戶點擊率低,瀏覽廣告的商品價格適中意系。這類用戶沒有點擊廣告的習慣泥耀,偶爾點擊廣告的商品價格也不高
- 應嘗試投放多種類型的廣告給這類用戶,觀察是否能找到用戶感興趣的廣告商品類型昔字,進而提高點擊率爆袍。
(5)低價值用戶
- 這類用戶點擊率低首繁,瀏覽廣告商品價格低,屬于平臺的免費用戶陨囊,用戶價值較低
根據(jù)聚類結(jié)果弦疮,對應上述五類客戶類型,進行匹配蜘醋,得到客戶群體的價值排名:
根據(jù)結(jié)果胁塞,我們可以發(fā)現(xiàn)5類用戶的分布如圖所示:
可以看出:最有價值的3類用戶占比約為20%。這20%的用戶必然貢獻了廣告點擊率的絕大部分压语,平臺如果希望廣告效果好啸罢,就需要投入資源服務好這部分用戶
一般用戶、低價值用戶仍為平臺用戶的主體胎食,對于這類用戶需要通過運營/營銷策略扰才,提高他們的活躍度/點擊率,爭取將他們轉(zhuǎn)換成重要的用戶厕怜。
③ 小結(jié)
- 重要用戶占比20%衩匣,對于群體1、2粥航、5里的用戶琅捏,應針對用戶特點,定向推送廣告递雀,在高點擊率的同時柄延,爭取進一步提高廣告的轉(zhuǎn)化率,將點擊落實為購買缀程。
- 其他用戶占比80%搜吧,對于群體3、4的用戶杠输,應推送多種類型的廣告給這類用戶赎败,尋找用戶對哪類廣告的商品更感興趣,并可以通過相應促銷活動蠢甲,提高其活躍度和廣告點擊率僵刮,爭取將這類用戶轉(zhuǎn)換為重要用戶
四、結(jié)論和建議
把上述的分析過程中的小結(jié)正例出來鹦牛,得到分析結(jié)論搞糕,并綜合所有的結(jié)論提出建議: