如果某日百度的用戶檢索量下降了5%羊赵,該如何分析其原因独悴,說明思路和要點(diǎn)。(百度-2014)
1.題目分析
本題考查點(diǎn):數(shù)據(jù)分析混驰、業(yè)務(wù)分解攀隔。通過產(chǎn)品核心數(shù)據(jù)來緊密跟蹤產(chǎn)品的運(yùn)營狀態(tài),是每一個PM的基本能力栖榨。而一旦某項(xiàng)數(shù)據(jù)產(chǎn)生重大波動竞慢,PM能夠通過對業(yè)務(wù)進(jìn)行抽絲剝繭的分析來迅速定位問題點(diǎn),從而尋找和明確解決方案治泥。要想回答好本題,既需要有較強(qiáng)的數(shù)據(jù)分析能力遮精,也需要對搜索業(yè)務(wù)有一個比較深入的理解居夹。
2.回答策略
本題可以從以下四個角度進(jìn)行闡述:
1)明確問題是什么?(哪個指標(biāo)出了問題)
2)問題有多大本冲?(預(yù)期影響面估算)
3)分析的目的是什么准脂?(重大因素排查→問題精確定位→止損)
4)分析的方式是什么?(從全局到細(xì)分檬洞,從常見到非常見狸膏,從嚴(yán)重到相對影響較小,逐層排查數(shù)據(jù)添怔,并借助各種手段逐漸定位問題)
3.背景知識
答題前湾戳,先了解下面三個與搜索相關(guān)的問題。
(1)檢索量是什么广料?一般情況下每發(fā)起一次檢索請求記為一次檢索砾脑,當(dāng)同一用戶發(fā)起多次檢索時記為多個檢索量,而當(dāng)同一用戶在短時間內(nèi)檢索同一搜索詞時艾杏,不重復(fù)累計(jì)韧衣。
(2)下降5%是什么概念?以Google 2013年給出的舊聞來看购桑,當(dāng)時Google月檢索量過1000億次畅铭,折算日均33億次,以2013~2015年50%以上的增幅來看勃蜘,現(xiàn)在Google保守估計(jì)日均檢索量為50億次硕噩。由于中文檢索市場的強(qiáng)大,百度達(dá)到這個體量也并非難事元旬,那么下降5%意味著損失了過億次檢索量榴徐,天然的單一突發(fā)事件(如娛樂新聞等)幾乎不可能造成這么大的檢索量流失守问。
(3)檢索量下降這個事情要怎么看待?無論是驟降還是平緩下降坑资,5%的非預(yù)期性下降都是極為敏感的耗帕,所以需要第一時間做出反應(yīng),觀察期不可能拖太久袱贮,所以需要迅速完成“重大因素排查→問題精確定位→止損”的步驟仿便。
第一步:數(shù)據(jù)異常分析的基礎(chǔ)數(shù)據(jù)層面要點(diǎn)有哪些?
1)全局指標(biāo)分析攒巍。全局指標(biāo)包含但不限于一段合理的時間段內(nèi)的檢索量嗽仪、獨(dú)立用戶數(shù)、總CTR柒莉、首次點(diǎn)擊時間闻坚、翻頁率等。以上全局指標(biāo)可用于排查全局性問題兢孝,比如節(jié)日窿凤、重大事件效應(yīng),另外可以發(fā)現(xiàn)用戶行為異常以進(jìn)一步縮小問題范圍跨蟹。
2)分渠道數(shù)據(jù)分析雳殊。主要統(tǒng)計(jì)多個維度不同渠道的指標(biāo),渠道可以按引流方式窗轩、地域夯秃、瀏覽器、操作系統(tǒng)痢艺、運(yùn)營商等分類仓洼。此步驟主要用于觀察渠道數(shù)據(jù)是否有異常,常车淌妫可以定位到如瀏覽器切換默認(rèn)搜索引擎衬潦、地方運(yùn)營商劫持之類的問題。
3)用戶行為數(shù)據(jù)分析植酥。在1)和2)的基礎(chǔ)上镀岛,分析用戶不同時間段、不同群體友驮、不同需求類型下的數(shù)據(jù)情況漂羊,另外在1)的基礎(chǔ)上,更細(xì)致地分析則需要抽取隨機(jī)(檢索詞)卸留,通過用戶session(用戶為了得到某個信息而在一段時間內(nèi)連續(xù)搜索的行為)人工排查是否出現(xiàn)行為異常走越。此步驟主要為排查是否有事件導(dǎo)致用戶行為異常,例如開學(xué)了耻瑟,學(xué)生們都乖乖回去上課了旨指,可能導(dǎo)致娛樂類搜索量下降赏酥。
4)搜索結(jié)果數(shù)據(jù)分析。針對搜索各類型結(jié)果做數(shù)據(jù)分析谆构,分結(jié)果類型統(tǒng)計(jì)影響面裸扶、點(diǎn)擊率、結(jié)尾點(diǎn)擊率等數(shù)據(jù)搬素。此步驟主要為排查是否出現(xiàn)結(jié)果異常呵晨,尤其是排查是否線上出現(xiàn)事故。
以上數(shù)據(jù)需要在定位到原因后嚴(yán)格計(jì)算原因造成的檢索量損失是否真的吻合實(shí)際數(shù)據(jù)熬尺,比如假設(shè)認(rèn)為是某節(jié)日引起的摸屠,則必須拉取同比數(shù)據(jù)對比同樣該節(jié)日的情況下下降數(shù)據(jù)是否接近,如果仍有較大偏差則不能掉以輕心粱哼,需要繼續(xù)排查直到數(shù)據(jù)最終符合預(yù)期為止季二。
第二步:除了數(shù)據(jù)之外,還有哪些手段配合定位原因揭措?
1)輿情監(jiān)控戒傻。輿情監(jiān)控包括但不限于從內(nèi)部反饋渠道、微博蜂筹、論壇、朋友圈等方式收集用戶對百度搜索的反饋芦倒,一般來說艺挪,過億的檢索量影響是極有可能在輿情層面發(fā)現(xiàn)問題的。
2)其他產(chǎn)品線監(jiān)控兵扬。除了第一步4)中提到的基本數(shù)據(jù)之外麻裳,實(shí)際上其他產(chǎn)品線監(jiān)控?cái)?shù)據(jù)也是可以協(xié)助排查問題的,例如行為異常器钟,其他類似貼吧津坑、視頻之類的產(chǎn)品線可以提供佐證數(shù)據(jù)。
3.詳細(xì)解答
為了分析百度檢索量下降5%的原因傲霸,可以按照以下步驟進(jìn)行分析疆瑰。
(1)排查全局指標(biāo),排查以下因素
1)同比數(shù)據(jù)是否有同級別下降昙啄?排查是否周期性影響穆役,如節(jié)日、重大賽事影響等梳凛。
2)環(huán)比數(shù)據(jù)特征耿币?平穩(wěn)下降還是驟跌?排查突發(fā)性事件還是累積性事件韧拒。
3)排查CTR淹接、首點(diǎn)時間十性、翻頁率等,確認(rèn)是否有全局性影響因素導(dǎo)致用戶數(shù)據(jù)異常塑悼。
(2)排查分渠道數(shù)據(jù)劲适,排查以下因素
1)是否出現(xiàn)個別地區(qū)大幅下跌?
2)是否出現(xiàn)個別運(yùn)營商大幅下跌拢肆?
3)是否出現(xiàn)個別UA大幅下跌减响?……(其他可能性不贅述)
(3)排查用戶行為變化,排查以下因素
1)是否某群體使用百度的量減泄帧支示?
2)是否某類需求在百度搜索減少?
3)是否某些場景下使用百度的量減斜刹拧颂鸿?……(其他可能性不贅述)
(4)排查搜索結(jié)果變化,挨個兒追查產(chǎn)品線上線攒庵、下線情況嘴纺,主要排查是否出現(xiàn)事故
(5)同時結(jié)合輿情、同類/相關(guān)產(chǎn)品線浓冒,進(jìn)行協(xié)助分析排查完成后栽渴,定位到某個具體原因,然后根據(jù)具體原因來考慮止損方案稳懒。
------------筆記來源:產(chǎn)品經(jīng)理面試攻略