35. 舉一個(gè)具體的例子原押,在工作中分析了什么問(wèn)題帘饶,對(duì)公司有哪些影響和風(fēng)險(xiǎn)瓣铣,你是怎么給出方案去改善去落地的干签?(京東)
參考答案:
(項(xiàng)目背景)在xx實(shí)習(xí)的時(shí)候术辐,我們?nèi)可暇€了一個(gè)短視頻流的功能砚尽,但是全量上線后的數(shù)據(jù)表現(xiàn)沒(méi)有達(dá)到預(yù)期,所以我們做了關(guān)于這個(gè)短視頻流稿件的分析辉词。
(分析過(guò)程)我們分別從近一周被消費(fèi)的短視頻情況必孤、高粉博主發(fā)布的視頻消費(fèi)情況以及消費(fèi)情況好的視頻的詳情分析。
(分析結(jié)論)結(jié)果發(fā)現(xiàn)雖然我們有好的視頻但是好的視頻并沒(méi)有得到好的消費(fèi)瑞躺。
(策略落地)所以我們?nèi)ヅc運(yùn)營(yíng)團(tuán)隊(duì)溝通分析什么是符合我們app特色的視頻敷搪,并與算法團(tuán)隊(duì)溝通推薦策略。
(落地影響)在我們推進(jìn)后一周幢哨,xx數(shù)據(jù)和xx數(shù)據(jù)得到了顯著的提高赡勘。
36. 你現(xiàn)在獨(dú)立做分析報(bào)告嗎?多久做一次捞镰?(京東)
參考答案:
之前有嘗試過(guò)做xx項(xiàng)目的分析報(bào)告闸与,我是從xxx方面進(jìn)行分析,后和我的mentor討論發(fā)現(xiàn)還可以從xxx方面進(jìn)行分析岸售,隨后我們得出了xxx結(jié)論几迄,想出來(lái)xx策略。大約一個(gè)月兩次的樣子冰评,沒(méi)有固定的時(shí)間映胁,是業(yè)務(wù)出現(xiàn)問(wèn)題或者我們?cè)谌粘7治鲋邪l(fā)現(xiàn)問(wèn)題后才回去做分析報(bào)告。
答案解析:
不止是回答有分析報(bào)告甲雅,最好介紹之前準(zhǔn)備的分析項(xiàng)目報(bào)告解孙,引導(dǎo)面試官接下來(lái)的問(wèn)題。
46. 你剛才提到了版本你會(huì)用什么方法分析抛人。(新版本上線分析)(字節(jié)跳動(dòng))
參考答案:
我主要從以下幾個(gè)方面寫的分析報(bào)告:
1.基于什么樣的背景(在什么樣背景下版本更新了)弛姜。
2.為了達(dá)成怎樣的目的(版本更新針對(duì)什么問(wèn)題,針對(duì)哪些人群)妖枚。
3.做了怎樣的功能(新功能/改動(dòng)功能有哪些)廷臼。
4.監(jiān)控了哪些指標(biāo)項(xiàng)。
5.各指標(biāo)得到的結(jié)論。
6.總結(jié)這次版本更新的表現(xiàn)荠商。
25.愛(ài)奇藝想要提高付費(fèi)會(huì)員數(shù)寂恬,應(yīng)從哪幾個(gè)方面分析。(拼多多)
參考答案
內(nèi)部和外部進(jìn)行分析莱没。
內(nèi)部:從未付費(fèi)用戶初肉,持續(xù)付費(fèi)用戶,流失付費(fèi)用戶饰躲。分別分析這些用戶的付費(fèi)率情況牙咏,以及如何提高對(duì)應(yīng)用戶的付費(fèi)意愿。
外部:競(jìng)品用戶嘹裂。分析競(jìng)品的付費(fèi)用戶情況妄壶,可以從外部購(gòu)買數(shù)據(jù)或數(shù)據(jù)爬蟲等方法獲取,分析這些用戶能否轉(zhuǎn)化為愛(ài)奇藝的付費(fèi)用戶寄狼。
26.給一張流量表盯拱,怎么識(shí)別不同渠道的變化?(拼多多)
參考答案
取數(shù)的時(shí)候?qū)roupby不同的渠道進(jìn)行聚合例嘱。變化的話看不同渠道的影響系數(shù)=(該渠道變化前指標(biāo)-該渠道變化后指標(biāo))/總的變化前指標(biāo)狡逢,就可以量化比較不同渠道變化帶來(lái)的影響。
12.選擇AB實(shí)驗(yàn)的樣本的時(shí)候拼卵,應(yīng)該注意什么(滴滴)
參考答案
選擇AB實(shí)驗(yàn)的樣本的時(shí)候奢浑,我們最要考慮的是樣本量的選擇,影響樣本量選擇通常有4個(gè)因素:顯著性水平(α)腋腮、標(biāo)準(zhǔn)差(1 – β)雀彼、統(tǒng)計(jì)功效(μA-μB)、均值差異(σ)
● 顯著性水平:顯著性水平越低即寡,對(duì)AB實(shí)驗(yàn)結(jié)果的要求也就越高徊哑,越需要更大的樣本量來(lái)確保精度
● 統(tǒng)計(jì)功效:統(tǒng)計(jì)功效意味著避免犯二類錯(cuò)誤的概率,統(tǒng)計(jì)功效越大聪富,需要的樣本量也越大
● 均值差異:如果真實(shí)值和測(cè)試值的均值差別巨大莺丑,也不太需要多少樣本,就能達(dá)到統(tǒng)計(jì)顯著
● 標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差越小墩蔓,代表兩組差異的趨勢(shì)越穩(wěn)定梢莽。越容易觀測(cè)到顯著的統(tǒng)計(jì)結(jié)果
將這四個(gè)值帶入樣本計(jì)算量公式就能得到需要的樣本量,通常有網(wǎng)站專門計(jì)算AB實(shí)驗(yàn)的樣本量奸披,所以只要搞清楚上面四個(gè)值昏名,就能計(jì)算出你需要的樣本量
答案解析
這道題主要是對(duì)AB實(shí)驗(yàn)樣本量選擇的考量,因?yàn)樵谶x擇樣本的時(shí)候最關(guān)鍵也是最重要的一步就是對(duì)樣本量的選擇阵面,對(duì)于有經(jīng)驗(yàn)的人來(lái)說(shuō)可以按照經(jīng)驗(yàn)判斷樣本量級(jí)轻局,但是對(duì)于更多人來(lái)說(shuō)還是需要有更多輔助的判斷洪鸭。通常來(lái)說(shuō)樣本量太少,實(shí)驗(yàn)結(jié)果不大可信仑扑,但是樣本量太多览爵,也不是更好,一個(gè)最直接的原因就是樣本量越大夫壁,影響的用戶越多拾枣,就有可能影響到用戶對(duì)產(chǎn)品的體驗(yàn)沃疮。
13.如何設(shè)計(jì)ABtest確定此功能上線收益(正負(fù)收益平衡點(diǎn))(快手)
參考答案
1.?A方案和B方案盒让,哪個(gè)方案的結(jié)果更好?
首先的話司蔬,需要做需要運(yùn)用假設(shè)檢驗(yàn)邑茄,分為兩種不同的檢驗(yàn)方式,對(duì)于留存率俊啼、滲透率等漏斗類肺缕,采用卡方檢驗(yàn)。對(duì)于人均時(shí)長(zhǎng)類等均值類指標(biāo)授帕,采用t檢驗(yàn)同木。
2.?通過(guò)假設(shè)檢驗(yàn)后,如果結(jié)論置信跛十,我們就能夠得到A方案和B方案哪個(gè)指標(biāo)更好(有顯著性差異)彤路, 對(duì)于不置信的結(jié)論,盡管A方案和B方案 的指標(biāo)可能略有差異芥映,但可能是數(shù)據(jù)正常波動(dòng)產(chǎn)生洲尊。哪個(gè) ROI 更高?
一般有活動(dòng)相比無(wú)活動(dòng)奈偏,留存坞嘀、人均時(shí)長(zhǎng)等各項(xiàng)指標(biāo)均會(huì)顯著。
對(duì)于ROI 的計(jì)算惊来,成本方面丽涩,每個(gè)實(shí)驗(yàn)組成本可以直接計(jì)算,對(duì)于收益方面裁蚁,就要和對(duì)照組相比較内狸,假定以總?cè)栈钴S天(即 DAU 按日累計(jì)求和)作為收益指標(biāo),需要假設(shè)不做運(yùn)營(yíng)活動(dòng)厘擂,DAU 會(huì)是多少昆淡,可以通過(guò)對(duì)照組計(jì)算,即:
● 實(shí)驗(yàn)組假設(shè)不做活動(dòng)日活躍天 = 對(duì)照組日活躍天 * (實(shí)驗(yàn)組流量 / 對(duì)照組流量)
● 實(shí)驗(yàn)組收益 = 實(shí)驗(yàn)組日活躍天 - 實(shí)驗(yàn)組假設(shè)不做活動(dòng)日活躍天
這樣就可以量化出每個(gè)方案的ROI刽严。
答案解析
這道題主要是考察ABtest上線后昂灵,從哪些維度來(lái)確認(rèn)哪個(gè)方案更好避凝,或者說(shuō)新的方案是否比舊的方案更加適合上線
14.根據(jù)上面說(shuō)的改進(jìn)點(diǎn)做AB測(cè)試,從什么角度來(lái)分析眨补?(小紅書)
參考答案
以下是ABtest常用的不同的分析指標(biāo)管削,可以從這些指標(biāo)來(lái)分析ABtest(以電商為例)
● 點(diǎn)擊率
● 留存率
● 復(fù)購(gòu)率
● 轉(zhuǎn)化率
● 跳出率
● 平均保留率
● 平均使用時(shí)長(zhǎng)(應(yīng)用,手機(jī)網(wǎng)站撑螺、網(wǎng)頁(yè)或游戲場(chǎng)景上的時(shí)間)
● 客戶滿意率
● 平均用戶收入
● 平均訂單金額
通過(guò)對(duì)比以上指標(biāo)在ABtest中的效果含思,就可以分析不同方案的優(yōu)缺點(diǎn)
答案解析
這題考慮的是ABtest的分析的角度,分析的角度可以通過(guò)不同的指標(biāo)來(lái)分析甘晤,不同的指標(biāo)體現(xiàn)了不同角度的意義
15.怎么驗(yàn)證你的改進(jìn)辦法有沒(méi)有效(字節(jié)跳動(dòng))
參考答案
常見的方法就是去關(guān)注一下指定的指標(biāo)含潘,因?yàn)榇蠖鄶?shù)ABtest在確認(rèn)做之前都會(huì)指定一些關(guān)鍵性指標(biāo),比如线婚,點(diǎn)擊率遏弱、留存率、復(fù)購(gòu)率和轉(zhuǎn)化率等等塞弊,所以在上線后就可以直接關(guān)注這些指標(biāo)是否有提高漱逸,如果有就說(shuō)明辦法有效,如果沒(méi)有提高就需要看看辦法哪里出了問(wèn)題游沿。其次也能夠通過(guò)計(jì)算ROI來(lái)比對(duì)不同的方案饰抒。
對(duì)于ROI 的計(jì)算,成本方面诀黍,每個(gè)實(shí)驗(yàn)組成本可以直接計(jì)算袋坑,對(duì)于收益方面,就要和對(duì)照組相比較蔗草,假定以總?cè)栈钴S天(即 DAU 按日累計(jì)求和)作為收益指標(biāo)咒彤,需要假設(shè)不做運(yùn)營(yíng)活動(dòng),DAU 會(huì)是多少咒精,可以通過(guò)對(duì)照組計(jì)算镶柱,即:
● 實(shí)驗(yàn)組假設(shè)不做活動(dòng)日活躍天 = 對(duì)照組日活躍天 * (實(shí)驗(yàn)組流量 / 對(duì)照組流量)
● 實(shí)驗(yàn)組收益 = 實(shí)驗(yàn)組日活躍天 - 實(shí)驗(yàn)組假設(shè)不做活動(dòng)日活躍天
這樣就可以量化出每個(gè)方案的ROI。
答案解析
這題主要還是考察ABtest上線后的效果模叙,最簡(jiǎn)單的是一些指標(biāo)可以看出是否有效果歇拆,也能看一個(gè)投資回報(bào)率ROI來(lái)看是否有效果
16.A/B test場(chǎng)景問(wèn)題,第一類錯(cuò)誤范咨,第二類錯(cuò)誤具體是什么故觅,你覺(jué)得哪個(gè)更嚴(yán)重等延伸開的問(wèn)題(阿里)
參考答案
第一類錯(cuò)誤:原假設(shè)正確但是拒絕原假設(shè),棄真錯(cuò)誤渠啊。第二類錯(cuò)誤:原假設(shè)錯(cuò)誤但是接受原假設(shè)输吏,取偽錯(cuò)誤。第一類錯(cuò)誤更嚴(yán)重替蛉,由于報(bào)告了本來(lái)不存在的現(xiàn)象贯溅,則因此現(xiàn)象而衍生出的后續(xù)研究拄氯、應(yīng)用的危害將是不可估量的。
1.這份實(shí)習(xí)中主要跟的項(xiàng)目或者case它浅,自己獨(dú)立完成的(可以使行業(yè)分析译柏、可以使指標(biāo)體系的搭建等),整個(gè)框架詳細(xì)介紹(美團(tuán))
參考答案
先介紹項(xiàng)目背景:在xxx上線后姐霍,數(shù)據(jù)效果不明顯鄙麦,所以需要我們對(duì)其進(jìn)行分析,找到原因镊折。隨后介紹分析思路:我們構(gòu)建了指標(biāo)體系:主指標(biāo)為xxx胯府,用戶輔助指標(biāo)為xxx。后我們從xxx腌乡,xxx等維度進(jìn)行分析這些指標(biāo)盟劫,得到xxx的現(xiàn)象夜牡。最后說(shuō)明分析結(jié)論和對(duì)應(yīng)的解決策略与纽。如果后續(xù)有繼續(xù)觀察策略落地的情況可以繼續(xù)說(shuō)策略落地后的效果。
2.大三的實(shí)習(xí)怎么做數(shù)據(jù)的相關(guān)性分析和聚類(招聯(lián)金融)
參考答案
相關(guān)性分析:
1.?畫散點(diǎn)圖塘装,觀察兩個(gè)變量有沒(méi)有規(guī)律變化
2.?根據(jù)變量類型或者正態(tài)性檢驗(yàn)急迂,選擇合適的相關(guān)系數(shù)公式
3.?計(jì)算相關(guān)系數(shù)r,評(píng)估相關(guān)程度
4.?顯著性檢驗(yàn)蹦肴,如果P<α(一般取0.05)僚碎,表示存在顯著相關(guān)性
5.?總結(jié)分析結(jié)論,并從業(yè)務(wù)層面給出業(yè)務(wù)判斷及策略
根據(jù)上面的步驟阴幌,即可完成相關(guān)性分析勺阐,注意,在回答的時(shí)候在每一步最好結(jié)合業(yè)務(wù)相關(guān)的場(chǎng)景去解釋矛双,這樣回答起來(lái)會(huì)更有說(shuō)服力
聚類分析:
下面以kmeans為例渊抽,因?yàn)樵诿枋?a href="http://www.reibang.com/jump/super-jump/word?word=%E7%AE%97%E6%B3%95" target="_blank">算法的時(shí)候盡量講了解的算法,才不至于被考倒
(圖片來(lái)源于網(wǎng)絡(luò))
同樣的议忽,最好能結(jié)合具體案例分析kmeans算法
答案模板
兩步分析法:首先定位問(wèn)題原因,這里可以通過(guò)計(jì)算各個(gè)維度DAU的變動(dòng)系數(shù)=(該維度下異常前DAU-該維度下異常后DAU)/該維度下異常前DAU栈幸,選出變動(dòng)系數(shù)較大的前幾個(gè)維度愤估,對(duì)其進(jìn)行分析。
然后可以從內(nèi)部和外部進(jìn)行分析速址,內(nèi)部從產(chǎn)品(版本更新)玩焰、技術(shù)(卡頓,閃退)芍锚、運(yùn)營(yíng)(運(yùn)營(yíng)活動(dòng))分別溝通看是否能找到原因昔园。外部從政策和競(jìng)品的角度找原因荔棉。
答案解析
定位問(wèn)題+找到原因
4.相關(guān)性分析(快手)
參考答案
有四種相關(guān)性分析的方法:
1.圖標(biāo)相關(guān)分析(折線圖及散點(diǎn)圖)
2.計(jì)算協(xié)方差及協(xié)方差矩陣
3.計(jì)算相關(guān)系數(shù)
4.建立一元回歸或多元回歸模型,做回歸分析蒿赢,計(jì)算r方润樱。
5.微信日收入下降分析(快手)
參考答案
1.?數(shù)據(jù)驗(yàn)證,驗(yàn)證日收入的數(shù)據(jù)口徑是否一致羡棵,確認(rèn)是否是真的日收入下降
2.?指標(biāo)拆解壹若,可以參考如下指標(biāo)拆解
3.?從上述指標(biāo)來(lái)看是否出問(wèn)題,如果某個(gè)指標(biāo)出問(wèn)題皂冰,可能就是因?yàn)檫@個(gè)指標(biāo)的下降導(dǎo)致收入下降店展。比如,從每一個(gè)數(shù)據(jù)指標(biāo)去看后秃流,發(fā)現(xiàn)是渠道A的付費(fèi)人數(shù)下降赂蕴,就可以找到負(fù)責(zé)這個(gè)渠道的同事來(lái)了解這個(gè)渠道是否真的付費(fèi)人數(shù)減少,如果是真的減少的話舶胀,就找到了收入下降的原因概说,就可以跟進(jìn)這個(gè)渠道去解決付費(fèi)人數(shù)下降的問(wèn)題。