近幾年來崩侠,在廣告領(lǐng)域里大數(shù)據(jù)及用戶畫像技術(shù)已經(jīng)變成“常規(guī)武器”费薄,關(guān)于大數(shù)據(jù)價(jià)值的思考也開始向?qū)嵱没较蜓由臁H绻阕龅募夹g(shù)恰好有合適的業(yè)務(wù)指標(biāo)進(jìn)行評價(jià)部宿,那么恭喜你,你自然的有了評價(jià)自己工作效果的手段瓢湃,如果你恰好在“專注”的做數(shù)據(jù)供給各個業(yè)務(wù)部門或其它第三方公司使用那很“不幸”理张,你面臨最大的問題和困惑就是:如何證明你的產(chǎn)出是優(yōu)秀的對業(yè)務(wù)有提升的?因?yàn)閮H僅證明你做的是對的是不足以打動數(shù)據(jù)使用者的绵患。
“做對”就是件不容易的事情
很多人覺得目前大數(shù)據(jù)平臺技術(shù)和機(jī)器學(xué)習(xí)開源包使得做對是件很容易完成的事情雾叭,無非就是工程化的過程而已,其實(shí)事情往往不那么簡單落蝙。
從上述的數(shù)據(jù)管理平臺的基本架構(gòu)可以看出织狐,從數(shù)據(jù)收集->數(shù)據(jù)處理->數(shù)據(jù)服務(wù)是一個流程比較長的過程,期間還伴生著很多要這個流程正常運(yùn)作的基礎(chǔ)類目及運(yùn)營監(jiān)控筏勒,每個地方略有疏忽都會影響到數(shù)據(jù)的對外服務(wù)移迫。而往往很多時(shí)候這些東西因?yàn)闆]有產(chǎn)出而被“忽略”,因?yàn)榇蠹铱梢院堋罢_”的說管行,如果沒有好的產(chǎn)出厨埋,這些東西都是沒有價(jià)值的,很“神奇”的是對于這種觀點(diǎn)即便覺得有那么點(diǎn)兒不對可是總體上說的好像也沒有錯捐顷。其實(shí)做數(shù)據(jù)是件很“嚴(yán)謹(jǐn)(苦逼)”的事情荡陷,上述的每個地方做的不好怎么可能有好的產(chǎn)出呢?
"做好"是件更不容易的事情
如何評價(jià)一個數(shù)據(jù)管理平臺的產(chǎn)出是好還是壞本身就是個難題迅涮,往往現(xiàn)在的數(shù)據(jù)平臺在對外交流的時(shí)候說的都是自己的數(shù)據(jù)源如何如何的覆蓋高數(shù)據(jù)準(zhǔn)废赞,很少會提自己的技術(shù)多好多先進(jìn),為什么呢叮姑?因?yàn)榍罢弑容^好理解唉地,后者很難說清楚。也有些會說自己做的對戏溺,但是不保證“好用”渣蜗,因?yàn)楦髯缘臉I(yè)務(wù)的差異。
可是如果你是個弱勢的第三方或者公司里邊的一個部門旷祸,如果不說清你做得“好”耕拷,如何評價(jià)你的價(jià)值呢?所以還是要建立一些指標(biāo)來對產(chǎn)出進(jìn)行評價(jià)托享。
經(jīng)過多年的探索骚烧,業(yè)界漸漸形成一套不太完善的評估體系浸赫,該體系大體可以分成兩個部分:離線評估與在線評估。每個階段有些自己的指標(biāo):
離線評估
步驟1:用戶重合度
步驟2:標(biāo)簽的準(zhǔn)確率(有監(jiān)督和基于規(guī)則)
半手工的方式進(jìn)行赃绊,基于監(jiān)督數(shù)據(jù)或規(guī)則與用戶行為分析判斷標(biāo)簽的準(zhǔn)確性既峡。
(結(jié)合規(guī)則的使用率和日志覆蓋度及人群標(biāo)簽的分布)
步驟3:標(biāo)簽的覆蓋度
統(tǒng)計(jì)標(biāo)簽及各個子類的人群覆蓋度,流量覆蓋度碧查。
在線評估
根據(jù)對線上指標(biāo)的影響分析运敢,對數(shù)據(jù)進(jìn)行評估。
其實(shí)離線評估或許還相對客觀可衡量忠售,在線評估就相對比較難传惠。因?yàn)閺臄?shù)據(jù)多業(yè)務(wù)指標(biāo)可能還隔著很遠(yuǎn)的“路程”,影響的因素也千變?nèi)f化稻扬,但從概率上來分析這種評估方式還是可以被各方接受的卦方。
總結(jié)
做數(shù)據(jù)價(jià)值的評估是件難做的事情,可是也不是無規(guī)律可循的泰佳,認(rèn)認(rèn)真真把每一個步驟做好才能得到期待的結(jié)果(雖然這個事情很難)盼砍。做任何事情的第一個步驟就應(yīng)該是制定評價(jià)標(biāo)準(zhǔn),這樣做事情才能確定方向逝她〗阶“神化”和“工程化”數(shù)據(jù)平臺技術(shù)都是片面的,大數(shù)據(jù)正在照進(jìn)現(xiàn)實(shí)汽绢,扎扎實(shí)實(shí)的做好每個步驟吗跋,確確實(shí)實(shí)的支撐業(yè)務(wù)才是正道。