數(shù)據(jù)價(jià)值評估的思考

近幾年來崩侠,在廣告領(lǐng)域里大數(shù)據(jù)及用戶畫像技術(shù)已經(jīng)變成“常規(guī)武器”费薄,關(guān)于大數(shù)據(jù)價(jià)值的思考也開始向?qū)嵱没较蜓由臁H绻阕龅募夹g(shù)恰好有合適的業(yè)務(wù)指標(biāo)進(jìn)行評價(jià)部宿,那么恭喜你,你自然的有了評價(jià)自己工作效果的手段瓢湃,如果你恰好在“專注”的做數(shù)據(jù)供給各個業(yè)務(wù)部門或其它第三方公司使用那很“不幸”理张,你面臨最大的問題和困惑就是:如何證明你的產(chǎn)出是優(yōu)秀的對業(yè)務(wù)有提升的?因?yàn)閮H僅證明你做的是對的是不足以打動數(shù)據(jù)使用者的绵患。

“做對”就是件不容易的事情

很多人覺得目前大數(shù)據(jù)平臺技術(shù)和機(jī)器學(xué)習(xí)開源包使得做對是件很容易完成的事情雾叭,無非就是工程化的過程而已,其實(shí)事情往往不那么簡單落蝙。

數(shù)據(jù)管理平臺基本架構(gòu)

從上述的數(shù)據(jù)管理平臺的基本架構(gòu)可以看出织狐,從數(shù)據(jù)收集->數(shù)據(jù)處理->數(shù)據(jù)服務(wù)是一個流程比較長的過程,期間還伴生著很多要這個流程正常運(yùn)作的基礎(chǔ)類目及運(yùn)營監(jiān)控筏勒,每個地方略有疏忽都會影響到數(shù)據(jù)的對外服務(wù)移迫。而往往很多時(shí)候這些東西因?yàn)闆]有產(chǎn)出而被“忽略”,因?yàn)榇蠹铱梢院堋罢_”的說管行,如果沒有好的產(chǎn)出厨埋,這些東西都是沒有價(jià)值的,很“神奇”的是對于這種觀點(diǎn)即便覺得有那么點(diǎn)兒不對可是總體上說的好像也沒有錯捐顷。其實(shí)做數(shù)據(jù)是件很“嚴(yán)謹(jǐn)(苦逼)”的事情荡陷,上述的每個地方做的不好怎么可能有好的產(chǎn)出呢?

"做好"是件更不容易的事情

如何評價(jià)一個數(shù)據(jù)管理平臺的產(chǎn)出是好還是壞本身就是個難題迅涮,往往現(xiàn)在的數(shù)據(jù)平臺在對外交流的時(shí)候說的都是自己的數(shù)據(jù)源如何如何的覆蓋高數(shù)據(jù)準(zhǔn)废赞,很少會提自己的技術(shù)多好多先進(jìn),為什么呢叮姑?因?yàn)榍罢弑容^好理解唉地,后者很難說清楚。也有些會說自己做的對戏溺,但是不保證“好用”渣蜗,因?yàn)楦髯缘臉I(yè)務(wù)的差異。
可是如果你是個弱勢的第三方或者公司里邊的一個部門旷祸,如果不說清你做得“好”耕拷,如何評價(jià)你的價(jià)值呢?所以還是要建立一些指標(biāo)來對產(chǎn)出進(jìn)行評價(jià)托享。
經(jīng)過多年的探索骚烧,業(yè)界漸漸形成一套不太完善的評估體系浸赫,該體系大體可以分成兩個部分:離線評估與在線評估。每個階段有些自己的指標(biāo):

離線評估

步驟1:用戶重合度
步驟2:標(biāo)簽的準(zhǔn)確率(有監(jiān)督和基于規(guī)則)
半手工的方式進(jìn)行赃绊,基于監(jiān)督數(shù)據(jù)或規(guī)則與用戶行為分析判斷標(biāo)簽的準(zhǔn)確性既峡。
(結(jié)合規(guī)則的使用率和日志覆蓋度及人群標(biāo)簽的分布)
步驟3:標(biāo)簽的覆蓋度
統(tǒng)計(jì)標(biāo)簽及各個子類的人群覆蓋度,流量覆蓋度碧查。

在線評估

在線評估

根據(jù)對線上指標(biāo)的影響分析运敢,對數(shù)據(jù)進(jìn)行評估。
其實(shí)離線評估或許還相對客觀可衡量忠售,在線評估就相對比較難传惠。因?yàn)閺臄?shù)據(jù)多業(yè)務(wù)指標(biāo)可能還隔著很遠(yuǎn)的“路程”,影響的因素也千變?nèi)f化稻扬,但從概率上來分析這種評估方式還是可以被各方接受的卦方。

總結(jié)

做數(shù)據(jù)價(jià)值的評估是件難做的事情,可是也不是無規(guī)律可循的泰佳,認(rèn)認(rèn)真真把每一個步驟做好才能得到期待的結(jié)果(雖然這個事情很難)盼砍。做任何事情的第一個步驟就應(yīng)該是制定評價(jià)標(biāo)準(zhǔn),這樣做事情才能確定方向逝她〗阶“神化”和“工程化”數(shù)據(jù)平臺技術(shù)都是片面的,大數(shù)據(jù)正在照進(jìn)現(xiàn)實(shí)汽绢,扎扎實(shí)實(shí)的做好每個步驟吗跋,確確實(shí)實(shí)的支撐業(yè)務(wù)才是正道。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末宁昭,一起剝皮案震驚了整個濱河市跌宛,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌积仗,老刑警劉巖疆拘,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異寂曹,居然都是意外死亡哎迄,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進(jìn)店門隆圆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來漱挚,“玉大人,你說我怎么就攤上這事渺氧≈祭裕” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵侣背,是天一觀的道長白华。 經(jīng)常有香客問我慨默,道長,這世上最難降的妖魔是什么弧腥? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任厦取,我火速辦了婚禮,結(jié)果婚禮上管搪,老公的妹妹穿的比我還像新娘虾攻。我一直安慰自己,他們只是感情好更鲁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布台谢。 她就那樣靜靜地躺著,像睡著了一般岁经。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蛇券,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天缀壤,我揣著相機(jī)與錄音,去河邊找鬼纠亚。 笑死塘慕,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蒂胞。 我是一名探鬼主播图呢,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼骗随!你這毒婦竟也來了蛤织?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤鸿染,失蹤者是張志新(化名)和其女友劉穎指蚜,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體涨椒,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡摊鸡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蚕冬。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片免猾。...
    茶點(diǎn)故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖囤热,靈堂內(nèi)的尸體忽然破棺而出猎提,到底是詐尸還是另有隱情,我是刑警寧澤赢乓,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布忧侧,位于F島的核電站石窑,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蚓炬。R本人自食惡果不足惜松逊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肯夏。 院中可真熱鬧经宏,春花似錦、人聲如沸驯击。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽徊都。三九已至沪斟,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間暇矫,已是汗流浹背主之。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留李根,地道東北人槽奕。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像房轿,于是被迫代替她去往敵國和親粤攒。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內(nèi)容