什么是大數(shù)據(jù)认罩?
這個問題要回答起來就和O2O一樣漫無邊際箱蝠。
或許是因為互聯(lián)網(wǎng)發(fā)展到現(xiàn)在,信息技術(shù)已經(jīng)不僅僅是社會的「外掛」(逍遙子語)那么簡單,而是深入到了人類社會和生活的方方面面宦搬,要想回答這個問題牙瓢,涉及的不僅僅只有開發(fā)一個工具、或者打造一個平臺间校,背后還有用戶需求矾克、產(chǎn)業(yè)鏈、商業(yè)模式等等一大堆需要同時解決的麻煩憔足。
不同的人胁附,因為對于技術(shù)理解的不同,因為所處環(huán)境的不同滓彰,對于大數(shù)據(jù)都會有自身不同維度的解釋控妻。譬如對于最初提出大數(shù)據(jù)4V理論的IBM而言,4V或許就是那個年代定義大數(shù)據(jù)最合理的解釋揭绑,但是放到今天的技術(shù)環(huán)境和理解程度弓候,如果還在說大數(shù)據(jù)4V,那基本就可以說是落伍了洗做。
放到媒體層面弓叛,對于概念的解析就更加碎片化,公說公有理诚纸,婆說婆有理撰筷,甚至出現(xiàn)真假大數(shù)據(jù)的辨析。不過相比較O2O畦徘,大數(shù)據(jù)因為需要更多的技術(shù)理解能力毕籽,所以相對媒體報道的時候都很小心,沒太出現(xiàn)睜眼說瞎話的情況井辆。
大數(shù)據(jù)的模糊性关筒,正如Steve Lohr在New York Times上的文章指出:「大數(shù)據(jù)這個詞現(xiàn)在時常被人們隨意使用,然而其語義十分模糊杯缺。簡單地說蒸播,這個包羅萬象的詞條一般有三層含義:首先,它指代一攬子的技術(shù)萍肆;其次袍榆,它有可能引發(fā)一場度量數(shù)據(jù)規(guī)模的革命;最后塘揣,它為人們未來將會包雀、甚或是應(yīng)該如何制定政策提供了一個新視角、一種新理念亲铡〔判矗」
盡管因為工作需求葡兑,我也一直在嘗試跟別人解釋大數(shù)據(jù),但我也不認(rèn)為這些解釋是一成不變的赞草。核心在于讹堤,作為一個趨勢概念,對于「大數(shù)據(jù)」本身的理解房资,是跟著業(yè)務(wù)需求在生長的蜕劝,并不存在學(xué)術(shù)意義上可以被引用被討論的定義。換句話說轰异,「大數(shù)據(jù)」這個概念本身岖沛,同樣在經(jīng)歷小步快跑的修正,每個人都可以也應(yīng)該從自身業(yè)務(wù)出發(fā)搭独,去歸納總結(jié)和吸收他人的解釋婴削,來形成最適合自己的定義。
從業(yè)務(wù)出發(fā)形成定義這件事情牙肝,說起來容易唉俗,做起來難。
特別是自己最近在實際參與數(shù)據(jù)業(yè)務(wù)之后配椭,過去這段時間「大數(shù)據(jù)」自我定義的修正次數(shù)虫溜,恐怕比過去三年里的總和來得都要多。
所以股缸,一年前聽我叨比叨大數(shù)據(jù)的同學(xué)們衡楞,今天你再聽到我講大數(shù)據(jù)的時候,你一定會聽到更多不一樣的東西敦姻。整個修正的過程其實也很有意思瘾境,有時間再來形成一篇文章吧。
這里就先推薦一個朋友寫的東西镰惦,他也是我在大數(shù)據(jù)這條道路上的引路人迷守。關(guān)于什么是數(shù)據(jù)業(yè)務(wù),關(guān)于怎么定義云計算背景下不同公司業(yè)務(wù)的合作旺入,關(guān)于如何推動數(shù)據(jù)業(yè)務(wù)兑凿,文中都有比較精彩的描述。
因為他本身的理論水平也很棒茵瘾,所以他寫出來的東西也非常凝練急膀,我會嘗試在每段話之后對文中的一些用詞和語句添加我自己的理解。
「數(shù)據(jù)連接是一切數(shù)據(jù)業(yè)務(wù)的上游」
1 把今晚跟哥們一起吃飯碰撞的收獲分享出來龄捡,是近14個月學(xué)習(xí)后的收獲。數(shù)據(jù)業(yè)務(wù)要解的問題是「A用B的數(shù)據(jù)」慷暂,這里A是有業(yè)務(wù)場景上改善經(jīng)營的需求聘殖。首先A用B的數(shù)據(jù)晨雳,不是A把B的數(shù)據(jù)拷走,因為數(shù)據(jù)安全和業(yè)務(wù)隱私奸腺,除非簽訂嚴(yán)格的不對等契約這一步幾乎不可能餐禁。我看過好幾個奇葩的案例,最終走到最后大家彼此的互信越來越低突照,數(shù)據(jù)每加工一次熵增一次帮非。A用B的數(shù)據(jù),B要解決數(shù)據(jù)連接的問題讹蘑,如何保障數(shù)據(jù)連接而保障持久的高頻調(diào)用末盔?這是一個難題。大一統(tǒng)的openID我不看好座慰,B要保護好自己才能服務(wù)好A陨舱,所以需要「鐵皮盒子」機制。身份證這類ID是前大數(shù)據(jù)時代的事情版仔。還有游盲,切莫指望數(shù)據(jù)連接稱為公共服務(wù),真正的公共服務(wù)是在云端協(xié)同的物理層蛮粮。這一點益缎,我也是花了好久才撇清認(rèn)識∪幌耄「誰來提供公共品」莺奔,并沒有「這是不是公共品」重要。數(shù)據(jù)是生產(chǎn)要素又沾,對A和B而言是縱深的視角弊仪,B提供的數(shù)據(jù)連接服務(wù)則是水平視角。數(shù)據(jù)合作沒有上下游關(guān)系杖刷,只有戰(zhàn)略合作關(guān)系励饵。而數(shù)據(jù)連接是一切數(shù)據(jù)業(yè)務(wù)的上游。
現(xiàn)在業(yè)務(wù)上碰到的最大麻煩滑燃,是客戶對于「數(shù)據(jù)上云」這件事情疑慮重重——而要實現(xiàn)文中所謂「A用B的數(shù)據(jù)」業(yè)務(wù)的前提役听,是數(shù)據(jù)能夠在一個「云端協(xié)同的物理層」上打通。
目前來看表窘,大部分的傳統(tǒng)公司翘骂,CRM數(shù)據(jù)在CRM部門蜈首,ERP數(shù)據(jù)在銷售部門,營銷數(shù)據(jù)在市場部門,地方數(shù)據(jù)在各地分公司懂拾,而且,各自所使用的系統(tǒng)甚至來自于不同的軟件開發(fā)商缘滥,哪怕是在這些公司內(nèi)部,要解決這些數(shù)據(jù)的打通問題艾扮,也是需要通過自建數(shù)據(jù)中心來解決數(shù)據(jù)打通問題。那么占婉,要想讓公司和外部的平臺實現(xiàn)數(shù)據(jù)上的合作泡嘴,就必須首先實現(xiàn)「數(shù)據(jù)上云」,所有的數(shù)據(jù)在一個物理層面上流通逆济,這樣才能解決數(shù)據(jù)的可用性問題酌予。
這也是文中所說,「真正的公共服務(wù)是在云端協(xié)同的物理層」的真意奖慌。
阿里云在這次云棲大會上說:「數(shù)據(jù)是生產(chǎn)資料」抛虫、「計算是公共服務(wù)」,可以自行感受一下升薯。
不過莱褒,從另一個角度來看,原本的「死數(shù)據(jù)」通過上云成為可用的「活數(shù)據(jù)」涎劈,這或許就是DT時代的數(shù)據(jù)紅利广凸。
我們可以比照下淘寶的發(fā)展歷史。
淘寶的發(fā)展蛛枚,很長時間其實就完成了一個轉(zhuǎn)變:零售上網(wǎng)——原本線下的街邊店谅海、買手店、經(jīng)銷商蹦浦、實體店通過上網(wǎng)扭吁,把線下的店鋪搬到了線上。這個被朋友玉關(guān)稱為抓住「渠道紅利」的發(fā)展史盲镶,卻通過「上網(wǎng)」突破了零售的三重邊界:1)場所變場景侥袜,地面銷售變空中銷售,線下實體交易變成線上隨時隨地的購買溉贿,原本小范圍的實體銷售變成面向全國的銷售枫吧;2)有限貨架變無限貨架,碎片化需求不斷得到聚集和滿足宇色,這也是淘寶成為「萬物商店」的基礎(chǔ)九杂;3)導(dǎo)購和顧客的一次性交易關(guān)系變成賣家和買家的「always online」,經(jīng)營粉絲比經(jīng)營店鋪更重要宣蠕。
如果說「零售上網(wǎng)」是電子商務(wù)帶來的第一波紅利例隆,那么「數(shù)據(jù)上云」就很可能是電子商務(wù)帶來的第二波紅利。移動互聯(lián)網(wǎng)背景下抢蚀,人(CRM數(shù)據(jù))和貨(庫存數(shù)據(jù))在場景下的連接镀层,從而實現(xiàn)碎片化需求碎片化滿足,都要通過機器自動化來完成皿曲,這就可能需要打破三層邊界:1)企業(yè)或平臺內(nèi)部縱向和橫向的數(shù)據(jù)壁壘鹿响;2)企業(yè)和平臺之間的數(shù)據(jù)壁壘羡微;3)全網(wǎng)全渠道的數(shù)據(jù)壁壘,小范圍來看就是平臺和平臺之間的數(shù)據(jù)壁壘惶我。
其中,解決數(shù)據(jù)連接的「鐵皮盒子」是問題關(guān)鍵博投,這里通常會碰上三個理解誤區(qū):
1绸贡、大數(shù)據(jù)是公共服務(wù)。
計算才是公共服務(wù)毅哗,大數(shù)據(jù)不是√拢現(xiàn)在市面上所說的各種大數(shù)據(jù)服務(wù)猜想,或者把大數(shù)據(jù)稱為「公共服務(wù)」的提法虑绵,都把「數(shù)據(jù)連接」看作了「公共服務(wù)」本身尿瞭。歸謬一下,如果全中國只需要一個店鋪提供所有貨物翅睛,大致上就是這種提法的感覺了声搁。但事實上,人們是通過一個個店鋪捕发、一個個平臺來和特定的貨物產(chǎn)生連接疏旨,這些店鋪和平臺某種意義上就構(gòu)成了連接過程的「鐵皮盒子」。
2扎酷、A的數(shù)據(jù)會不會被拷走檐涝,B會不會看到A的數(shù)據(jù),等等法挨。
這個問題和上一個理解有關(guān)谁榜,「公共服務(wù)」并無法解決私有問題:第一點,「鐵皮盒子」機制本質(zhì)上解決了數(shù)據(jù)的「可用但不可見」凡纳,A的數(shù)據(jù)對B不可見窃植;第二點,也是最重要的惫企,數(shù)據(jù)可以連接和交換的前提撕瞧,是把數(shù)據(jù)視為一種資產(chǎn),而資產(chǎn)本身也要先確定產(chǎn)權(quán)狞尔,任何讓數(shù)據(jù)可見的行為丛版,都是在侵犯他人的數(shù)據(jù)產(chǎn)權(quán)。這點可以參考之前阿里發(fā)布的大數(shù)據(jù)產(chǎn)權(quán)聲明偏序。
3页畦、數(shù)據(jù)業(yè)務(wù)的前提是數(shù)據(jù)共享。
這就忘了數(shù)據(jù)是一種資產(chǎn)研儒,不是公共品豫缨,任何資產(chǎn)在使用過程中都是要付出代價的独令,數(shù)據(jù)也是一樣。資產(chǎn)的交換和使用本身存在博弈行為好芭,并不是一種共享過程燃箭。如果承認(rèn)數(shù)據(jù)共享,那么就是默認(rèn)「鐵皮盒子」機制無用舍败,而這和實際業(yè)務(wù)相悖招狸。
即使是在一個公司內(nèi)部,不同部門的數(shù)據(jù)交換也會存在交易成本邻薯,如果不是從這個角度去理解裙戏,那么就無法解釋,為什么公司內(nèi)部的數(shù)據(jù)打通都如此艱難厕诡。
場景:理解深度決定應(yīng)用深度
2 我們祈愿每個有數(shù)據(jù)的人相連累榜,是由于在解決具體業(yè)務(wù)過程中對數(shù)據(jù)的渴求×橄樱互聯(lián)網(wǎng)的成長是用戶行為數(shù)據(jù)的成長壹罚。每一個A都渴望在自己的運營場景中走向精細(xì)化,不管是拉新維舊醒第,還是優(yōu)化迭代渔嚷。B在服務(wù)A的過程中,從自己的利益出發(fā)必須要走到A的業(yè)務(wù)場景中去測算B之?dāng)?shù)據(jù)的價值稠曼,不然難以定價形病。無法定價則難以簽訂契約。B必須搭建一個讓數(shù)據(jù)可用但不透漏用戶隱私也不產(chǎn)生數(shù)據(jù)泄漏的服務(wù)霞幅。在實踐中漠吻,數(shù)據(jù)不管如何量化,只要不進入脫敏的極端情況司恳,都會有安全問題途乃。而業(yè)務(wù)策略不會,因為B必須要據(jù)此來建立計費計量的體系扔傅,來響應(yīng)業(yè)務(wù)規(guī)則因數(shù)而變耍共。由此催生了對計算平臺的需求。B要服務(wù)好A猎塞,要滿足A在業(yè)務(wù)場景中的響應(yīng)需求试读。我現(xiàn)在對每一個這樣的場景,首先問的就是:鏈路通路是否滿足業(yè)務(wù)需求荠耽,相應(yīng)而言業(yè)務(wù)規(guī)則具體如何切分钩骇?其次才是數(shù)據(jù)質(zhì)量問題。這是可行與不可行的問題,其次才是便宜和貴的問題倘屹。合約定價在產(chǎn)權(quán)界定以先银亲,A用B的成本究竟如何?這是服務(wù)科學(xué)里服務(wù)質(zhì)量研究的內(nèi)容了纽匙∥耱穑總結(jié)下,A用B的數(shù)據(jù)哄辣,需要B在數(shù)據(jù)相連之上提供數(shù)據(jù)服務(wù)请梢。所謂DP脫離了這個,天方夜譚力穗!
其中描述的具體業(yè)務(wù)鏈路,需要的時候自然會懂气嫁,這里就不冗述了当窗。這里主要聊聊業(yè)務(wù)場景。
「B在服務(wù)A的過程中寸宵,從自己的利益出發(fā)必須要走到A的業(yè)務(wù)場景中去測算B之?dāng)?shù)據(jù)的價值崖面,不然難以定價√萦埃」
換句話來說巫员,數(shù)據(jù)要從商業(yè)維度發(fā)揮價值,前提是要「滿足A在業(yè)務(wù)場景中的相應(yīng)需求」——理解業(yè)務(wù)場景甲棍,才能準(zhǔn)確地定位問題简识,「一旦我們可將問題數(shù)據(jù)化,就能改變?nèi)藗兊囊鈭D感猛,并在這些信息基礎(chǔ)上產(chǎn)生新價值」七扰。(via The Rise of Big Data,Foreign Affairs陪白,2013 5/6th)
那么颈走,我們又如何來理解業(yè)務(wù)場景?理解業(yè)務(wù)場景為何如此重要咱士?
人們面臨的現(xiàn)狀立由,是社會整體線上線下的網(wǎng)絡(luò)結(jié)構(gòu)化,以便于計算機解析序厉。數(shù)據(jù)化則被定義為一種問題的處理流程锐膜,通過數(shù)據(jù)化,人們把人和生活的方方面面轉(zhuǎn)化成數(shù)據(jù)脂矫,比如好友關(guān)系數(shù)據(jù)枣耀、交易數(shù)據(jù)、金融數(shù)據(jù)等等。
以供應(yīng)鏈舉例捞奕,生產(chǎn)數(shù)據(jù)牺堰、庫存數(shù)據(jù)、物流數(shù)據(jù)颅围、銷售數(shù)據(jù)打通伟葫,帶來的就是淘寶上出現(xiàn)的「多批次、小批量的連續(xù)生產(chǎn)補貨院促,保證產(chǎn)品全生命周期內(nèi)不斷貨筏养,同時也沒有過多庫存」(via 游五洋 《關(guān)于互聯(lián)網(wǎng)+傳統(tǒng)產(chǎn)業(yè)的9個觀點》)。其中具體的業(yè)務(wù)場景常拓,可以參考Gartner的供應(yīng)鏈報告渐溶。
這其中弄抬,每一個業(yè)務(wù)場景茎辐,彼此之間都不是割裂的狀態(tài),需要整體地了解和深入考慮每個環(huán)節(jié)在流程中的作用掂恕,從系統(tǒng)的角度來優(yōu)化局部拖陆。這其中做得最好的,就是連續(xù)7年蟬聯(lián)Gartner供應(yīng)鏈Top25的蘋果懊亡。為了提高整體效率依啰,加快價值傳導(dǎo),蘋果形成了一套自己的縱向一體化供應(yīng)體系店枣。
由于蘋果對于全流程的熟悉速警,蘋果可以在洞察歷史數(shù)據(jù)和產(chǎn)品數(shù)據(jù)的基礎(chǔ)上,基于用戶需求充分地優(yōu)化整體的系統(tǒng)流程艰争,預(yù)測可能存在的瓶頸和問題坏瞄,并且根據(jù)數(shù)據(jù)的反饋來調(diào)整供應(yīng)策略乃至商業(yè)策略。僅僅站在局部優(yōu)化的角度上看甩卓,蘋果的很多策略匪夷所思鸠匀,比如投入人力和資金幫助供應(yīng)商研發(fā)新技術(shù),給供應(yīng)商買數(shù)控機床逾柿,甚至直接收購指紋識別公司等等缀棍,但是,站在系統(tǒng)的角度机错,所有這些都保證了到達(dá)消費者手中的蘋果產(chǎn)品的最終體驗爬范,正如iPhone6s的廣告詞,讓蘋果產(chǎn)品「唯一的不同是處處不同」弱匪。
這個過程中青瀑,「鏈路通路是否滿足業(yè)務(wù)需求」是蘋果考量供應(yīng)鏈的第一要素,而不是每個局部的優(yōu)化,也不是「便宜和貴的問題」斥难。
再舉一個例子枝嘶,淘寶直通車。
「由于淘寶對其廣告主全部轉(zhuǎn)化流程的了解哑诊,使得淘寶直通車在利用后續(xù)數(shù)據(jù)優(yōu)化廣告系統(tǒng)群扶,如轉(zhuǎn)化預(yù)估、商品上下架同步等方面镀裤,都有著一般搜索廣告難以達(dá)到的深入程度竞阐。」《計算廣告》上關(guān)于淘寶直通車的這段描述暑劝,說明了購買的垂直搜索如何形成自身的閉環(huán)骆莹。
一方面,因為淘寶直通車自身特性担猛,搜索結(jié)果和購買意愿強相關(guān)汪疮,購買轉(zhuǎn)化高,而且商家可以復(fù)用商品圖片用于制作推廣創(chuàng)意毁习,降低了成本;另一方面卖丸,垂直搜索數(shù)據(jù)纺且、購買轉(zhuǎn)化數(shù)據(jù)、商品推廣成本稍浆、消費者數(shù)據(jù)等等結(jié)合载碌,商家可以很方便地去根據(jù)數(shù)據(jù)反饋來判斷自身的直通車投放策略是否成功,從而持續(xù)地改善和優(yōu)化整體的投放策略乃至產(chǎn)品的商業(yè)策略衅枫。
而淘寶直通車系統(tǒng)在這個過程中嫁艇,依靠積累的大量商家數(shù)據(jù)(可以視為對商家業(yè)務(wù)邏輯的深入了解),就可以給商家在「轉(zhuǎn)化預(yù)估弦撩、商品上下架等方面」給予自動化的優(yōu)化指導(dǎo)步咪,這就大大降低了商家整體的學(xué)習(xí)成本和營銷成本,經(jīng)歷過那個年代的電商應(yīng)該都深有體會益楼。
從這個邏輯上猾漫,「A用B的數(shù)據(jù)」前面應(yīng)該還有一句話——B用A的業(yè)務(wù)邏輯,從而幫助A快速在B的數(shù)據(jù)體系里形成運營和產(chǎn)品的閉環(huán)感凤,并用數(shù)據(jù)反饋持續(xù)優(yōu)化商業(yè)目標(biāo)悯周。
「從數(shù)據(jù)開始,到數(shù)據(jù)結(jié)束陪竿∏菀恚」
標(biāo)簽:「數(shù)據(jù)業(yè)務(wù)最精彩的地方」
3 前面兩步,A用B的數(shù)據(jù)有了一個相對可靠的通路,那么如何讓通路run起來闰挡?這里談下標(biāo)簽锐墙。這個敏感的東西。通常A要探索B的數(shù)據(jù)是很困難的解总。去年做數(shù)據(jù)大連接贮匕,面向小伙伴們,感受到標(biāo)簽體系建設(shè)是一個龐大的工程花枫。B只是先為A來做標(biāo)簽刻盐,數(shù)據(jù)加工的動作很難交付給A,因此有了「數(shù)據(jù)可用不可見」劳翰。這是一個整體敦锌,從資源層,數(shù)據(jù)開發(fā)層到數(shù)據(jù)服務(wù)層佳簸,需要系統(tǒng)考慮安全問題乙墙。另一個側(cè)面是質(zhì)量問題。鑒于此生均,產(chǎn)生的需求是A如何利用B的數(shù)據(jù)來自己做標(biāo)簽听想,因為B的服務(wù)效率永遠(yuǎn)會有瓶頸。人工一定要陸續(xù)被機器服務(wù)所優(yōu)化马胧,這是生產(chǎn)率提升的效率汉买。A能夠用到B的數(shù)據(jù),依賴于B走過這么三段路佩脊,這條路更多是心路蛙粘。這條路繼續(xù)走下去會碰到什么?我也在路上威彰。標(biāo)簽是一個海量出牧、實時、高頻的東西歇盼。它是數(shù)據(jù)業(yè)務(wù)最精彩的地方舔痕。就好比宇宙大爆炸,熵增到一個合適的程度旺遮,才會誕生如此美麗的地球赵讯,和上帝覺得「一切甚好」的人類。
在和某朋友討論其數(shù)據(jù)產(chǎn)品的時候耿眉,最后我們發(fā)現(xiàn)边翼,事實上,今天的數(shù)據(jù)業(yè)務(wù)鸣剪,數(shù)據(jù)挖掘和算法都不算特別大的問題组底,特別是基于阿里巴巴的數(shù)據(jù)和技術(shù)能力丈积,只要我們能想到的東西,都有辦法去實現(xiàn)债鸡。
請分外注意加粗的「能想到」三個字江滨。
另一位朋友,在利用阿里大數(shù)據(jù)投放鉆展(阿里的Display Ads. Platform)的時候厌均,在平日(非活動)ROI投出了1:16的峰值唬滑。總結(jié)經(jīng)驗的時候棺弊,發(fā)現(xiàn)是因為他們是做社會化數(shù)據(jù)抓取出身晶密,通過社會化數(shù)據(jù)抓取及人群分析,他們能夠清晰地認(rèn)知到某群人的特性模她,通過抓取其中某些特征(比如愛喝咖啡)稻艰,并在阿里的數(shù)據(jù)體系內(nèi)通過對應(yīng)的標(biāo)簽(比如:咖啡品牌、器具侈净、咖啡豆等等)抓取人群尊勿,他們的鉆展ROI不管是峰值還是均值都超過了大部分的商家。
也請分外注意加粗的部分畜侦。
總結(jié)來看元扔,「A如何利用B的數(shù)據(jù)來自己做標(biāo)簽」,本質(zhì)上看的就是A是否具備創(chuàng)造性使用數(shù)據(jù)的能力旋膳。和數(shù)據(jù)挖掘和算法能力相比摇展,是否具備創(chuàng)造性使用數(shù)據(jù)的能力,恐怕將成為各大玩家的分水嶺溺忧。和「能做到」相比,「能想到」是玩轉(zhuǎn)標(biāo)簽非常重要的一步盯孙。
還是上述的第一位朋友鲁森,對此的總結(jié)是:「策略比數(shù)據(jù)業(yè)務(wù)本身更重要,而且會越來越重要振惰「韪龋」而這種策略必然需要建立在對于數(shù)據(jù)挖掘和算法等基礎(chǔ)知識的掌握之上,并且要對于其自身業(yè)務(wù)邏輯和所面對的市場有深入的了解骑晶,
B解決的是安全和質(zhì)量問題痛垛,以及如何讓標(biāo)簽更好地和場景相匹配。這里的場景指的不單純是上文中的業(yè)務(wù)場景桶蛔,包括用戶的使用場景和消費場景等等匙头。
B幫助A打通了數(shù)據(jù)業(yè)務(wù)的通路,A用B的數(shù)據(jù)標(biāo)簽圈出針對性的人群仔雷,B再幫助A快速在合適的場景下抵達(dá)這些人群——通過這樣的「標(biāo)簽+場景」蹂析,B就能幫助A提升整體的效率舔示,并且降低相應(yīng)的成本。
這個過程电抚,一句話描述就是「算法代替經(jīng)驗公式」惕稻,在數(shù)據(jù)業(yè)務(wù)里表達(dá)的其實是兩個意思:
第一,有經(jīng)驗公式蝙叛;
第二俺祠,能夠通過算法把經(jīng)驗轉(zhuǎn)化成可用的標(biāo)簽。
這就是A在使用B的數(shù)據(jù)過程中需要注意的部分借帘。
從「數(shù)據(jù)作為生產(chǎn)要素」出發(fā)理解數(shù)據(jù)業(yè)務(wù)
4 我在說什么蜘渣?「生產(chǎn)要素-公共品還是私有品-合約定價-產(chǎn)權(quán)界定」。9月是個好月份姻蚓,沾技術(shù)大牛們的光宋梧,我人生第一次忝居某個專利的作者。這個專利是我在阿里最美的回憶之一狰挡。KPI壓力很重捂龄,過去三天我最擔(dān)心的事情有了解決之道,拜托諸君加叁。但愿未來的路不再讓我局促不安倦沧,以致于會有沮喪的時候。我也在努力尋求它匕,會有什么幫助我戰(zhàn)勝自己展融。
這部分的核心就在第一句話上,盡管該位大神已經(jīng)有過解釋豫柬,但我解釋起來還是有些費力告希,只能說盡力而為。
事實上烧给,目前對于數(shù)據(jù)的定義有很多燕偶,也不僅僅限于「生產(chǎn)要素」,也有人把數(shù)據(jù)定義為「生產(chǎn)資料」础嫡,這里就主要從「數(shù)據(jù)作為生產(chǎn)要素」來理解數(shù)據(jù)業(yè)務(wù)指么。
首先,如果我們認(rèn)為數(shù)據(jù)是生產(chǎn)要素榴鼎,那么從經(jīng)濟學(xué)上我們就在認(rèn)定數(shù)據(jù)和土地伯诬、勞動力一樣屬于稀缺資源。
也許有同學(xué)會說巫财,不對呀盗似,大數(shù)據(jù)大數(shù)據(jù),數(shù)據(jù)量不是應(yīng)該非常巨大才對嗎平项?同樣還是拿土地做比較桥言,整個中國960萬平方公里土地萌踱,但是耕地只占其中的7%,可用土地面積遠(yuǎn)遠(yuǎn)小于我們能看到的數(shù)量号阿。在數(shù)據(jù)業(yè)務(wù)里也是一樣并鸵,目前經(jīng)過處理后可用的數(shù)據(jù)表單占整體的比例也不太會超過7%,相比較龐大的業(yè)務(wù)量(人口)而言扔涧,這是一個很小的數(shù)字园担。
其次,既然屬于稀缺資源枯夜,我們就需要像土地一樣弯汰,先定義出哪些數(shù)據(jù)業(yè)務(wù)屬于公有服務(wù),哪些屬于私有服務(wù)湖雹。比如說ID Mapping咏闪、Cookie Match就屬于公有服務(wù),而某些業(yè)務(wù)則屬于私有服務(wù)摔吏。這和土地類似鸽嫂,如果不去區(qū)分公有和私有,不在此之上建立一套制度來區(qū)分不同的土地用途征讲,那么据某,土地的使用就變成了一鍋爛粥——每個人都在造房子,卻不關(guān)心房子和房子之間是否要留下道路诗箍,留多寬癣籽。最后,雖然房子造起來了滤祖,但是因為沒有道路筷狼,所以誰都沒辦法住到房子里面去。
只有合理的道路和房子的規(guī)劃(制度)匠童,人們才能享受到房子和道路的不同用途(能力)桑逝,并且充分發(fā)揮土地的價值。
再次俏让,還是拿土地做類比:如果A要使用B的土地,那么茬暇,首先就要定義清楚首昔,這塊土地的產(chǎn)權(quán)屬于B,而在這塊土地上A所產(chǎn)出的作物糙俗,歸屬于A勒奇,但是A要支付一部分給B作為交換使用權(quán)的費用——在土地里面這就叫地租。
好的土地因為生產(chǎn)率高巧骚,就可以獲得超額利潤赊颠,同時要繳納更高的地租格二;中等土地生產(chǎn)率普通,只能獲得平均利潤竣蹦,就只需要繳納普通地租顶猜,而低等土地因為生產(chǎn)率落后,獲得利潤低于平均水平痘括,就無人愿意經(jīng)營這些土地——這就叫做級差地租长窄。
如果用數(shù)據(jù)來代替土地,也會發(fā)生同樣的情形纲菌。
A用B的數(shù)據(jù)挠日,那么就會有第一方、第二方翰舌、第三方數(shù)據(jù)的分別嚣潜,A用B的第二方數(shù)據(jù),就需要承認(rèn)B對于第二方數(shù)據(jù)的產(chǎn)權(quán)椅贱,并且因此繳納相應(yīng)的數(shù)據(jù)使用費(地租)懂算。
數(shù)據(jù)業(yè)務(wù)表現(xiàn)越出色,交換價值就越大夜涕,A就需要付出更多的數(shù)據(jù)使用費犯犁,來使用B的高性能數(shù)據(jù)來獲取超額利潤。但和級差地租類似女器,這里的紅利在于酸役,A在使用B的數(shù)據(jù)業(yè)務(wù)過程中,提升的生產(chǎn)率越多驾胆,就越能獲取超越平均利潤的超額利潤涣澡,最終就會形成「瀑布」效應(yīng),市場上的超額利潤會越來越聚集到A的手中丧诺。
一句話來說就是:「交換帶來價值」入桂。
最后,A和B就要簽訂合約驳阎,來具體確定數(shù)據(jù)使用費的價格抗愁,來確保數(shù)據(jù)供應(yīng)鏈的暢通,來為B在數(shù)據(jù)處理過程中「采集呵晚、交換蜘腌、加工、服務(wù)」支付費用饵隙。
至此撮珠,數(shù)據(jù)業(yè)務(wù)就從生產(chǎn)要素出發(fā)完成了其最終的「A用B的數(shù)據(jù)」的過程。
最后的最后
我非常感激文中的這位大神金矛,感謝各位朋友和引路人芯急,也非常感謝我所在的team勺届,感謝阿里媽媽,能夠給我這個機會娶耍,在第一線實際地觸摸和觀摩大數(shù)據(jù)業(yè)務(wù)這個「teenage sex」免姿。
這恐怕是我寫過最硬的文章了。如果你對此文章表示憤慨伺绽,我表示嚴(yán)重的理解养泡,但作為一個連高數(shù)都沒上過的文科生而言,我已經(jīng)盡了最大努力去解釋我所理解的數(shù)據(jù)業(yè)務(wù)奈应。因為我對很多算法和技術(shù)原理尚不熟悉澜掩,對經(jīng)濟學(xué)也沒有那么精通,所以杖挣,在整個描述過程中肩榕,肯定存在眾多有理解偏差和不準(zhǔn)確的地方,如果有疑問的地方惩妇,請千萬來信來人和我一起探討株汉。
我的郵箱是anson.77.ho@live.com,請勿詢問任何和我現(xiàn)在公司相關(guān)的具體業(yè)務(wù)問題歌殃,其他不管是批評還是情感問題我統(tǒng)統(tǒng)接下乔妈。
最后,以上內(nèi)容僅代表本人觀點氓皱,和所在公司無關(guān)路召。(據(jù)說加了這句就不會被請喝咖啡了呢。)
人了解世界的時候波材,都是先問who & where股淡,慢慢學(xué)會問why,當(dāng)對答案不滿足的時候就開始問how廷区,所以唯灵,knowhow才是人對世界的回答。謝謝關(guān)注Knowhow_Ho隙轻,何夕一言堂埠帕,這是我對世界的回答,一家之言玖绿,不求正確敛瓷,但求有所啟發(fā)。