大數(shù)據(jù)的應(yīng)用階段已經(jīng)從發(fā)現(xiàn)問題嫉拐、分析問題過渡到幫助企業(yè)挖掘更大的商業(yè)機會梦湘、輔助高層決策了。于此同時月洛,很多企業(yè)的數(shù)據(jù)應(yīng)用依然停留在表面何恶,不僅錯過了大數(shù)據(jù)蘊藏的巨大商業(yè)機會,也沒有用數(shù)據(jù)給企業(yè)帶來實打?qū)嵉睦麧櫧狼R虼讼覆悖緯暮诵膬?nèi)容主要分享作者在數(shù)據(jù)領(lǐng)域深耕十幾年的經(jīng)驗,阿里巴巴數(shù)據(jù)實戰(zhàn)應(yīng)用的方法論唬涧,以及提出了大數(shù)據(jù)在未來實戰(zhàn)層面上的應(yīng)用趨勢疫赎。
一、大數(shù)據(jù)怎么樣從說到用
1碎节、大數(shù)據(jù)捧搞,為什么很多人只會說,不會用狮荔。
斷層才是大數(shù)據(jù)所面臨的最嚴重的問題√テ玻現(xiàn)在,收集數(shù)據(jù)的人并不清楚未來使用數(shù)據(jù)的人要做什么殖氏,這是目前大數(shù)據(jù)的一大關(guān)鍵命門创坞。
不只是收集數(shù)據(jù)的人不知道將來的人怎么使用數(shù)據(jù),就連創(chuàng)建模型的人也不知道自己所采用的數(shù)據(jù)在未來是否穩(wěn)定受葛,而使用模型的人也不知道整個數(shù)據(jù)的來路或加工過程,這些都是普遍存在且很現(xiàn)實的問題。
2总滩、大數(shù)據(jù)的本質(zhì)就是還原用戶場景
數(shù)據(jù)收集的價值包含兩個維度纲堵。一方面,你是否能衡量這個數(shù)據(jù)對企業(yè)產(chǎn)生的價值——你不會將用戶的所有行為都記錄下來闰渔,而是記錄那些對企業(yè)自身有幫助的數(shù)據(jù)席函,即企業(yè)價值;另一方面冈涧,你是否能衡量這個數(shù)據(jù)對顧客的價值——這個數(shù)據(jù)如何幫助企業(yè)為客戶提供更好的服務(wù)茂附,即客戶價值。從企業(yè)價值來看督弓,數(shù)據(jù)收集實現(xiàn)的是企業(yè)資源的合理分配营曼。從客戶價值來看,數(shù)據(jù)收集實現(xiàn)的是顧客體驗的提升愚隧。
我的觀點是蒂阱,數(shù)據(jù)價值的確要分是從誰的角度出發(fā)的。所以狂塘,當(dāng)我們談大數(shù)據(jù)價值的時候录煤,第一點要注意的就是角色不一樣,對于數(shù)據(jù)價值的看法也就不同荞胡,所以在衡量價值時要考慮到受眾和給予者這兩個對立面的不同看法妈踊。在招場景與還原并行——前端還原消費者場景,后端還原業(yè)務(wù)需求泪漂。
數(shù)據(jù)的本質(zhì)就是還原廊营,這是收集元數(shù)據(jù)的關(guān)鍵方法。
我認為窖梁,數(shù)據(jù)的本質(zhì)就是還原赘风,這是收集元數(shù)據(jù)的關(guān)鍵方法。如果沒有這個概念纵刘,你就不知道未來你需要什么數(shù)據(jù)邀窃,就更不懂得什么是重要的數(shù)據(jù),到最后只會產(chǎn)生越來越多的無從辨別的數(shù)據(jù)假哎。一旦數(shù)據(jù)多到了連你的公司都沒有辦法處理的時候瞬捕,那么其他會處理的人、公司和國家就會把你毫不留情地擠出市場舵抹。
3肪虎、“活”得數(shù)據(jù)才是大數(shù)據(jù)
死”數(shù)據(jù)就是單純存儲在數(shù)據(jù)庫中,無法進行分析和使用惧蛹,并且不能夠產(chǎn)生價值的數(shù)據(jù)扇救。大數(shù)據(jù)的真正價值是將數(shù)據(jù)用于形成主動收集數(shù)據(jù)的良性循環(huán)中刑枝,以帶動更多的數(shù)據(jù)進入這個自循環(huán)中,并應(yīng)用于各個行業(yè)迅腔。
在數(shù)據(jù)的自循環(huán)中装畅,有兩個核心的關(guān)鍵點:一個是“活”做數(shù)據(jù)收集,另一個是“活”看數(shù)據(jù)指標(biāo)沧烈。所謂“活”做數(shù)據(jù)收集掠兄,就是指企業(yè)不要局限于只收集自己用戶產(chǎn)生的數(shù)據(jù),還要把“別人”的數(shù)據(jù)收集過來進行綜合分析锌雀;“活”看數(shù)據(jù)指標(biāo)蚂夕,就是指企業(yè)不要局限于已有的數(shù)據(jù)框架,而應(yīng)該結(jié)合用戶需求的不同場景來靈活應(yīng)用收集到的“活”數(shù)據(jù)腋逆⌒鲭梗“活”看數(shù)據(jù)指標(biāo),動態(tài)地使用數(shù)據(jù) 把數(shù)據(jù)激活闲礼,從靜態(tài)數(shù)據(jù)變成動態(tài)數(shù)據(jù)牍汹,必須要用場景來驗證。
“活”用數(shù)據(jù)柬泽,就是你是否能看出這個數(shù)據(jù)本身的局限是什么慎菲。一方面,是我們的數(shù)據(jù)為用戶體驗改善了什么锨并;另一方面露该,企業(yè)在使用數(shù)據(jù)時,對活數(shù)據(jù)的運用解決了什么問題或者開創(chuàng)了什么機會第煮。要牢牢記住解幼,活用數(shù)據(jù)很重要。
4包警、無線數(shù)據(jù)撵摆,大數(shù)據(jù)的顛覆者
為了方便理解,我想出了兩個名詞:前端行為數(shù)據(jù)和后端商業(yè)數(shù)據(jù)害晦。前者指的是訪問量特铝、瀏覽量、點擊率及站內(nèi)搜索等壹瘟,是反映用戶行為的數(shù)據(jù)鲫剿;而后者更側(cè)重于商業(yè)數(shù)據(jù),比如交易量稻轨、投資回報率灵莲、客戶終生價值[LTV(Life Time Value)]。
APP數(shù)據(jù)收集的方式包括兩種:一是收集用戶聯(lián)網(wǎng)時請求服務(wù)器的記錄殴俱;二是在將用戶的行為數(shù)據(jù)記錄下來之后政冻,適時地傳給網(wǎng)站枚抵。但不論是什么樣的收集方式,無線數(shù)據(jù)最終的表現(xiàn)是在沒有賬戶體系的情況下赠幕,和PC的用戶行為完全沒有辦法進行關(guān)聯(lián)俄精,這也就意味著用戶的數(shù)據(jù)出現(xiàn)了斷層。
我的看法是榕堰,保證PC和無線兩份數(shù)據(jù)的完整,通過用戶體系將兩份數(shù)據(jù)關(guān)聯(lián)起來嫌套,就可以在分析的時候用彼此的融合來還原用戶的行為逆屡。
面對無線數(shù)據(jù),要解決的主要問題有兩個:一是做到高效準(zhǔn)確的收集踱讨;二是培養(yǎng)數(shù)據(jù)分析師的多屏思維魏蔗。 所謂做到高效準(zhǔn)確的收集,就是需要建立一套面向多操作系統(tǒng)痹筛、多版本莺治、自動、可靈活配置的用戶行為獲取系統(tǒng)帚稠。通過這個系統(tǒng)谣旁,開發(fā)工程師不再需要采用人工寫代碼的方式來收集數(shù)據(jù),從不同滋早。大數(shù)據(jù)相信全量數(shù)據(jù)榄审,而非樣本;是分析得出杆麸,而不是抽樣獲得搁进。
5、數(shù)據(jù)的分類與價值
數(shù)據(jù)作為一種資產(chǎn)昔头,不同的數(shù)據(jù)含金量必然不同饼问,自然就會產(chǎn)生不同的價值。而且揭斧,就同一組數(shù)據(jù)而言莱革,在不同的環(huán)境下甚至?xí)尸F(xiàn)出不同的價值。從數(shù)據(jù)分類的角度來看未蝌,可以將之分為以下4種驮吱。 1.按照是否可以再生的標(biāo)準(zhǔn)來看,可以分為不可再生數(shù)據(jù)和可再生數(shù)據(jù)萧吠。不過千萬不能因為“可再生”這個詞語的存在左冬,就對可再對不可再生的數(shù)據(jù)而言,已有的數(shù)據(jù)要嚴格保護纸型,想要但是還沒有的數(shù)據(jù)就要及早收集拇砰。2.按照數(shù)據(jù)所處的存儲層次來看梅忌,可以分為基礎(chǔ)層、中間層和應(yīng)用層除破。任何管理方法牧氮,無論是集中式管理,還是分散式管理瑰枫,都各有利弊踱葛,而且人和業(yè)務(wù)多了之后,企業(yè)也很難進行集中式管理光坝。我給出的建議是尸诽,基礎(chǔ)層必須統(tǒng)一,因為這是最基本的數(shù)據(jù)盯另,而且基本數(shù)據(jù)是原始數(shù)據(jù)性含。除了備份的需求外沒有必要在各個場合保留多份數(shù)據(jù)。只要保證這個數(shù)據(jù)有良好的元數(shù)據(jù)管理方式鸳惯,就能極大地降低成本商蕴。3.各個數(shù)據(jù)主體。內(nèi)容芝发,在平臺型電商可以分為交易類數(shù)據(jù)绪商、會員類數(shù)據(jù)、日志類數(shù)據(jù)等后德。4.按照是否為隱私來區(qū)分部宿,可以分為隱私數(shù)據(jù)和非隱私數(shù)據(jù)。
數(shù)據(jù)的5大價值:
數(shù)據(jù)價值1:識別和串聯(lián)的價值
數(shù)據(jù)價值2:描述價值瓢湃。但是理张,對于企業(yè)來說,數(shù)據(jù)的描述價值與業(yè)務(wù)目標(biāo)的實現(xiàn)并不呈正比關(guān)系绵患,也就是說雾叭,描述數(shù)據(jù)不是越多越好,而是應(yīng)該收集和業(yè)務(wù)緊密相關(guān)的數(shù)據(jù)落蝙。用來描述數(shù)據(jù)最好的一種方式就是分析數(shù)據(jù)的框架织狐。
數(shù)據(jù)價值3:時間價值
數(shù)據(jù)價值4:預(yù)測價值
數(shù)據(jù)價值5:產(chǎn)出數(shù)據(jù)的價值
6、從用數(shù)據(jù)到養(yǎng)數(shù)據(jù)
重復(fù)購買率有不同的定義筏勒,而做不同的決策需要考慮經(jīng)過不同定義的重復(fù)購買率移迫。如果一家投資公司想收購A公司,那么會從重復(fù)購買率來看整個A公司的運營良好程度或用戶質(zhì)量等管行;如果從A公司本身運營的角度來看重復(fù)購買率厨埋,那么它更應(yīng)該關(guān)注的是日、周級別的重復(fù)購買率的變化趨勢捐顷,或者當(dāng)月新增客戶有多少人在三個月后進行了重復(fù)購買荡陷,從而可以衡量出每個月新增及存量客戶的忠誠度和質(zhì)量雨效,進而找出改善的空間。在知道了以上的背景之后废赞,再去選擇使用什么數(shù)據(jù)不是更有的放矢嗎?
數(shù)據(jù)應(yīng)用因小而美 “小”不是指數(shù)據(jù)量徽龟,而是指應(yīng)用的目標(biāo)很具體
把數(shù)據(jù)放進“框”之中 在大數(shù)據(jù)的背景下,必須考慮數(shù)據(jù)之間的關(guān)聯(lián)性唉地。一個單獨的數(shù)據(jù)是沒有意義的据悔,要把數(shù)據(jù)放在一個“數(shù)據(jù)框架”(場景)之中,才能看出存在的問題渣蜗。
如何用框架來做決策 想要解決的問題越復(fù)雜屠尊,框架也就越復(fù)雜。但是耕拷,決策最重要的前提是要從小角度切入,從“小”做起托享。 對此骚烧,我總結(jié)了4步走的方法: 1.首先確定有什么問題,從解決問題的角度出發(fā)去收集數(shù)據(jù)窄潭。 2.把收集到的數(shù)據(jù)整理好贴浙,放入一個“數(shù)據(jù)框架”內(nèi)(這個框架是用來幫助決策者做決定的)3.看框架與做決策的關(guān)系豺总。4.根據(jù)決策行動,然后檢查行動是否達到目的碧查。
“用數(shù)據(jù)”更多的是一種方法論,而“養(yǎng)數(shù)據(jù)”則是一種數(shù)據(jù)戰(zhàn)略校仑,是基于深入業(yè)務(wù)理解的更高層次的商業(yè)決策忠售。
養(yǎng)數(shù)據(jù)通常有兩類,一類是網(wǎng)站自身沒有的數(shù)據(jù)迄沫,需要用戶主動提供的稻扬;另一類是公司擁有的,但沒有進行收集的數(shù)據(jù)羊瘩。
有一個問題必須得到解決泰佳,那就是假定數(shù)據(jù)都是可以獲得的情況下,什么樣的數(shù)據(jù)才是關(guān)鍵尘吗?
7逝她、數(shù)據(jù)的盲點,負面數(shù)據(jù)的力量
數(shù)據(jù)盲點 在數(shù)據(jù)中黔宛,盲點可以分為兩類:一類是物理盲點,另一類是邏輯盲點侧戴。正能量思考告訴你怎么做可以到達成功的終點宁昭,負能量思考則告訴你怎么做才不會失敗跌宛。
數(shù)據(jù)盲點的價值 是否看到數(shù)據(jù)盲點價值的核心就是,有沒有看到應(yīng)該看到的數(shù)據(jù)积仗,有沒有錯失不應(yīng)該錯失的數(shù)據(jù)
而且還能引發(fā)我們思考另外一個問題:數(shù)據(jù)的盲點在哪里疆拘?
以我的日常工作為例,在團隊給高管們做報告的時候寂曹,我通常不看報告哎迄,而是主要記錄高管們“什么時間點頭”、“什么時間針對性地做了筆記”和“什么時間沒怎么聽在看手機”隆圆。你不要小看這三個數(shù)據(jù)漱挚,當(dāng)與當(dāng)時報告的內(nèi)容對應(yīng)(關(guān)聯(lián))起來時,我就能容易地知道在剛才做的報告中哪一部分是不吸引人的和哪一部分是需要改進的渺氧。尤其是高管看手機的時間旨涝,完全可以算是理論上的“負能量”數(shù)據(jù),但對報告的改進其實非常有價值侣背。
二白华、阿里巴巴數(shù)據(jù)應(yīng)用的“內(nèi)外三板斧”
作者在阿里巴巴任職期間,總結(jié)了一套“內(nèi)三板斧”和“外三板斧”的辦法贩耐,對內(nèi)弧腥,用來培養(yǎng)數(shù)據(jù)人才,對外潮太,實現(xiàn)數(shù)據(jù)應(yīng)用的不斷升級迭代管搪。
1、 “混铡买、通更鲁、曬”——阿里巴巴培養(yǎng)數(shù)據(jù)人才的“內(nèi)三板斧”
“混”,指的是寻狂,數(shù)據(jù)分析師一定要跟各業(yè)務(wù)部門混在一起岁经,了解業(yè)務(wù)人員的核心需求,掌握他們真正關(guān)心的數(shù)據(jù)蛇券,從而幫助他們改善績效缀壤。
“通”,指的是纠亚,數(shù)據(jù)分析師對業(yè)務(wù)理解通暢了塘慕,也是“混”的結(jié)果。阿里巴巴通過車品覺主張的“混”在一起蒂胞,把部門之間的隔閡給打“通”了图呢。團隊合作也變得更加和諧高效。把數(shù)據(jù)打通,一是商業(yè)理解和數(shù)據(jù)之間的“通”蛤织,另一種就是部門數(shù)據(jù)和部門數(shù)據(jù)的交叉赴叹。
“曬”,指的是指蚜,最終的數(shù)據(jù)表現(xiàn)和結(jié)果乞巧,是人、商業(yè)和數(shù)據(jù)結(jié)合之后的一種“看數(shù)據(jù)”和“用數(shù)據(jù)”的方法論摊鸡。在阿里巴巴绽媒,“曬”通常是通過數(shù)據(jù)來回答幾個關(guān)鍵問題,比如:業(yè)務(wù)現(xiàn)在發(fā)展的好還是不好免猾,如何利用數(shù)據(jù)幫助業(yè)務(wù)部門發(fā)現(xiàn)機會等等是辕。“曬”是產(chǎn)生組織力量的過程猎提,同樣也適用于企業(yè)內(nèi)部获三。
2、“存锨苏、管石窑、用”——阿里巴巴的數(shù)據(jù)應(yīng)用“外三板斧”
“存”,指的是收集數(shù)據(jù)蚓炬,收集起來的數(shù)據(jù)產(chǎn)生價值。盲目的收集不旦不會給企業(yè)創(chuàng)造價值躺屁,還會增加昂貴的存儲和管理成本肯夏,即使像阿里巴巴這樣的公司,也承擔(dān)不起無限收集數(shù)據(jù)和管理數(shù)據(jù)的成本犀暑。所以驯击,車品覺建議,企業(yè)在收集數(shù)據(jù)之前一定要有一個特定的目的耐亏。
“管”徊都,指的是對存儲數(shù)據(jù)進行保管,以確保數(shù)據(jù)的安全广辰、準(zhǔn)確等等暇矫。數(shù)據(jù)管理的內(nèi)容包括很多方面,比如:數(shù)據(jù)的來源择吊,如何讓數(shù)據(jù)不丟失李根,如何保護數(shù)據(jù)的安全,如何讓數(shù)據(jù)準(zhǔn)確穩(wěn)定几睛,以及如何更好的運用數(shù)據(jù)房轿,這些都是數(shù)據(jù)運營當(dāng)中的“管”。
“用”,指的是思考“如何應(yīng)用數(shù)據(jù)解決運營中存在的問題”囱持。就拿電商的用戶標(biāo)簽來說夯接,阿里總共有18個用戶性別標(biāo)簽,這些標(biāo)簽并不是真正意義上的生理性別纷妆,而是從用戶的購物屬性上定義出來的性別盔几。比如說:夫妻倆共用一個賬號,早上妻子用凭需,晚上丈夫用问欠,那這個賬號在阿里巴巴的性別標(biāo)簽就是“早女晚男”。在數(shù)據(jù)應(yīng)用的過程中粒蜈,把本來不可以分裂的東西分裂之后再重組顺献,就能產(chǎn)生新的數(shù)據(jù)價值。
三枯怖、大數(shù)據(jù)在未來的應(yīng)用趨勢
作者以十幾年的數(shù)據(jù)實戰(zhàn)注整,對未來的數(shù)據(jù)應(yīng)用有六個方向的趨勢預(yù)測,分別是:應(yīng)用無線化度硝、信息數(shù)據(jù)化肿轨、交易無紙化、人類智能化蕊程、決策實時化椒袍、線下線上化。在這一部分藻茂,我們來分享 “信息數(shù)據(jù)化驹暑、決策實時化和人類智能化”三個方面。
1辨赐、信息數(shù)據(jù)化
未來會有更多的信息被數(shù)據(jù)化优俘。由于技術(shù)限制,很多有價值的信息還不能被收集成數(shù)據(jù)掀序,隨著科技的發(fā)展帆焕,這些信息都將被數(shù)據(jù)化。比如不恭,人臉識別技術(shù)就能讓零售門店的客戶信息被數(shù)據(jù)化叶雹。店員不需要再問“您需要些什么”這樣的問題,就能給出相應(yīng)的商品推薦县袱。當(dāng)更多有價值的信息被收集成數(shù)據(jù)浑娜,各個行業(yè)都將面臨巨大的沖擊。每個行業(yè)都要思考式散,在這一波數(shù)據(jù)紅利上筋遭,如何搶占先機,管理好自己的用戶數(shù)據(jù),提升用戶體驗漓滔。
2编饺、決策實時化
生活中我們遇到的很多問題,都是因為沒有得到及時的反饋响驴,導(dǎo)致我們無法作出正確決策透且。如果銀行提前告訴你,再不還款就會收取額外利息豁鲤,相信很多人都不會忘記還款了秽誊。再比如,如果糖尿病患者可以實時的了解自己的血糖水平琳骡,知道當(dāng)下的這一餐會讓血糖升高到多少锅论,就能決定眼前這一餐要不要全吃光。
在未來激烈的商業(yè)競爭當(dāng)中楣号,企業(yè)影響消費者進行實時決策的能力會越來越重要最易。越是能夠在短時間內(nèi)抓住消費者,就越容易賣出產(chǎn)品炫狱,實現(xiàn)更高的顧客轉(zhuǎn)化率藻懒。
3、人類智能化
隨著可穿戴設(shè)備的出現(xiàn)视译,人和數(shù)據(jù)開始真正融為一體嬉荆,像谷歌眼鏡這樣的設(shè)備,將讓我們看到的東西即時數(shù)據(jù)化酷含;類似健康手環(huán)類設(shè)備员寇,和可以深度收集腦電波的數(shù)據(jù)設(shè)備,將隨時會使我們?nèi)梭w的活動轉(zhuǎn)化成數(shù)據(jù)第美。
在不遠的將來,用數(shù)3記錄實時記錄生活將成為可能陆爽。彼時什往,數(shù)據(jù)將會幫助人們做出更好的判斷,人類也會變得更加智能慌闭。未來别威,一個人的能力和聰明程度的不是由 IQ 決定的,而是這個人是否擁有足夠的數(shù)據(jù)驴剔。
本書中提出的好問題:
1省古、先問一個數(shù)據(jù)管理上最現(xiàn)實的問題:“大數(shù)據(jù)如何備份?“
2丧失、如果你在數(shù)據(jù)使用方面一直得心應(yīng)手豺妓,整個商業(yè)鏈條和數(shù)據(jù)緊密相關(guān)、相輔相成。但是琳拭,現(xiàn)在數(shù)據(jù)鏈忽然斷了训堆,或者不再有效了,你該怎么辦白嘁?
你需要注意的是坑鱼,這一問題說的不是你有沒有使用好數(shù)據(jù),而是說曾經(jīng)你可以得到的數(shù)據(jù)現(xiàn)在無從獲得了絮缅;或者說這些數(shù)據(jù)不能再在線上收集鲁沥,只能從線下獲取,成本也就相應(yīng)升高了耕魄;抑或說画恰,這些數(shù)據(jù)存儲在其他地方,你不能使用了屎开。在諸如此類的情況下阐枣,你該怎么辦?
3奄抽、很多人都會問蔼两,大數(shù)據(jù)能帶來什么價值?怎么衡量大數(shù)據(jù)創(chuàng)造的價值逞度?
事實上额划,最直接的衡量標(biāo)準(zhǔn)就是,在經(jīng)營上它為你賺了多少錢档泽,帶來了多少實際的利潤提升俊戳。
4、從公司管理層的角度來看馆匿,投資人了解數(shù)據(jù)的意義是什么嗎抑胎?
高層管理者對數(shù)據(jù)的期望和中層管理者之間又有什么不同?他們知道數(shù)據(jù)能幫助企業(yè)做什么嗎渐北?這些問題的答案完全會因立場而異阿逃。
5、首先赃蛛,你能否清楚地識別(Identify)用戶的身份恃锉?其次,你能否搞清楚收集的數(shù)據(jù)對你的價值(Value)是什么呕臂?最后破托,收集數(shù)據(jù)時的場景(Situation)是什么?
是否知道用戶是誰歧蒋,決定了企業(yè)數(shù)據(jù)收集行為的意義大小土砂。
6州既、為什么場景會變得如此重要?場景是不是被準(zhǔn)確地表達了瘟芝?場景是否會成為一件事情的背景易桃,用來還原整件事情?
7锌俱、如何更好地識別各個設(shè)備的使用者是否為同一個人晤郑,如何更好地理解用戶在各個不同場景下表現(xiàn)出來的不同需求,如何更好地理解數(shù)據(jù)融合后產(chǎn)生的價值贸宏,將是未來商業(yè)中每一個企業(yè)都必須考慮的問題造寝。
8、我在面試數(shù)據(jù)分析師的時候吭练,必然會問他們一個問題:“假如我是一家知名電商的CEO诫龙,而今天是星期一早上9點鐘,請你給我提供三個數(shù)據(jù)指標(biāo)向我證明在過去的一周里鲫咽,企業(yè)運營得一切正常签赃,可以讓我踏實下來。你認為分尸,會是哪三個指標(biāo)呢锦聊?”
9、現(xiàn)在的企業(yè)獲取數(shù)據(jù)如此容易箩绍,數(shù)據(jù)的增長速度如此之快孔庭,那么對于企業(yè)來說,到底要收集什么樣的數(shù)據(jù)材蛛?收集多少數(shù)據(jù)圆到?收集數(shù)據(jù)的邊界在哪里?
10卑吭、先提一個假設(shè)性問題:200米以外忽然發(fā)生了爆炸芽淡,你如何通過大數(shù)據(jù)鑒別出是不是有人蓄意而為?如果是豆赏,如何快速地鎖定嫌疑人吐绵?
11、假定數(shù)據(jù)是臟的 在處理數(shù)據(jù)的時候河绽,會像污水處理廠一樣,每一步都問自己要如何處理這些污水唉窃。這種情況的出現(xiàn)耙饰,到底是因為數(shù)據(jù)源臟了,還是因為數(shù)據(jù)提煉過程做得不好纹份?
金句
1 大數(shù)據(jù)的應(yīng)用已經(jīng)不局限在分析問題反映問題的層面了苟跪,它已經(jīng)成為商業(yè)決策的重要工具廷痘,所以說,未來企業(yè)的核心競爭力很大程度上取決于“用數(shù)據(jù)”的能力件已。
2笋额、數(shù)據(jù)如何用,用的好不好篷扩,最關(guān)鍵的是“用戶意識”兄猩,也就是從數(shù)據(jù)使用者的角度去做分析。一個產(chǎn)品的成功鉴未,取決于它在多大程度上滿足了用戶的需求枢冤,解決了用戶的問題。
3铜秆、收集數(shù)據(jù)不是目的淹真,讓收集起來的數(shù)據(jù)產(chǎn)生價值才是最終的目的。沒有一家公司可以承擔(dān)得起無止境收集數(shù)據(jù)的成本连茧,如果只收集數(shù)據(jù)核蘸,而不當(dāng)機立斷做出分析和應(yīng)用決策的話,代價只能是慘重的存儲和管理成本啸驯。
4客扎、阿里巴巴培養(yǎng)數(shù)據(jù)人才的內(nèi)三板斧“混通曬”,以及阿里巴巴數(shù)據(jù)應(yīng)用反復(fù)升級迭代的外三板斧“存管用”坯汤,是阿里巴巴在數(shù)據(jù)應(yīng)用上最值得分享給你的寶貴經(jīng)驗虐唠。
5、在循環(huán)往復(fù)的大數(shù)據(jù)實戰(zhàn)當(dāng)中惰聂,最關(guān)鍵的是要一直保持新手的心態(tài)疆偿。要想用好大數(shù)據(jù),不能只關(guān)心科技的發(fā)展搓幌,還要注重思維的開拓杆故。只有先進的科技加上開闊的數(shù)據(jù)思維,大數(shù)據(jù)的價值才能發(fā)揮的淋漓盡致溉愁。