前言
移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展诫舅,移動(dòng)終端的廣泛普及羽利,催生了大數(shù)據(jù)技術(shù)宫患。今天刊懈,無(wú)論是個(gè)人的日常生活,還是企業(yè)的業(yè)務(wù)發(fā)展娃闲,都和數(shù)據(jù)密切相關(guān)虚汛,大數(shù)據(jù)技術(shù)正成為新發(fā)明、新產(chǎn)品和新服務(wù)的創(chuàng)新源泉皇帮。
近幾年卷哩,各種驅(qū)動(dòng)在天上飄,有產(chǎn)品驅(qū)動(dòng)属拾、技術(shù)驅(qū)動(dòng)将谊、政策驅(qū)動(dòng)還有老板驅(qū)動(dòng),大數(shù)據(jù)也不甘寂寞渐白,于是乎“數(shù)據(jù)驅(qū)動(dòng)”一詞漸漸熱了起來(lái)尊浓。很多企業(yè)都說(shuō)自己在搞數(shù)據(jù)驅(qū)動(dòng),也有不少?gòu)氖聰?shù)據(jù)技術(shù)的公司在對(duì)外提供數(shù)據(jù)驅(qū)動(dòng)的技術(shù)咨詢和實(shí)施服務(wù)纯衍。各個(gè)行業(yè)都在激動(dòng)地討論著“數(shù)據(jù)驅(qū)動(dòng)”栋齿,有些公司甚至宣稱已經(jīng)實(shí)現(xiàn)了“數(shù)據(jù)驅(qū)動(dòng)”。
像大數(shù)據(jù)和區(qū)塊鏈一樣襟诸,很多人似是而非地討論著數(shù)據(jù)驅(qū)動(dòng)瓦堵,而且數(shù)據(jù)驅(qū)動(dòng)逐漸也有很大希望繼在大數(shù)據(jù)、區(qū)塊鏈之后成為另外一個(gè)忽悠人民恐嚇百姓的民俗化名詞歌亲。那么到底什么是數(shù)據(jù)驅(qū)動(dòng)呢菇用?你真的在做數(shù)據(jù)驅(qū)動(dòng)嗎?
何為“數(shù)據(jù)驅(qū)動(dòng)”
在討論數(shù)據(jù)驅(qū)動(dòng)前陷揪,首先讓我們看一個(gè)例子惋鸥,打開(kāi)手機(jī)移動(dòng)應(yīng)用Uber泉唁,APP頁(yè)面會(huì)有優(yōu)惠碼提示:轉(zhuǎn)發(fā)優(yōu)惠碼,如有下線使用該優(yōu)惠碼揩慕,你將獲得優(yōu)惠亭畜;在用車時(shí),APP會(huì)根據(jù)坐車時(shí)間段和車輛緊張程度迎卤,提醒溢價(jià)的倍數(shù)拴鸵,你如果不接受,則訂單取消蜗搔;打車結(jié)束后劲藐,APP自動(dòng)選擇優(yōu)惠券進(jìn)行結(jié)算,無(wú)需手動(dòng)選擇樟凄;最后你的郵箱將收到此次打車的中英文版本的郵件聘芜。整個(gè)過(guò)程全部由系統(tǒng)自動(dòng)完成,無(wú)需人工決策缝龄。包括轉(zhuǎn)發(fā)優(yōu)惠碼的部分汰现,也是由系統(tǒng)自動(dòng)提醒,刺激用戶點(diǎn)擊完成的叔壤。
由此可見(jiàn)瞎饲,數(shù)據(jù)驅(qū)動(dòng)是通過(guò)移動(dòng)互聯(lián)網(wǎng)或者其他的相關(guān)軟件為手段采集海量的數(shù)據(jù),將數(shù)據(jù)進(jìn)行組織形成信息炼绘,之后對(duì)相關(guān)的信息進(jìn)行整合和提煉嗅战,在數(shù)據(jù)的基礎(chǔ)上經(jīng)過(guò)訓(xùn)練和擬合形成自動(dòng)化的決策模型。當(dāng)新的情況發(fā)生俺亮,新數(shù)據(jù)輸入的時(shí)候驮捍,系統(tǒng)可以用前面建立的模型以人工智能的方式直接進(jìn)行決策。如下圖所示脚曾,信號(hào)东且、數(shù)據(jù)、信息斟珊、情報(bào)苇倡、知識(shí)、智慧囤踩,一環(huán)扣一環(huán)旨椒,不斷地上升迭代,完成一個(gè)又一個(gè)決策堵漱。?
信號(hào)是機(jī)器可讀的模擬或者數(shù)字脈沖综慎,數(shù)據(jù)是人類可讀的信號(hào),信息是經(jīng)過(guò)索引后可以查詢的組織化的數(shù)據(jù)勤庐,而情報(bào)是對(duì)特定人在特定場(chǎng)景下有針對(duì)性的信息示惊,知識(shí)是大量情報(bào)積累后可以改變?nèi)说闹R(shí)結(jié)構(gòu)的部分好港,智慧是基于知識(shí)和經(jīng)驗(yàn)可用于決策的部分。這個(gè)決策在人工智能時(shí)代就是基于數(shù)據(jù)和算法米罚,特別是機(jī)器學(xué)習(xí)建立模型和使用模型的決策钧汹。因?yàn)樵谝苿?dòng)互聯(lián)網(wǎng)時(shí)代,業(yè)務(wù)需要海量毫秒級(jí)的瞬間決策录择,這是人類決策無(wú)法完成的拔莱。另外,人是感情動(dòng)物隘竭,所有的決策會(huì)夾雜著情緒塘秦、親情、關(guān)系等社會(huì)關(guān)系动看,所做的決策未必是完全客觀的尊剔,很有可能添加了主觀因素×饨裕基于數(shù)據(jù)和模型的數(shù)據(jù)驅(qū)動(dòng)決策是更加靠譜的方式须误。
但是這個(gè)過(guò)程需要數(shù)據(jù)的不斷輸入,需要模型根據(jù)比對(duì)決策結(jié)果和現(xiàn)實(shí)數(shù)據(jù)把偏差信息反饋給機(jī)器學(xué)習(xí)搔预,在其后不斷的機(jī)器學(xué)習(xí)迭代過(guò)程中自我完善霹期。從這個(gè)過(guò)程的描述中我們可以看到叶组,數(shù)據(jù)驅(qū)動(dòng)對(duì)企業(yè)的要求非常高拯田,要有流式的數(shù)據(jù)不斷地注入,要有以機(jī)器學(xué)習(xí)為基礎(chǔ)的決策模型甩十,要有能依賴模型輸出結(jié)果可以推動(dòng)的業(yè)務(wù)系統(tǒng)船庇,要有可以反饋預(yù)測(cè)偏差的反饋機(jī)制。
現(xiàn)在大家常聽(tīng)到“數(shù)據(jù)驅(qū)動(dòng)”侣监,也有很多公司對(duì)外宣稱其實(shí)現(xiàn)了“數(shù)據(jù)驅(qū)動(dòng)”鸭轮,諸如“這是一家數(shù)據(jù)驅(qū)動(dòng)公司”等話語(yǔ)比比皆是。但它果真是一家“數(shù)據(jù)驅(qū)動(dòng)”公司么橄霉?
“數(shù)據(jù)驅(qū)動(dòng)”的特征
在一個(gè)真正的數(shù)據(jù)驅(qū)動(dòng)的企業(yè)窃爷,數(shù)據(jù)是提供報(bào)告、深度模擬預(yù)測(cè)的來(lái)源姓蜂,企業(yè)決策者應(yīng)該將數(shù)據(jù)分析納入公司決策流程按厘,并對(duì)公司的決策提供價(jià)值和影響。數(shù)據(jù)驅(qū)動(dòng)企業(yè)最大的特點(diǎn)是擁有一套完整的數(shù)據(jù)價(jià)值體系钱慢。數(shù)據(jù)價(jià)值體系指的是一套完整的從數(shù)據(jù)收集逮京、整理、報(bào)告到轉(zhuǎn)化成行業(yè)洞見(jiàn)和決策建議的流程束莫。而落實(shí)到操作層面則是通過(guò)對(duì)數(shù)據(jù)的收集懒棉、整理草描、提煉,總結(jié)出規(guī)律形成一套智能模型策严,之后通過(guò)人工智能的方式作出最終的決策穗慕。因此,真正的數(shù)據(jù)驅(qū)動(dòng)公司應(yīng)該具備以下特征:
1妻导、海量的數(shù)據(jù)揍诽;
2、自動(dòng)化的業(yè)務(wù)栗竖;
3暑脆、強(qiáng)大的模型支持自動(dòng)化決策。
這三個(gè)條件缺一不可狐肢,并形成一個(gè)循環(huán)添吗,不斷地進(jìn)行數(shù)據(jù)收集,完成建模份名,自動(dòng)決策碟联。
何為“以數(shù)據(jù)為中心”
到目前為止,好多宣稱自己是“數(shù)據(jù)驅(qū)動(dòng)”業(yè)務(wù)的公司僵腺,其實(shí)并沒(méi)有真正的做到“數(shù)據(jù)驅(qū)動(dòng)”鲤孵,也許他只是一個(gè)“以數(shù)據(jù)為中心”進(jìn)行決策的公司,只是在利用數(shù)據(jù)辰如,并沒(méi)有真正實(shí)現(xiàn)數(shù)據(jù)的價(jià)值普监。
“以數(shù)據(jù)為中心進(jìn)行決策”的方式與“數(shù)據(jù)驅(qū)動(dòng)”相比,他沒(méi)有“數(shù)據(jù)驅(qū)動(dòng)”那樣的智能琉兜,也沒(méi)有“數(shù)據(jù)驅(qū)動(dòng)”那樣的高效凯正。“以數(shù)據(jù)為中心進(jìn)行決策”顧名思義就是用數(shù)據(jù)來(lái)支持決策豌蟋,這些數(shù)據(jù)包括歷史記錄中的和現(xiàn)在產(chǎn)生的廊散。通過(guò)對(duì)數(shù)據(jù)的整理、抽取梧疲,將數(shù)據(jù)轉(zhuǎn)化為可讀的知識(shí)允睹,形成分析結(jié)果,決策者根據(jù)分析報(bào)告的結(jié)果考慮并決定決策結(jié)果幌氮,最終決策由人為參與缭受。
舉一個(gè)簡(jiǎn)單的例子,假設(shè)有A 和 B兩家訂票網(wǎng)站浩销,A 公司將從網(wǎng)站收集到的數(shù)據(jù)進(jìn)行分析贯涎,通過(guò)數(shù)據(jù)分析結(jié)果認(rèn)為五一是出行高峰,于是決定抬高價(jià)格慢洋,并手動(dòng)從后臺(tái)調(diào)整了五一前后的機(jī)票價(jià)格和酒店價(jià)格塘雳。
B 公司則通過(guò)自動(dòng)化手段實(shí)時(shí)收集陆盘、分析相關(guān)信息,總結(jié)規(guī)律败明,形成智能模型隘马,當(dāng)用戶進(jìn)行搜索時(shí),后臺(tái)自動(dòng)根據(jù)模型規(guī)則妻顶,對(duì)價(jià)格進(jìn)行調(diào)整酸员。
這2個(gè)公司,哪家是數(shù)據(jù)驅(qū)動(dòng)型的公司呢讳嘱?
顯而易見(jiàn)幔嗦,公司 B 是數(shù)據(jù)驅(qū)動(dòng)型的公司,而公司 A 則是一家“以數(shù)據(jù)為中心進(jìn)行決策”的公司沥潭。
“以數(shù)據(jù)為中心進(jìn)行決策”的公司邀泉,表面上公司所有人員,如產(chǎn)品钝鸽、運(yùn)營(yíng)汇恤、技術(shù)、銷售都可以貢獻(xiàn)數(shù)據(jù)拔恰,也可以從數(shù)據(jù)里得出東西因谎,但中間做決策的是人。如 A 公司颜懊,最終由人來(lái)決定機(jī)票是否提價(jià)财岔。
數(shù)據(jù)即未來(lái)
那么該如何真正的打造一個(gè)“數(shù)據(jù)驅(qū)動(dòng)”的項(xiàng)目或公司呢?現(xiàn)在市面上關(guān)于大數(shù)據(jù)的書(shū)籍汗牛充棟饭冬,扔出去一塊磚也可以砸到N個(gè)大數(shù)據(jù)專家使鹅。但是數(shù)據(jù)科學(xué)作為一門嚴(yán)肅的新學(xué)科方興未艾,真正關(guān)于利用數(shù)據(jù)科學(xué)的方法論解決實(shí)際工作中的數(shù)據(jù)科學(xué)問(wèn)題的實(shí)踐書(shū)籍少之又少昌抠。Brian Godsy(布瑞恩·戈德西)在他的《數(shù)據(jù)即未來(lái)》一書(shū)詳細(xì)介紹了數(shù)據(jù)科學(xué)項(xiàng)目的三個(gè)階段:
1、準(zhǔn)備階段進(jìn)行信息收集鲁僚;
2炊苫、構(gòu)建階段將計(jì)劃付諸行動(dòng),利用準(zhǔn)備階段獲得的信息以及相關(guān)統(tǒng)計(jì)和軟件提供的可用工具來(lái)構(gòu)建產(chǎn)品冰沙;
3侨艾、交付階段進(jìn)行產(chǎn)品的交付、反饋及修改等拓挥。
書(shū)中還會(huì)教你如何預(yù)見(jiàn)問(wèn)題以及如何處理不確定性唠梨,一步步引導(dǎo)你完成軟件和科學(xué)思維的最佳實(shí)踐,堪稱“數(shù)據(jù)驅(qū)動(dòng)”方面的扛鼎之作〗钠。現(xiàn)在他的中文譯版《數(shù)據(jù)即未來(lái)》即將在京東發(fā)售当叭。
中文版譯者陳斌茬故,先后譯有《架構(gòu)即未來(lái)》、《架構(gòu)真經(jīng)》等書(shū)蚁鳖,其中《架構(gòu)即未來(lái)》還得到了CCTV2《第一時(shí)間》欄目的大力推薦磺芭。希望這本《數(shù)據(jù)即未來(lái)》能為更多想要在數(shù)據(jù)領(lǐng)域有所研究的人提供幫助。