《大數(shù)據(jù)時(shí)代》
一癞埠、思維變革
大數(shù)據(jù)和三個(gè)思維的轉(zhuǎn)變有關(guān)
1.要分析與某事物相關(guān)的“所有數(shù)據(jù)”状原,而不是依靠“少量樣本”
數(shù)據(jù)處理技術(shù)的進(jìn)步,讓樣本等于總體成為現(xiàn)實(shí)苗踪。大數(shù)據(jù)即指不用隨機(jī)分析法這樣的捷徑颠区,而采用所有數(shù)據(jù)的方法,而這較為有效通铲。比如毕莱,專門從事跨境匯款業(yè)務(wù)的XOOM公司,它對(duì)一筆交易的所有相關(guān)數(shù)據(jù)進(jìn)行分析测暗,系統(tǒng)曾因注意到用“發(fā)現(xiàn)卡”從新澤西州匯款的交易量比正常情況多而自動(dòng)啟動(dòng)報(bào)警央串,事實(shí)證明磨澡,確是犯罪集團(tuán)試圖詐騙碗啄。
2.人們樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不是精確性
大數(shù)據(jù)不僅讓人們不再期待精確性稳摄,也讓人們無法實(shí)現(xiàn)精確性——數(shù)據(jù)庫一般分散在多個(gè)硬盤和多臺(tái)電腦上稚字,一個(gè)記錄可能分開儲(chǔ)存在多個(gè)地方,同步更新不太現(xiàn)實(shí)厦酬。而當(dāng)數(shù)量規(guī)模夠大時(shí)胆描,確切的數(shù)量就沒那么重要了——想想社交帖閱讀量的標(biāo)示以及人們的心理:閱讀量1萬以上,就很少有人在乎最末的個(gè)位數(shù)了仗阅。如谷歌翻譯系統(tǒng)昌讲,為了訓(xùn)練計(jì)算機(jī),會(huì)吸收它能找到的所有翻譯——各類語言的公司網(wǎng)站减噪、聯(lián)合國和歐盟發(fā)布的官方文件的譯本短绸、迅讀項(xiàng)目中的書籍翻譯等,盡管其輸入源很混亂筹裕,但翻譯質(zhì)量更高醋闭,可翻譯的內(nèi)容更多了。
3.人們的思想發(fā)生了轉(zhuǎn)變朝卒,不再探究難以捉摸的因果關(guān)系证逻,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系
過去人們通過因果關(guān)系了解世界:比如感冒和不帶帽子;肚子不舒服和剛在某家飯店吃過飯……并不一定準(zhǔn)確抗斤。大數(shù)據(jù)時(shí)代囚企,理解世界不再需要建立在假設(shè)的基礎(chǔ)上丈咐,建立相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。
亞馬遜團(tuán)隊(duì)最初想通過分析“客戶之間的相似性”建立推薦系統(tǒng)洞拨,后來發(fā)現(xiàn)這非吵豆蓿瑣碎而無效,最后轉(zhuǎn)向“找到產(chǎn)品之間的關(guān)聯(lián)性”烦衣,這為亞馬遜帶來三分之一的銷售額歹河。沃爾瑪對(duì)包含每一個(gè)顧客的購物清單、消費(fèi)額花吟、具體購買時(shí)間秸歧、購買天氣的龐大數(shù)據(jù)庫進(jìn)行分析發(fā)現(xiàn),每當(dāng)在季節(jié)性颶風(fēng)來臨之前衅澈,不僅手電筒銷量增加键菱,某品牌蛋撻的銷量也增加了,沃爾瑪接下來會(huì)在同樣的天氣來臨前把庫存的蛋撻放在颶風(fēng)用品旁邊以增加銷量今布。
二经备、商業(yè)變革
1.理解數(shù)字化和數(shù)據(jù)化
數(shù)字化:谷歌把所有版權(quán)書籍通過掃描存入谷歌服務(wù)器的高分辨率數(shù)字圖像文件中,書本上的內(nèi)容變成了網(wǎng)絡(luò)上的數(shù)字文本部默,任何地方任何人都可以方便查閱侵蒙,然而這還需要用戶在浩瀚的內(nèi)容中尋覓自己需要的片段。
2.量化一切傅蹂,數(shù)據(jù)化的核心
1)文字變成數(shù)據(jù):人們可以用來閱讀纷闺,機(jī)器可以用之分析。
2)方位變成數(shù)據(jù):典型代表GPS份蝴,手機(jī)用戶地理位置的價(jià)值——根據(jù)他所居住的地點(diǎn)和要去的地方的預(yù)測(cè)數(shù)據(jù)犁功,為他定制廣告。
3)溝通變成數(shù)據(jù):FACEBOOK的“社交圖譜”婚夫;推特讓人們記錄和分享零散的想法讓情緒數(shù)據(jù)化得以實(shí)現(xiàn)……潛在用途如消費(fèi)信貸公司考慮開發(fā)以臉書社交圖譜為依據(jù)的信用評(píng)分——物以類聚浸卦,人以群分,一項(xiàng)研究表明案糙,個(gè)人償還債務(wù)的可能性和朋友會(huì)償還的可能性呈正相關(guān)限嫌。
4)萬物數(shù)據(jù)化:如觸感技術(shù)先導(dǎo)可以通過一個(gè)人的體重、站姿和走路方式確認(rèn)身份侍筛;將感應(yīng)器綁定到哮喘病人佩戴的呼吸器上萤皂,通過GPS定位,可以判斷環(huán)境對(duì)哮喘的影響等匣椰。
3.數(shù)據(jù)再利用
在數(shù)字化時(shí)代裆熙,數(shù)據(jù)是被交易的對(duì)象;大數(shù)據(jù)時(shí)代,數(shù)據(jù)將發(fā)揮潛在價(jià)值入录。對(duì)于組織來說蛤奥,應(yīng)收集盡可能多的使用數(shù)據(jù)并保存盡可能長的時(shí)間,同時(shí)在保留“延展性”權(quán)利的前提下與第三方分享僚稿,分得潛在價(jià)值一杯羹凡桥。
1)數(shù)據(jù)再利用:如移動(dòng)電話運(yùn)營商收集用戶位置信息傳輸電話信號(hào),調(diào)整網(wǎng)絡(luò)性能蚀同,而手機(jī)制造商可以用它來了解影響信號(hào)強(qiáng)度的因素缅刽,改善手機(jī)接收質(zhì)量,電話公司甚至創(chuàng)立獨(dú)立公司向零售商和買家出售其收集到的匿名用戶位置信息蠢络。
2)重組數(shù)據(jù):如房地產(chǎn)網(wǎng)站將房地產(chǎn)信息和價(jià)格添加在美國的社區(qū)地圖上衰猛,同時(shí)聚合大量信息,如社區(qū)近期的交易和物業(yè)規(guī)格刹孔,以此來預(yù)測(cè)區(qū)域內(nèi)具體每套住宅的價(jià)值啡省。
3)可擴(kuò)展數(shù)據(jù):攝像頭一直用于安全保衛(wèi),是一項(xiàng)成本支出髓霞,但還可以跟蹤購物客戶流和他們停留的位置卦睹,用來參考店面最佳布局并判斷營銷活動(dòng)的有效性。
4)數(shù)據(jù)的折舊值:如亞馬遜某客戶十年前購買了一本書方库,現(xiàn)在對(duì)這類書可能不感興趣结序,如果這個(gè)時(shí)候亞馬遜繼續(xù)用這個(gè)數(shù)據(jù)推薦其他相關(guān)書籍,則可能被質(zhì)疑薪捍。因此笼痹,亞馬遜利用時(shí)間及各種因素的復(fù)雜模型分離有用和無用的數(shù)據(jù)配喳,使得模型的“折舊率”更明顯酪穿。
5)數(shù)據(jù)廢氣:指用戶在線交互的副產(chǎn)品,包括瀏覽了哪些頁面晴裹、停留了多久被济、鼠標(biāo)光標(biāo)停留位置、輸入什么信息等涧团。如電子閱讀器捕捉讀者閱讀一頁或一節(jié)的時(shí)長只磷,是否畫線強(qiáng)調(diào)或者在空白處作筆記,通過記錄泌绣、聚集钮追,可以展示一些出版商和作者永遠(yuǎn)不可能知道的信息。
6)開放數(shù)據(jù):如奧巴馬開放政府?dāng)?shù)據(jù)的data.gov網(wǎng)站的建立阿迈。
4.給數(shù)據(jù)估值
數(shù)據(jù)被計(jì)入和品牌元媚、人才、戰(zhàn)略并列的無形資產(chǎn)范疇,其潛在價(jià)值被投資者注意刊棕,擁有數(shù)據(jù)或能輕松收集數(shù)據(jù)的公司股價(jià)上漲炭晒。價(jià)值利用最常見的可能性是將數(shù)據(jù)授權(quán)給第三方,給數(shù)據(jù)定價(jià)的市場(chǎng)已經(jīng)出現(xiàn)甥角,如冰島一家公司向人們提供聯(lián)合國网严、世界銀行和歐盟統(tǒng)計(jì)局等的免費(fèi)數(shù)據(jù)集,靠倒賣商業(yè)供應(yīng)商(市場(chǎng)研究公司)的數(shù)據(jù)來獲利嗤无。
5.大數(shù)據(jù)價(jià)值鏈的3大構(gòu)成
1)基于數(shù)據(jù)本身的公司:擁有或能夠收集大量數(shù)據(jù)震束,不一定能從中催生創(chuàng)新思想的節(jié)能那個(gè),如推特当犯,擁有海量數(shù)據(jù)驴一,但只能通過兩個(gè)獨(dú)立的公司授權(quán)給別人使用。
2)基于技能的公司:咨詢公司灶壶、技術(shù)供應(yīng)商肝断、分析公司,掌握專業(yè)技能但不一定擁有數(shù)據(jù)或提出數(shù)據(jù)創(chuàng)新性用途驰凛,如沃爾瑪?shù)臄?shù)據(jù)分析商天睿公司胸懈。
3)基于思維的公司:擁有挖掘數(shù)據(jù)價(jià)值的獨(dú)特想法,如JETPAC公司通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下次旅行的目的地恰响。
3.管理的變革
1)個(gè)人隱私保護(hù)趣钱,從個(gè)人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任。
2)個(gè)人可以并應(yīng)該為他們的行為而非傾向負(fù)責(zé)胚宦。
3)大數(shù)據(jù)需要被監(jiān)督并保持透明度以防變成一個(gè)“黑盒子”首有。
4)大數(shù)據(jù)算法師的崛起:來自計(jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)領(lǐng)域枢劝,是擔(dān)任大數(shù)據(jù)分析和預(yù)測(cè)的評(píng)估專家井联,必須保證公正和保密。他們可以評(píng)估數(shù)據(jù)源的挑選烙常,分析和預(yù)測(cè)工具的選取鹤盒,甚至包括運(yùn)算法則和模型,以及計(jì)算結(jié)果的解讀是否正確合理驼鞭。一旦出現(xiàn)爭議挣棕,他們有權(quán)考察與分析結(jié)果相關(guān)的運(yùn)算法則、統(tǒng)計(jì)方法以及數(shù)據(jù)集细燎。
5)反數(shù)據(jù)壟斷大亨:參考19世紀(jì)美國反壟斷的歷程玻驻,保護(hù)極具競爭力的大數(shù)據(jù)市場(chǎng)偿枕。
4.大數(shù)據(jù)和不確定性
大數(shù)據(jù)改變了人們的生活渐夸,能優(yōu)化、提高墓塌、高效化并最終捕捉住利益,但發(fā)明的火花往往存在于數(shù)據(jù)未顯示的信息之中访诱。科技再先進(jìn)也無法將世界上數(shù)據(jù)的總量盡數(shù)收集触菜,人們收集的數(shù)據(jù)不過是現(xiàn)實(shí)的投影涡相,大數(shù)據(jù)不能提供最終答案催蝗,它只提供參考答案喻旷。人類最偉大的地方正是運(yùn)算法和硅片沒有也無法揭示的東西牢屋,如信仰烙无、不確定性和創(chuàng)意。