這世界發(fā)展太快,記得87年我上大學(xué)時個人計算機還是很稀罕的物品钥弯,學(xué)計算機語言Fortran還是用的穿孔卡片,95年買的第一臺奔騰計算機幾乎花費一年工資。進(jìn)入21世紀(jì)谬返,隨著互聯(lián)網(wǎng)的發(fā)展智亮,世界很快從個人電腦發(fā)展為信息化時代酌呆。僅僅又過了10年榔幸,隨著網(wǎng)絡(luò)普及、移動互聯(lián)網(wǎng)飛速擴張篓吁、云計算和各類網(wǎng)絡(luò)應(yīng)用的發(fā)展茫因,人們發(fā)現(xiàn)網(wǎng)上各種數(shù)據(jù)是如此之多,而如果能分析挖掘杖剪,可以從中發(fā)現(xiàn)巨大價值冻押,因而出現(xiàn)了大數(shù)據(jù)技術(shù)驰贷。本書的副標(biāo)題生活、工作與思維的大變革洛巢,正說明了我們對大數(shù)據(jù)時代來臨的思考括袒,我覺得大數(shù)據(jù)是技術(shù),是方法稿茉,也是思維方式锹锰,更可能影響我們世界觀。
本書第一作者維克托?邁爾—舍恩伯格漓库,被譽為大數(shù)據(jù)時代的預(yù)言家恃慧,現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,對互聯(lián)網(wǎng)有著深入的研究米苹,是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與真糕伐。本書2013年由浙江人民出版社翻譯出版砰琢,知名IT評論人謝文評價“此書的一大貢獻(xiàn)就是在大數(shù)據(jù)方興未艾蘸嘶、眾說紛紜的時刻,進(jìn)一步闡述和厘清了大數(shù)據(jù)的基本概念和特點陪汽,這對許多以為大數(shù)據(jù)就是“數(shù)據(jù)大”的人來說很有幫助”训唱。作為在IT周邊打工人士,我早就知道有這么一部名著挚冤,只是一只沒有機會閱讀况增,不過現(xiàn)在看過以后,覺得也不是太晚训挡,還有很大幫助澳骤。
這本書沒有過多拘泥與技術(shù)細(xì)節(jié),也沒有難以理解的專業(yè)術(shù)語澜薄,但把大數(shù)據(jù)的來龍去脈为肮、價值、影響和發(fā)展前景講得都很清楚肤京,所以有評論說這是迄今為止(2013年)最好的一本專著颊艳。作者用兩個例子作為引言,說明了大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型忘分。這兩個例子我們都耳熟能詳了棋枕,一個是利用谷歌的搜索引擎預(yù)測流感,一個是根據(jù)海量航班機票歷史信息做出的機票價格預(yù)測系統(tǒng)妒峦。這兩個典型的例子說明世界正發(fā)生著我們以前所不知道的變化重斑,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式。
首先肯骇,大數(shù)據(jù)帶來的是思維變革】耍現(xiàn)在講大數(shù)據(jù)卤恳,通常大家都認(rèn)為有四大:數(shù)據(jù)量大、數(shù)據(jù)種類更雜寒矿、處理速度要求更快突琳、價值更大。大數(shù)據(jù)帶來的思維變革有三點符相,一是更多帶來不是隨機樣本拆融,而是全體數(shù)據(jù)。隨著網(wǎng)絡(luò)和各類傳感器的進(jìn)步啊终,我們得到的數(shù)據(jù)與以前相比不可同日而語镜豹,以前分析問題時總要考慮抽樣,用最少的數(shù)據(jù)獲得最多的信息±渡現(xiàn)在數(shù)據(jù)已經(jīng)不成為問題趟脂,只要需要,可以從很多渠道收集到例衍,要分析購物習(xí)慣昔期,只要把淘寶京東的客戶購物記錄拿過來就可以了。二是更雜佛玄,不是精確性硼一,而是混雜性。過去實驗或調(diào)查數(shù)據(jù)很少梦抢,我們執(zhí)著于精確性般贼,得到的數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)時代奥吩,95%的是非結(jié)構(gòu)化數(shù)據(jù)哼蛆,如果不接受混雜就無法被利用,必須接受適度的錯誤霞赫。這也發(fā)展出很多模糊算法腮介、混沌計算,如谷歌的翻譯绩脆、Facebook的標(biāo)簽等萤厅,也產(chǎn)生了新的數(shù)據(jù)處理架構(gòu)如hadoop,大數(shù)據(jù)告訴我們靴迫,每個問題只有一個答案是站不住腳的惕味,如果我們承認(rèn)這一點,就離真相又進(jìn)了一步玉锌。三是更好名挥,不是因果關(guān)系,而是相關(guān)關(guān)系主守。多少年來禀倔,人們一直在尋找事情后面的原因榄融,堅定的認(rèn)為有因必有果。但現(xiàn)在不需要了救湖,技術(shù)人員已經(jīng)讓數(shù)據(jù)自己說話了愧杯。也許事后人們會找出各種理由,但真正是這個理由嗎?亞馬遜的圖書推薦系統(tǒng)非常有效率鞋既,它不知道你為什么喜歡某類書力九,但它知道你想買什么書,甚至是你將要買的下一本書邑闺,經(jīng)過多次改進(jìn)后跌前,推薦系統(tǒng)打敗了書評團隊,現(xiàn)在很多商業(yè)網(wǎng)站都在使用類似的系統(tǒng)陡舅。在大數(shù)據(jù)時代抵乓,更快也意味著更好,相關(guān)關(guān)系可以幫助我們更快捕捉現(xiàn)在和預(yù)測未來靶衍。
其次灾炭,大數(shù)據(jù)帶來了商業(yè)變革。既然數(shù)據(jù)蘊含著巨大的價值摊灭,來源就是一個重點咆贬。網(wǎng)絡(luò)信息技術(shù)關(guān)注的焦點一直在技術(shù)的不斷升級,突然發(fā)現(xiàn)原來數(shù)據(jù)才是核心帚呼。有個比喻,網(wǎng)絡(luò)信息系統(tǒng)是軀干皱蹦,信息數(shù)據(jù)就是流淌的血液煤杀,沒有數(shù)據(jù)就沒有生命。其實看看我們周圍沪哺,數(shù)據(jù)無處不在沈自,每個人每件物品每時每刻都在產(chǎn)生數(shù)據(jù),看病購物行走辜妓,工廠交通醫(yī)院枯途,時間萬物都可數(shù)據(jù)化。數(shù)據(jù)就像一個神奇的鉆石礦籍滴,當(dāng)他的首要價值被發(fā)掘后仍能不斷給予酪夷。亞馬遜開始是為會計核算收集數(shù)據(jù),后來利用客戶購買的書籍和瀏覽過的網(wǎng)頁提供個性化建議孽惰,再后來就做起了廣告晚岭。谷歌也是如此。大數(shù)據(jù)價值鏈三大構(gòu)成勋功,基于數(shù)據(jù)本身坦报、技能和思維库说,最值錢的部分就是它自身。三者皆有就是其中的王者片择,如谷歌潜的、亞馬遜、淘寶字管、百度夏块。
最后大數(shù)據(jù)還帶來了管理變革。這一方面是好事纤掸,破案抓壞人變得更容易了脐供,對于管理者或政府來說,絕大多數(shù)事情都在掌握之中借跪,信息量和處理速度極大提高政己,可以做到分鐘級甚至秒級反應(yīng),交通調(diào)度比以前更靈活掏愁,雖然不能減少擁堵歇由,但能提供信息。但另一方面果港,對個人隱私的保護(hù)更加困難沦泌,也更加重要,位置辛掠、財務(wù)谢谦、習(xí)慣等,還可能關(guān)系到個人安全萝衩,這是責(zé)任與自由并舉的信息管理回挽。
凡是過去,皆為序曲猩谊。作者也認(rèn)為千劈,大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案牌捷,幫助是暫時的墙牌,而更好的方法和答案還在不久的未來。我覺得大數(shù)據(jù)技術(shù)暗甥、方法喜滨、思維改變了很多方面,雖然大數(shù)據(jù)不能解決所有問題淋袖,但如果你還沒有了解大數(shù)據(jù)鸿市,就可能無法理解這個時代。大數(shù)據(jù)時代是真正的信息社會,我們也已踏入這個時代焰情,只有擁抱融入陌凳,才能跟上時代的發(fā)展。