三周時間奇唤,終于將《大數(shù)據(jù)時代》讀完。
全書從兩部分來寫大數(shù)據(jù)時代對人社會的改變匹摇,第一是思維變革咬扇,第二是商業(yè)變革。
從思維變革上來說廊勃,第一懈贺,樣本=全體;傳統(tǒng)小數(shù)據(jù)的處理方法已不再適用坡垫。傳統(tǒng)的數(shù)據(jù)處理是對數(shù)據(jù)取樣梭灿,而大數(shù)據(jù)時代是對全體數(shù)據(jù)取樣,樣本=全體冰悠,傳統(tǒng)的數(shù)據(jù)量需要用復(fù)雜的算法才能準確預(yù)測堡妒,兒進入大數(shù)據(jù)時代大數(shù)據(jù)處理需要簡單地算法就可以準確預(yù)測。第二溉卓,混雜而非精確皮迟;傳統(tǒng)的數(shù)據(jù)庫要求單一的精確的數(shù)據(jù)格式搬泥,而這已經(jīng)不能滿足大數(shù)據(jù)時代,大數(shù)據(jù)万栅,不單單指數(shù)據(jù)量大佑钾,也只數(shù)據(jù)結(jié)構(gòu)復(fù)雜,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(結(jié)構(gòu)化查詢語言(SQL))就不再適用烦粒,而需要NOSQL休溶,非關(guān)系型數(shù)據(jù)庫。第三扰她,相關(guān)關(guān)系而不是因果關(guān)系兽掰; 讓數(shù)據(jù)自己發(fā)聲,不需要我們?nèi)ヌ綔y數(shù)據(jù)背后的原因徒役,而直接告訴我們事物的相關(guān)關(guān)系孽尽。雖然我們習(xí)慣于探尋因果關(guān)系,但實際上通過大數(shù)據(jù)我們可以更快速的建立相關(guān)關(guān)系忧勿,而對于因果關(guān)系杉女,我們很多時候耗費大量時間得到的也不一定是正確的。
從商業(yè)變革上來說鸳吸,我們處于信息(IT)時代熏挎,而直到目前,我們一直側(cè)重于T(技術(shù))變革晌砾,而現(xiàn)在以及未來的大數(shù)據(jù)時代坎拐,我們是該把目光聚焦于I(信息數(shù)據(jù))上了。未來社會养匈,一切皆可量化哼勇。而數(shù)據(jù)除了其本身的價值外,還可以進行二次利用呕乎,數(shù)據(jù)重組积担,數(shù)據(jù)創(chuàng)新。
大數(shù)據(jù)的商業(yè)價值鏈上猬仁,有三種類型的公司帝璧,第一,數(shù)據(jù)公司逐虚,即本身掌握了數(shù)據(jù)的公司;第二技術(shù)公司谆膳,即掌握了數(shù)據(jù)處理技術(shù)的公司叭爱;第三,思維創(chuàng)新公司漱病,即懂得通過處理數(shù)據(jù)達到服務(wù)未來的公司买雾。其實有點像金礦把曼,數(shù)據(jù)公司,就像金礦漓穿;技術(shù)公司嗤军,為掘金人;思維公司晃危,為將金子打磨為精美藝術(shù)品的工匠叙赚。哪一環(huán)都很重要,但作者認為最重要的是數(shù)據(jù)公司僚饭。
本書的最后震叮,也提到,隱私鳍鸵,數(shù)據(jù)的交叉復(fù)用苇瓣,會讓所有人的隱私曝光在大眾或者說首先商業(yè)公司面前。而在大數(shù)據(jù)時代偿乖,傳統(tǒng)的數(shù)據(jù)使用的告知和許可方法击罪,已不再可能實現(xiàn),這就需要立法規(guī)定數(shù)據(jù)使用者的責任贪薪。
另外媳禁,大數(shù)據(jù)時代才剛剛開啟,但是古掏,數(shù)據(jù)的利用如何能保證謹慎损话,文中提到,未來社會可能會因為數(shù)據(jù)預(yù)測某人會犯罪而逮捕某人槽唾,這樣從數(shù)據(jù)角度上來說預(yù)防犯罪事件發(fā)生上來說是沒有問題的丧枪,但是從人類自由意志上來說,在事情沒有發(fā)生之前就采取措施是明顯不妥的庞萍。
大數(shù)據(jù)時代只是我們目前預(yù)測的為未來提供的一個選擇拧烦,當然如何書寫還有待我們?nèi)ビH自實現(xiàn)。