這本書儒拂,在我書柜里擱置了少說3年寸潦,直到這幾天才終于讀完了它。讀小說固然饒有趣味社痛,但是有時(shí)候讀一下偏理論的書籍也是不錯的见转。可惜有個(gè)略麻煩的事情就在于蒜哀,讀稍微理論的東西斩箫,有時(shí)候自己看了幾頁就已經(jīng)堅(jiān)持不住了。這本書就著這樣撵儿,在第一部分卡住乘客,一卡就是2年。
在談這本書的讀后感前淀歇,我讀完這本書后易核,我理解的大數(shù)據(jù)。簡單的理解浪默,“大數(shù)據(jù)”就是大量的數(shù)據(jù)牡直,海量的數(shù)據(jù)缀匕。什么叫做大量的數(shù)據(jù),幾百碰逸,幾千個(gè)數(shù)據(jù)可不能叫做大量的數(shù)據(jù)乡小,對一個(gè)事物只對應(yīng)幾個(gè)數(shù)據(jù)條目也不叫大量的數(shù)據(jù)。對應(yīng)一個(gè)事物饵史,可能存在著許多繁雜的满钟,甚至于我們認(rèn)為無聊無用的數(shù)據(jù),而且有量非常的大胳喷。如書中一開頭講到湃番,谷歌用了5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,用來分析是否能夠通過搜索這些人是否患上流感吭露。這些在我們平常人的眼里牵辣,
一是數(shù)據(jù)量大,5000萬條美國人最頻繁檢索詞條奴饮,那肯定是由龐大的檢索記錄數(shù)據(jù)庫進(jìn)行排序比較后得出的結(jié)果纬向。
二是數(shù)據(jù)比較無聊,5000萬條最頻繁檢索詞條除了他們希望知道的信息戴卜,一定還包括其他的東西逾条,而這些有時(shí)我們并不關(guān)心。
三感覺對照的兩個(gè)數(shù)據(jù)庫兩者沒太大聯(lián)系投剥。
四從檢索條目來判斷“人是否患上流感”讓人覺得相關(guān)性不是很大师脂。可是在分析之后江锨,卻發(fā)現(xiàn)吃警,某些詞條被搜索,這個(gè)人就很可能患上流感啄育。相關(guān)性非常地高酌心。
這本書讓我印象最深刻的有2個(gè)說法:
1、在計(jì)算機(jī)時(shí)代數(shù)據(jù)存儲和處理能力已經(jīng)大大加強(qiáng)挑豌,數(shù)據(jù)已經(jīng)從過去追求精確性安券,改成混雜性;數(shù)據(jù)也從以前追求因果關(guān)系氓英,改為相關(guān)關(guān)系侯勉。
這個(gè)其實(shí)和金融方面關(guān)于市場有效性成立的獨(dú)立理性偏差假設(shè)(指不要求所有投資者都是理性的,但他們的偏差可以大體抵消)描述優(yōu)點(diǎn)類似铝阐。當(dāng)數(shù)據(jù)量從少量到非常大的時(shí)候址貌,混雜有偏差的數(shù)據(jù),最后能夠得出相對正確的結(jié)論,就是由于這些偏差能夠互相抵消练对。
但是余舶,兩個(gè)相關(guān)性高的事物,卻不一定有因果關(guān)系锹淌。還是書里面開頭的例子,查找“哪些是治療咳嗽和發(fā)熱的藥物”等詞條的人很可能患上了流感赠制,這說明查找這個(gè)搜索條目和流感是有強(qiáng)相關(guān)性的赂摆。但是這些患者不是因?yàn)椴榱诉@些詞條才得了流感。
2钟些、由于數(shù)據(jù)正在被或被知悉或不被知悉的情形下被收集烟号,且有可能在不被知悉的情況下,被個(gè)人和企業(yè)使用數(shù)據(jù)政恍。隱私在大數(shù)據(jù)面前會失效汪拥。
我們的所有數(shù)據(jù)會被收集,包括但不限于我們的姓名地址篙耗,網(wǎng)購信息迫筑,我們刷卡記錄,我們在百度和谷歌進(jìn)行搜索時(shí)用過的搜索條宗弯「迹或許我們自己早已經(jīng)不記得我們使用過什么搜索條目,但是數(shù)據(jù)庫會幫我們記住蒙保。而不知不覺地辕棚,這些搜索條目可能會被第三方用于預(yù)測我們的行為,我們的需求邓厕。
我大膽設(shè)想逝嚎,這樣下去,或許某一天详恼,我們被某國拒簽补君,或許是由于某國的領(lǐng)事館除了審查我的身份,還利用他們所掌握到的數(shù)據(jù)庫昧互,查詢了我們以往的搜索條赚哗,我們的社交網(wǎng)絡(luò),然后通過大數(shù)據(jù)分析硅堆,來得出我們不應(yīng)當(dāng)批準(zhǔn)入境的結(jié)論屿储。
對于整本書來說,都在討論對于管理行為渐逃、商業(yè)行為和公共福利行為够掠。我們往往想知道“是什么”和“怎么辦”丁侄,而并不想過分探究“為什么”宝磨,在這種情況下舶胀,大數(shù)據(jù)能夠在很大程度上幫助我們祝旷。但是在合上書本以后,我認(rèn)為在一部分領(lǐng)域里竖哩,我們需要有一個(gè)“為什么”的精神哭廉。這樣,我們才有希望走的更遠(yuǎn)相叁。