錯誤(不精確)并不是大數據固有的特性九杂,它只是我們用來測量鸵贬、記錄和交流數據的工具或方法的一個缺陷祷嘶。如果說哪天技術變得完美無缺了屎媳,不精確的問題也就不復存在了夺溢。雖然說錯誤(不精確)是一個亟需我們去處理的現實問題,并且有可能長期存在烛谊,但擁有更大數據量所能帶來的商業(yè)利益遠遠超過增加一點精確性风响,所以我們通常不會花費大量力氣去提升有限的精確性。
亞馬遜網站的工程師對“書評家在線評論”及“大數據計算個性推薦”兩種不同的促銷手段做了測評丹禀,發(fā)現“大數據計算個性推薦”的銷售貢獻遠遠超過書評家状勤。在傳統思維中,銷售人員被告知他們需要了解客戶所做決定背后的真正原因双泪,因此專業(yè)技能和多年經驗受到高度重視持搜。但本案例說明,推薦算法模型可能不知道為什么喜歡海明威作品的客戶會購買菲茨杰拉德的書焙矛,但這似乎并不重要葫盼,重要的是銷量。現如今村斟,亞馬遜銷售額的三分之一都來自于它的個性化推薦系統贫导。所以,知道“是什么”就夠了蟆盹,沒必要知道“為什么”孩灯。在大數據時代,我們不必非得知道現象背后的原因逾滥,而是要讓數據自己“發(fā)聲”峰档。“重點不是找出因果關系寨昙,而是找出相關關系”面哥。