??此書來歷
? ? 這本書是我參加CSDN公眾號活動時贏取的姐扮,感謝小李以及我小伙伴們的援助~
??感受
? ? 1. 英文翻譯過來的書纸淮,看起來真別扭
? ? 2. 太久沒讀“枯燥的”科普讀物逢并,很難精心播歼,需要進一步修煉
??內(nèi)容
零 廉價改變一切
????#? 目前的“人工智能”其實是預(yù)測植旧,預(yù)測是根據(jù)你掌握的信息(數(shù)據(jù))漠趁,生成你未掌握的信息
? ? #? 預(yù)測成本下降會影響其他東西的價值:互補品(如數(shù)據(jù))價值升高佑菩,替代品(人類預(yù)測)價值降低盾沫。然而,廉價帶來的影響卻常常意想不到殿漠。例如赴精,計算變得廉價后,音樂CD行業(yè)由于數(shù)字音樂的興起而變得一蹶不振
? ? #? 計算機還不會思考绞幌,思考不會變的廉價
? ? #? 人工智能能協(xié)助組織執(zhí)行當前的戰(zhàn)略蕾哟,但當人工智能過于強大時,會促成戰(zhàn)略的改變莲蜘。例如谭确,如果亞馬遜可以預(yù)測購物者想買什么,就可以先寄后買票渠。2013年亞馬遜就申請了“預(yù)測性購物”的專利
第一部分 預(yù)測
? ? #? 預(yù)測除了生成未來的信息逐哈,還會生成現(xiàn)在和過去的信息。例如问顷,信用卡盜刷檢測
? ? #? 準確度的小幅提高可能有迷惑性昂秃。比如,準確度從80%提高到90%杜窄,幅度為從98%到99.9%的兩倍肠骆。然而,前者意味著錯誤率降到了2/3塞耕,后者意味著降到了1/20
? ? #? 回歸是根據(jù)過去發(fā)生的事件的平均值進行預(yù)測蚀腿,回歸模型渴望無偏差的結(jié)果。因此荷科,預(yù)測的足夠多唯咬,預(yù)測在平均概率下就是完全正確的。但無偏差的預(yù)測也并非完美
? ? #? 與回歸不同畏浆,機器學(xué)習(xí)的預(yù)測平均概率下可能是錯誤的胆胰,但允許偏差,以求減小方差
? ? #? ??預(yù)測無線電視客戶流失刻获,運用回歸模型的人會挑選影響因素蜀涨,而運用機器學(xué)習(xí)的人會將影響因素的選擇權(quán)交給了機器。因此,我們“意外的”發(fā)現(xiàn)厚柳,愛發(fā)大量短信氧枣、付費時間遲的人容易流失。而上述因素恰恰未被歸入回歸模型
? ? #? 數(shù)據(jù)是預(yù)測的互補品别垮,隨著預(yù)測變得廉價便监,數(shù)據(jù)的價值水漲船高
? ? #? 大數(shù)據(jù)熱的原因:人們希望數(shù)據(jù)能幫助減少不確定性,以及了解正發(fā)生的事情
? ? #? 要平衡獲取數(shù)據(jù)的成本碳想,與提高預(yù)測準確度的好處烧董,需要估算投資回報率
? ? #? 從統(tǒng)計角度看,數(shù)據(jù)收益遞減胧奔。每增加一個數(shù)據(jù)對預(yù)測的改善逊移,都比前一個小。例如龙填,第一百次測量胳泉,比第一萬次測量對預(yù)測提升更大
? ? #? 從經(jīng)濟角度上看,往大庫存中增加數(shù)據(jù)岩遗,或許比往小庫存中增加數(shù)據(jù)效果更好扇商。例如,就算只比競爭對手好一點點宿礁,也能獲得巨大的收益
? ? #? 亞當 · 斯密(Adam Smith)提出勞動分工的經(jīng)濟思想:根據(jù)相對優(yōu)勢來分配任務(wù)
? ? #? 即使是專業(yè)人士钳吟,人類也會過分看中凸顯信息,而忽視統(tǒng)計信息窘拯。例如,“存活率為90%”時更多醫(yī)生選擇手術(shù)坝茎,而“死亡率為10%”時更少醫(yī)生選擇手術(shù)涤姊。
? ? #? 世上存在“已知的已知”,“已知的未知”嗤放,“未知的已知”思喊,“未知的未知”
? ? #? 對于“已知的已知”,機器能提供更好地預(yù)測
? ? #? 對于“已知的未知”次酌,人類更擅長在數(shù)據(jù)極少時進行預(yù)測恨课。例如,美國總統(tǒng)選舉時岳服,候選人和環(huán)境隨時都在變化剂公,只提前幾天預(yù)測也很難做到。(不只是對于機器吊宋,人類亦然)
? ? #? 面對“未知的未知”纲辽,人和機器都會失敗。黑天鵝事件
? ? #? 面對“未知的已知”,例如拖吼,旺季需求多價格高鳞上,但錯誤歸因會讓人認為,價格高可以提升銷量
? ? #? 人和機器之間應(yīng)該恰當分工
? ? #? 預(yù)測的成本隨著應(yīng)用頻率而下降吊档,預(yù)測機器可以規(guī)母菀椋化擴展〉∨穑總而言之鬼贱,人類有認知,故可根據(jù)少量數(shù)據(jù)來預(yù)測拒名。機器則生成大部分常規(guī)預(yù)測吩愧,面對罕見情況時,要尋求人類協(xié)助增显。