Unix的哲學(xué)換一些關(guān)鍵詞姜胖,完全適用于機(jī)器學(xué)習(xí)硕并。
圖片發(fā)自簡(jiǎn)書App
原則1: 你無法斷定模型會(huì)在什么情況下失效。問題經(jīng)常出現(xiàn)在想不到的地方址愿,所以別急于胡亂找個(gè)地方調(diào)整參數(shù)和模型,除非你已經(jīng)證實(shí)那兒就是瓶頸所在冻璃。
原則2:分析响谓。在你沒對(duì)任務(wù)進(jìn)行分析,特別是沒找到關(guān)鍵問題之前俱饿,別去調(diào)參數(shù)或模型歌粥。
原則3:復(fù)雜的模型在小(方差信牟骸)或臟(噪聲多)的數(shù)據(jù)上通常不work失驶,而數(shù)據(jù)通常小或臟。復(fù)雜模型的參數(shù)很多枣购。除非你的數(shù)據(jù)大且凈嬉探,否則不要用復(fù)雜的模型(即使數(shù)據(jù)大且凈,也優(yōu)先考慮原則2)棉圈。
原則4:復(fù)雜的模型比簡(jiǎn)單模型更容易過擬合涩堤,難以調(diào)試。盡量使用簡(jiǎn)單的模型配合正確的數(shù)據(jù)分瘾。
原則5:數(shù)據(jù)壓倒一切胎围。如果已經(jīng)做了正確的數(shù)據(jù)處理并且把一切組織的井井有條,正確的模型也就不言自明了德召。機(jī)器學(xué)習(xí)的核心是數(shù)據(jù)白魂,而不是模型。
原則6:沒有原則6上岗。