我一直在思考,AI的熱潮到底能持續(xù)多久冲秽?為什么現(xiàn)在她如此熱舍咖,到底極限在哪里?
AI本次的熱潮是從06年深度學(xué)習(xí)問世并且證明自己開始在某個特定領(lǐng)域打敗一切其他對手開始(圖像識別與分類)锉桑。
那么為什么深度學(xué)習(xí)讓大家這么興奮排霉?
內(nèi)在原因來看,我們發(fā)現(xiàn)她做的比傳統(tǒng)方法好民轴,而且也比傳統(tǒng)方法成本更低攻柠。
從成本來看:以前某個任務(wù)需要 3 個工程師從清洗數(shù)據(jù)、找特征后裸、構(gòu)建模型瑰钮、訓(xùn)練與應(yīng)用,這些都跑完一個流程微驶,需要3個月浪谴。這還不算找特征、構(gòu)建模型這些工作需要很強的行業(yè)領(lǐng)域知識與工程經(jīng)驗因苹」冻埽總共消耗了9個人月。
而深度學(xué)習(xí)所做的就是扶檐,現(xiàn)在只需要一個工程師凶杖,清洗數(shù)據(jù)、構(gòu)建模型款筑、訓(xùn)練與應(yīng)用智蝠,可能只需要一個月,總共1個人月醋虏。
為什么寻咒?首先深度學(xué)習(xí)降低了找特征的成本,甚至可以說在某些時候可以把這個過程忽略颈嚼,在以前這個過程本身可能就需要3~5個人月的反復(fù)工程實驗毛秘。而清洗數(shù)據(jù)也更快了,因為深度學(xué)習(xí)的魯棒性更好(rubust)阻课,尤其是針對大數(shù)據(jù)的魯棒性(百萬條數(shù)據(jù))叫挟。如果放在2、3年前限煞,深度學(xué)習(xí)的訓(xùn)練與應(yīng)用所需要的時間成本也不低抹恳,可是現(xiàn)在無論是各種框架(Torch,Keras署驻,TensorFlow)也好奋献,還是各種工程經(jīng)驗也好健霹,都更加充足了,使得時間成本越來越低瓶蚂。
從外在原因來看糖埋,深度學(xué)習(xí)遇到了兩個機遇:1、GPU(顯卡)速度很快窃这,并且深度學(xué)習(xí)可利用瞳别,極大的降低了工程實驗成本;2杭攻、互聯(lián)網(wǎng)數(shù)據(jù)獲取越來越容易祟敛,數(shù)據(jù)量越來越大(傳統(tǒng)方法很難處理一些領(lǐng)域的大數(shù)據(jù))。
你需要知道的:
- 深度學(xué)習(xí)不是萬能藥兆解,她可能不會馆铁、至少短期不會在所有領(lǐng)域上大放異彩
- 深度學(xué)習(xí)同樣需要領(lǐng)域知識,處理文本和處理圖像的模型可以類似锅睛,但是細微差別就可能導(dǎo)致極大的不同叼架,而找到最合適的模型需要工程師本身就有很強的經(jīng)驗
- 深度學(xué)習(xí)并不昂貴,并且成本越來越低衣撬,前提是你知道你想要什么
- 深度學(xué)習(xí)需要其他各種知識與能力的配合,例如處理文本依然需要正則表達式扮饶,處理圖像與視頻具练,依然需要大量的相關(guān)知識
- 深度學(xué)習(xí)是機器學(xué)習(xí) + 大量的技巧與經(jīng)驗,深度學(xué)習(xí)實際并沒有超出機器學(xué)習(xí)范疇甜无,各種傳統(tǒng)的測試扛点、驗證方法必須要有;傳統(tǒng)的聚類岂丘、分類陵究、強化、回歸模型經(jīng)驗也要有奥帘;除此之外铜邮,還需要熟悉深度學(xué)習(xí)的各種訓(xùn)練技巧
你可能想嘗試的:
- 把問題總結(jié)好,尋找可能建模的點
- 假設(shè)你擁有一些數(shù)據(jù)寨蹋,人可以通過這些數(shù)據(jù)得出結(jié)論松蒜,深度學(xué)習(xí)可能也可以并且成本更低;假設(shè)你沒有數(shù)據(jù)已旧,或者人也無法僅僅從這些數(shù)據(jù)得到結(jié)論秸苗,那么深度學(xué)習(xí)很可能也無能為力
- 深度學(xué)習(xí)可能是一種低成本的嘗試點,不要太高估她运褪,不過至少你覺得有一點點可能性惊楼,最好咨詢相關(guān)專家玖瘸,成本可能沒有你想象的那么高