本周二晚上協(xié)助指導(dǎo)的一名博士生Dr.周畢業(yè)請客吃飯。Dr.周和我不在同一個課題組姐仅,參加此次吃飯的部分人員我并不熟悉仗颈。經(jīng)介紹有兩名是今年7月剛上了一年課入所的研二學(xué)生,還有一名是明年7月畢業(yè)的博士生诸尽。聊天中獲得兩條引起我后來思考的信息原杂,第一條是,這兩名研二學(xué)生一個禮拜前剛剛參加國內(nèi)某公司舉辦的機器翻譯競賽您机,分別拿了中英翻譯和英中翻譯的第一名穿肄,獎金各30W年局。第二條信息是這位馬上畢業(yè)的博士,簽約某互聯(lián)網(wǎng)公司咸产,年薪50w起矢否。
這幾天我一直在思考:作為人工智能領(lǐng)域的技術(shù)從業(yè)者,在當(dāng)前這個AI熱潮時代如何保持長期可持續(xù)發(fā)展脑溢。自己從事這個領(lǐng)域也有十幾年僵朗,之前主要是做模式識別,只是因為個人感興趣屑彻,覺得它可以替代人的一部分重復(fù)勞動验庙,把人解放出來,往大了說算是生產(chǎn)工具的革新工作社牲。過去本領(lǐng)域入門和從業(yè)的思路基本是壶谒,先把領(lǐng)域內(nèi)經(jīng)典的文章好好看,重點算法自己親自實現(xiàn)膳沽,再跟蹤最新的算法汗菜,找到不足設(shè)計改進方案實驗再實驗,直到有好的結(jié)果發(fā)表文章或者應(yīng)用到系統(tǒng)或項目中挑社。從入門到熟練再到出好成果快的1-2年陨界,慢的2-3年。然而隨著這一波開源和神經(jīng)網(wǎng)絡(luò)技術(shù)的浪潮痛阻,有些規(guī)則在發(fā)生著潛移默化的變化:開源思想讓人工智能算法的實現(xiàn)和改進變得前所未有的便捷菌瘪,只要有編程的基礎(chǔ),大多數(shù)開源算法都可在一兩周左右掌握并再現(xiàn)算法的實驗結(jié)果阱当,無論是直接對算法進行應(yīng)用還是在當(dāng)前基礎(chǔ)上進一步改進創(chuàng)新俏扩,baseline的門檻都低了很多。神經(jīng)網(wǎng)絡(luò)尤其是深度神經(jīng)網(wǎng)絡(luò)技術(shù)弊添,讓算法的自適應(yīng)性大幅度提高录淡,盡管也需要參數(shù)調(diào)優(yōu),但模型的關(guān)鍵已變?yōu)槭欠駬碛泻A繕俗?shù)據(jù)和大規(guī)模計算資源油坝。這一點也是造成目前很多新的算法都先從產(chǎn)業(yè)界嫉戚,尤其是google、openAI澈圈、deepmind爆發(fā)的主要原因彬檀,他們因和用戶距離最近擁有更多數(shù)據(jù)且通過雄厚資本構(gòu)建普通企業(yè)無法企及的計算集群,從而在相同的AI算法探索方向上走的更快瞬女。而王者通吃的互聯(lián)網(wǎng)規(guī)律又進一步將這種優(yōu)勢放大窍帝,終于領(lǐng)域內(nèi)的選手一次又一次的在競爭中成為這些頂級AI公司的觀眾又無能為力。
而另外一個思考便是诽偷,神經(jīng)網(wǎng)絡(luò)技術(shù)的普適性和低門檻讓這個領(lǐng)域的經(jīng)驗積累變得可有可無坤学。過去多年學(xué)習(xí)的各種特征表示疯坤、分類理論與算法在深度神經(jīng)網(wǎng)絡(luò)面前顯得多余,任何一個領(lǐng)域收集足夠的數(shù)據(jù)利用基本的神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練便可很快取得基本可用程度的AI模型拥峦,優(yōu)化的門檻也低到多收集樣本贴膘,多跑實驗即可卖子。這兩天在NIPS大會上關(guān)于AI變成“煉金術(shù)”的爭論大概也是因為在這次AI浪潮中算法背后的理論被無情的拋棄略号,取而代之的是搭積木似的組合與數(shù)據(jù)驅(qū)動的計算資源pk。大公司當(dāng)然可以沿著有錢任性的實力比拼中繼續(xù)前行洋闽,而作為一直follow的二線從業(yè)者玄柠,在大公司背影漸行漸遠的路口,我們更好的選擇是什么呢诫舅?