大家好券腔,我是對白拘泞。
今天給大家分享一位大佬在Facebook做了四年機器學(xué)習(xí),又到CMU攻讀AI PhD的經(jīng)歷陪腌,希望給后續(xù)也想要深造的朋友們一點經(jīng)驗和幫助烟瞧,以下為原文染簇。
作者:SpadeAce?| 編輯:對白的算法屋https://zhuanlan.zhihu.com/p/519841457
不知不覺在 CMU 待了快一年了,時間過得可太快了卵洗。弥咪。。以前總覺得 PhD 五年時間很漫長聚至,實際上第一年已經(jīng)不知不覺溜走了,給人感覺也就過了一個月脆诉。贷币。击胜。第一年過得很開心役纹,然而感覺個人的成長卻沒有很多,主要還是自己花的時間不夠多辰斋,之后應(yīng)該更努力一些瘸味。
關(guān)于Research
我一直蠻明確自己的 research taste,想要做 “可以解決實際問題的 research旁仿,且方法是 principled,是 theoretically motivated 的”汁胆。這類 research 我總結(jié)一般有如下幾個步驟:
最近我們在 arxiv 上面 post 了一個我個人很喜歡的工作,這個工作主要解決的問題是:在推薦系統(tǒng)當(dāng)中损搬,因為 maximization bias 而導(dǎo)致的 prediction over-estimation 的問題柜与。雖然 maximization bias 在 RL 里面比較有名,我個人之前沒聽說過有誰意識到 maximization bias 也會導(dǎo)致推薦系統(tǒng)中的 prediction over-estimization弄匕。而我們解決這個問題的方法就是按照上面幾步曲來做的。
通過這個工作剩瓶,我深刻的認(rèn)識到了自己的不足:technical 水平(數(shù)學(xué)水平)實在差的太遠(yuǎn)。延曙。。上述的第一步第四步我都能比較自信的解決布疙,但是這第二步第三步有點超出我現(xiàn)在的能力范圍了愿卸。。擦酌。數(shù)學(xué)這東西也沒有什么捷徑,只能慢慢積累睁搭。希望之后幾年能提高我的 technical 水平笼平。
業(yè)界的方法VS學(xué)界的方法
可能是因為我工作過蠻長時間,我解決問題的思路和方法也都很業(yè)界:重解決問題寓调,而輕方法的 guarantee。我比較喜歡的解決 ML 問題 empirically 的方法論是:
回到上面 maximization bias 的例子。作為 engineer垮衷,一開始發(fā)現(xiàn)的問題就是上線的模型效果不好(prediction over-estimization)乖坠,但是并不知道是什么導(dǎo)致的。這時候就需要提出假設(shè):如果我們認(rèn)為每個 prediction 都有 variance瓤帚,那么之后的 selection step 就會導(dǎo)致那些被 over-estimated 的 prediction 更容易被選擇到涩赢,也就出現(xiàn)了 maximization bias轩勘。有了假設(shè)怯邪,實驗便很容易設(shè)計了:同時上線若干個類似的模型,可以發(fā)現(xiàn)每個模型只在自己 serve 的 traffic 上有 over estimation澄步,而在其他模型 serve 的 traffic 一直都是 well calibrated 的和泌。基于這個被驗證的假設(shè)武氓,解決方法可以參考 RL 里面經(jīng)典的方法,比如一個模型用來 select东羹,一個模型用來 predict忠烛。
到此為止,我覺得這是一個很好的業(yè)界解決 prediction over-estimization 的 empirical work:解釋清楚了這個現(xiàn)象的原因美尸,并提出了解決方法师坎。但是卻沒能更進一步:把問題抽象化,通過數(shù)學(xué)的方法進行分析屹耐,并提出更好的解決方案。我個人感覺這就是業(yè)界學(xué)界解決問題的方法的不同之處之一:業(yè)界解決完問題就結(jié)束了寿弱,不會進行更深入的思考按灶,也不會要求解決方法的數(shù)學(xué) guarantee,empirically 解決了問題就大功告成鸯旁。而學(xué)界常常要求進行深入思考量蕊,并對提出的方法有一些數(shù)學(xué)上 guarantee 的要求艇挨,至少要解釋清楚,這個方法什么時候 work势就,什么時候不 work脉漏,assumptions 是什么。如果沒有某些情況下的 guarantee侧巨,那么提出的方法顯得很 ad hoc,很難變得 convincing皇忿。我就常常在這一步被卡住烘贴,還需要好好提高 technical 水平。桨踪。。
業(yè)界給人帶來很多很好的實際問題锻离,學(xué)界給人帶來扎實的 technical 基礎(chǔ)汽纠,能夠使人不僅僅局限于最好想的 naive 的解決方法。以后要多去業(yè)界看看虱朵,積累好的問題;同時在學(xué)界踏下心來絮宁,夯實基礎(chǔ)服协。