2018NLP秋招求職記錄
總結
首先介紹一下背景勃教,博主來自大連理工大學私痹,計算機專業(yè)研究生脐嫂,研究方向主要是信息抽取、情感分析之類的侄榴。研究生期間一開始主要做實驗室的課題(生物文本挖掘之類)雹锣,后來又自己拓展了情感分析相關的課題,然后在18年6月參加了一個NLP的比賽癞蚕。所以我簡歷上的項目基本就是這幾個蕊爵,兩篇論文,一個比賽桦山。
秋招期間前后陸續(xù)面試了大概14家公司攒射,面的都是NLP工程師的崗位,拿到了9個offer恒水。其中拿到offer的公司有百度会放、網(wǎng)易、貝殼钉凌、知乎咧最、360、小米御雕、科大訊飛矢沿、東軟、vivo酸纲。
大概從7月份做完魔鏡杯之后就開始準備捣鲸,先刷了一遍劍指offer,然后做了LeetCode前100題里邊的中等和困難題闽坡,又針對自己的弱項研究了動態(tài)規(guī)劃栽惶、樹愁溜、搜索之類的專題,這些算是代碼題方面的準備外厂。另外因為我面的是自然語言處理冕象,所以機器學習算法也是免不掉了,我復習了下《統(tǒng)計學習方法》酣衷,推公式看到了隨機森林那一章交惯。從8月份開始就開始陸續(xù)的開始了內(nèi)推的面試,然后也是在面試的過程中不斷的發(fā)現(xiàn)自己的問題穿仪,一開始8月份的時候面試還是非常緊張的席爽,到了后面10月的時候就有些游刃有余了,面試時有時還能吹個牛啊片。下面我介紹一下各個公司的面試經(jīng)歷只锻,只為拋磚引玉,給大家一點啟發(fā)紫谷。
面試經(jīng)歷記錄
CVTE
CVTE是我最早面的一家齐饮,我也沒什么經(jīng)驗,所以在講述自己的工作的時候也沒什么底氣笤昨。有時候講完了還會加一句 “當然這個創(chuàng)新也不大”祖驱,“我覺得這樣是對的”之類的,感覺影響了跟面試官的溝通瞒窒。
一面 50分鐘
首先上來自我介紹捺僻,然后聊了一下論文〕绮茫基本上就是要把網(wǎng)絡結構給面試官講懂才行匕坯。然后他讓我講了一下模型里的self attention,gru的結構修改拔稳,還有各種attention的用法怎么做的葛峻。這里感覺其實面試官是非常懂這方面的,對于我的論文也有模型和解釋有牽強的感覺巴比。(這一段是我當時寫的术奖,我現(xiàn)在個人認為,面試官可能并不是太懂……)
接著又問我了一些比賽的情況轻绞,我講了一下比賽中的一些操作腰耙。包括stacking,用沒用特征工程铲球,除了論文里的模型還做了什么,stacking兩層分開訓練還是聯(lián)合訓練等等
最后是一些零散的問題
詞向量是作為網(wǎng)絡的哪一部分訓練的
講一下貝葉斯公式晰赞,先驗概率和后驗概率稼病。
二面
首先上來选侨,又是講論文。這次的面試官是個廣東腔很重的然走,我們經(jīng)吃疲互相聽不懂,交流起來比較困難芍瑞。
然后我就論文中的一點跟他撕了快半小時晨仑,他可能不是太懂深度學習,對網(wǎng)絡結構的靈活運用可能不是太理解拆檬,追著問為什么softmax能替代tanh洪己,問題是我這邊是做分類,并不存在替代了tanh的事竟贯。他最經(jīng)典一句話:“你好像對GRU經(jīng)典結構不是太了解”答捕,然后說了一堆完全錯誤的論斷……我結合GRU結構解釋,他又聽不懂……GG
阿里 菜鳥
阿里我投的是菜鳥的內(nèi)推屑那,崗位是自然語言處理拱镐。流程還是很快的,感覺很快就接到了面試持际。
一面 55分鐘
一面比較基礎沃琅,主要是了解一下簡歷上寫的內(nèi)容。
我簡歷上主要寫了一個比賽三篇論文蜘欲,他就讓我介紹了兩篇論文和比賽益眉。
中途他會打斷問一些細節(jié),并不見得多難芒填,但一定是和任務相關的呜叫,我猜是想判斷一下你相關項目的真實性。主要是我介紹網(wǎng)絡結構殿衰,他提一些他的建議朱庆,然后問有沒有考慮過這么做。阿里的面試官水平還是非常高的闷祥,提的建議也是一針見血娱颊,很多思路我感覺對結果的提升很有幫助。
最后面試官讓我問問題凯砍,我問了一個特別傻x的問題:菜鳥需要NLP做什么……面試官:……然后一頓講解箱硕。然后讓我傳統(tǒng)機器學習的原理也要掌握。
阿里我只面了一面悟衩,后面二面的時候我在外面剧罩,想跟面試官推個時間,然后他就再也沒有打過來了……大概也是因為阿里投的多招的少座泳?不過阿里從來不約時間突擊打電話惠昔,簡直是考驗心理素質幕与。
百度 paddlepaddle
百度是在牛客網(wǎng)上找的內(nèi)推镇防,然后有HR聯(lián)系加微信約定面試時間啦鸣。這里必須夸一下百度,有HR全程負責面試的進度来氧,這個非常舒服了诫给。百度也是我八月份第一個拿到口頭offer的公司,部門是深度學習平臺部啦扬。
一面 50分鐘
主要還是介紹簡歷上寫的項目中狂,我主要的項目就是發(fā)表的論文,就給他介紹任務背景考传,然后講解網(wǎng)絡結構以及其中的一些創(chuàng)新吃型。他主要問了我self-attention的介紹以及self-attention直接用于序列建模的優(yōu)缺點。
然后是一些深度學習基礎問題僚楞,梯度消失的原因勤晚、網(wǎng)絡權重初始化的目的。
最后是一道代碼題泉褐,LeetCode上的赐写,找到矩陣左上角到右下角權重最大的路徑。
二面 50分鐘左右
上來先是在線編程膜赃,一個是寫二叉樹深度挺邀,另一個是二叉樹層次遍歷。結果我二叉樹深度那里寫的有問題跳座,面試官提醒我也沒看出來端铛,嚇得我一身冷汗。
然后就是繼續(xù)介紹項目疲眷,面試官可能更多是做開發(fā)的禾蚕,對深度學習不是特別了解,所以沒怎么提問狂丝。主要是問在項目中扮演的角色换淆,提升了多少之類的。再就是會不會C++啊這種的几颜。
在結束之間倍试,我感覺自己第一題沒答好,可能會跪蛋哭,強行自己主動要求再爭取一下县习,講了一下我的比賽經(jīng)歷,在比賽中復現(xiàn)論文的經(jīng)歷。然后就加問了我的一些調參經(jīng)驗躁愿、batch normalization之類的問題哈蝇。
三面 40分鐘左右
三面是部門的一個項目經(jīng)理。
上來先讓我介紹一下在實驗室一般都用哪些模型攘已,我就具體結合一個項目給他說了一個,他也沒怎么問問題怜跑。然后就是聊聊本科時候的經(jīng)歷样勃,有沒有開發(fā)經(jīng)驗、哪門課學得好這種的性芬。然后聊了聊人生規(guī)劃峡眶、談論了一下部門的一些工作和前景。你是怎么學習深度學習的植锉,學習生活中遇到壓力怎么解決……等一些問題辫樱。然后我倆都沒啥問題就結束了。
然后三面結束當晚HR發(fā)微信說技術面都ok了俊庇,這應該算是過了的意思狮暑?
百度整個面試流程體驗都非常好,就是后面校招組的處理有些讓人難過辉饱,八月份拿的提前批offer搬男,直到十月末才打電話,表示十一月末給發(fā)正式offer彭沼,評級和薪資也是最低一檔缔逛。雖然最后部門經(jīng)理給我打電話,評級提升了一級姓惑,工資也漲到了跟我其他的sp一個水平褐奴,但是已經(jīng)來不及了,我已經(jīng)簽了別的公司了于毙《囟總之也是非常遺憾。
vivo
vivo是在八月份有個內(nèi)推節(jié)望众,只要在官網(wǎng)投了簡歷就算內(nèi)推匪补,當時我在牛客上看很多人投了烂翰,就跟著投了一個夯缺,當時投了很多簡歷都沒有回應,也想先拿個offer甘耿。
一面
了解哪些模型
講一個項目
SRU聽說過嗎
最大連續(xù)子序列和
二面 HR面
評價一下自己
對vivo有什么了解
有女朋友嗎
想在哪里工作
vivo 總體來說難度還不是太大踊兜,最后拿到了北京的小sp,但是要求很快就要給結果確定去不去佳恬,所以我放棄了捏境。
搜狗桌面事業(yè)部
一面 50分鐘左右
首先是介紹自己的項目于游,她會針對項目中的一些技術展開提問,主要還是集中在attention這塊垫言》“總結一下每個論文的創(chuàng)新點之類的。
因為我做了一個問題相似度的比賽筷频,就針對這個問了一個場景題蚌成,如果知識庫中的問題沒有是否相似的標簽怎么辦?我想了好幾種標注標簽的方式(包括用戶對獲得答案滿意度作為標簽)都不對凛捏,最后她說是把答案相同的問題作為相似的問題担忧。
然后就讓我回去等通知了,一面沒有問算法題坯癣。不過很快約了二面視頻面瓶盛,估計代碼是逃不掉了。
二面
本來二面約的面試官臨時開會示罗,所以換了一個女面試官電話面試惩猫。
首先還是介紹項目,感覺她理解了項目的內(nèi)容鹉勒,不過似乎沒什么興趣帆锋,雖然聽的饒有興致。
后面就是問問題了禽额,LR過擬合該怎么解決锯厢,為什么用L1不用L2,模型的集成該什么情況下使用脯倒。
給我介紹一下詞向量实辑。
算法題:找股票合適的買入賣出時機,應該是個比較普遍的題藻丢,雖然我沒見過(補充:leetcode上的)剪撬。是個簡單的動態(tài)規(guī)劃,我說了下思路她覺得還行悠反。二面就結束了残黑。
搜狗二面之后就沒有消息了,應該是掛掉了斋否,總結了一下原因梨水,我覺得可能還是對于LR過擬合的問題沒有回答好,我當時認為只能使用L1正則化茵臭,但實際上L2正則化從理論上也是有道理的疫诽。確實可能沒達到要求。
貝殼找房
一面
一道貝葉斯概率題
然后聊項目
python 生成器、裝飾器的使用
attention模型了解哪些
給定一個分類器的混淆矩陣奇徒,判斷分類器的問題
二面
講幾個項目
有沒有在大數(shù)據(jù)上做過模型
聊人生
三面 HR面
評價自己
如何選擇公司
期望薪資是多少
有offer嗎
貝殼的整個面試流程也是非常的舒服雏亚,雖然必須現(xiàn)場面試,但是報銷路費摩钙。HR校招組也是耐心溝通罢低,整體的待遇什么的也都非常不錯。今年貝殼也正在擴張胖笛,所以招的人也非常多奕短。
網(wǎng)易有道
有道同樣是在牛客上找的提前批內(nèi)推匀钧,因為我不想去杭州,所以投的北京的谬返。網(wǎng)易的內(nèi)推也是需要筆試的之斯,
一面
似乎是因為筆試做得比較坑,一面提前批面試的時候遣铝,沒被叫去現(xiàn)場佑刷,只是線上視頻面試了一下。
LSTM每個時刻酿炸,有多少次乘法操作瘫絮。
一個均勻的木棒,隨機切成三段填硕,三段可以構成三角形的概率麦萤。
一個車站,平均每分鐘來一趟車扁眯,那么十分鐘都不來車的概率壮莹。
通過了一面之后,等待了半個月姻檀,安排了現(xiàn)場面試命满,來到了北京網(wǎng)易研發(fā)中心。
二面
介紹一下自己的項目绣版,對attention的理解胶台。
詳細講了一個項目,然后做了一個代碼題杂抽。
然后討論了一下平時網(wǎng)絡訓練的一些trick诈唬。(到現(xiàn)在才發(fā)現(xiàn),那會我的調參經(jīng)驗是多么的匱乏默怨。)
三面
三面是總監(jiān)面讯榕,主要跟我討論一個現(xiàn)實的業(yè)務,主要是作文自動批改的一個場景。
我主要從任務定義入手愚屁,然后針對其中一個子任務济竹,跟面試官討論了各種建模方式。(回想一下霎槐,其實也是面試官引導著我去思考存在的問題和解決方式送浊。)
四面 VP面
都讀了哪些最新論文
工作中怎么和同事溝通,怎么處理各方面的需求丘跌,如何處理多個任務并行的情況袭景。
怎么看待深度學習,怎么看待算法與工程闭树。
網(wǎng)易的整個面試流程也非常的愉快耸棒,當時后天就要去北京了 ,我還沒買到車票报辱,用搶票軟件好不容易搶到了与殃。到了北京手機還沒電了,借的街電充電寶還是壞的碍现。在西二旗附近差點沒找到網(wǎng)易公司幅疼。
小米人工智能與云平臺
小米的面試經(jīng)歷總體來說非常愉快,面試官都比較年輕昼接,而且態(tài)度也比較舒服爽篷,會引導你把話說完。
一面
講一個項目慢睡。
對基礎知識的考察逐工,比如常見的排序算法,單鏈表的一些操作等漂辐。
二面
介紹一下比賽當中的一些工作钻弄,然后挨個聊了幾個項目。
LSTM的公式者吁。
知乎宣講會
知乎來我們學校宣講窘俺,順便線下進行了面試。
一面
先簡單講一個項目复凳,因為面試官是做推薦算法的瘤泪,所以似乎對我做的NLP相關的不是太感冒,有個地方position embedding他的理解甚至略微有點回路清奇……好像在他眼里只有特征
然后問交叉熵為什么能做損失函數(shù)
以及在一個大樣本中如何無偏的采樣(我:GG)(理論基礎還是需要在日常研究學習中補充的)
代碼題是復制鏈表
二面
介紹了一下比賽育八,講了在比賽中用的各種模型对途。
問了我預測情感程度的話,會采用分類還是回歸髓棋。
代碼題是在K個排序鏈表中找第K小的元素实檀。
然后因為我說對attention非常了解惶洲,就讓我介紹了了解的各種attention。
順手還提問了LSTM膳犹、GRU為什么能解決梯度消失恬吕。
盡管知乎后面出了一些問題,但是就面試來說還是不錯的须床。最后面試官校友也是加了微信關心了我們的情況铐料,感謝。
科大訊飛
一面
挑一個項目講一下
你比賽訓練集多大
數(shù)據(jù)集有沒有做什么調整
深度學習的優(yōu)化方法講一下
你寫代碼咋樣
合肥北京怎么選擇
二面
講一個項目
說一下對NLP在現(xiàn)實場景中應用的看法
想做哪些工作
想在哪里工作
期望薪資
360信息安全部
360面試都是視頻面豺旬,一個上午連續(xù)三輪钠惩,也算是強度比較大了。而且他們那邊是所有人在一個屋里的族阅,所以超級吵篓跛。
一面
上來先是聊項目,給他講了一篇我的論文坦刀。然后他說你思路挺清晰的举塔,好我們做一道題吧(我:……)
給定一個正整數(shù)數(shù)組,有甲乙兩個人求泰,兩人輪流從數(shù)組中取數(shù),取數(shù)時只能從頭或尾選取计盒,問判斷甲會不會獲勝渴频。
我開始想的用貪心,面試官說不對北启;我開始往動態(tài)規(guī)劃上思考卜朗,然后在面試官的提示下,想了解決辦法然后寫了代碼咕村。
然后他又給我看了一堆公式场钉,我看了下是batch normolization的公式,然后讓我求導懈涛,結果我掉進坑里了逛万,gg
二面
二面面試官感覺不像是做AI相關的,他似乎不是太懂批钠,問的全是一些泛泛的問題宇植,之前這領域有哪些先進模型,你有哪些自己的思考之類的埋心。
三面
三面是個HR阿姨指郁,問我目前有哪些offer,怎么選擇拷呆,有哪些考慮闲坎。然后覺得這個部門做安全的疫粥,可能讓AI沒法大展身手,讓我做判斷的時候也要了解一些安全方面的東西腰懂,看看自己喜不喜歡梗逮。