大家好送丰,我是對(duì)白缔俄。
今天給大家分享一篇小伙伴的算法崗秋招總結(jié)文章,作者的背景是:1個(gè)騰訊實(shí)習(xí)、4個(gè)比賽俐载、2個(gè)項(xiàng)目蟹略、1篇CCF-A二作和CCF-C一作,雖然網(wǎng)易遏佣、快手和百度都掛了挖炬,華為還在池子里,但最終拿下騰訊和字節(jié)的offer状婶,希望能幫助到下半年準(zhǔn)備秋招的小伙伴們意敛,以下為原文。
一. 字節(jié)技術(shù)中臺(tái)
一面(通過(guò)):
算法題:刪除倒數(shù)第N個(gè)鏈表
面試題:
1膛虫、為什么要用尖括號(hào)標(biāo)記實(shí)體草姻,尖括號(hào)在BERT詞表中么,最好用unuse1字符稍刀;
2撩独、FastText和Word2vec的區(qū)別;
3账月、Xgboost和Adaboost综膀、GBDT、隨機(jī)森林局齿,隨機(jī)森林如何采樣剧劝;
4、怎么解決人工漏標(biāo)项炼、錯(cuò)標(biāo)担平,NER的損失函數(shù),關(guān)系抽取為什么用這個(gè)模型锭部,有調(diào)研其它模型么暂论;
二面(掛):
1、手撕編輯距離拌禾;
2取胎、Xgboost如何分裂,公式湃窍,樹(shù)的生成闻蛀;
3、邏輯回歸推導(dǎo)您市;
4觉痛、交叉熵;
5茵休、softmax薪棒;
二. 字節(jié)電商
一面(通過(guò)):
1手蝎、邏輯回歸求導(dǎo)、均方誤差和交叉熵的區(qū)別俐芯;
2棵介、防止欠擬合、過(guò)擬合吧史、梯度爆炸的方式邮辽;
3、BERT結(jié)構(gòu)贸营、transformer中feed forward的作用吨述;
4胧弛、self-attention的形式,為什么要除以根號(hào)d_k叙量;
5并徘、算法題:手撕kmeans,鏈表反轉(zhuǎn)接谨、撲克牌隨機(jī)分3堆,大小王在同一堆的概率;
6亿笤、圖最短路徑算法;
二面(通過(guò)):
1栋猖、比賽:為什么使用注意力機(jī)制净薛、介紹multi sample dropout;
2蒲拉、注意力機(jī)制為什么不用多頭肃拜;
3、矩陣相加和點(diǎn)乘雌团;
4燃领、SPU海量數(shù)據(jù)查重;
5锦援、softmax猛蔽;
6、手撕代碼:前k個(gè)相似整數(shù)灵寺、最長(zhǎng)不重復(fù)子串曼库;
三面(通過(guò)):
1、比賽略板;
2毁枯、實(shí)習(xí)項(xiàng)目;
3叮称、手撕代碼:堆排序种玛、組成某個(gè)值的硬幣種數(shù)(回溯)藐鹤、不相鄰子序列最大和;
三. 華為消費(fèi)者BG
?一面(通過(guò)):
1蒂誉、算法題:LeetCode 739 每日溫度教藻;
2、決策樹(shù)算法有哪些:ID3右锨、C4.5括堤、CART;
3绍移、TF-IDF特征悄窃;
4、BERT mask策略蹂窖,分別的作用轧抗;
5、多模態(tài)建模思路瞬测;
6横媚、上線部署時(shí)延要求,模型剪枝月趟、模型蒸餾灯蝴;
7、Transformer與LSTM相比孝宗,優(yōu)勢(shì)在哪穷躁;
8、Boosting算法的優(yōu)缺點(diǎn)因妇;
二面(通過(guò)):
1问潭、實(shí)習(xí)項(xiàng)目;
2婚被、為什么要finetune狡忙;
3、知識(shí)圖譜技術(shù)路線摔寨,信息抽取綜述去枷;
三面(通過(guò)):
問(wèn)的問(wèn)題跟HR差不多
四. 阿里本地生活(上海)
一面(通過(guò)):
1、實(shí)習(xí)項(xiàng)目是复,fusion層删顶,下一步如何優(yōu)化,如何處理長(zhǎng)文本淑廊;
2逗余、語(yǔ)言模型,Word2vec季惩,具體流程录粱,損失函數(shù)腻格,優(yōu)化算法(hierarchical softmax、negative sampling)啥繁;
3菜职、邏輯回歸損失函數(shù)為什么取log;
4旗闽、模型評(píng)估酬核,F(xiàn)1、ROC-AUC适室;
5嫡意、kmeans聚類,向量距離不適合用歐氏距離衡量捣辆,如何變換蔬螟;
6、CRF損失汽畴,實(shí)體識(shí)別有嘗試其他算法么旧巾,關(guān)系抽取閾值有選擇么;
五. 網(wǎng)易有道
一面(通過(guò)):
1忍些、介紹中文人機(jī)對(duì)話技術(shù)評(píng)測(cè)比賽菠齿,別的隊(duì)伍的優(yōu)點(diǎn);
2坐昙、介紹試題生成項(xiàng)目;
3芋忿、介紹BERT炸客、attention公式,為什么除以根號(hào)dk戈钢;
4痹仙、介紹AAAI的論文,負(fù)責(zé)哪部分殉了;
5开仰、手撕算法:最小k個(gè)數(shù)、移掉k位數(shù)字薪铜;
二面(通過(guò)):
1众弓、正則化有哪些;
2隔箍、深度神經(jīng)網(wǎng)絡(luò)為什么不使用sigmoid或tanh激活函數(shù)谓娃,什么情況下可以使用;
4蜒滩、Self-attention時(shí)間復(fù)雜度滨达;
5奶稠、手撕:循環(huán)遞增數(shù)組查找、self-attention實(shí)現(xiàn)捡遍;
三面(通過(guò))
1锌订、給你一個(gè)項(xiàng)目,描述下你的技術(shù)路線画株;
六. 百度知識(shí)圖譜
一面(通過(guò)):
1辆飘、Vggnet的Resnet的區(qū)別,Densenet污秆;
2劈猪、Transformer在哪些地方體現(xiàn)了共享和并行;
3良拼、is 和 ==區(qū)別战得;
4、re match 和 search庸推;
5常侦、range返回的是什么;
6贬媒、python內(nèi)存管理聋亡、淺拷貝和深拷貝;
7际乘、如何拼接字符串最高效坡倔;
8、手撕:二叉樹(shù)層序遍歷脖含、連續(xù)子數(shù)組乘積最大罪塔;
二面(通過(guò)):
1、docker原理养葵;
2征堪、手撕:LRU;
3关拒、場(chǎng)景題:給定一個(gè)文章佃蚜,如何識(shí)別出所有觀點(diǎn)(一個(gè)句子),如何識(shí)別出核心觀點(diǎn)着绊,如何識(shí)別出提出者
三面(通過(guò)):
1谐算、實(shí)習(xí)項(xiàng)目背景、難點(diǎn)分析畔柔;
2氯夷、給定一個(gè)文本,如何抽取aspect靶擦、opinion腮考、sentiment雇毫;
3、反問(wèn):部門規(guī)模踩蔚、氛圍棚放、交流,管理馅闽;
四面(通過(guò)):
1飘蚯、比賽負(fù)責(zé)什么,每個(gè)人的分工福也;
2局骤、情感識(shí)別的建模思路;
3暴凑、知識(shí)圖譜:項(xiàng)目背景峦甩,有考慮意圖識(shí)別么,實(shí)體消歧现喳,為什么用pipeline凯傲、不用joint;
4嗦篱、如果現(xiàn)在考慮的話該怎么提升模型性能冰单;
5、CRF和HMM的區(qū)別灸促,HMM解決哪三個(gè)問(wèn)題诫欠;
6、CRF基于條件分布建模是什么意思浴栽,什么條件呕诉;
7、維特比思路吃度,解決HMM的什么問(wèn)題;
8贴硫、詞向量發(fā)展歷史:one-hot椿每、NNLM、word2vec英遭、glove(推導(dǎo)公式)间护、fasttext、ELMO挖诸、CoVE(不了解)汁尺、GPT、BERT多律、ERNIE(清華的不了解)痴突、ERNIE 2.0搂蜓、Bert-wwm、Roberta辽装、Xlnet帮碰;