百度
一面
TCP協(xié)議
C++里繼承的多態(tài)
- 概率題,6位數(shù)倒過來還是一樣的概率
- 從袋子里拿紅黑球
- 2xN的大方塊悠砚,用1x2和2x1填滿有多少種方法
- 找一個最長遞增子序列
- 判斷兩個二叉樹是否相等
- 判斷一個二叉樹是否是完全二叉樹
- 爬樓梯
- 二分查找
二面
- 快速排序
- 項目
- 有100億數(shù)據(jù),判斷出來那些是賭博的米奸?
12. 一個電腦昼接,1k內(nèi)存,讓我跑1T的數(shù)據(jù)
大數(shù)據(jù)的套路是:分解大問題悴晰,解決小問題辩棒,從局部最優(yōu)中選擇全局最優(yōu)。分解常用方法:hash(x)%膨疏,x為字符串/url/ip一睁,m為小問題數(shù)目。
UDP 協(xié)議是無連接的佃却,盡最大可能交付者吁,沒有擁塞控制,面向報文(對應(yīng)用程序傳下來的報文不合并也不拆分饲帅,只是添加UDP首部)
TCP協(xié)議是面向連接的复凳,提供可靠交付,有流量控制灶泵,擁塞控制育八,面向字節(jié)流(把應(yīng)用層傳下來的報文看成字節(jié)流)
美團(tuán)
1.爬樓梯
leetcode#70
# Top down - TLE
def climbStairs1(self, n):
if n == 1:
return 1
if n == 2:
return 2
return self.climbStairs(n-1)+self.climbStairs(n-2)
2 AUC含義?
對結(jié)果的概率按從大到小排序赦邻,依次取為閾值髓棋,計算結(jié)果中預(yù)測準(zhǔn)確和錯誤的概率分別作為橫縱坐標(biāo),繪制roc曲線惶洲,曲線之下的面積就是auc按声。
3 XGBoost原理
參考
XGBoost:Extreme Gradient Boosting
Boosting Tree最基本的部分是CART,使用平方損失函數(shù)擬合殘差為Adaboost恬吕,使用一階梯度擬合殘差為GBDT(利用損失函數(shù)的負(fù)梯度在當(dāng)前模型的值签则,作為回歸問題中提升書算法殘差的近似值)。
……
4 線上模型和線下模型的效果差異怎么解決铐料?
改變評估方法……
5 task渐裂,stage,job的關(guān)系
一個Job被拆分成若干個Stage钠惩,每個Stage執(zhí)行一些計算柒凉,產(chǎn)生一些中間結(jié)果。它們的目的是最終生成這個Job的計算結(jié)果妻柒。而每個Stage是一個task set扛拨,包含若干個task。Task是Spark中最小的工作單元举塔,在一個executor上完成一個特定的事情绑警。
6 action和transformation分別有哪些算子求泰?