重點(diǎn)梳理
機(jī)器學(xué)習(xí)
1麻车、如何解決樣本不均衡的問題?比如目標(biāo)檢測任務(wù)受裹,背景很多碌补,目標(biāo)很少,怎么辦棉饶?
https://blog.csdn.net/Jemila/article/details/77992967
2厦章、怎么數(shù)據(jù)增強(qiáng)?怎么對圖像進(jìn)行數(shù)據(jù)增強(qiáng)照藻?
3袜啃、如何解決過擬合的問題?
4幸缕、有哪些模型評(píng)價(jià)指標(biāo)群发?AUC取值范圍?(x2)
5冀值、參數(shù)更新方法有哪些也物?
6宫屠、手寫sigmoid函數(shù)的導(dǎo)數(shù)
7列疗、手寫邏輯斯蒂回歸,交叉熵?fù)p失函數(shù)的公式(x2)
8浪蹂、每個(gè)樣本有100維特征抵栈,標(biāo)簽是性別(男、女)坤次,用線性回歸和邏輯回歸分別分類古劲,哪種會(huì)好一些?兩者有什么特點(diǎn)缰猴?
9产艾、邏輯斯蒂回歸為什么用sigmoid函數(shù)?
10、二分類模型中負(fù)例很多如何解決闷堡?
11隘膘、SVM(不常見)
12、GBDT(重點(diǎn))
13杠览、XGBOOST
深度學(xué)習(xí)
1弯菊、手推梯度反向傳播公式
2、unet尺寸會(huì)變嗎踱阿?每一層連起來的時(shí)候尺寸不一樣怎么辦管钳?
3、激活函數(shù)有哪些软舌?激活函數(shù)對結(jié)果影響大嗎才漆?(重點(diǎn))
4、怎么理解dropout佛点?
5栽烂、自己一般怎么調(diào)參?調(diào)哪些參數(shù)恋脚?
6腺办、怎么理解卷積?算一下特征圖卷積后的大小
7糟描、你在訓(xùn)練網(wǎng)絡(luò)的時(shí)候用什么初始化方式怀喉?如果初始化時(shí)全為0會(huì)有什么問題?(參數(shù)全部相同)
8船响、一個(gè)神經(jīng)元躬拢,簡單手寫一下反向傳播的梯度更新公式
9、圖像局部特征提取算子是什么见间?介紹拉普拉斯算子(二階梯度)
10聊闯、l1和l2正則化的作用和區(qū)別,從梯度角度解釋
數(shù)據(jù)結(jié)構(gòu)米诉、C++基礎(chǔ)知識(shí)
1菱蔬、python、C++里list史侣、set拴泌、dict是怎么實(shí)現(xiàn)的?
https://blog.csdn.net/single_wolf_wolf/article/details/52854015
2惊橱、如果讓你用C++實(shí)現(xiàn)一個(gè)map蚪腐,你會(huì)怎么做?
3税朴、講到了散列函數(shù)回季,然后問會(huì)沖突嗎家制?沖突怎么處理
4、map的底層結(jié)構(gòu)泡一,為什么map的查找復(fù)雜度為O(1)慰丛?
5、malloc和new的區(qū)別瘾杭,解釋new的內(nèi)存分配機(jī)制
6诅病、解釋堆和棧的區(qū)別(內(nèi)存方面的堆和棧)
7、C++指針和引用的區(qū)別是什么粥烁?
8贤笆、用什么操作系統(tǒng)比較多?LINUX中什么命令可以得到文件夾下所有文件的數(shù)目
算法
1讨阻、講一下快速排序芥永,手寫快速排序,時(shí)間復(fù)雜度(x3)
2钝吮、有一個(gè)無序的數(shù)組埋涧,怎么找到數(shù)組第K大的數(shù)?用快速排序怎么做奇瘦?時(shí)間復(fù)雜度是多少棘催?
3、劍指offer原題耳标,找出數(shù)組中重復(fù)的數(shù)字醇坝,時(shí)間復(fù)雜度和空間復(fù)雜度最低
4、給定一個(gè)用戶點(diǎn)擊商品的日志文件(10億條記錄)次坡,格式形如
//userid, itemid, click_time
//要求計(jì)算點(diǎn)擊次數(shù)最多的N個(gè)商品 c++/java/python
5呼猪、跳臺(tái)階,一次只能跳一步或者兩步砸琅,求臺(tái)階數(shù)為n時(shí)宋距,總的方法數(shù)
6、跳臺(tái)階症脂,一次只能跳a步或者b步谚赎,b>a,求臺(tái)階數(shù)為n時(shí),總的方法數(shù)
7摊腋、算法題
struct list
{
? int val;
? bool deleted;
}
給定兩個(gè)unordered 的list數(shù)組沸版,合并數(shù)組, 如果該數(shù)的deleted為true,則合并數(shù)組里不能出現(xiàn)這個(gè)數(shù)兴蒸。
例:
數(shù)組1
1 deleted
2
1
3
4
數(shù)組2
2 delete
3
4
5
合并后應(yīng)該輸出:3 4 5
8、兩兩反轉(zhuǎn)鏈表的結(jié)點(diǎn)(遞歸和非遞歸)
9细办、算法題:在一個(gè)2*n的地面上鋪設(shè)瓷磚橙凳,有兩種一種是a 一種是b形狀的蕾殴,問一共有多少種鋪設(shè)方法。
10岛啸、pow(a,b) 注意邊界條件
11钓觉、LRU緩存
12、堆排序
開放性問題
1坚踩、你理解的圖像處理一般用CNN效果好的原因是什么荡灾?
2、你了解nlp嗎瞬铸?開始講nlp的例子批幌,然后問你怎么理解CNN為什么不適用于nlp?
3、你對現(xiàn)在市面上的推薦算法有什么了解嗓节,說一說你的體驗(yàn)
4荧缘、大概聊一聊協(xié)同過濾,目的是擴(kuò)展用戶視野拦宣,但是發(fā)現(xiàn)用戶點(diǎn)擊率不高截粗,所以現(xiàn)有的模型一般還是基于用戶的日志來做推薦,如果讓你建模鸵隧,你怎么保證擴(kuò)展視野的同時(shí)增加點(diǎn)擊率绸罗?
5、做過分類的項(xiàng)目嗎豆瘫?
6从诲、分割和超分的區(qū)別?
7靡羡、聽說過nvidia的DSR嗎系洛?
8、有什么要問面試官的嗎略步?
9描扯、假如現(xiàn)在我們已經(jīng)建立起了一個(gè)關(guān)于貓的抖音頻道,怎么來優(yōu)化模型趟薄?
10绽诚、假設(shè)抖音每天有1000萬的短視頻,每段15s杭煎,現(xiàn)在要把其中有貓的視頻都找出來恩够,有什么想法?分類用什么模型比較好羡铲?