機(jī)器學(xué)習(xí)面試備忘

面經(jīng)

機(jī)器學(xué)習(xí)算法一定要推導(dǎo)!
面試地點(diǎn):字節(jié)跳動(dòng)-北京

面試官是一個(gè)技術(shù)部的大牛,基本是半英文交流的。首先給了一張紙去寫一個(gè)遞歸谜叹,然后開始問(wèn)算法相關(guān)的問(wèn)題,如Xgboost和GBDT搬葬、以及欠擬合和過(guò)擬合的解決方法荷腊。當(dāng)然截止目前,其實(shí)都還算是簡(jiǎn)單的急凰,最后女仰,最傷心的事情來(lái)了,推導(dǎo)算法抡锈!從最簡(jiǎn)單的決策樹C4.5開始疾忍,能推導(dǎo)出幾個(gè),加幾分床三。心態(tài)直接崩了一罩,好像只成功推導(dǎo)了C4.5,CART撇簿,HMM聂渊,LR,SVM差购,其他的都不成功。
面試官笑了笑汉嗽,也沒問(wèn)其他問(wèn)題欲逃,也沒讓我問(wèn)問(wèn)題,心很忐忑饼暑。過(guò)了一周左右稳析,我終于放心了,是真的涼了
面試官的問(wèn)題:

問(wèn)對(duì)于logistic regession問(wèn)題:prob(t|x)=1/(1+exp(w*x+b))且label y=0或1弓叛,請(qǐng)給出loss function和權(quán)重w的更新公式及推導(dǎo)迈着。
答這個(gè)題其實(shí)是BAT1000題中的一道,w的更新公式可以由最小化loss function得到邪码,也可以用極大似然函數(shù)方法求解,過(guò)程略...大家可以直接搜BAT面試1000題咬清。

面試知識(shí)點(diǎn)掌握

  1. 知識(shí)點(diǎn)梳理

https://github.com/shunliz/Machine-Learning

  1. 算法推導(dǎo)

https://shunliz.gitbooks.io/machine-learning/content/

附: 機(jī)器學(xué)習(xí)十大算法

http://panchuang.net/2018/09/17/%E6%96%B0%E6%89%8B%E5%85%A5%E9%97%A8%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%8D%81%E5%A4%A7%E7%AE%97%E6%B3%95/

  1. 如何選擇算法

微軟如何選擇 Azure 機(jī)器學(xué)習(xí)工作室算法:

https://docs.microsoft.com/zh-cn/azure/machine-learning/studio/algorithm-choice#algorithm-notes

機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)對(duì)比及選擇(匯總篇):

https://ask.hellobi.com/blog/shuzhiwuyu/19008

盤點(diǎn)最實(shí)用的機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)分析闭专,沒有比這篇說(shuō)得更好了:

https://cloud.tencent.com/developer/article/1111064

面試中常見問(wèn)題

softmax loss在遇到樣本不均衡的情況下,能夠做出那些改進(jìn)旧烧?
答focal loss, 加上temperature 或者 label smooth

算法相關(guān)的簡(jiǎn)單問(wèn)題(GBDT影钉、Xgboost等
Logistic Regression優(yōu)化方程的證明。

兩道算法題掘剪,手寫代碼平委。一道基于線性數(shù)據(jù)結(jié)構(gòu),一道基于樹形數(shù)據(jù)結(jié)構(gòu)

gbdt:

  • gbdt原理
  • gbdt推導(dǎo)
    • 公式分布推導(dǎo)
    • 殘差如何計(jì)算
    • 損失函數(shù)形式
    • 基于常見損失函數(shù)的公式推導(dǎo)
  • boosting體現(xiàn)在哪里
  • 非mse損失時(shí)-\nabla_{F_{m-1}}L(y_i,F_{m-1}(x_i))作為殘差近似值的數(shù)學(xué)意義
  • gbdt的weak learner是什么,為什么用CART回歸樹而不是分類樹(分類樹殘差相減沒有意義)
  • CART回歸樹
    • 節(jié)點(diǎn)分裂規(guī)則,寫出公式
    • 公式中每個(gè)值在實(shí)際訓(xùn)練中是怎么計(jì)算出來(lái)的,舉例子說(shuō)明
    • 連續(xù)變量節(jié)點(diǎn)如何劃分
    • 離散變量節(jié)點(diǎn)如何劃分
  • gbdt的訓(xùn)練過(guò)程
    • 做分類預(yù)測(cè)時(shí)如何訓(xùn)練
    • 做回歸預(yù)測(cè)時(shí)怎么訓(xùn)練
  • gbdt分類輸出
    • 輸出概率如何計(jì)算
    • 能否計(jì)算多分類, 是互斥多分類還是非互斥的?
    • 如果做互斥多分類,在哪一步改進(jìn)?
  • gbdt調(diào)參
    • 調(diào)過(guò)哪些參數(shù), 各有哪些作用
    • 重要參數(shù)為什么有這些作用?從原理出發(fā)講一下
    • gbdt里的subsample作用,為何可以提高泛化,和rf的采樣是否相同
    • rf里行采樣,列采樣解釋,作用
    • rf為什么要使得每棵樹不一樣,數(shù)學(xué)解釋
    • shrinkage作用
  • gbdt學(xué)習(xí)速率設(shè)置
    • 為什么設(shè)置學(xué)習(xí)速率可防止過(guò)擬合?
    • 深度學(xué)習(xí)中常見的學(xué)習(xí)速率設(shè)置方式有哪些? 數(shù)學(xué)公式
    • gbdt中學(xué)習(xí)速率是如何使用的?數(shù)學(xué)解釋
    • 通常合理設(shè)置學(xué)習(xí)速率模型會(huì)變好,原理是什么
  • gbdt+lr過(guò)程

lr:

  • 數(shù)學(xué)推導(dǎo), 求導(dǎo)
  • sigmoid why?

svm:

  • svm原理
  • 對(duì)偶作用
  • 推導(dǎo)公式

dnn, cnn:

  • 畫網(wǎng)絡(luò)結(jié)構(gòu)
  • 用到的激活函數(shù), relu好處
  • 優(yōu)化方法, 每種優(yōu)化的過(guò)程, 參數(shù)更新公式
  • 動(dòng)量
    • 可走出局部最小值原因? 數(shù)學(xué)解釋
    • 動(dòng)量為啥比mini-batch好: 數(shù)學(xué)解釋

正則:

  • l1, l2的作用
  • 為什么l1稀疏,l2權(quán)重衰減? 不能畫圖, 數(shù)學(xué)解釋

不均衡樣本:

  • 上采樣, 下采樣
  • easy-enesmble

多模型對(duì)比:

  • gbdt, xgboost, rf
  • lr, 線性模型

特征工程及模型評(píng)估:

  • 模型效果評(píng)估方式, ROC
  • 模型性能下降的改進(jìn)
  • 過(guò)擬合原因及改善
  • 特征篩選方式

關(guān)于GBDT重點(diǎn)關(guān)注一下:

  • Boosting算法Bagging算法介紹
  • GBDT基本原理
  • GBDT如何正則化
  • GBDT分裂規(guī)則
  • GBDT的“梯度提升”體現(xiàn)在那個(gè)階段
  • GBDT如何做特征選擇
  • GBDT為什么使用cart回歸樹而不是使用分類樹
  • 為什么GBDT的樹深度較RF通常都比較淺
  • GBDT那些部分可以并行
  • GBDT與RF的區(qū)別
  • GBDT與XGBoost的區(qū)別
  • xgboost/gbdt在調(diào)參時(shí)為什么樹的深度很少就能達(dá)到很高的精度夺谁?

這里有一份答案:
https://blog.csdn.net/xwl198937/article/details/79749048#gbdt%E4%B8%BA%E4%BB%80%E4%B9%88%E4%BD%BF%E7%94%A8cart%E5%9B%9E%E5%BD%92%E6%A0%91%E8%80%8C%E4%B8%8D%E6%98%AF%E4%BD%BF%E7%94%A8%E5%88%86%E7%B1%BB%E6%A0%91

工程算法:

  • 斐波那契數(shù)列非遞歸編程
  • 二叉樹遍歷
  • 中位數(shù)查找,不能對(duì)數(shù)組排序
  • 合并k個(gè)有序數(shù)組
  • 假設(shè)全球所有人都在一個(gè)矩形方格中廉赔,每個(gè)人有坐標(biāo)(xi,yi),距離每個(gè)人半徑為r的范圍中的總?cè)藬?shù)為Ci匾鸥,現(xiàn)在要求max(Ci)蜡塌,應(yīng)當(dāng)使用什么方法進(jìn)行處理?
  • 如果一個(gè)國(guó)家發(fā)行的鈔票面值都是斐波那契里的數(shù)字勿负,給s定一個(gè)物品價(jià)值n馏艾,問(wèn)購(gòu)買這個(gè)物品總共有多少種鈔票組合方式。
  • 這里重點(diǎn)關(guān)注回答里的算法問(wèn)題: 如何準(zhǔn)備機(jī)器學(xué)習(xí)工程師的面試 奴愉? - 姚凱飛的文章 - 知乎
    https://zhuanlan.zhihu.com/p/29969587

面試總結(jié):
https://www.cnblogs.com/ModifyRong/p/7744987.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末琅摩,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子锭硼,更是在濱河造成了極大的恐慌房资,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件账忘,死亡現(xiàn)場(chǎng)離奇詭異志膀,居然都是意外死亡熙宇,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門溉浙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)烫止,“玉大人,你說(shuō)我怎么就攤上這事戳稽」萑洌” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵惊奇,是天一觀的道長(zhǎng)互躬。 經(jīng)常有香客問(wèn)我,道長(zhǎng)颂郎,這世上最難降的妖魔是什么吼渡? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮乓序,結(jié)果婚禮上寺酪,老公的妹妹穿的比我還像新娘。我一直安慰自己替劈,他們只是感情好寄雀,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著陨献,像睡著了一般盒犹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上眨业,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天急膀,我揣著相機(jī)與錄音,去河邊找鬼龄捡。 笑死脖阵,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的墅茉。 我是一名探鬼主播命黔,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼就斤!你這毒婦竟也來(lái)了悍募?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤洋机,失蹤者是張志新(化名)和其女友劉穎坠宴,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绷旗,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡喜鼓,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年副砍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片庄岖。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡豁翎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出隅忿,到底是詐尸還是另有隱情心剥,我是刑警寧澤,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布背桐,位于F島的核電站优烧,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏链峭。R本人自食惡果不足惜畦娄,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望弊仪。 院中可真熱鬧纷责,春花似錦、人聲如沸撼短。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)曲横。三九已至,卻和暖如春不瓶,著一層夾襖步出監(jiān)牢的瞬間禾嫉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工蚊丐, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留熙参,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓麦备,卻偏偏與公主長(zhǎng)得像孽椰,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子凛篙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容