KeyQuestions

1、隨機采集實時流數(shù)據(jù) 如何保證隨機性且概率均等?
http://wenda.chinahadoop.cn/question/383
2刨沦、從左上角到右下角 每個格子權(quán)重不一 如何路徑最短?
3、反轉(zhuǎn)鏈表稻扬?
4、數(shù)組元素 最快查詢個數(shù)時間羊瘩?
5泰佳、離散數(shù)據(jù) 用在Wide&Deep的哪一側(cè)?
6尘吗、LightGBM為啥快逝她?
GBDT 準確率高 一次 二次;
XGBoost:連續(xù)型睬捶;分割點黔宛;信息增益率 信息增益 基尼系數(shù);
普通決策樹 分桶擒贸;倆桶臀晃?
XGBoost 連續(xù) 排序 唯一值 0123--100相鄰中值切割點;窮舉介劫;數(shù)據(jù)集中值徽惋;
Wide 離散;LR:連續(xù)值離散化座韵;
7险绘、梯度下降一階 牛頓法二階導數(shù);深度學習:變形誉碴;
先用梯度下降 最優(yōu) 慢宦棺;Adam跑大概范圍 梯度下降;
7翔烁、AUC模型訓練中 迭代如何計算渺氧?ROC曲線如何形成?
卡定不同閾值-指標 訓練集總樣本 概率 0-1 正例 假陽性真陽性蹬屹;
0.7-0.8AUC 卡定不同閾值 輸出不同結(jié)果的平均侣背;
8、ALS與ALSW2有啥區(qū)別慨默?
9贩耐、ALS的優(yōu)化方法?
10厦取、模型評估潮太,ctr瀏覽時長等價打分數(shù)據(jù)如何使用?
用戶正樣本;負樣本铡买;
規(guī)則 同類的 過濾更鲁;

11、兩個字符串 最長子串奇钞?
12澡为、Gini原理?交叉熵景埃?信息熵媒至?
不確定性 混亂程度 不純度;分類中谷徙?分類好壞拒啰?
兩個分布的差異 分類后的 與真實的;
數(shù)據(jù)間差異程度完慧?根據(jù)某個指標 一堆-兩堆谋旦; 每一堆數(shù)據(jù)各自的差異度 加權(quán);
13骗随、為啥用FTRL優(yōu)化Wide蛤织?
14、DeepFM與WideFM哪個好 為啥鸿染?
15指蚜、隨機森林與XGBoost?
Bagging并行 多個決策樹 均值涨椒;
XGBoost 決策樹 擬合前幾輪預測殘差 Boosting摊鸡;殘差;
LightGBM 子過程并行 但仍是Boosting蚕冬;
Stacking:Bag基礎(chǔ)上改進免猾,投票預測結(jié)果,家模型
16囤热、KCNN原理猎提?這里為啥選擇卷積?注意力網(wǎng)絡(luò)旁蔼;
17锨苏、對于用戶行為數(shù)據(jù)如何處理?空白數(shù)據(jù)棺聊?如何提高置信伞租?
18、LSH怎么工作限佩?輸入輸出是啥葵诈?內(nèi)容輸入啥裸弦?用戶輸入哪些?
19作喘、如何過擬合理疙?
20、講講Word2Vec中 cbow與skip-gram模型徊都?
21沪斟、深度模型訓練時广辰,初始化權(quán)重可以為0嗎暇矫?為啥?
22择吊、DropOut李根?還有啥?
BN:batch normolization; 每層計算后 結(jié)果分布 每層正態(tài) 前一層正態(tài) 本層正態(tài)几睛;

23房轿、Spark如何按照某字段groupby?如何統(tǒng)計TopK?
24所森、Kafka如何實現(xiàn)數(shù)據(jù)同步囱持?Partition?參數(shù)含義要把握焕济!
25纷妆、離線召回?排序晴弃?調(diào)用模型還是數(shù)據(jù)表掩幢?服務(wù)部署?調(diào)度邏輯順序上鞠?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末际邻,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子芍阎,更是在濱河造成了極大的恐慌世曾,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件谴咸,死亡現(xiàn)場離奇詭異轮听,居然都是意外死亡,警方通過查閱死者的電腦和手機寿冕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進店門蕊程,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人驼唱,你說我怎么就攤上這事藻茂。” “怎么了?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵辨赐,是天一觀的道長优俘。 經(jīng)常有香客問我,道長掀序,這世上最難降的妖魔是什么帆焕? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮不恭,結(jié)果婚禮上叶雹,老公的妹妹穿的比我還像新娘。我一直安慰自己换吧,他們只是感情好折晦,可當我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著沾瓦,像睡著了一般满着。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上贯莺,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天风喇,我揣著相機與錄音,去河邊找鬼缕探。 笑死魂莫,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的撕蔼。 我是一名探鬼主播豁鲤,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼鲸沮!你這毒婦竟也來了琳骡?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤讼溺,失蹤者是張志新(化名)和其女友劉穎楣号,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體怒坯,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡炫狱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了剔猿。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片视译。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖归敬,靈堂內(nèi)的尸體忽然破棺而出酷含,到底是詐尸還是另有隱情鄙早,我是刑警寧澤,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布椅亚,位于F島的核電站限番,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏呀舔。R本人自食惡果不足惜弥虐,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望媚赖。 院中可真熱鬧霜瘪,春花似錦、人聲如沸省古。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽豺妓。三九已至,卻和暖如春布讹,著一層夾襖步出監(jiān)牢的瞬間琳拭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工描验, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留白嘁,地道東北人。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓膘流,卻偏偏與公主長得像絮缅,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子呼股,可洞房花燭夜當晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容