開篇記錄面試第四天

今天沒有面試,要準(zhǔn)備下周五的頭條的面試下愈。因?yàn)轭^條的JD里面有涉及到矩陣分解纽绍、GBDT、LTR势似、Word2vec拌夏、LSTM,所以決定簡單了解下矩陣分解履因、GBDT障簿、LTR,著重看下word2vec和LSTM搓逾。

矩陣分解

矩陣分解來自https://blog.csdn.net/qq_19446965/article/details/82079367
推薦系統(tǒng)中最為主流與經(jīng)典的技術(shù)之一是協(xié)同過濾技術(shù)(Collaborative Filtering)卷谈,它是基于這樣的假設(shè):用戶如果在過去對(duì)某些項(xiàng)目產(chǎn)生過興趣杯拐,那么將來他很可能依然對(duì)其保持熱忱霞篡。其中協(xié)同過濾技術(shù)又可根據(jù)是否采用了機(jī)器學(xué)習(xí)思想建模的不同劃分為基于內(nèi)存的協(xié)同過濾(Memory-based CF)與基于模型的協(xié)同過濾技術(shù)(Model-based CF)。其中基于模型的協(xié)同過濾技術(shù)中尤為矩陣分解(Matrix Factorization)技術(shù)最為普遍和流行端逼,因?yàn)樗目蓴U(kuò)展性極好并且易于實(shí)現(xiàn)朗兵,因此接下來我們將梳理下推薦系統(tǒng)中出現(xiàn)過的經(jīng)典的矩陣分解方法。
對(duì)于推薦系統(tǒng)來說存在兩大場景即評(píng)分預(yù)測(rating prediction)與Top-N推薦(item recommendation顶滩,item ranking)余掖。評(píng)分預(yù)測場景主要用于評(píng)價(jià)網(wǎng)站,比如用戶給自己看過的電影評(píng)多少分(MovieLens)礁鲁,或者用戶給自己看過的書籍評(píng)價(jià)多少分(Douban)盐欺。其中矩陣分解技術(shù)主要應(yīng)用于該場景。Top-N推薦場景主要用于購物網(wǎng)站或者一般拿不到顯式評(píng)分信息的網(wǎng)站仅醇,即通過用戶的隱式反饋信息來給用戶推薦一個(gè)可能感興趣的列表以供其參考冗美。其中該場景為排序任務(wù),因此需要排序模型來對(duì)其建模析二。因此粉洼,我們接下來更關(guān)心評(píng)分預(yù)測任務(wù)。
重點(diǎn):推薦系統(tǒng)的評(píng)分預(yù)測場景可看做是一個(gè)矩陣補(bǔ)全的游戲叶摄,矩陣補(bǔ)全是推薦系統(tǒng)的任務(wù)属韧,矩陣分解是其達(dá)到目的的手段。因此蛤吓,矩陣分解是為了更好的完成矩陣補(bǔ)全任務(wù)(欲其補(bǔ)全宵喂,先其分解之)。之所以可以利用矩陣分解來完成矩陣補(bǔ)全的操作会傲,那是因?yàn)榛谶@樣的假設(shè):假設(shè)UI矩陣是低秩的樊破,即在大千世界中愉棱,總會(huì)存在相似的人或物,即物以類聚哲戚,人以群分奔滑,然后我們可以利用兩個(gè)小矩陣相乘來還原它。
所以說重要的是用相似的人或物來補(bǔ)全矩陣顺少,以完成要推薦的任務(wù)朋其。

GBDT

文章內(nèi)容來自:https://blog.csdn.net/yyy430/article/details/85108797
GBDT(Gradient Boosting Decision Tree)是boosting系列算法中的一個(gè)代表算法,它是一種迭代的決策樹算法脆炎,由多棵決策樹組成梅猿,所有樹的結(jié)論累加起來作為最終答案。它的基本思想是根據(jù)當(dāng)前模型損失函數(shù)的負(fù)梯度信息來訓(xùn)練新加入的弱分類器秒裕,然后將訓(xùn)練好的弱分類器以累加的形式結(jié)合到現(xiàn)有模型中袱蚓。

word2vec

它是目前最常用的詞嵌入模型,也是一種淺層的神經(jīng)網(wǎng)絡(luò)模型几蜻,它有兩種網(wǎng)絡(luò)結(jié)構(gòu)喇潘,分別是CBOW和Skip-gram。
CBOW的目標(biāo)是通過上下午出現(xiàn)的詞語加權(quán)求和的方式預(yù)測當(dāng)前詞的生成概率梭稚,而skip-gram則是根據(jù)當(dāng)前詞來計(jì)算預(yù)測上下文中各詞的生成概率颖低。這里輸入都是經(jīng)過one-hot編碼的向量,N個(gè)詞就是把每個(gè)詞表示成一個(gè)N維向量弧烤,中間經(jīng)過與權(quán)重矩陣的相乘忱屑,得到輸出層的向量。輸出層應(yīng)用softmax激活函數(shù)暇昂,可以計(jì)算出每個(gè)單詞的生成概率莺戒。
訓(xùn)練權(quán)重的時(shí)候可以用反向傳播算法,每次迭代時(shí)將權(quán)重沿梯度更優(yōu)的方向進(jìn)行一小步更新急波。但是由于softmax激活函數(shù)中存在歸一化的緣故从铲,推導(dǎo)出來的迭代公式需要對(duì)詞匯表中的所有單詞進(jìn)行遍歷,是的每次迭代過程非常緩慢幔崖,由此產(chǎn)生了Hierarchical Softmax和Negative Sampling食店。

LSTM

RNN的結(jié)構(gòu)是當(dāng)前層的輸入也作為下層輸入的一部分,用這種結(jié)構(gòu)就可以解決序列的問題赏寇,但是隨著預(yù)測信息間的間隔增加吉嫩,RNNs就很難把它們關(guān)聯(lián)起來了,而LSTM可以嗅定。
時(shí)間關(guān)系自娩,LSTM就單獨(dú)再寫一篇吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市忙迁,隨后出現(xiàn)的幾起案子脐彩,更是在濱河造成了極大的恐慌,老刑警劉巖姊扔,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件惠奸,死亡現(xiàn)場離奇詭異,居然都是意外死亡恰梢,警方通過查閱死者的電腦和手機(jī)佛南,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嵌言,“玉大人嗅回,你說我怎么就攤上這事〈蒈睿” “怎么了绵载?”我有些...
    開封第一講書人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長苛白。 經(jīng)常有香客問我娃豹,道長,這世上最難降的妖魔是什么丸氛? 我笑而不...
    開封第一講書人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任培愁,我火速辦了婚禮著摔,結(jié)果婚禮上缓窜,老公的妹妹穿的比我還像新娘。我一直安慰自己谍咆,他們只是感情好禾锤,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著摹察,像睡著了一般恩掷。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上供嚎,一...
    開封第一講書人閱讀 51,198評(píng)論 1 299
  • 那天黄娘,我揣著相機(jī)與錄音,去河邊找鬼克滴。 笑死逼争,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的劝赔。 我是一名探鬼主播誓焦,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼着帽!你這毒婦竟也來了杂伟?” 一聲冷哼從身側(cè)響起移层,我...
    開封第一講書人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎赫粥,沒想到半個(gè)月后观话,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡越平,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年匪燕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片喧笔。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡帽驯,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出书闸,到底是詐尸還是另有隱情尼变,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布浆劲,位于F島的核電站嫌术,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏牌借。R本人自食惡果不足惜度气,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望膨报。 院中可真熱鬧磷籍,春花似錦、人聲如沸现柠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽够吩。三九已至比然,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間周循,已是汗流浹背强法。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留湾笛,地道東北人饮怯。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像迄本,于是被迫代替她去往敵國和親硕淑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354