最近在看王喆的知乎專欄骚揍,第三、四啰挪、十三篇都是Youtube的經(jīng)典論文DNN:https://zhuanlan.zhihu.com/p/52169...
好久沒寫了信不,看了一下中間隔了居然有一個(gè)月,這種沒有活水流入的生活亡呵,確實(shí)會讓人feel bad抽活; 這篇要講到DQN,主要是Nature2015那版...
Q-learning: 這里并不知道為啥每一輪都要初始化s锰什,但是在每一輪需要采取動(dòng)作的每一步(step)要做的事情如下: 根據(jù)epsilon-g...
from:http://www.reibang.com/p/295d7a8ebe48 都說要做強(qiáng)化學(xué)習(xí)先要搞明白馬爾可夫決策過程下硕,也還沒明白為...
通過上一節(jié)的zhihu鏈接明白了從這開始講ee,以及后面講rl的原因歇由,都是源自這個(gè)zhihu專欄:https://zhuanlan.zhihu....
bandit基礎(chǔ)看了一下并不是很難卵牍,先記錄一下,文集里沒有貼個(gè)公眾號地址吧:https://mp.weixin.qq.com/s?src=11&...
參考:http://www.reibang.com/p/6173dbde4f53 NCF全稱Neural Collaborative Filt...
文集里的下一篇是AUC沦泌,應(yīng)該也是我看的第一篇了糊昙,重新看了之后,梳理了一些易忘的和以前沒考慮過的谢谦,再拎出來寫一下释牺。 1.為什么AUC的最低值為0....
Deepfm是把FM和DNN并行了,但是其實(shí)FM和DNN還有一種串行模式回挽,接下來要講的這三種就是没咙; 先說PNN,老規(guī)矩先放圖(https://w...