syat_e6da - 簡書

IP屬地：山西

Reinforcement Learning 重要性采樣和Prioritized Experience Replay
今天詳細(xì)閱讀了Prioritized Experience Replay這篇論文担猛，記錄下心得體會(huì)杜顺。 Introduction online RL...

744 0 0
論文閱讀：Graph Convolutional Reinforcement Learning
這篇論文主要介紹了DGN的算法鱼辙，在DQN的基礎(chǔ)上加了圖網(wǎng)絡(luò)禁添，用于狀態(tài)的融合纠炮。在多智能體環(huán)境下運(yùn)用嘉裤。relation kernel用的是self-...

2296 0 0

稀疏矩陣的4種存儲(chǔ)方式
COO[https://www.geeksforgeeks.org/sparse-matrix-representation/]CSR[http...

635 0 0
GCN在推薦系統(tǒng)中的應(yīng)用之GraphSage-based
GraphSage GraphSage是在論文Inductive Representation Learning on Large Graphs...

3316 0 0
GCN在推薦系統(tǒng)中的應(yīng)用
圖網(wǎng)絡(luò)（graph neural network槐瑞， GNN） Category： Recurrent Graph Neural Networks...

2511 0 0
為什么在分類問題中常用交叉熵而不是MSE或者平均誤差?
交叉熵可以在得到正確結(jié)果的同時(shí)衡量模型的好壞犹芹；交叉熵在模型不能很好擬合的似乎求的偏導(dǎo)大崎页，而模型擬合的差不多之后偏導(dǎo)變小。對(duì)比之下腰埂，MSE在訓(xùn)練...

1598 0 0
2020-12-07讀論文：A Heterogeneous Graph Neural Model for Cold-start Recommendation
這篇文章的主要貢獻(xiàn)點(diǎn)在于通過user-item interactions建立interactive graph飒焦，通過social network...

702 0 0

2020-12-03 - 2020-12-06 京東RL論文整理
把京東系的強(qiáng)化學(xué)習(xí)的論文復(fù)習(xí)整理一下。讀論文：Recommendations with Negative Feedback via Pairw...

474 0 0
2020-12-02學(xué)習(xí)筆記
讀論文：Reinforcement Learning to Rank in E-Commerce Search Engine: Formaliz...

332 0 0