記錄一下自己所看的論文厕诡,后續(xù)會繼續(xù)更新一些model-based的論文閱讀記錄,歡迎交流蜓耻、討論(emmmmm蜡镶,我實在才疏學(xué)淺)雾袱。 論文:P Karkus,D Hsu,WS L...
IP屬地:山西
記錄一下自己所看的論文厕诡,后續(xù)會繼續(xù)更新一些model-based的論文閱讀記錄,歡迎交流蜓耻、討論(emmmmm蜡镶,我實在才疏學(xué)淺)雾袱。 論文:P Karkus,D Hsu,WS L...
雖然前段時間稍微了解過Policy Gradient,但后來發(fā)現(xiàn)自己對其原理的理解還有諸多模糊之處官还,于是希望重新梳理一番芹橡。Policy Gradient的基礎(chǔ)是強化學(xué)習(xí)理論,...