240 發(fā)簡信
IP屬地:山西
  • 請問這篇文章的代碼你復現(xiàn)了嗎锦庸,我復現(xiàn)的時候好多問問題她倘,當然主要是tensorflow版本問題狞洋,怎么都調(diào)不好

    QMDP-Net閱讀記錄

    記錄一下自己所看的論文,后續(xù)會繼續(xù)更新一些model-based的論文閱讀記錄矮燎,歡迎交流、討論(emmmmm,我實在才疏學淺)舞虱。 論文:P Karkus,D Hsu,WS L...

  • 120
    QMDP-Net閱讀記錄

    記錄一下自己所看的論文,后續(xù)會繼續(xù)更新一些model-based的論文閱讀記錄母市,歡迎交流矾兜、討論(emmmmm,我實在才疏學淺)患久。 論文:P Karkus,D Hsu,WS L...

  • 關于Policy Gradient的理解

    雖然前段時間稍微了解過Policy Gradient嫉髓,但后來發(fā)現(xiàn)自己對其原理的理解還有諸多模糊之處观腊,于是希望重新梳理一番邑闲。Policy Gradient的基礎是強化學習理論,...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品