feiyu87 - 簡書

feiyu87

IP屬地：北京

Ubuntu 編碼問題
Windows 下的zip文件方法Ubuntu下亂碼树姨。讓Ubuntu支持gbk字符集查看系統(tǒng)支持的字符集 cat /usr/share/i...

1439 0 0
#David Silver Reinforcement Learning # 筆記4 MC-TD
本節(jié)主要介紹 Model-free prediction浪慌。從一個未知的MDP中估計出值函數笨触。 1. Monte-Carlo Reinforcem...

543 0 0

#David Silver Reinforcement Learning # 筆記3-DP
這節(jié)主要講了動態(tài)規(guī)劃在強化學習中的用法蕉扮。引入兩個問題的定義，Prediction篙螟，Control芹扭。Prediction：預測問題，MDP的信...

351 0 0
#ACL-2016#A Persona-Based Neural Conversation Model
問題：同樣的問題脓匿，不同的表述淘钟，生成的回復就不一致。方法：在seq2seq的的decoder 加入了用戶向量亦镶，類似詞向量日月，利用用戶帳號信息，如性...

568 0 0
#David Silver Reinforcement Learning # 筆記2-MDP
這節(jié)課同樣講的一些基礎概念缤骨，為之后的課程做鋪墊爱咬。馬爾科夫過程（Markov Processes） S是一個有限的狀態(tài)集合P是state之間的轉...

949 0 1
#David Silver Reinforcement Learning 筆記1#
這節(jié)課主要講了一些基本概念。強化學習的特點非監(jiān)督绊起，只需要一個獎勵R 獎勵是非即時的 agent 的actions 影響它后續(xù)的數據 1. R...

602 0 0
#NIPS-2015# Pointer Networks
Pointer Networks 論文地址：https://arxiv.org/abs/1506.03134 因為上一篇博客CopyNet引用了...

512 0 0

#ACL-2016# CopyNet
Incorporating Copying Mechanism in Sequence-to-Sequence Learning 作者來自香港大...

1332 0 0
Ubuntu 安裝
首先是ubuntu的安裝制作U盤啟動（windows下UltralSO工具制作）精拟。開機狂按F12(不同的機器，快捷鍵不同)，進入BIOS界面...

337 0 0