博主暫居英國倫敦佳簸,從事人工智能和物聯(lián)網(wǎng)相關(guān)工作。<br>歡迎關(guān)注我的微信公眾號“Tensorflow機(jī)器學(xué)習(xí)”逻谦。二維碼見下方微信圖標(biāo)掌实。<br>帶你掌握智能時(shí)代的“算法”,而不是成為這個(gè)時(shí)代的“數(shù)據(jù)”跨跨。
IP屬地:上海
強(qiáng)化學(xué)習(xí) 元素:actor(我們可以控制,決策我們的行為)齿兔,Env橱脸,Reward(我們不能控制環(huán)境)主要方法:model-baed(對Env建模,actor可以理解環(huán)境), ...