博主暫居英國倫敦,從事人工智能和物聯(lián)網(wǎng)相關(guān)工作壶辜。<br>歡迎關(guān)注我的微信公眾號“Tensorflow機(jī)器學(xué)習(xí)”。二維碼見下方微信圖標(biāo)洗出。<br>帶你掌握智能時代的“算法”士复,而不是成為這個時代的“數(shù)據(jù)”。
IP屬地:上海
強(qiáng)化學(xué)習(xí) 元素:actor(我們可以控制,決策我們的行為)蚌本,Env盔粹,Reward(我們不能控制環(huán)境)主要方法:model-baed(對Env建模,actor可以理解環(huán)境), ...