![240](https://upload.jianshu.io/users/upload_avatars/8297658/4af29492-3f32-404c-b62d-be07b3b7a922.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
背景:只專注于單個模型可能會忽略一些相關(guān)任務(wù)中可能提升目標(biāo)任務(wù)的潛在信息新翎,通過進(jìn)行一定程度的共享不同任務(wù)之間的參數(shù)领突,可能會使原任務(wù)泛化更好提揍。廣義...
強(qiáng)化學(xué)習(xí) 元素:actor(我們可以控制虎韵,決策我們的行為),Env验烧,Reward(我們不能控制環(huán)境)主要方法:model-baed(對Env建模...
Unspervised learning主要任務(wù)目標(biāo)是發(fā)掘數(shù)據(jù)潛在有價值的結(jié)構(gòu)怜跑,主要分為clustering,dimentionality re...
神經(jīng)網(wǎng)絡(luò)構(gòu)建好锥腻,訓(xùn)練不出好的效果怎么辦嗦董?明明說好的擬合任意函數(shù)(一般連續(xù))(為什么?可以參考Neural Network and Deep Le...
David Silver說瘦黑,AI = RL + DL = Deep Reinforcement Learning他的課程:RL Cource b...
這次給大家介紹一下GAN的generalized framework京革。其實很多研究都是這樣,先找到一個比較直觀好理解方法幸斥,然后去研究他的框架匹摇,發(fā)...
為了后面介紹seqGAN + RL的應(yīng)用,先來介紹一下這個很火的GAN甲葬,火到似乎女媧上帝都是“干”出來的...稍提一點背景廊勃。統(tǒng)計機(jī)器學(xué)習(xí)中,這個...
Seq2Seq的資料很多经窖,這里就簡單介紹下吧坡垫。顧名思義,它就是一個sequence來預(yù)測另一個sequence的模型画侣,主要是一個encoder-...