fada_away - 簡書

fada_away

IP屬地：北京

Multi-task Learning(Review)多任務(wù)學(xué)習(xí)概述
背景：只專注于單個模型可能會忽略一些相關(guān)任務(wù)中可能提升目標(biāo)任務(wù)的潛在信息新翎，通過進(jìn)行一定程度的共享不同任務(wù)之間的參數(shù)领突，可能會使原任務(wù)泛化更好提揍。廣義...

1.3 10304 0 11
精簡強(qiáng)化學(xué)習(xí)總結(jié)
強(qiáng)化學(xué)習(xí) 元素：actor(我們可以控制虎韵，決策我們的行為)，Env验烧，Reward（我們不能控制環(huán)境）主要方法：model-baed（對Env建模...

0.7 19112 0 14

Generative Model（VAE1）
Unspervised learning主要任務(wù)目標(biāo)是發(fā)掘數(shù)據(jù)潛在有價值的結(jié)構(gòu)怜跑，主要分為clustering，dimentionality re...

1705 0 2
神經(jīng)網(wǎng)絡(luò)訓(xùn)練Trick
神經(jīng)網(wǎng)絡(luò)構(gòu)建好锥腻，訓(xùn)練不出好的效果怎么辦嗦董？明明說好的擬合任意函數(shù)(一般連續(xù))(為什么？可以參考Neural Network and Deep Le...

6039 1 5
Deep Reinforcement Learning簡介
David Silver說瘦黑，AI = RL + DL = Deep Reinforcement Learning他的課程：RL Cource b...

1664 0 1
【GAN貨】進(jìn)階預(yù)備知識
這次給大家介紹一下GAN的generalized framework京革。其實很多研究都是這樣，先找到一個比較直觀好理解方法幸斥，然后去研究他的框架匹摇，發(fā)...

2221 0 3 1
GAN原理"潛"析
為了后面介紹seqGAN + RL的應(yīng)用，先來介紹一下這個很火的GAN甲葬，火到似乎女媧上帝都是“干”出來的...稍提一點背景廊勃。統(tǒng)計機(jī)器學(xué)習(xí)中，這個...

0.5 6474 1 14

源碼解讀Tensorflow的Seq2Seq實現(xiàn)API,構(gòu)建一個數(shù)值預(yù)測
Seq2Seq的資料很多经窖，這里就簡單介紹下吧坡垫。顧名思義，它就是一個sequence來預(yù)測另一個sequence的模型画侣，主要是一個encoder-...

0.1 8804 6 16 6