secondplayer - 簡(jiǎn)書(shū)

發(fā)簡(jiǎn)信

secondplayer

10
關(guān)注
57
粉絲
25
文章
53983

字?jǐn)?shù)
49

收獲喜歡
3

總資產(chǎn)

IP屬地：上海

機(jī)器學(xué)習(xí)筆記19: 線性二次型高斯
線性二次型高斯(Linear Quadratic Gaussian (LQG)) 在現(xiàn)實(shí)世界中马篮，我們通常不能獲取到所有的狀態(tài)st。比如一個(gè)自動(dòng)駕...

0.1 4480 0 2
機(jī)器學(xué)習(xí)筆記18: 微分動(dòng)態(tài)規(guī)劃
上一節(jié)中我們介紹了一個(gè)特殊的MDP模型：線性二次型調(diào)節(jié)控制(LQR)宜猜。事實(shí)上很多問(wèn)題都可以用LQR來(lái)解決溺拱，即使動(dòng)態(tài)模型是非線性的。盡管LQR是一...

5065 0 0

機(jī)器學(xué)習(xí)筆記17: 線性二次型調(diào)節(jié)控制
有限邊界的MDP 在前面兩章關(guān)于強(qiáng)化學(xué)習(xí)的介紹中，我們定義了馬爾可夫決策過(guò)程(MDP)以及價(jià)值迭代/策略迭代這兩種用于求解MDP的算法。特別地做修，...

2921 1 0
機(jī)器學(xué)習(xí)筆記16: 馬爾可夫決策過(guò)程(下)
到目前為止，我們一直都在討論有限狀態(tài)下的MDP問(wèn)題，現(xiàn)在我們來(lái)看下當(dāng)狀態(tài)數(shù)量是無(wú)限時(shí)如何求解MDP問(wèn)題缓待。離散化也許求解無(wú)限狀態(tài)下的MDP問(wèn)題...

0.1 1595 0 0
機(jī)器學(xué)習(xí)筆記15: 馬爾可夫決策過(guò)程(上)
這一節(jié)開(kāi)始我們介紹強(qiáng)化學(xué)習(xí)(reinforcement learning)。在監(jiān)督學(xué)習(xí)中渠牲，對(duì)于一個(gè)給定的輸入x旋炒，我們可以明確知道輸出y。而在很多...

0.1 3711 0 1
機(jī)器學(xué)習(xí)筆記14: 獨(dú)立成分分析
這一節(jié)的主題是獨(dú)立成分分析(Independent Components Analysis, ICA)签杈。和PCA的降維思路不同瘫镇，ICA主要解決的...

2571 0 0
機(jī)器學(xué)習(xí)筆記13: 主成分分析
上一節(jié)我們介紹了因子分析，該模型通過(guò)一系列變換可以將高維數(shù)據(jù)用低維數(shù)據(jù)來(lái)表示答姥。因子分析基于的是概率模型铣除，并且需要用到EM算法進(jìn)行參數(shù)估計(jì)。這一...

557 0 0

機(jī)器學(xué)習(xí)筆記12: 因子分析
上一節(jié)我們介紹了用EM算法求解混合高斯模型鹦付，但這個(gè)算法通常是在樣本數(shù)足夠多的情況下才成立尚粘，即滿足樣本數(shù)m遠(yuǎn)遠(yuǎn)大于特征數(shù)n。如果n >> m敲长，那...

2589 0 0
機(jī)器學(xué)習(xí)筆記11: K-Means算法和EM算法
這一節(jié)開(kāi)始我們討論非監(jiān)督學(xué)習(xí)(Unsupervised Learning)的算法郎嫁。在監(jiān)督學(xué)習(xí)算法中，訓(xùn)練數(shù)據(jù)既包含特征也包含標(biāo)簽祈噪，通常表示為{(...

4806 1 2