初七123 - 簡書

IP屬地：遼寧

最優(yōu)控制: LQR
一份關(guān)于 LQR 的簡單易懂的入門級教程溺职，它是最優(yōu)控制的基礎(chǔ)概念傲醉。我將會在這篇文章中討論最優(yōu)控制，并會更具體的討論性能非常優(yōu)秀的線性二次調(diào)節(jié)器...

0.1 4613 0 1
偽隨機數(shù)算法生成高斯分布
偽隨機數(shù)算法平方取中法（Middle-square method）是個產(chǎn)生偽隨機數(shù)的方法杀餐，由馮·諾伊曼在1946年提出甩栈。算法：即平方取中...

3.1 4590 0 1

反向傳播算法
卷積網(wǎng)絡(luò) 這里討論通過卷積的方式表達CNN反向傳播池化層假設(shè)我們的池化區(qū)域大小是2x2佳遂，并且下一層的梯度為：如果是MAX狸页，假設(shè)我們之前在前...

0.1 1176 0 2
從傅里葉級數(shù)到快速傅里葉變換
在計算機上編程做信號處理時，我們通常用的是FFT, 但是開始學(xué)信號處理時箩退，一般是從FS開始的离熏。所以這里整理一下從FS到FFT“演變”的過程。以下...

1409 1 2
噪聲對比估計
說到噪聲對比估計戴涝，或者“負采樣”滋戳，大家可能立馬就想到了Word2Vec。事實上啥刻，它的含義遠不止于此胧瓜，噪音對比估計（NCE, Noise Cont...

2257 1 1
Ring Allreduce
The Communication Problem 當(dāng)將神經(jīng)網(wǎng)絡(luò)的訓(xùn)練并行化到許多GPU上時，你必須選擇如何將不同的操作分配到你可用的不同GPU...

1.3 18864 0 11
自然梯度
什么是自然梯度首先郑什，我們必須理解標(biāo)準(zhǔn)梯度下降。假設(shè)我們有一個神經(jīng)網(wǎng)絡(luò)蒲肋，由一些參數(shù)向量參數(shù)化蘑拯。我們想要調(diào)整這個網(wǎng)絡(luò)的參數(shù)，所以網(wǎng)絡(luò)的輸出在某種...

0.1 4517 0 1

《強化學(xué)習(xí)導(dǎo)論》：Policy Gradient Methods
在這一章中兜粘，我們討論策略梯度 Policy Approximation and its Advantages the approximate p...

811 0 0
《強化學(xué)習(xí)導(dǎo)論》：Eligibility Traces
資格跡是增強學(xué)習(xí)的一個基本的機制申窘。比如在流行的TD(k)算法中，k涉及到資格跡的使用孔轴。幾乎所有的時間差分算法如Q-Learning剃法，Sarsa，...

1622 0 0