4e293577acb1 - 簡書

發(fā)簡信

4e293577acb1

32
關(guān)注
1
粉絲
0
文章
0

字數(shù)
0

收獲喜歡
60

總資產(chǎn)

IP屬地：北京

winddy_akoky

Actor Critic
一界弧、介紹 Actor-Critic 算法有兩部分組成：actor 和 critic趋观。其中 action 就是Policy Gradient 算法，critic 是Q-lear...

17980 2 4
文哥的學(xué)習(xí)日記

殘差網(wǎng)絡(luò)ResNet網(wǎng)絡(luò)原理及實現(xiàn)
論文地址：https://arxiv.org/pdf/1512.03385.pdf 1、引言-深度網(wǎng)絡(luò)的退化問題在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中，從經(jīng)驗來看，隨著網(wǎng)絡(luò)深度的增加，模型理...

34634 1 19
文哥的學(xué)習(xí)日記

強化學(xué)習(xí)AC偎漫、A2C、A3C算法原理與實現(xiàn)有缆！
跟著李宏毅老師的視頻象踊，復(fù)習(xí)了下AC算法温亲，新學(xué)習(xí)了下A2C算法和A3C算法，本文就跟大家一起分享下這三個算法的原理及tensorflow的簡單實現(xiàn)杯矩。視頻地址：https://...

44200 0 34
文哥的學(xué)習(xí)日記

Q-Learning 和 SARSA 算法對比
1栈虚、Q-learning Q-learning算法的過程可以根據(jù)下面的步驟：首先，我們會初始化一個Q-table史隆，可以是全0或者是其他的數(shù)值魂务，一般都是全0，然后我們設(shè)定訓(xùn)練...

12854 0 12
臻甄

迷霧探險6 | Q-learning和Sarsa的區(qū)別理解
了解了強化學(xué)習(xí)各種算法及其分類關(guān)系后泌射，就可以開始逐個擊破和提升粘姜，在這里，我主要參考B站上莫煩大神的視頻課程學(xué)習(xí)熔酷，并記錄下自己的一些淺顯的理解孤紧。詳細文檔可以直接移步莫大神的社區(qū)...

3642 0 3
MapleLuv

RCNN->SppNET->Fast-RCNN->Faster-RCNN
參考：RCNN介紹參考：RCNN,Fast RCNN, Faster RCNN整理總結(jié) 一、 RCNN【借助CNN良好的特征提取和分類性能拒秘，通過RegionProposal方...

1017 1 10