Junr_0926 - 簡(jiǎn)書

IP屬地：北京

模型搜索
1. 前言最近做了一段時(shí)間的模型搜索摧莽，實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)模型搜索作用還是很明顯的脓规。本篇文章主要回顧了一下近幾年一些關(guān)于模型搜索的文章： RL-ba...

2.3 2286 1 9
Policy Gradient Methods, DPG 和 DDPG
1. 介紹首先了解一下策略梯度法，之后再對(duì)DPG和DDPG兩篇論文進(jìn)行學(xué)習(xí)弱卡。 2. 梯度策略法梯度策略法 ( Policy Gradient...

0.2 4723 0 3

MXNet中的圖是怎么構(gòu)建的峦阁？
1. 介紹這是一篇粗淺并且可能存在錯(cuò)誤的個(gè)人理解我們?cè)谑褂肕XNet的時(shí)候辆飘，都是通過(guò)調(diào)用python端提供的接口。通過(guò)一步步地構(gòu)建symbo...

1197 0 0
MXNet: Barrier
1. KVStore里的Barrier 在mxnet的分布式訓(xùn)練里卓嫂，主要模式就是參數(shù)服務(wù)器慷暂。每個(gè)worker或者agent就是一臺(tái)machine...

780 0 0
MXNet: wait_to_read 方法
wait_to_read 在mxnet中，類ndarray可以調(diào)用 wait_to_read晨雳，官方給出的該函數(shù)解釋是： Waits until ...

0.2 1297 0 1
Continuous control with deep Reinforcement Learning 筆記
1. 介紹這篇論文將DQN應(yīng)用于動(dòng)作空間是連續(xù)的情況行瑞。我們知道，DQN的輸入通常是高緯度的觀測(cè)空間（例如圖像像素）餐禁，輸出則是離散的動(dòng)作空間血久。生...

969 0 0
Deterministic Policy Gradient Algorithms 筆記
1. 介紹 Policy gradient算法在增強(qiáng)學(xué)習(xí)中有非常多的應(yīng)用，尤其是動(dòng)作空間連續(xù)的情況帮非。通常我們使用一個(gè)函數(shù)來(lái)表示策略氧吐。通常poli...

3188 0 0

Mimicking Very Efficient Network for Object Detection 筆記
1. 介紹如今大多數(shù)的檢測(cè)模型的backbone都需要在ImageNet預(yù)訓(xùn)練，才能達(dá)到一個(gè)較好的結(jié)果末盔。但是如果是新設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)筑舅，就需要先在...

1433 0 0
Distilling the Knowledge in a Neural Network 筆記
1. 介紹在論文中，作者提出了先訓(xùn)練一個(gè)大的笨重的模型陨舱，再使用distilling來(lái)將笨重的模型的知識(shí)遷移到小的模型中翠拣，用于實(shí)際部署。通常情況...

1428 0 0