2017.08.14先慷,結(jié)束了兩周的等待酬屉,如愿以償開始了自己的美團(tuán)實(shí)習(xí)生活,本來抱著三五個(gè)月走人匀伏,爭取下一份實(shí)習(xí)的心態(tài),沒想到一直到轉(zhuǎn)為暑期實(shí)習(xí)生、到通過留用面試单默、再到年后繼續(xù)...
![240](https://cdn2.jianshu.io/assets/default_avatar/10-e691107df16746d4a9f3fe9496fd1848.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
2017.08.14先慷,結(jié)束了兩周的等待酬屉,如愿以償開始了自己的美團(tuán)實(shí)習(xí)生活,本來抱著三五個(gè)月走人匀伏,爭取下一份實(shí)習(xí)的心態(tài),沒想到一直到轉(zhuǎn)為暑期實(shí)習(xí)生、到通過留用面試单默、再到年后繼續(xù)...
之前介紹的DQN及其各種變體忘瓦,網(wǎng)絡(luò)輸出的都是狀態(tài)-動(dòng)作價(jià)值Q的期望預(yù)估值搁廓。而本文將介紹的Categorical DQN,它建模的是狀態(tài)-動(dòng)作價(jià)值Q的分布。這樣的估計(jì)方法使得估...
寫的非常棒境蜕,抓住了精髓
信賴域策略優(yōu)化(TRPO)根據(jù)策略梯度方法线欲,參數(shù)更新方程式為: 在策略梯度方法中,合適的步長對于參數(shù)更新至關(guān)重要汽摹,當(dāng)步長不合適時(shí)李丰,更新的參數(shù)所對應(yīng)的策略是一個(gè)更不好的策略,當(dāng)利用這個(gè)更不好的策略進(jìn)行采...
根據(jù)策略梯度方法逼泣,參數(shù)更新方程式為: 在策略梯度方法中趴泌,合適的步長對于參數(shù)更新至關(guān)重要,當(dāng)步長不合適時(shí)拉庶,更新的參數(shù)所對應(yīng)的策略是一個(gè)更不好的策略嗜憔,當(dāng)利用這個(gè)更不好的策略進(jìn)行采...
ElasticFusion: Dense SLAM Without A Pose Graph 沒有姿態(tài)圖稠密SLAM [TOC] 摘要 提出了一種實(shí)時(shí)密集視覺SLAM的新方法...
正文前的扯淡 之前電話面試一個(gè)公司時(shí)呐舔,面試官讓寫一個(gè)堆排序,遺憾的是我忘了堆排序的思想了慷蠕,所以直接說不會(huì)寫珊拼,這次電面也以失敗告終...知恥后勇,這幾天在網(wǎng)上找了很多寫堆排序的...
本節(jié)課主要將兩件事情: 1. Pytorch 搭建分類神經(jīng)網(wǎng)絡(luò) 2. 神經(jīng)網(wǎng)絡(luò)基本架構(gòu) --- 0 項(xiàng)目準(zhǔn)備: 這里先下載數(shù)據(jù)剑辫,這里主要是下載手寫 mnist 數(shù)據(jù)集; 這個(gè)...
這次看下wgan腳本捐名,這里使用fastai來完成wgan的訓(xùn)練和使用旦万。 老三樣,我就不加標(biāo)題了 1 重要的包 其中g(shù)an包是在../fastai/vision下的文件夾镶蹋。大家...
文章: Focal Loss for Dense Object Detection 作者: Tsung-Yi Lin, Priya Goyal, Ross Girshick,...
roidb數(shù)據(jù)結(jié)構(gòu) roidb的類型是list, 其中的每個(gè)元素的數(shù)據(jù)類型都是dict, roidb列表的長度為數(shù)據(jù)集的數(shù)量(即圖片的數(shù)量), roidb中每個(gè)元素的詳細(xì)情況...
8.1 R-FCN R-FCN屬于two-stage的目標(biāo)檢測算法。 backbone部分RPN淆两,這里使用ResNet断箫。 head部分R-FCN,使用全連接網(wǎng)絡(luò)秋冰。 其中Res...