文章內(nèi)容剖析
實驗代碼在這里.
摘要
本文主要工作
- 1蹬刷、闡述GAP如何使CNN具有卓越定位能力
- 2、證明了所提出網(wǎng)絡能定位出“區(qū)別性”區(qū)域文判,且分類效果也不差
1 介紹
擴寫摘要,展示結果圖
- 引出GAP的功能遠不止正則化,更重要的是定位能力
- 指出本文所提網(wǎng)絡保留了定位能力且分類能力也不差
1.1 相關研究(研究現(xiàn)狀)
- 已有研究證明:CNN分類能和定位能力都很好
- 介紹已有研究的兩個主要工作&提出缺陷
- 弱監(jiān)督物體定位
- 缺陷:作者并沒有評估定位能力夺衍;不是端到端的訓練,需要額外工作喜命,可擴展性差
- 可視化CNN內(nèi)在表現(xiàn)
- 缺陷:只分析了卷積層沟沙,忽略了全連接層,因此是不全面的壁榕;只展示了深層特征中什么信息被保留矛紫,并沒有凸顯出這些信息的相對重要性
- 弱監(jiān)督物體定位
2 類激活圖(CAM)
作用:展示被劃分為某個特定類的“區(qū)別性”區(qū)域
網(wǎng)絡結構
-
詳細計算推理過程
對于一個圖,用fk(x, y)代表最后一個卷積層的單元k在空間坐標(x,y)中的激活值牌里。對于每個單元k颊咬,通過GAP后的結果Fk為∑x,yfk(x, y)。則牡辽,對于每個類c贪染,輸入softmax的Sc為∑kwc,kFk,wc,k代表單元k對應的類c的權重催享。實際上杭隙,wc,k就是Fk對類c的重要性。最后類c的sotfmax輸出Pc為exp(Sc)/∑cexp(Sc)因妙。這里我們忽略偏差項:我們明確地把softmax的偏差項設置為0因為它幾乎對分類表現(xiàn)沒有影響痰憎。
把Fk=∑x,yfk(x, y)帶入Sc票髓,得
我們用Mc定義類別c的CAM,則空間每個元素為
則Sc = ∑x,yMc(x,y)铣耘,所以Mc(x,y)直接表明了把空間網(wǎng)格(x,y)激活對圖片劃分為類別c的的重要性洽沟。
對比使用GAP 和 GMP
3 弱監(jiān)督物體定位
- 評估了CAM的定位能力
- 3.1 不同CNN網(wǎng)絡的設置
- 3.2 定位的同時不影響分類性能
4 通用的定位特征
- 我們網(wǎng)絡即使在陌生數(shù)據(jù)上(不訓練)也能定位
- 4.1 鳥類細粒度識別與定位能力評估
- 4.2 證明GoogLeNet-GAP能用于圖片通用模式識別
5 可視化特定類單元
6 結論
- 提出CAM技術
- 證明了CAM在定位方面的泛化能力
寫作套路
摘要
開頭
In this work, we ...
對比
While ... , we ...
介紹自己工作
Despite ... we ...
We demonstrate that our ...
最先進的技術
state-of-the-art
研究現(xiàn)狀
引用前人研究
Recent work by xxx has shown that ...
xxx et al propose a technique/method for ...
These approaches ...
介紹自己研究
In our experiments, we found that ...
our approach is ...
xxx 遠不止能做()工作,更重要的是還能()
the advantages of xxx extend beyond () - In fact, () can
we can generalize this ability beyond just ()
引出文章創(chuàng)新
However, their ...
Both of these works only analyze ... , ignoring ...
While these works can ..., they only show ...
Unlike xxx and xxx, our approach can ...
Overall, our approach provides ...
正文
開頭
In this section, we describe the procedure for ...
技術可以用于()
This technique can be applied to do sth.
研究成功
This suggests that our approach works as expected.
通用
如圖所示
xxx is illustrated in Fig. 2.
As shown in Figure 1
如表所示
Tbl.1summarizes ...
本質(zhì)上講
In fact
Essentially, xxx indicates ...
形容表現(xiàn)的詞
remarkable ability
impressive performance
generic
連接詞
further
In general
specificly
文章參考論文
通過避免使用全連接層來減少參數(shù)蜗细,保持高性能
Network In Network
GoogLeNet證明了CNN每層都是物體檢測器
Object detectors emerge in deep scene cnnsCNN在圖像識別方面做得很出色
Imagenet classi?cation with deep convolutional neural networks
Learning deep features for scene recognition using places database
Rich feature hierarchies for accurate object detection and semantic segmentationCNN在定位方面也很出色
Self-taught object localization with deep networks
Weakly supervised object localization with multi-fold multiple instance learning
Learning and transferring mid-level image representations using convolutional neural networks
Is object localization for free? weakly-supervised learning with convolutional neural networks可視化CNN
Inverting convolutional networks with convolutional networks
Understanding deep image representations by inverting them
Visualizing and understanding convolutional networks
Object detectors emerge in deep scene cnns