為什么(預)特征提取不能與數(shù)據(jù)增強結(jié)合使用

參考鏈接

前提:

在《python深度學習》第五章講,使用預訓練模型VGG16自己的密集連接分類器結(jié)合時赂乐,講了兩種方法:

《python深度學習》
  • 法一:用預訓練模型的卷積基對數(shù)據(jù)集進行特征提取妙蔗,生成原訓練數(shù)據(jù)集的特征新锈,這是我們訓練分類器的訓練集芦缰,這一步暫時稱之為預特征提取孩锡。然后高职,基于預提取的特征訓練最后的密集連接層分類器藐吮。
  • 法二:在卷積基的基礎上進行擴展疼约,追加密集連接分類器卤档,形成一個端到端的網(wǎng)絡。然后在凍結(jié)卷積基的條件下程剥,基于數(shù)據(jù)增強技術(shù)對整個模型進行訓練劝枣。由于卷積基被凍結(jié),其權(quán)重沒有更新,所以卷積基的作用也僅僅是用于特征提取舔腾,但是它是在線(on-the-fly)進行的溪胶,所以這一步暫時稱之為實時特征提取,以區(qū)別于上面的預特征提取稳诚。
  • 原書中提到法一不能與數(shù)據(jù)增強技術(shù)結(jié)合使用哗脖,但是沒有解釋具體的原因。原因在于沒有真正理解數(shù)據(jù)增強技術(shù)的處理過程扳还。

解釋:

  • 這是因為:

    • 在采用數(shù)據(jù)增強技術(shù)時才避,每一輪(epoch)訓練所使用的樣本不是完全一樣的(雖然都是基于原始訓練集進行變換而得)
    • 不采取數(shù)據(jù)增強時普办,每一輪(epoch)訓練所使用的樣本是完全一樣的(可能只是使用的順序不同工扎,因為mini-batch生成的隨機性)
  • 預特征提取是一次性地用卷積基對訓練集進行特征提取衔蹲,即便是這里使用了“數(shù)據(jù)增強”肢娘,生成的特征集(訓練分類器的訓練集)就不會再變化了。在后面訓練中的每一輪(epoch)中都是使用相同的預提取特征(對應于使用相同的原始訓練集)舆驶。

  • 所以方法一(預特征提瘸鹘 )速度快,計算代價低沙廉,因為對于每一個數(shù)據(jù)樣本只運行了一次卷積基拘荡,而卷積基的計算代價是遠遠大于最后的密集連接層的。而方法二(實時特征提取+數(shù)據(jù)增強)則是每一輪都要針對數(shù)據(jù)增強產(chǎn)生的不同的數(shù)據(jù)樣本進行卷積基特征提取撬陵,因此其訓練時的計算代價要遠遠大于方法一珊皿。

  • 當然,有人解釋了理論上方法一也是可以做到預特征提取與數(shù)據(jù)增強結(jié)合使用巨税。那就是:假如你要訓練M輪蟋定,原始樣本集大小為N,則基于原始樣本集利用數(shù)據(jù)增強技術(shù)先生成N?M個樣本草添。然后利用卷積基對這個大小為N?M的增強數(shù)據(jù)樣本集進行預特征提取驶兜。然后在后續(xù)的M輪訓練,每一輪訓練中從這N?M個樣本中無放回(without replacement)地采N個樣本進行訓練远寸。這樣做的效果就與方法二(實時特征提取+數(shù)據(jù)增強技術(shù))完全一樣了抄淑,計算量和訓練效果都一樣。但是這種做法就比方法二要麻煩多了驰后,所以就沒有什么實質(zhì)性的意義肆资,不如直接采用后者。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末倡怎,一起剝皮案震驚了整個濱河市迅耘,隨后出現(xiàn)的幾起案子贱枣,更是在濱河造成了極大的恐慌,老刑警劉巖颤专,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件纽哥,死亡現(xiàn)場離奇詭異,居然都是意外死亡栖秕,警方通過查閱死者的電腦和手機春塌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來簇捍,“玉大人只壳,你說我怎么就攤上這事∈钏埽” “怎么了吼句?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長事格。 經(jīng)常有香客問我惕艳,道長,這世上最難降的妖魔是什么驹愚? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任远搪,我火速辦了婚禮,結(jié)果婚禮上逢捺,老公的妹妹穿的比我還像新娘谁鳍。我一直安慰自己,他們只是感情好劫瞳,可當我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布倘潜。 她就那樣靜靜地躺著,像睡著了一般志于。 火紅的嫁衣襯著肌膚如雪窍荧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天恨憎,我揣著相機與錄音,去河邊找鬼郊楣。 笑死憔恳,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的净蚤。 我是一名探鬼主播钥组,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼今瀑!你這毒婦竟也來了程梦?” 一聲冷哼從身側(cè)響起点把,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎屿附,沒想到半個月后郎逃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡挺份,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年褒翰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片匀泊。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡优训,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出各聘,到底是詐尸還是另有隱情揣非,我是刑警寧澤,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布躲因,位于F島的核電站早敬,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏毛仪。R本人自食惡果不足惜搁嗓,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望箱靴。 院中可真熱鬧腺逛,春花似錦、人聲如沸衡怀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抛杨。三九已至够委,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間怖现,已是汗流浹背茁帽。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留屈嗤,地道東北人潘拨。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像饶号,于是被迫代替她去往敵國和親铁追。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,465評論 2 348

推薦閱讀更多精彩內(nèi)容