煉丹筆記四:小樣本問題

歡迎大家關(guān)注微信公眾號(hào):baihuaML浙宜,白話機(jī)器學(xué)習(xí)平夜。

碼字不易线脚,如轉(zhuǎn)載請(qǐng)私信我:焓 额各!原文鏈接:https://zhuanlan.zhihu.com/p/56365256

在這里,我們一起分享AI的故事吧恃。

您可以在后臺(tái)留言虾啦,關(guān)于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的問題痕寓,我們會(huì)選擇其中的優(yōu)質(zhì)問題進(jìn)行回答傲醉!

本期問題

關(guān)于深度學(xué)習(xí)中的小樣本問題,有哪些研究進(jìn)展呻率?

正所謂“巧婦難為無米之炊”硬毕,在是使用深度學(xué)習(xí)解決各種問題的時(shí)候,難免會(huì)遇到樣本不充足的情況礼仗。那這個(gè)時(shí)候應(yīng)該怎樣做呢吐咳?

什么是小樣本問題?

小樣本問題是指研究如何從少量的樣本中去學(xué)習(xí)元践。眾所周知温鸽,深度學(xué)習(xí)的訓(xùn)練需要大量的數(shù)據(jù)佳窑,然而纫溃,在實(shí)際的生產(chǎn)生活中巍沙,可能由于數(shù)據(jù)采集困難,樣本標(biāo)注代價(jià)高等問題象浑,使得訓(xùn)練樣本的規(guī)模不大蔫饰,因此,小樣本問題就成為了機(jī)器學(xué)習(xí)領(lǐng)域中重要的研究方向之一愉豺。本篓吁。

小樣本會(huì)對(duì)模型訓(xùn)練帶來什么影響?

小樣本訓(xùn)練模型時(shí)蚪拦,容易產(chǎn)生過擬合現(xiàn)象杖剪。具體以分類問題為例:

對(duì)于classification model节腐,有如下結(jié)論

訓(xùn)練樣本N,h為Vc維數(shù),詳見https://www.cnblogs.com/HappyAngel/p/3633989.html

如果現(xiàn)在訓(xùn)練模型的算法能使得training error很小摘盆,而model complexity penalty又很小,就能保證test error也很小的概率是 1-η饱苟。所以要使得模型的generalization比較好孩擂,要保證training error和model complexity penalty都能比較小。觀察model complexity penalty項(xiàng)箱熬,可以看到类垦,h越大,model complexity penalty就會(huì)越大城须。N越大蚤认,model complexity penalty則會(huì)越小。大致上講糕伐,越復(fù)雜的模型有著越大的h(VC dimension)砰琢,所以為了使得模型有著好的generalization,需要有較大的N來壓低model complexity penalty良瞧。 這就是為什么深度學(xué)習(xí)的模型需要大量的數(shù)據(jù)來訓(xùn)練陪汽,否則模型的generalization會(huì)比較差,也就是過擬合褥蚯。

目前關(guān)于小樣本問題挚冤,有哪些研究進(jìn)展?

對(duì)于小樣本問題的研究主要有:

1. zero-shot learning(零樣本學(xué)習(xí))赞庶,即要識(shí)別訓(xùn)練集中沒有出現(xiàn)過的類別樣本训挡,雖然類別不存在,但是我們可以學(xué)習(xí)到一個(gè)映射X->Y歧强。如果這個(gè)映射足夠好的話澜薄,我們就可以處理沒有看到的類了。 比如誊锭,我們?cè)谟?xùn)練時(shí)沒有看見過獅子的圖像表悬,但是我們可以用這個(gè)映射得到獅子的特征。一個(gè)好的獅子特征丧靡,可能就和貓蟆沫,老虎等等比較接近,和汽車温治,飛機(jī)比較遠(yuǎn)離饭庞。

最早出現(xiàn)zero-shot的文章:

http://www.cs.cmu.edu/afs/cs/project/theo-73/www/papers/zero-shot-learning.pdf?(zero-shot)

目前關(guān)于zero-shot已經(jīng)出現(xiàn)很多優(yōu)秀的成果,比如:

【1】Zero-Shot Object Detection

【2】Zero-Shot Recognition using Dual Visual-Semantic Mapping Paths

【3】Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

【4】Xian Y, Lampert C H, Schiele B, et al.?Zero-shot learning-A comprehensive evaluation of the good, the bad and the ugly[J]. IEEE transactions on pattern analysis and machine intelligence, 2018

【4】等等

2. one-shot learning/few shot learning熬荆,即在訓(xùn)練集中舟山,每一類都有一張或者幾張樣,主要方法可以關(guān)注遷移學(xué)習(xí)、meta-learning累盗,metric-learning的相關(guān)研究進(jìn)展寒矿。單例學(xué)習(xí)是遷移學(xué)習(xí)/Domain Adaptation的一個(gè)特例。模型在source domain訓(xùn)練好之后若债,遷移到target domain符相,target domain只用一個(gè)標(biāo)記樣本去訓(xùn)練模型的參數(shù)就可以了。

圖8 平衡車單例識(shí)別

比如識(shí)別平衡車蠢琳。訓(xùn)練時(shí)啊终,source domain有大量標(biāo)記樣本,比如自行車傲须、獨(dú)行車蓝牲、摩托車和轎車等類別,模型可以從source domain學(xué)到表示車的有效特征泰讽,比如有輪子例衍、輪子尺寸大小、有踏板已卸、方向盤或龍頭等肄渗。測(cè)試時(shí),在target domian咬最,只需要一個(gè)或很少一些target domain的標(biāo)記樣本翎嫡,比如只需要在模型可以準(zhǔn)確識(shí)別車的條件下,給模型一張平衡車的標(biāo)記圖片就可以了永乌。

更多內(nèi)容推薦閱讀:

【領(lǐng)域報(bào)告】小樣本學(xué)習(xí)年度進(jìn)展|VALSE2018惑申,連接地址:https://blog.csdn.net/XWUkefr2tnh4/article/details/80729940

《few shot learning調(diào)研》鏈接地址:https://zhuanlan.zhihu.com/p/56014325

最早出現(xiàn)one-shot的文章:http://vision.stanford.edu/documents/Fei-FeiFergusPerona2006.pdf?(one-shot)

實(shí)際上,Zero/One-shot learning都屬于transfer learning翅雏,要點(diǎn)在于先學(xué)到好的X->Y的關(guān)系圈驼,希望能應(yīng)用到其他問題上。

3. 從數(shù)據(jù)增強(qiáng)的角度來看望几,也可以用來解決one-shot绩脆,zero-shot的相關(guān)問題

第一,利用流信息學(xué)習(xí)one-shot模型橄抹,常見的有半監(jiān)督學(xué)習(xí)和transductive learning靴迫,探討的是如何用無標(biāo)簽數(shù)據(jù)去做one-shot learning。

第二楼誓,在有預(yù)訓(xùn)練模型時(shí)玉锌,用這些預(yù)訓(xùn)練模型進(jìn)行數(shù)據(jù)增強(qiáng)。

第三疟羹,從相近的類別借用數(shù)據(jù)主守,來增強(qiáng)訓(xùn)練數(shù)據(jù)集禀倔。

第四,合成新的有標(biāo)簽訓(xùn)練數(shù)據(jù)参淫,用一些遙感里的方法救湖,可以合成一些圖像,或者3d物體涎才。

第五捎谨,用GAN來學(xué)習(xí)合成模型,比如最近用GAN來做personal ID和人臉相關(guān)研究憔维。

第六,屬性引導(dǎo)的增強(qiáng)方法畏邢。具體大家可以在文章里進(jìn)行詳細(xì)了解业扒。?

幾個(gè)小樣本問題的數(shù)據(jù)集

1. 提供幾個(gè)最常用的Zero-Shot Learning的數(shù)據(jù)集,均為GoogleNet提取的圖片特征舒萎,引用相應(yīng)數(shù)據(jù)時(shí)程储,請(qǐng)注意對(duì)應(yīng)作者的引用說明。

AwA:http://pan.baidu.com/s/1nvPzsXb

CUB:http://pan.baidu.com/s/1nv3KCYH

aPaY:http://pan.baidu.com/s/1hseSzVe

SUN:http://pan.baidu.com/s/1gfAc33X

ImageNet2:http://pan.baidu.com/s/1pLfZYQ3

2. one-shot learning 數(shù)據(jù)集

Omniglot

行人Reid數(shù)據(jù)集:Viper/CUHK01

歡迎加入深度學(xué)習(xí)臂寝、機(jī)器學(xué)習(xí)技術(shù)研討群章鲤!

745224003

歡迎關(guān)注我們的微信公眾號(hào):baihuaML,白話機(jī)器學(xué)習(xí)

關(guān)注知乎“會(huì)寫代碼的好廚師”

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末咆贬,一起剝皮案震驚了整個(gè)濱河市败徊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌掏缎,老刑警劉巖皱蹦,帶你破解...
    沈念sama閱讀 222,378評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異眷蜈,居然都是意外死亡沪哺,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門酌儒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來辜妓,“玉大人,你說我怎么就攤上這事忌怎〖危” “怎么了?”我有些...
    開封第一講書人閱讀 168,983評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵榴啸,是天一觀的道長(zhǎng)异逐。 經(jīng)常有香客問我,道長(zhǎng)插掂,這世上最難降的妖魔是什么灰瞻? 我笑而不...
    開封第一講書人閱讀 59,938評(píng)論 1 299
  • 正文 為了忘掉前任腥例,我火速辦了婚禮,結(jié)果婚禮上酝润,老公的妹妹穿的比我還像新娘燎竖。我一直安慰自己,他們只是感情好要销,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,955評(píng)論 6 398
  • 文/花漫 我一把揭開白布构回。 她就那樣靜靜地躺著,像睡著了一般疏咐。 火紅的嫁衣襯著肌膚如雪纤掸。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,549評(píng)論 1 312
  • 那天浑塞,我揣著相機(jī)與錄音借跪,去河邊找鬼。 笑死酌壕,一個(gè)胖子當(dāng)著我的面吹牛掏愁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卵牍,決...
    沈念sama閱讀 41,063評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼果港,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了糊昙?” 一聲冷哼從身側(cè)響起辛掠,我...
    開封第一講書人閱讀 39,991評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎释牺,沒想到半個(gè)月后公浪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,522評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡船侧,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,604評(píng)論 3 342
  • 正文 我和宋清朗相戀三年欠气,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片镜撩。...
    茶點(diǎn)故事閱讀 40,742評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡预柒,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出袁梗,到底是詐尸還是另有隱情宜鸯,我是刑警寧澤,帶...
    沈念sama閱讀 36,413評(píng)論 5 351
  • 正文 年R本政府宣布遮怜,位于F島的核電站淋袖,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏锯梁。R本人自食惡果不足惜即碗,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,094評(píng)論 3 335
  • 文/蒙蒙 一焰情、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧剥懒,春花似錦内舟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至保檐,卻和暖如春耕蝉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背夜只。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評(píng)論 1 274
  • 我被黑心中介騙來泰國(guó)打工垒在, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人盐肃。 一個(gè)月前我還...
    沈念sama閱讀 49,159評(píng)論 3 378
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像权悟,于是被迫代替她去往敵國(guó)和親砸王。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,747評(píng)論 2 361