什么是Few-shot Learning

Few-shot Learning(少樣本學習)是Meta Learning(元學習)中的一個實例[1],所以在了解什么是Few-shot Learning之前有必要對Meta Learning有一個簡單的認識线得。不過在了解什么是Meta Learning之前還是要了解一下什么是Meta贯钩。因此办素,閱讀本文后你將對如下知識有一個初步的了解祸穷。

  1. What is Meta
  2. What is Meta Learning
  3. What is Few-shot Learning

1. What is Meta?

meta就是描述數(shù)據(jù)的數(shù)據(jù)。

比如照片需曾,我們看到的是它呈現(xiàn)出來的數(shù)據(jù)祈远, 即Data,但它還含有許多描述它拍攝參數(shù)的數(shù)據(jù)谋减,比如光圈扫沼、快門速度、相機品牌等严就,即Meta器罐。

Data and Meta

對于一片博客而言,博客內(nèi)容就是Data抖誉,博客的網(wǎng)址衰倦,標題旁理,作者信息等就是Meta [2]
Data and Meta

2. What is Meta Learning?

機器學習模型一般要求訓練集樣本量足夠大驻襟,才能取得不錯的預測效果芋哭。但對于人來說卻不需要,對于一個從沒有見過小貓和小狗的小朋友來說豌习,給他幾張照片他就能輕松的學會如何分辨兩只動物。如果一個人已經(jīng)掌握了如何騎自信車既荚,那么學習如何騎摩托車對他來說會非常輕松栋艳。我們能否設(shè)計一個模型,讓模型僅從一點點訓練樣本就能學會新的“知識”呢晴叨?即讓模型“自己學會去學習”[1]矾屯。

舉個簡單的例子,一個小朋友去動物園遍略,里面有些動物他沒有見過所以不知道叫什么名字骤坐,然后你給他一些小卡片,卡片上有各個動物的照片和名稱蕾久,小朋友就可以自己學習拌夏,從這些卡片中找出這些動物的名字。這里的未知動物叫做query障簿,小卡片叫做support set站故。培養(yǎng)小朋友從小卡片中自主學習就叫做meta learning[3]。如果一個類別的小卡片只有一張西篓,那么就叫做one-shot learning岂津。

meta learning

Meta learning是一種學習其它機器學習任務(wù)輸出的機器學習算法(有一點繞,不過理解了meta data理解meta learning就會相對容易一些)橱乱。

Machine learning algorithm從歷史數(shù)據(jù)中學習知識,然后泛化到新的數(shù)據(jù)樣本中冗美。

  • Learning Algorithm: Learn from historical data and make predictions given new examples of data.

而meta learning是從其它學習算法(learning algorithm)的輸出中學習析二,這就要求其它學習算法以及被預訓練過。即meta learning算法將其它機器學習算法的輸出作為輸入叶摄,然后進行回歸和分類預測蛤吓。

  • Meta Learning Algorithm: Learn from the output of learning algorithms and make a prediction given predictions made by other models.

如果說machine learning是如果使用信息做出更好的預測,那么meta learning就是利用machine learning的預測作出最好的預測[3] [4]锅棕。

3. What is Few-shot Learning

3.1 Few-shot learning

Few-shot learning指從少量標注樣本中進行學習的一種思想淌山。Few-shot learning與標準的監(jiān)督學習不同,由于訓練數(shù)據(jù)太少德绿,所以不能讓模型去“認識”圖片退渗,再泛化到測試集中。而是讓模型來區(qū)分兩個圖片的相似性会油。當把few-shot learning運用到分類問題上時翻翩,就可以稱之為few-shot classification,當運用于回歸問題上時体斩,就可以稱之為few-shot regression絮吵。下面所提到的few-shot learning都只針對分類問題進行討論忱屑。

假如我們的有一個很大的訓練集暇昂,包含以下五類樣本伴嗡,有哈士奇、大象澄暮、老虎阱扬、金剛鸚鵡和汽車。我們的目標不是讓模型認出哪個是哈士奇馍刮,哪個是大象窃蹋,而是讓模型知道不同類別間的區(qū)別。


traing set

我們現(xiàn)在給模型輸入一張新的圖片松鼠(squirrel)匈辱,模型并不知道它是松鼠惠奸,因為訓練樣本中沒有這一種動物。但當你把兩只松鼠的圖片都輸入到網(wǎng)絡(luò)中梗掰,它雖然不知道它們屬于松鼠這一類別嗅回,但模型可以很確信的告訴你這是同一物種,因為長得很像埂陆。


squirrels

但當你輸入一只穿山甲(pangolin)和一只狗(dog)娃豹,模型能夠區(qū)分出來它們長得不像懂版,所以不是同一種動物。
pangolin and dog

3.2 Support set vs training set

小樣本帶標簽的數(shù)據(jù)集稱為support set民鼓,由于support set數(shù)據(jù)樣本很少,所以不足以訓練一個神經(jīng)網(wǎng)絡(luò)丰嘉。而training set每個類別樣本量很大饮亏,使用training set訓練的模型能夠在測試集取得很好的泛化效果。

3.3 Supervised learning vs few-shot learning

  • 監(jiān)督學習
    (1)測試樣本之前從沒有見過
    (2)測試樣本類別出現(xiàn)在訓練集中
  • Few-shot learning
    (1)query樣本之前從沒有見過
    (2)query樣本來自于未知類別

由于query并未出現(xiàn)在訓練集中逼争,我們需要給query提供一個support set劝赔,通過對比query和support set間的相似度,來預測query屬于哪一類別杂伟。


query, support set and training set

3.4 k-way n-shot support set

  • k-way:support set中有k個類別
  • n-shot:每一個類別有n個樣本

例如下圖中有四個類別仍翰,每個類別有兩個樣本,所以是4-way 2-shot support set

4-way 2-shot

Few-shot learning的預測準確率隨 #-way 增加而減小越平,隨 #-shot 增加而增加秦叛。因為對于2-way問題瀑粥,預測準確率顯然要比1000-way問題要高。而對于 #-shot避咆,一個類別中樣本數(shù)越多越容易幫助模型找到正確的類別修噪。

3.5 Basic idea behind few-shot learning

Few-shot learning的最基本的思想是學一個相似性函數(shù):Sim(x, {x}') 來度量兩個樣本x{x}'的相似性。Sim(x, {x}') 越大表明兩個圖片越相似樊销,Sim(x, {x}')越小,表明兩個圖片差距越大现柠。

操作步驟:
(1)從大規(guī)模訓練數(shù)據(jù)集中學習相似性函數(shù)
(2)比較query與support set中每個樣本的相似度够吩,然后找出相似度最高的樣本作為預測類別[3][5]

few-shot learning

參考:


  1. Meta-Learning: Learning to Learn Fast ? ?

  2. What is metadata? ?

  3. Youtube - few-shot learning ? ? ?

  4. What Is Meta-Learning in Machine Learning? ?

  5. An Introduction to Few-Shot Learning ?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末周循,一起剝皮案震驚了整個濱河市万俗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌嚎研,老刑警劉巖库倘,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件教翩,死亡現(xiàn)場離奇詭異,居然都是意外死亡饱亿,警方通過查閱死者的電腦和手機彪笼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來队寇,“玉大人章姓,你說我怎么就攤上這事》惨粒” “怎么了系忙?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長风宁。 經(jīng)常有香客問我,道長热监,這世上最難降的妖魔是什么饮寞? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮苦始,結(jié)果婚禮上慌申,老公的妹妹穿的比我還像新娘。我一直安慰自己柠贤,他們只是感情好类缤,可當我...
    茶點故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著宴霸,像睡著了一般膏蚓。 火紅的嫁衣襯著肌膚如雪瓢谢。 梳的紋絲不亂的頭發(fā)上驮瞧,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天论笔,我揣著相機與錄音,去河邊找鬼狂魔。 笑死,一個胖子當著我的面吹牛整份,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播火俄,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼讲冠,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起德迹,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤揭芍,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后肌毅,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體姑原,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年笨奠,在試婚紗的時候發(fā)現(xiàn)自己被綠了唤殴。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡蔚袍,死狀恐怖配名,靈堂內(nèi)的尸體忽然破棺而出段誊,到底是詐尸還是另有隱情,我是刑警寧澤连舍,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站盼玄,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏埃儿。R本人自食惡果不足惜器仗,卻給世界環(huán)境...
    茶點故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望童番。 院中可真熱鬧精钮,春花似錦、人聲如沸剃斧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽幼东。三九已至臂容,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間根蟹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工简逮, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留球散,地道東北人。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓散庶,卻偏偏與公主長得像沛婴,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子督赤,可洞房花燭夜當晚...
    茶點故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容