淺析計(jì)算機(jī)視覺中的自監(jiān)督學(xué)習(xí)

在計(jì)算機(jī)視覺(CV)領(lǐng)域,目前的方法主要依賴大量的標(biāo)注樣本來學(xué)習(xí)豐富的視覺表征柱搜,從而在各項(xiàng)CV任務(wù)中取得較好的表現(xiàn)迟郎。然而在許多情況下,大規(guī)模的人工標(biāo)注并不容易獲得聪蘸。因此宪肖,我們希望可以利用無監(jiān)督方法去學(xué)習(xí)那些不帶標(biāo)注的樣本。那么問題來了健爬,一個(gè)樣本沒有了標(biāo)簽匈庭,我們該設(shè)計(jì)怎樣的目標(biāo)任務(wù),才能促使網(wǎng)絡(luò)學(xué)習(xí)到好的特征表示呢浑劳?


首先,我們來聽一個(gè)隔壁領(lǐng)域的小故事夭拌。

在自然語言處理(NLP)領(lǐng)域魔熏,上下文信息(context)常常作為特征學(xué)習(xí)的監(jiān)督信號。舉個(gè)栗子鸽扁,我們學(xué)生時(shí)代的老朋友——“完形填空”:給定一個(gè)很大的語料庫蒜绽,我們要訓(xùn)練一個(gè)模型,能夠?qū)⒚總€(gè)詞映射為特征向量桶现,然后根據(jù)上下文信息去預(yù)測某個(gè)被挖掉的詞躲雅。在特征空間中哪個(gè)詞和上下文詞距離越近,那么要填這個(gè)詞的可能性越大骡和。這可以看作是把一個(gè)無監(jiān)督問題(找到單詞間的相似性度量)轉(zhuǎn)化為了“自監(jiān)督問題”:學(xué)習(xí)一個(gè)函數(shù)相赁,能夠表示挖掉的詞與他旁邊的詞的關(guān)系相寇。這里的“完形填空”就作為一個(gè)pretext task(直譯借口任務(wù),或稱代理任務(wù))促進(jìn)模型學(xué)習(xí)詞特征钮科,進(jìn)而在很多真實(shí)任務(wù)中起到很大幫助唤衫。

于是,這樣的思路被帶進(jìn)了CV領(lǐng)域绵脯。CV中的自監(jiān)督學(xué)習(xí)隆重登場佳励。


下面正式地向大家介紹——“自監(jiān)督學(xué)習(xí)”(Self-supervised Learning)

自監(jiān)督學(xué)習(xí),是無監(jiān)督學(xué)習(xí)的一種蛆挫,即無需額外的人工標(biāo)簽赃承,僅利用數(shù)據(jù)自身的信息作為監(jiān)督(自己監(jiān)督自己)。利用來自數(shù)據(jù)自身的監(jiān)督信息悴侵,設(shè)計(jì)一個(gè)pretext task瞧剖,訓(xùn)練網(wǎng)絡(luò)去完成該pretext task,從而促使網(wǎng)絡(luò)學(xué)習(xí)到數(shù)據(jù)特征畜挨。

如何檢驗(yàn) pretext task 的有效性筒繁,或者說學(xué)習(xí)到的數(shù)據(jù)特征是否足夠好?

通過遷移學(xué)習(xí)巴元,將pretext task中學(xué)到的特征遷移到downstream task(直譯下游任務(wù)毡咏,或稱后續(xù)任務(wù))中,包括圖像分類逮刨、檢測呕缭、分割等任務(wù),類似于提供了預(yù)訓(xùn)練模型修己。如果能促進(jìn)這些 downstream ?task 中取得很好的表現(xiàn)恢总,則說明學(xué)習(xí)到的特征是好的。

自監(jiān)督表征學(xué)習(xí)流程

說到這里睬愤,想必大家可以發(fā)現(xiàn)片仿,自監(jiān)督學(xué)習(xí)中最重要的一環(huán),就是如何設(shè)計(jì)一個(gè)pretext task尤辱,讓模型可以學(xué)到更好的數(shù)據(jù)特征砂豌。接下來,帶大家看看各種腦洞大開的pretext task光督。

[1] 相對位置預(yù)測:預(yù)測一張圖像中隨機(jī)選擇的兩個(gè)圖像塊之間的相對位置阳距。

[2] 圖像修復(fù):預(yù)測一張圖像中被遮擋的部分。

[3] 拼圖游戲:將圖像中打亂的9個(gè)圖像塊復(fù)原结借。

[4] 旋轉(zhuǎn)角度預(yù)測:預(yù)測圖像中物體的旋轉(zhuǎn)角度筐摘。

[5] 圖像著色:Lab圖像中利用L亮度通道,預(yù)測ab色彩通道。

[6] 跨通道預(yù)測:L通道和ab通道相互預(yù)測咖熟。

[7] 計(jì)數(shù):預(yù)測鼻子圃酵、眼睛、爪子球恤、頭的數(shù)量辜昵。

[8] 實(shí)例區(qū)分:分類,一張圖像和其增強(qiáng)的圖像為一類咽斧,和其他圖像為不同類堪置。

[9] 對比預(yù)測編碼:根據(jù)“過去的”信息,預(yù)測“未來的”信息张惹。



欲知后事如何舀锨,且待明天繼續(xù)更...

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市宛逗,隨后出現(xiàn)的幾起案子坎匿,更是在濱河造成了極大的恐慌,老刑警劉巖雷激,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件替蔬,死亡現(xiàn)場離奇詭異,居然都是意外死亡屎暇,警方通過查閱死者的電腦和手機(jī)承桥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來根悼,“玉大人凶异,你說我怎么就攤上這事〖费玻” “怎么了剩彬?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長矿卑。 經(jīng)常有香客問我喉恋,道長,這世上最難降的妖魔是什么母廷? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任瀑晒,我火速辦了婚禮,結(jié)果婚禮上徘意,老公的妹妹穿的比我還像新娘。我一直安慰自己轩褐,他們只是感情好椎咧,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般勤讽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天烈评,我揣著相機(jī)與錄音宵膨,去河邊找鬼。 笑死诸狭,一個(gè)胖子當(dāng)著我的面吹牛券膀,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播驯遇,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼芹彬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了叉庐?” 一聲冷哼從身側(cè)響起舒帮,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎陡叠,沒想到半個(gè)月后玩郊,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡枉阵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年译红,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片岭妖。...
    茶點(diǎn)故事閱讀 38,650評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡临庇,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出昵慌,到底是詐尸還是另有隱情假夺,我是刑警寧澤,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布斋攀,位于F島的核電站已卷,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏淳蔼。R本人自食惡果不足惜侧蘸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望鹉梨。 院中可真熱鬧讳癌,春花似錦、人聲如沸存皂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至骤菠,卻和暖如春它改,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背商乎。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工央拖, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人鹉戚。 一個(gè)月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓鲜戒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親崩瓤。 傳聞我的和親對象是個(gè)殘疾皇子袍啡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評論 2 349