Open Set Domain Adaptation 開集領(lǐng)域適應(yīng)

1. Motivation

2017年ICCV上發(fā)表了一篇題為Open Set Domain Adaptation[1]的論文說:一般我們所講的領(lǐng)域適應(yīng)(domain adaptation)是在一個(gè)閉集(close set)的前提條件下進(jìn)行的,即源域和目標(biāo)與擁有相同的標(biāo)簽類別对省。但是在大多數(shù)的實(shí)際情況中整陌,源域和目標(biāo)域可能只共享了一部分相同類別。如圖1所示(圖片來源于文獻(xiàn)[1])疼约,在Close set domain adaptation問題中,目標(biāo)與中出現(xiàn)的標(biāo)簽類別全在源域中出現(xiàn)了,而在Open set domain adaptation問題中速妖,目標(biāo)域中出現(xiàn)的摩托車虱颗、電視沥匈、飛機(jī)等均未在源域中出現(xiàn);相反忘渔,源域中出現(xiàn)的鳥高帖、筆記本、杯子也未在目標(biāo)域中出現(xiàn)畦粮。

圖1:Close set domain adaptation和Open set domain adaptation對(duì)比 [1]

顯然domain adaptation in close set中的方法不能用于解決domain adaptation in open set問題散址,在進(jìn)行特征對(duì)齊的時(shí)候只能對(duì)其已知的類別乖阵,不能對(duì)齊未知的類別。

2. Method

圖2:Method

為解決Open Set問題预麸,作者提出了Open Set Domain Adaptation方法瞪浸,步驟如下:
(a) 源域中包含已知帶標(biāo)簽的樣本(分別用紅、藍(lán)吏祸、綠以及不同形狀表示)和未知樣本(灰色表示)对蒲,而目標(biāo)域中不包含任何標(biāo)簽信息;
(b) 首先贡翘,我們?yōu)橐恍┠繕?biāo)樣本分配類別標(biāo)簽蹈矮,留下未標(biāo)記的異常樣本;
(c) 通過減小標(biāo)記為同一類別的源域和目標(biāo)域數(shù)據(jù)之間的距離鸣驱,我們可以學(xué)習(xí)到從源域到目標(biāo)域的映射關(guān)系含滴。降(b)和(c)反復(fù)迭代,直到源域與目標(biāo)域之間的距離收斂到局部最小值丐巫;
(d) 為了個(gè)目標(biāo)域的樣本打上標(biāo)簽(紅色谈况,綠色,藍(lán)色和灰色(未知類別))递胧,我們?cè)谝呀?jīng)映射到目標(biāo)域的源域數(shù)據(jù)上學(xué)習(xí)分類器碑韵,并用它來分類目標(biāo)域樣本。

這里分別以Usupervised Domain Adaptation(無監(jiān)督領(lǐng)域自適應(yīng))和Semi-supervised Domain Adaptation(半監(jiān)督領(lǐng)域自適應(yīng))兩個(gè)應(yīng)用場(chǎng)景來介紹缎脾。

2.1 Unsupervised Domain Adaptation

源域數(shù)據(jù)C個(gè)類別祝闻,其中\left | C-1\right |個(gè)已知,1個(gè)未知
目標(biāo)域數(shù)據(jù)\mathcal{T}=\left \{T_1, T_2, ...,T_{\mathcal{T}}\right \}
目標(biāo):給目標(biāo)域中的每一個(gè)數(shù)據(jù)\mathcal{T}打上標(biāo)簽c \in C
損失函數(shù):將目標(biāo)域樣本T_t標(biāo)記為標(biāo)簽c的損失函數(shù)記為:d_{ct}=\left \| S_{c}-T_{t}\right \|_{2}^{2}遗菠,其中T_{t}是目標(biāo)域樣本t的特征表達(dá)联喘,S_{c}是源域中標(biāo)簽為c的樣本的均值。這里采用的是樣本一階矩來度量?jī)蓚€(gè)分布間差異辙纬,當(dāng)然我們是希望d_{ct}越小越好豁遭,表明給目標(biāo)域數(shù)據(jù)T_{c}的標(biāo)簽越接近真實(shí)標(biāo)簽。

為了增加模型的魯棒性贺拣,這里并不會(huì)為目標(biāo)域中的沒有一個(gè)樣本都分配一個(gè)標(biāo)簽c蓖谢,而是引入了異常值o_{t},整個(gè)模型的優(yōu)化目標(biāo)如下:


其中x_{ct}o_{t}是兩個(gè)二值變量譬涡,他們要么是0要么是1闪幽。當(dāng)x_{ct}為0 ,o_{t}為1表明目標(biāo)域中的該樣本為異常值涡匀,反之亦然盯腌。第二個(gè)約束條件確保至少有一個(gè)樣本被標(biāo)記為了標(biāo)簽c。所以最終的目標(biāo)是確保目標(biāo)域中所有樣本的d_{ct}o_{t}的和最小陨瘩。

2.2 Semi-supervised Domain Adaptation

當(dāng)目標(biāo)域有一小部分標(biāo)記數(shù)據(jù)之后無監(jiān)督問題可以變成一個(gè)半監(jiān)督問題腕够。要處理semi-supervised情況级乍,只需要在現(xiàn)有的unsupervised情況下,添加那些有l(wèi)abel的target的約束信息燕少。作者為了達(dá)到這個(gè)目的卡者,引入了一個(gè)新的變量x_{\hat{c}_{t}t} = 1,\forall (t,\hat{c}_{t})\in \mathcal{L}蒿囤,其中\mathcal{L}表示帶目標(biāo)域帶標(biāo)簽樣本集客们,\hat{c}_{t}表示目標(biāo)域樣本t的標(biāo)簽。該項(xiàng)表示所有已有標(biāo)簽的目標(biāo)域樣本不改變其標(biāo)簽材诽。目標(biāo)函數(shù)就變成了:


其中底挫,d_{cc'}=\left \| S_{c}-S_{c'}\right \|_{2}^{2},它表示當(dāng)樣本t的臨近點(diǎn) 中有臨近點(diǎn)N_{t}被分配到另一類的時(shí)候脸侥,額外加上一個(gè)類間的距離差作為損失建邓。

2.3 Mapping

我們假設(shè)有一個(gè)線性變換,可以估計(jì)出源域到目標(biāo)域的映射關(guān)系睁枕,用一個(gè)矩陣W \in \mathbb{R}^{D \times D}官边。損失函數(shù)如下:


對(duì)W求偏導(dǎo)可以求出使f(W)最小的W

References:

[1] Busto, P. P. , and J. Gall . "Open Set Domain Adaptation." IEEE International Conference on Computer Vision IEEE, 2017.
[2] 《小王愛遷移》系列之九:開放集遷移學(xué)習(xí)(Open Set)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末外遇,一起剝皮案震驚了整個(gè)濱河市注簿,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌跳仿,老刑警劉巖诡渴,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異菲语,居然都是意外死亡妄辩,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門山上,熙熙樓的掌柜王于貴愁眉苦臉地迎上來眼耀,“玉大人,你說我怎么就攤上這事佩憾∨纤” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵鸯屿,是天一觀的道長(zhǎng)澈吨。 經(jīng)常有香客問我,道長(zhǎng)寄摆,這世上最難降的妖魔是什么谅辣? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮婶恼,結(jié)果婚禮上桑阶,老公的妹妹穿的比我還像新娘柏副。我一直安慰自己,他們只是感情好蚣录,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布割择。 她就那樣靜靜地躺著,像睡著了一般萎河。 火紅的嫁衣襯著肌膚如雪荔泳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天虐杯,我揣著相機(jī)與錄音玛歌,去河邊找鬼。 笑死擎椰,一個(gè)胖子當(dāng)著我的面吹牛支子,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播达舒,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼值朋,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了巩搏?” 一聲冷哼從身側(cè)響起昨登,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎塔猾,沒想到半個(gè)月后篙骡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡丈甸,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年糯俗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片睦擂。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡得湘,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出顿仇,到底是詐尸還是另有隱情淘正,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布臼闻,位于F島的核電站鸿吆,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏述呐。R本人自食惡果不足惜惩淳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望乓搬。 院中可真熱鬧思犁,春花似錦代虾、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至学辱,卻和暖如春乘瓤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背项郊。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工馅扣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斟赚,地道東北人着降。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像拗军,于是被迫代替她去往敵國(guó)和親任洞。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容