翻譯論文：Deep Domain Confusion: Maximizing for Domain Invariance

題外話： 第一次做全文翻譯筝野，翻譯不好請(qǐng)諒解，多多給予意見粤剧。最近在看DDC歇竟，順便就把這篇文章翻譯一下。

摘要

　　最近的報(bào)告表明抵恋，在大規(guī)模數(shù)據(jù)集上訓(xùn)練的通用監(jiān)督深度cnn模型可以減少但不消除對(duì)標(biāo)準(zhǔn)基準(zhǔn)數(shù)據(jù)集的偏差焕议。在新的領(lǐng)域中對(duì)深度模型進(jìn)行微調(diào)可能需要大量的數(shù)據(jù)，對(duì)于許多應(yīng)用程序來(lái)說弧关，這些數(shù)據(jù)都是不可用的盅安。我們提出了一種新的cnn體系結(jié)構(gòu)，它引入了一個(gè)適應(yīng)層和一個(gè)額外的域混淆損失别瞭，學(xué)習(xí)一種既具有語(yǔ)義意義又具有域不變的表示畜隶。此外籽慢，我們還顯示箱亿，可以使用域混淆度量來(lái)進(jìn)行模型選擇髓帽，以決定適應(yīng)層的尺寸和在CNN架構(gòu)中的層的最佳位置郑藏。我們提出的自適應(yīng)方法提供了超過先前公布的結(jié)果的經(jīng)驗(yàn)性能。在標(biāo)準(zhǔn)基準(zhǔn)上視覺領(lǐng)域適配任務(wù)俱饿。

介紹

? ? 數(shù)據(jù)集偏差 是傳統(tǒng)的有監(jiān)督的圖像識(shí)別方法中一個(gè)眾所周知的問題失驶。最近的一些理論和經(jīng)驗(yàn)結(jié)果表明嬉探，監(jiān)督方法的測(cè)試誤差隨測(cè)試和訓(xùn)練輸入分布之間的差異而增加。在過去的幾年中,已經(jīng)提出了幾種用于視覺領(lǐng)域適配的方法, 克服此問題，但僅限于淺層模型芹敌。適應(yīng)深度模型的傳統(tǒng)方法是微調(diào)氏捞；有關(guān)最近的示例液茎，請(qǐng)參見。

? 在少量標(biāo)記的目標(biāo)數(shù)據(jù)上直接微調(diào)深度網(wǎng)絡(luò)的參數(shù)是有問題的栋烤。幸運(yùn)的是挺狰，經(jīng)過預(yù)先訓(xùn)練的深層模型在新領(lǐng)域確實(shí)表現(xiàn)良好。最近始绍，表明亏推，使用在ImageNet上學(xué)習(xí)到的深中位特征，而不是更傳統(tǒng)的詞包特征篇亭，有效地消除了某些域自適應(yīng)集合中的偏差译蒂。在office數(shù)據(jù)集中柔昼。

? 這些算法將特征從一個(gè)大范圍內(nèi)遷移出來(lái)捕透。ImageNet乙嘀，和使用該域中的所有數(shù)據(jù)作為相應(yīng)類別的源數(shù)據(jù)。但是曹质，這些方法無(wú)法從深層體系結(jié)構(gòu)中選擇特征几莽，而是跨多層選擇報(bào)告結(jié)果银觅。

? 數(shù)據(jù)集偏差在計(jì)算機(jī)視覺中通過托拉爾巴和埃弗羅斯（Torralba and　Efros）的“命名數(shù)據(jù)集”游戲進(jìn)行了經(jīng)典的說明究驴。實(shí)際上蝴韭，這被證明與領(lǐng)域差異度量有著正式的連接榄鉴。因此，對(duì)領(lǐng)域不變性的優(yōu)化驶忌，可以被視為等同于學(xué)習(xí)預(yù)測(cè)類標(biāo)簽的任務(wù)付魔。當(dāng)同時(shí)找到一個(gè)特征時(shí)几苍，使得這個(gè)領(lǐng)域出現(xiàn)盡可能相似妻坝。這一原則構(gòu)成了我們提議的方法的本質(zhì)。我們通過優(yōu)化損失來(lái)學(xué)習(xí)深度特征，這既包括標(biāo)簽數(shù)據(jù)上的分類誤差涂臣，也包括域混淆損失署辉。它試圖使域無(wú)法區(qū)分哭尝。

? 我們提出了一個(gè)新的CNN架構(gòu)（如圖1所示）材鹦，該架構(gòu)使用自適應(yīng)層以及基于最大均值差異（MMD）的域混淆損失來(lái)自動(dòng)學(xué)習(xí)一個(gè)特征聯(lián)合訓(xùn)練優(yōu)化分類和域不變栅葡。我們表明欣簇，我們的域混淆度量可以用于選擇適應(yīng)層的尺寸熊咽。在預(yù)先訓(xùn)練的CNN架構(gòu)中，選擇一個(gè)有效的位置對(duì)于一個(gè)新的適應(yīng)層滥玷，并對(duì)特征進(jìn)行微調(diào)。

? 我們的體系結(jié)構(gòu)可以用來(lái)解決兩種１．有監(jiān)督的適應(yīng)如贷，當(dāng)少量標(biāo)記的目標(biāo)域數(shù)據(jù)可用時(shí)，和２．無(wú)監(jiān)督自適應(yīng)楣富，當(dāng)沒有標(biāo)記的目標(biāo)訓(xùn)練數(shù)據(jù)可用時(shí)纹蝴。我們對(duì)流行的Office數(shù)據(jù)集在視覺上不同的領(lǐng)域進(jìn)行了全面的評(píng)估。我們通過對(duì)領(lǐng)域混淆和分類的聯(lián)合優(yōu)化來(lái)證明我們能夠顯著地超越當(dāng)前最新的視覺領(lǐng)域適配結(jié)果兼犯。事實(shí)上切黔，對(duì)于輕微的姿勢(shì)脓规、分辨率和照明變化的情況侨舆，我們的算法能夠在目標(biāo)域上實(shí)現(xiàn)96％的準(zhǔn)確率绢陌，這表明事實(shí)上脐湾，我們學(xué)到了一種對(duì)這些偏差不變的特征秤掌。

圖1：我們的體系結(jié)構(gòu)為分類損失和域不變性優(yōu)化了深度CNN愁铺。當(dāng)有少量的目標(biāo)數(shù)據(jù)可用時(shí)，可以對(duì)模型進(jìn)行監(jiān)督適應(yīng)訓(xùn)練闻鉴。在沒有目標(biāo)標(biāo)簽可用時(shí)茵乱。我們通過域混淆引入域不變性，引導(dǎo)自適應(yīng)層深度和寬度的選擇孟岛。以及微調(diào)期間附加的域損失項(xiàng)瓶竭，它直接最小化了源和目標(biāo)特征之間的距離。*

相關(guān)工作：

　視覺數(shù)據(jù)集偏差的概念在【無(wú)偏查看數(shù)據(jù)集偏差。在過程中屯吊，CVPR辨嗽，2011武花。1,2】中得到推廣跃须。近年來(lái)，人們提出了許多解決視覺領(lǐng)域適應(yīng)問題的方法冲泥。大家都認(rèn)識(shí)到有一個(gè)轉(zhuǎn)變?cè)谠春湍繕?biāo)數(shù)據(jù)特征的分布中。實(shí)際上,領(lǐng)域轉(zhuǎn)換的大小經(jīng)常通過源和目標(biāo)子空間特征之間的距離來(lái)測(cè)量。大量的方法試圖通過學(xué)習(xí)特征空間變換來(lái)克服這個(gè)差異隅很，以對(duì)準(zhǔn)源和目標(biāo)特征畜挥。對(duì)于監(jiān)督適應(yīng)情景來(lái)說，當(dāng)目標(biāo)域中有限數(shù)量的標(biāo)記數(shù)據(jù)是可用的時(shí)候十办，提出了一些方法來(lái)學(xué)習(xí)對(duì)源分類進(jìn)行正則化的目標(biāo)分類器。其他人試圖同時(shí)學(xué)習(xí)特征變換并規(guī)范目標(biāo)分類器紊撕。

? 最近，基于監(jiān)督卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特征表示已經(jīng)被證明是非常有效的各種視覺識(shí)別任務(wù)。特別的，使用深度表示顯著地減少分辨率和照明對(duì)域移動(dòng)的影響了赵。

? 并行CNN結(jié)構(gòu)络断，如暹羅網(wǎng)絡(luò)遭商，已經(jīng)被證明是有效的學(xué)習(xí)不變性特征。然而圈澈，訓(xùn)練這些網(wǎng)絡(luò)需要每個(gè)訓(xùn)練實(shí)例的標(biāo)簽氯迂。因此驰坊，還不清楚如何將這些方法擴(kuò)展到無(wú)監(jiān)督的設(shè)置拳芙。

? 多模態(tài)深度學(xué)習(xí)架構(gòu)也被探索，用以學(xué)習(xí)對(duì)不同輸入模態(tài)不變的表征挖垛。然而靠汁，這種方法主要在生成環(huán)境中運(yùn)作闽铐，因此沒有提供足夠的代表性功能來(lái)監(jiān)督CNN表示蝶怔。

? [Deep learning for domain adaptation by interpolating between domains.]提出了訓(xùn)練聯(lián)合源和目標(biāo)CNN架構(gòu)，但僅限于兩層兄墅，因此使用更深層架構(gòu)的方法顯著優(yōu)于[ImageNet classi?cation with deep convolutional neural networks.]踢星，在大型輔助數(shù)據(jù)源上進(jìn)行了預(yù)訓(xùn)練（例如： ImageNet ）。

? [Domain adaptive neural networks for object recognition]提出了使用去噪自動(dòng)編碼器進(jìn)行預(yù)訓(xùn)練隙咸，然后在MMD域混淆損失的同時(shí)訓(xùn)練雙層網(wǎng)絡(luò)沐悦。由于學(xué)習(xí)網(wǎng)絡(luò)相對(duì)較淺，因此缺乏通過直接優(yōu)化具有監(jiān)督深度CNN的分類目標(biāo)而學(xué)習(xí)的強(qiáng)語(yǔ)義表示五督，因此這有效地學(xué)習(xí)了領(lǐng)域不變性特征藏否。

訓(xùn)練基于CNN的域不變表示

? 我們引入了一種新的卷積神經(jīng)網(wǎng)絡(luò)（CNN）架構(gòu)，我們用它來(lái)學(xué)習(xí)視覺表示充包，它既是域不變的又提供了強(qiáng)大的語(yǔ)義分離副签。已經(jīng)表明，預(yù)訓(xùn)練的CNN可以通過微調(diào)來(lái)適應(yīng)新的任務(wù)基矮。但是淆储，在域適應(yīng)場(chǎng)景中，目標(biāo)域中很少或沒有標(biāo)記的訓(xùn)練數(shù)據(jù)家浇，因此我們無(wú)法直接微調(diào)目標(biāo)域T中的感興趣類別C遏考，相反，我們將使用的數(shù)據(jù)來(lái)自一個(gè)相關(guān)但不同的源域S蓝谨，其中可以從相應(yīng)的類別C中獲得更多標(biāo)記的數(shù)據(jù)灌具。

? 僅使用源數(shù)據(jù)直接訓(xùn)練分類器通常會(huì)導(dǎo)致對(duì)源分布的過擬合青团，從而導(dǎo)致在目標(biāo)域中識(shí)別時(shí)在測(cè)試時(shí)性能降低。我們的直覺是咖楣，如果我們可以學(xué)習(xí)最小化源和目標(biāo)分布之間距離的表示督笆，那么我們可以在源標(biāo)記的數(shù)據(jù)上訓(xùn)練分類器，并且直接應(yīng)用目標(biāo)域诱贿，并且精度損失最小娃肿。

? 為了最小化這個(gè)距離，我們考慮標(biāo)準(zhǔn)分布距離度量珠十，最大均值差異（MMD）料扰。該距離是相對(duì)于特定的表示φ（·）計(jì)算的。在我們的例子中焙蹭，我們定義了一個(gè)表示晒杈，φ（·），它對(duì)源數(shù)據(jù)點(diǎn)進(jìn)行操作孔厉，拯钻，和目標(biāo)數(shù)據(jù)點(diǎn)，撰豺。該距離的經(jīng)驗(yàn)近似計(jì)算如下：

如圖2所示粪般，不僅是想要最小化域之間的距離（或最大化域混淆），但我們想要一種有助于訓(xùn)練強(qiáng)大分類器的表示污桦。這樣的表示將使我們能夠?qū)W習(xí)很容易跨域遷移的強(qiáng)大分類器亩歹。滿足這兩個(gè)標(biāo)準(zhǔn)的一種方法是盡量減少損失：

其中LC（XL，y）表示在可用的標(biāo)簽數(shù)據(jù)XL上的分類損失凡橱，和基本真實(shí)標(biāo)簽y和MMD（XS捆憎，XT）表示源數(shù)據(jù)XS與目標(biāo)數(shù)據(jù)XT之間的距離。超參數(shù)λ決定了我們想要的混淆域的強(qiáng)度梭纹。

圖2：對(duì)于偏差數(shù)據(jù)集（左）躲惰，在源域中學(xué)習(xí)的分類不一定能很好地轉(zhuǎn)移到目標(biāo)域。通過優(yōu)化目標(biāo)变抽，同時(shí)最小化分類誤差和最大化域混淆（右）础拨，我們可以學(xué)習(xí)具有判別性和域不變性的表示。*

? 最小化這種損失的一種方法是采用固定的CNN绍载，這已經(jīng)是一種強(qiáng)有力的分類表示诡宗，并且使用來(lái)自最小化域分布距離的MMD來(lái)決定哪個(gè)層使用激活。然后击儡，我們可以使用這樣的特征塔沃，以便在其他類別的課程中感到有興趣進(jìn)行識(shí)別。這可以被認(rèn)為是等式2的坐標(biāo)下降：我們采用一個(gè)網(wǎng)絡(luò)可以經(jīng)過訓(xùn)練最小化LC阳谍，選擇最小化MMD的表示蛀柴，然后根據(jù)表示再一次最小化LC.

? 然而螃概，這種方法是有限的，因?yàn)樗荒苤苯舆m應(yīng)這個(gè)特征 - 相反鸽疾，它被限制為從一組固定的表示中進(jìn)行選擇吊洼。因此，我們建議創(chuàng)建一個(gè)網(wǎng)絡(luò)來(lái)直接優(yōu)化分類和域混淆目標(biāo)制肮，如圖1所示冒窍。

? 我們從Krizhevsky架構(gòu)開始，它具有五個(gè)卷積層和池化層以及三個(gè)全連接層豺鼻，其尺寸為{4096,4096综液，| C |}。我們另外添加了一個(gè)較低維度的“瓶頸”適應(yīng)層儒飒。我們的直覺是谬莹，較低維度的層可用于規(guī)范源分類器的訓(xùn)練，并防止過度擬合源分布的特定細(xì)微差別约素。我們將域距離損失置于“瓶頸”層之上届良，以直接將特征規(guī)范化為不同的源和目標(biāo)域笆凌。

? 必須進(jìn)行兩種模型選擇才能添加適應(yīng)層和域距離損失圣猎。我們必須選擇網(wǎng)絡(luò)中放置適配層的位置，我們必須選擇層的尺寸乞而。我們使用MMD度量來(lái)做出這兩個(gè)決定送悔。首先，如前所述爪模，對(duì)于我們的初始固定表示欠啤，我們找到了最小化所有可用源數(shù)據(jù)和目標(biāo)數(shù)據(jù)之間的經(jīng)驗(yàn)MMD距離的層，在我們的實(shí)驗(yàn)中屋灌，這對(duì)應(yīng)于將層放置在全連接層fc7之后洁段。

接下來(lái)，我們必須確定適應(yīng)層的尺寸共郭。我們通過網(wǎng)格搜索解決了這個(gè)問題祠丝，我們使用各種維度對(duì)多個(gè)網(wǎng)絡(luò)進(jìn)行微調(diào)，并在新的低維表示中計(jì)算MMD除嘹，最終選擇最小化源和目標(biāo)距離的維度写半。

選擇使用哪個(gè)特征層（“深度”）和適應(yīng)層應(yīng)該有多大（“寬度”）都由MMD引導(dǎo)，因此可以看作是我們整體目標(biāo)的下降步驟尉咕。

我們的架構(gòu)（參見圖1）由源和目標(biāo)CNN組成叠蝇，具有共享權(quán)重。僅使用標(biāo)記的示例來(lái)計(jì)算分類損失年缎，而從兩個(gè)域使用所有數(shù)據(jù)來(lái)計(jì)算域混淆損失悔捶。這個(gè)網(wǎng)絡(luò)對(duì)所有可用的源和目標(biāo)數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練谨读。

方程式2中概述的目標(biāo)很容易通過該卷積神經(jīng)網(wǎng)絡(luò)中的MMD表示，其中MMD是在小批量的源和目標(biāo)數(shù)據(jù)上計(jì)算的矾飞。我們只需在適應(yīng)層之后使用網(wǎng)絡(luò)頂部的分支姓建。一個(gè)分支使用標(biāo)簽數(shù)據(jù)并訓(xùn)練分類器，其他分支使用所有數(shù)據(jù)并計(jì)算源和目標(biāo)之間的MMD蛇损。

在對(duì)這種架構(gòu)進(jìn)行微調(diào)之后赁温，由于聯(lián)合損失中的兩個(gè)項(xiàng)，適應(yīng)層學(xué)習(xí)是由于分類損失項(xiàng)而能夠有效地區(qū)分所討論的類的表示淤齐，同時(shí)由于MMD術(shù)語(yǔ)仍然保持不變的域遷移股囊。我們希望這種表示能夠提高適應(yīng)性能。

圖3：最大均值差異和測(cè)試準(zhǔn)確度對(duì)于特征層的不同選擇更啄。我們觀察到源和目標(biāo)之間的MMD以及目標(biāo)域測(cè)試集上的準(zhǔn)確度似乎是反向相關(guān)的稚疹，這表明MMD可以用于幫助選擇適應(yīng)層。*

圖4：最大均值差異和測(cè)試準(zhǔn)確度對(duì)于適應(yīng)層維度的不同值祭务。我們觀察到源和目標(biāo)之間的MMD以及目標(biāo)域測(cè)試集上的準(zhǔn)確度與之相反内狗，表明MMD可用于幫助選擇要使用的維度。*

評(píng)估

我們?cè)诰哂行∫?guī)模源域的標(biāo)準(zhǔn)域適應(yīng)數(shù)據(jù)集上評(píng)估我們的自適應(yīng)算法义锥。我們展示了我們的算法能夠有效地適應(yīng)一個(gè)深度CNN特征柳沙，具有有限或無(wú)目標(biāo)標(biāo)簽數(shù)據(jù)的目標(biāo)域。

Office 數(shù)據(jù)集是來(lái)自三個(gè)不同域的圖像集合：亞馬遜拌倍，DSLR和網(wǎng)絡(luò)攝像頭赂鲤。數(shù)據(jù)集中的31個(gè)類別包括常用設(shè)置中常見的對(duì)象，如鍵盤柱恤，文件柜和筆記本電腦数初。最大的域有2817個(gè)標(biāo)記圖像。

我們針對(duì)通常用于評(píng)估的3個(gè)傳輸任務(wù)（亞馬遜→網(wǎng)絡(luò)攝像頭梗顺，數(shù)碼單反相機(jī)→網(wǎng)絡(luò)攝像頭和網(wǎng)絡(luò)攝像頭→數(shù)碼單反相機(jī)）中的每一個(gè)泡孩，對(duì)5個(gè)隨機(jī)的訓(xùn)練/測(cè)試集拆分評(píng)估我們的方法，并報(bào)告每個(gè)設(shè)置的平均值和標(biāo)準(zhǔn)誤差寺谤。我們?cè)诒O(jiān)督和無(wú)監(jiān)督情景中與最近發(fā)布的六種方法報(bào)告的數(shù)字進(jìn)行比較仑鸥。

我們遵循該數(shù)據(jù)集的標(biāo)準(zhǔn)訓(xùn)練協(xié)議，每個(gè)類別使用20個(gè)源示例用于Amazon源域矗漾，每個(gè)類別8個(gè)圖像用于Webcam或DSLR作為源域[29,16]锈候。對(duì)于監(jiān)督的適應(yīng)設(shè)置，我們假設(shè)每個(gè)類別有3個(gè)標(biāo)記的目標(biāo)示例敞贡。

評(píng)估適應(yīng)層位置

? 我們首先評(píng)估我們的特征選擇策略泵琳。

使用預(yù)先訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)，我們使用每個(gè)全連接層的表示從源數(shù)據(jù)和目標(biāo)數(shù)據(jù)中提取特征。然后我們可以計(jì)算每層的源和目標(biāo)之間的MMD获列。由于較低的MMD預(yù)測(cè)該特征更加域不變谷市，我們期望具有最低MMD的呈現(xiàn)以在適應(yīng)層之后實(shí)現(xiàn)最高性能。

? 為了驗(yàn)證這一假設(shè)击孩，對(duì)于Amazon→Webcam拆分之一迫悠，我們應(yīng)用Daum'e III 引入的簡(jiǎn)單域自適應(yīng)基線來(lái)計(jì)算目標(biāo)域的測(cè)試精度。圖3顯示了不同橋接層選擇的MMD和適應(yīng)性能的比較巩梢。我們看到MMD準(zhǔn)確地對(duì)特征進(jìn)行排列创泄，將fc7選為表現(xiàn)最佳的層，將fc6選為最差的括蝠。因此鞠抑，我們?cè)趂c7之后添加我們的適應(yīng)層用于剩下的實(shí)驗(yàn)。

選擇適應(yīng)層的尺寸

? 通過我們提出的微調(diào)方法學(xué)習(xí)新的特征之前忌警，我們必須決定這種特征有多寬搁拙。同樣，我們使用MMD作為決定度量法绵。

? 為了確定我們學(xué)習(xí)的適應(yīng)層應(yīng)該具有什么維度箕速，我們?cè)贏mazon→Webcam任務(wù)中訓(xùn)練具有不同寬度的各種網(wǎng)絡(luò)，因?yàn)檫@是三者中最具挑戰(zhàn)性的朋譬。特別是盐茎，我們嘗試不同的寬度，從64到4096不等此熬，每次乘以兩次冪庭呜。一旦網(wǎng)絡(luò)被訓(xùn)練滑进，我們就為每個(gè)學(xué)習(xí)的特征計(jì)算源和目標(biāo)之間的MMD犀忱。然后，我們的方法是選擇最小化源數(shù)據(jù)和目標(biāo)數(shù)據(jù)之間的MMD的尺寸扶关。

表1：使用Office數(shù)據(jù)集對(duì)標(biāo)準(zhǔn)監(jiān)督適應(yīng)設(shè)置進(jìn)行多種類別的準(zhǔn)確率評(píng)估阴汇。我們使用[29]中的標(biāo)準(zhǔn)實(shí)驗(yàn)方案對(duì)所有31個(gè)類別進(jìn)行評(píng)估。在這里节槐，我們與六種最先進(jìn)的領(lǐng)域適應(yīng)方法進(jìn)行比較搀庶。*

表2：使用Office數(shù)據(jù)集對(duì)標(biāo)準(zhǔn)無(wú)監(jiān)督自適應(yīng)設(shè)置進(jìn)行多種類別準(zhǔn)確率評(píng)估。我們使用[16]中的標(biāo)準(zhǔn)實(shí)驗(yàn)方案對(duì)所有31個(gè)類別進(jìn)行評(píng)估铜异。在這里哥倔，我們與六種最先進(jìn)的領(lǐng)域適應(yīng)方法進(jìn)行比較。*

? 為了驗(yàn)證MMD做出正確的選擇揍庄，我們?cè)俅螌MD與測(cè)試集上的性能進(jìn)行比較咆蒿。圖4顯示我們?yōu)檫m應(yīng)層選擇了256個(gè)維度，雖然此設(shè)置不是最大化測(cè)試性能的設(shè)置，但它似乎是一個(gè)合理的選擇沃测。特別是缭黔，使用MMD可以避免選擇性能受損的極端值。值得注意的是蒂破，該情節(jié)有相當(dāng)多的不規(guī)則性 - 也許精確的采樣將允許更準(zhǔn)確的選擇馏谨。

使用域混淆正則化進(jìn)行微調(diào)

一旦我們確定了我們對(duì)適應(yīng)層尺寸的選擇，我們就可以使用第3節(jié)中描述的聯(lián)合損失開始微調(diào)附迷。但是惧互，我們需要設(shè)置正則化超參數(shù)λ。將λ設(shè)置得太低將導(dǎo)致MMD正則化器對(duì)學(xué)習(xí)到的特征沒有影響喇伯，但是將λ設(shè)置得太高將會(huì)過度調(diào)整并學(xué)習(xí)退化特征壹哺，其中所有點(diǎn)都太靠近在一起。我們將正則化超參數(shù)設(shè)置為λ=

0.25艘刚，這使得目標(biāo)主要加權(quán)分類管宵，但具有足夠的正則化以避免過度擬合。

我們對(duì)無(wú)監(jiān)督和監(jiān)督使用相同的微調(diào)架構(gòu)攀甚。但是箩朴，在監(jiān)督設(shè)置中，分類器對(duì)來(lái)自兩個(gè)域的數(shù)據(jù)進(jìn)行訓(xùn)練秋度，而在無(wú)監(jiān)督設(shè)置中炸庞，由于缺少有標(biāo)簽的訓(xùn)練數(shù)據(jù)，分類器僅查看源數(shù)據(jù)荚斯。在這兩種設(shè)置中埠居，MMD規(guī)范器都可以看到所有數(shù)據(jù)，因?yàn)樗恍枰獦?biāo)簽事期。

最后滥壕，因?yàn)檫m應(yīng)層和分類器正在從頭開始訓(xùn)練，我們將其學(xué)習(xí)率設(shè)置為比從預(yù)訓(xùn)練模型復(fù)制的網(wǎng)絡(luò)的較低層高10倍兽泣。然后通過標(biāo)準(zhǔn)反向傳播優(yōu)化進(jìn)行微調(diào)绎橘。

監(jiān)督的適應(yīng)設(shè)置結(jié)果如表1所示，無(wú)監(jiān)督的自適應(yīng)結(jié)果如表2所示唠倦。我們注意到我們的算法明顯優(yōu)于所有競(jìng)爭(zhēng)方法称鳞。我們方法的明顯改進(jìn)表明，通過MMD正則化調(diào)整學(xué)習(xí)的適應(yīng)層能夠成功地遷移到新的目標(biāo)域稠鼻。

為了確定MMD正則化如何影響學(xué)習(xí)冈止，我們還在圖5中的亞馬遜→網(wǎng)絡(luò)攝像頭遷移任務(wù)上比較有和沒有正則化的學(xué)習(xí)曲線。我們看到候齿，雖然非正則化的版本最初訓(xùn)練更快熙暴，但它很快就開始過度訓(xùn)練苫亦，并且測(cè)試精度受到影響。相比之下怨咪，使用MMD正則化防止網(wǎng)絡(luò)過擬合到源數(shù)據(jù)屋剑，雖然訓(xùn)練需要更長(zhǎng)時(shí)間，但正則化導(dǎo)致更高的最終測(cè)試精度诗眨。

圖5：對(duì)于正則化和非正則化方法的最初700次調(diào)整迭代期間無(wú)監(jiān)督的亞馬遜→Webcam分割的測(cè)試精度圖唉匾。雖然最初的非正則化訓(xùn)練可以獲得更好的性能，但它可以超過源數(shù)據(jù)匠楚。相比之下巍膘，使用正則化防止過擬合，因此盡管初始學(xué)習(xí)速度較慢芋簿，但我們最終會(huì)看到更好的最終性能峡懈。*

? 為了進(jìn)一步證明我們學(xué)習(xí)的特征的域不變性，我們?cè)趫D6中繪制了使用我們學(xué)習(xí)的表示的亞馬遜和網(wǎng)絡(luò)攝像頭圖像的t-SNE嵌入与斤，并將其與在預(yù)訓(xùn)練模型中用fc7創(chuàng)建的嵌入進(jìn)行比較肪康。通過檢查嵌入，我們看到我們的特征表示在混合每個(gè)簇內(nèi)的域時(shí)表現(xiàn)出更嚴(yán)格的類聚類撩穿。雖然fc7嵌入中存在弱聚類磷支，但我們發(fā)現(xiàn)大多數(shù)緊密聚類由來(lái)自一個(gè)域或另一個(gè)域的數(shù)據(jù)點(diǎn)組成，但很少都是食寡。

在office數(shù)據(jù)集上歷史的進(jìn)步

? 在圖7中雾狈，我們報(bào)告了自引入標(biāo)準(zhǔn)OFFICE數(shù)據(jù)集以來(lái)的歷史進(jìn)展。我們指出使用傳統(tǒng)特征的方法（例如：SURFBoW）和藍(lán)色圓圈以及使用深紅色方形的深度特征的方法抵皱。我們展示了兩種適應(yīng)方案善榛。第一種方案是視覺上遙遠(yuǎn)的域（亞馬遜→網(wǎng)絡(luò)攝像頭）的監(jiān)督適應(yīng)任務(wù)。對(duì)于此任務(wù)呻畸，我們的算法優(yōu)于DeCAF 3.4％的多類精度移盆。最后，我們展示了無(wú)監(jiān)督適應(yīng)相似轉(zhuǎn)換的最艱巨的任務(wù)擂错。在這里味滞，我們表明我們的方法提供了5.5％多類精度的最重要的改進(jìn)樱蛤。

圖7：過去幾年在標(biāo)準(zhǔn)視覺域適應(yīng)數(shù)據(jù)集上的快速進(jìn)展钮呀，結(jié)果[29]。我們?cè)趤嗰R遜→網(wǎng)絡(luò)攝像頭上展示使用傳統(tǒng)手工設(shè)計(jì)的藍(lán)色圓圈視覺表示的方法昨凡，使用深度表示的方法用紅色方塊表示爽醋。對(duì)于監(jiān)督任務(wù)，我們的方法實(shí)現(xiàn)了84％的多類精度便脊，增加了3％蚂四。對(duì)于無(wú)監(jiān)督任務(wù)，我們的方法實(shí)現(xiàn)了60％的多類精度，增加了6％遂赠。*

結(jié)論

在本文中久妆，我們提出了一個(gè)學(xué)習(xí)領(lǐng)域不變性特征的目標(biāo)函數(shù)用于分類。該目標(biāo)利用額外的域混淆術(shù)語(yǔ)來(lái)確保在學(xué)習(xí)的特征中無(wú)法區(qū)分域跷睦。然后筷弦，我們提出了各種方法來(lái)優(yōu)化這一目標(biāo)，從固定池的簡(jiǎn)單特征選擇到通過反向傳播直接最小化目標(biāo)的完整卷積架構(gòu)抑诸。

我們的完整方法使用MMD來(lái)選擇體系結(jié)構(gòu)的深度和寬度烂琴，同時(shí)在微調(diào)期間將其用作正則化器，在標(biāo)準(zhǔn)視覺域適應(yīng)基準(zhǔn)測(cè)試中實(shí)現(xiàn)了最先進(jìn)的性能蜕乡，超越了之前相當(dāng)可觀的方法奸绷。

這些實(shí)驗(yàn)表明，將域混淆項(xiàng)納入判別特征學(xué)習(xí)過程是確保學(xué)習(xí)特征既可用于分類又對(duì)域移位不變的有效方法层玲。

致謝

? 這項(xiàng)工作部分得到了DARPA的MSEE和SMISC計(jì)劃的支持号醉，NSF獎(jiǎng)勵(lì)了IIS-1427425，IIS-1212798和IIS-1116411辛块，豐田以及伯克利遠(yuǎn)景和學(xué)習(xí)中心

圖6：亞馬遜（藍(lán)色）和網(wǎng)絡(luò)攝像頭（綠色）圖像的t-SNE嵌入使用我們基于MMD正則化學(xué)習(xí)的監(jiān)督256維特征（左上）和來(lái)自預(yù)訓(xùn)練模型的原始fc7特征（右下）扣癣。觀察由我們的特征形成的聚類分離類別，同時(shí)比未訓(xùn)練域不變性的原始特征更有效地混合域憨降。例如父虑，在fc7-space中，亞馬遜監(jiān)視器和Webcam監(jiān)視器被分成不同的集群授药，而使用我們的所學(xué)習(xí)的特征士嚎，所有與域無(wú)關(guān)的監(jiān)視器都被混合到同一個(gè)集群中。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末悔叽，一起剝皮案震驚了整個(gè)濱河市莱衩，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌娇澎，老刑警劉巖笨蚁，帶你破解...
沈念sama閱讀 212,884評(píng)論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異趟庄，居然都是意外死亡括细，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,755評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門戚啥，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)奋单，“玉大人，你說我怎么就攤上這事猫十±辣簦” “怎么了呆盖？”我有些...
開封第一講書人閱讀 158,369評(píng)論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)贷笛。經(jīng)常有香客問我应又，道長(zhǎng)，這世上最難降的妖魔是什么乏苦？我笑而不...
開封第一講書人閱讀 56,799評(píng)論 1贊 285
?港島之戀（遺憾婚禮）
正文為了忘掉前任丁频，我火速辦了婚禮，結(jié)果婚禮上邑贴，老公的妹妹穿的比我還像新娘席里。我一直安慰自己，他們只是感情好拢驾，可當(dāng)我...
茶點(diǎn)故事閱讀 65,910評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布奖磁。她就那樣靜靜地躺著，像睡著了一般繁疤。火紅的嫁衣襯著肌膚如雪咖为。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 50,096評(píng)論 1贊 291
城市分裂傳說
那天稠腊，我揣著相機(jī)與錄音躁染，去河邊找鬼。笑死架忌，一個(gè)胖子當(dāng)著我的面吹牛吞彤，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播叹放，決...
沈念sama閱讀 39,159評(píng)論 3贊 411
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼饰恕，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了井仰？” 一聲冷哼從身側(cè)響起埋嵌，我...
開封第一講書人閱讀 37,917評(píng)論 0贊 268
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎俱恶，沒想到半個(gè)月后雹嗦，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,360評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡合是，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,673評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年了罪，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片端仰。...
茶點(diǎn)故事閱讀 38,814評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡捶惜，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出荔烧，到底是詐尸還是另有隱情吱七，我是刑警寧澤，帶...
沈念sama閱讀 34,509評(píng)論 4贊 334
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布鹤竭，位于F島的核電站踊餐，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏臀稚。R本人自食惡果不足惜吝岭，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,156評(píng)論 3贊 317
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望吧寺。院中可真熱鬧窜管，春花似錦、人聲如沸稚机。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,882評(píng)論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)赖条。三九已至失乾，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間纬乍，已是汗流浹背碱茁。一陣腳步聲響...
開封第一講書人閱讀 32,123評(píng)論 1贊 267
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留仿贬，地道東北人纽竣。一個(gè)月前我還...
沈念sama閱讀 46,641評(píng)論 2贊 362
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像茧泪，于是被迫代替她去往敵國(guó)和親退个。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,728評(píng)論 2贊 351

翻譯論文：Deep Domain Confusion: Maximizing for Domain Invariance

推薦閱讀更多精彩內(nèi)容