領(lǐng)域自適應(yīng)閱讀筆記2

Progressive Feature Alignment for Unsupervised Domain Adaptation

來源：CVPR 2019,廈門大學(xué)信息科學(xué)與工程學(xué)院，騰訊AI實驗室斩狱。

作者：Chaoqi Chen, Weiping Xie等

數(shù)據(jù)集：Office-31（31類樣本涵卵，三個域，A,W,D泉唁，本文適配6次）,ImageCLEF-DA（12類樣本，三個域，I,P,C妓忍，本文適配6次）,MNIST,SVHN,USPS（這三個數(shù)據(jù)集甲喝，MNIST的圖片size是28*28尝苇，SVHN的圖片size是16*16，USPS的圖片size是32*32埠胖，并且一張圖片上通常有多個數(shù)字糠溜，文中沿襲之前的工作，進(jìn)行MNIST到SVHN的雙向適配直撤，MNIST到USPS的單向適配）

實現(xiàn)框架：Caffe

實驗的backbone：AlexNet

損失函數(shù)：

整體的優(yōu)化目標(biāo)

對齊整體分布的損失函數(shù)

對齊原域和目標(biāo)域每一類樣本的損失函數(shù)

筆記里我記得比較雜非竿，可能突出不了本文的重點。目前正在探索中谋竖，目標(biāo)是红柱，既突出重點，又能把從該篇論文中得到的關(guān)于已學(xué)知識的進(jìn)一步認(rèn)識給記錄下來蓖乘。

摘要部分

之前有人提出用加入偽標(biāo)簽的方法來進(jìn)行原域和目標(biāo)域的類分布（class-level distribution）的對齊锤悄，但是這種方法對錯誤累積（error calculation）非常敏感，因而不能保留跨域的種類一致性（cross-domain category consistency）嘉抒。

本文提出用PFAN通過探索目標(biāo)域的類內(nèi)的多樣性來對齊原域和目標(biāo)域的有辨別力的特征零聚。

?We propose the Progressive Feature Alignment Network (PFAN) to align the discriminative features across domains progressively and effectively, via exploiting the intra-class variation in the target domain.

特別地，本文用特別提出用Easy to-Hard Transfer Strategy (EHTS) 和 Adaptive Prototype Alignment (APA) 來訓(xùn)練模型众眨。

?同時握牧，為了減慢原域分類損失的收斂速度，本文把在softmax函數(shù)中加入了一個temperature variate娩梨。

Introduction

本文方法的動機

圓圈代表原域樣本沿腰，三角代表目標(biāo)域樣本，綠色代表數(shù)字9狈定，橘色代表數(shù)字7颂龙，藍(lán)色代表數(shù)字1.

用原域樣本訓(xùn)練出分類器，對目標(biāo)域樣本進(jìn)行分類纽什，可以看到措嵌，目標(biāo)域樣本（三角形）可分成三種情況：

第一種，作者稱為easy samples芦缰。

這類目標(biāo)域樣本企巢，由于和原域非常接近，被分類器分對的可能性很大让蕾，不需要適配就能給它們分配偽標(biāo)簽浪规。

第二種稱為hard samples或听。圖中紫色圓圈圈住的樣本。

它們是那些離原域很遠(yuǎn)的目標(biāo)域樣本笋婿，,它們位于分類邊界附近誉裆，分類器不知道把它們分成哪一類。

第三種稱為叫做false-easy samples缸濒。圖中紅色圓圈圈住的樣本足丢。

它們屬于easy samples，但是分類器給它們分配的偽標(biāo)簽是錯誤的庇配。雖然分類器把這類樣本分錯了斩跌，但是分類器對自己

迷之自信，認(rèn)為自己分得是非常正確的讨永，換句話說滔驶，分類器對自己的分類結(jié)果有很高的confidence。

作者認(rèn)為卿闹，這些false-easy samples會給種類對齊（catagory alignment）帶來錯誤信息揭糕，可能會造成錯誤累積。

作者提出的PFAN網(wǎng)絡(luò)锻霎，主要采取EHTS和APA著角。EHTS的作用是漸進(jìn)式地選擇那些值得信賴的目標(biāo)域樣本（已經(jīng)被分配了偽標(biāo)簽），APA的作用是對于原域和目標(biāo)域中的每一類旋恼，對齊它們的原型（prototype).

EHTS和APA是相互作用的吏口，EHTS可以促進(jìn)APA，APA又可以反過來促進(jìn)EHTS冰更。

In this paper, we propose a Progressive Feature AlignmentNetwork (PFAN), which largely extends the abilityof prior discriminative representations-based approaches byexplicitly enforcing the category alignment in a progressivemanner. Firstly, an Easy-to-Hard Transfer Strategy(EHTS) progressively selects reliable pseudo-labeled targetsamples with cross-domain similarity measurements. However,the selected samples may include some misclassifiedtarget samples with high confidence. Then, to suppressthe negative influence of falsely-labeled samples, we proposean Adaptive Prototype Alignment (APA) to align thesource and target prototypes for each category. Rather thanbackpropagating the category loss for target samples basedon pseudo-labeled samples, our work statistically align thecross-domain class distributions based on the source samplesand the selected pseudo-labeled target samples产徊。

PFAN的整體結(jié)構(gòu)

接下來是過于詳細(xì)的解說：

??????? 每一個原域樣本通過嵌入函數(shù)G（即圖2中的特征提取器）后，會得到一個D維的特征向量蜀细，本文假定原域和目標(biāo)域中的樣本均有C類舟铜，對原域中的每一類樣本，計算其經(jīng)過潛入函數(shù)后得到向量的均值奠衔，該均值就是文中提到的source prototype谆刨，這個均值也是一個D維的向量。故原域中共有C個prototype.归斤。

source prototype的計算公式

對于一個不帶標(biāo)簽的目標(biāo)域樣本痊夭，文中通過以下方式為其分配偽標(biāo)簽。

????????? 首先脏里，文中定義一個相似性度量函數(shù)psi她我，該函數(shù)是一個cosine相似度函數(shù)，用于衡量經(jīng)過特征提取器提取后的目標(biāo)域向量和原域的某一類prototype之間相似性，原域有C類番舆，共有C個prototype,這樣根吁，就計算出了C個結(jié)果，最后合蔽，在這C個結(jié)果中選取psi最大的值對應(yīng)的類別數(shù)作為該目標(biāo)域樣本的標(biāo)簽。

相似性度量函數(shù)

?????? 接下來開始選擇目標(biāo)域樣本的easy samples介返，選擇的標(biāo)準(zhǔn)是設(shè)置一個閾值tau拴事，剛才，我們?yōu)槊恳粋€目標(biāo)域樣本都計算出了C個psi值圣蝎，選擇最大的psi值和tau比較刃宵，若大于tau，則該目標(biāo)域樣本被選中成easy samples徘公。

??? 由于隨著訓(xùn)練的進(jìn)行牲证，psi的值是逐漸增大的，所以為了控制easy samples的生成速率关面，文中對于tau值的設(shè)定是隨著訓(xùn)練的進(jìn)行而不斷變化的坦袍，文中給出了tau的計算公式。

tau的計算公式

目標(biāo)域的easy samples的選擇方式

APA通過對齊原域的prototype和被選擇出來的目標(biāo)域樣本的prototype來減弱false-easy samples的負(fù)面影響以及促進(jìn)原域和目標(biāo)域的種類一致性等太。對齊是通過最小化原域和目標(biāo)域的prototype之間的歐氏距離來實現(xiàn)的捂齐。

原域和目標(biāo)域的prototype的度量

等式5里面提到的prototype是全局的，也就是說要找出原域中某一類的全部樣本缩抡，然后再計算prototype奠宜，但是實際訓(xùn)練中，是用mini-batch方法訓(xùn)練的瞻想，每次只處理batchsize個樣本压真，因而，可以用原域樣本中batchsize個樣本去算出原域的一個local prototype蘑险，再用目標(biāo)域里通過EHTS選取出的樣本來算出目標(biāo)域的local prototype滴肿，然后去對齊這兩個prototype。

但是這種方法有缺點漠其，那就是當(dāng)每一個mini-batch中包含的樣本類別不到C時嘴高，目標(biāo)域里的一個false-sample樣本就會讓計算出的prototype和真實的prototype之間產(chǎn)生很大的差異。

基于上面的問題和屎，本文采用如下方式解決：首先APA根據(jù)最初選取的目標(biāo)域的easy-samples計算出目標(biāo)域的一個global prototype拴驮，然后，在每次迭代過程中柴信，都要去計算C個目標(biāo)域的local prototype套啤，迭代到當(dāng)前，總共迭代了I次，一共計算出了I*C個目標(biāo)域的local prototype潜沦，那么每一種類的樣本都計算出了I個local prototype萄涯，把這I個local prototype取平均值，然后利用這個平均值唆鸡，通過公式8所表達(dá)的那樣來得到當(dāng)前迭代次數(shù)下的某一類的global prototype涝影。公式8里首先用前面提到的psi函數(shù)來度量當(dāng)前上一迭代步的global prototype和本次迭代步計算出的平均值之間的相似度，然后利用這個相似度的平方和1減去這個相似度的平方分別做系數(shù)争占，根據(jù)這個平均數(shù)以及上一迭代步的global prototype來計算新的global prototype燃逻。原域樣本某一類的global prototype也通過這種方式來計算。

平均值計算公式

第I次迭代時臂痕，global prototype的計算方式

整體的算法流程

在這篇論文里伯襟，提到了其他運用偽標(biāo)簽的論文，我讀過的有Learning Semantic Representations for Unsupervised Domain Adaptation以及Collaborative and Adversarial Network for Unsupervised domain adaptation握童。這兩篇都是用對抗方法的姆怪。

關(guān)于對之前方法的總結(jié)，我認(rèn)為作者總結(jié)得不錯的部分澡绩，摘抄下來：

Many approaches utilize a distance metric to measurethe domain discrepancy between the source and target domains,such as maximum mean discrepancy (MMD), KLdivergenceor Wasserstein distance [12, 22, 37, 24, 42, 6].Most prior efforts intend to achieve domain alignment bymatching P(Xs) and P(Xt). However, an exact domainlevelalignment does not imply a fine-grained class-to-classoverlap.

最后編輯于：2019.10.25 21:55:37

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末稽揭，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子肥卡，更是在濱河造成了極大的恐慌淀衣，老刑警劉巖，帶你破解...
沈念sama閱讀 211,743評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件召调，死亡現(xiàn)場離奇詭異膨桥，居然都是意外死亡，警方通過查閱死者的電腦和手機唠叛，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,296評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門只嚣，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人艺沼，你說我怎么就攤上這事册舞。” “怎么了障般？”我有些...
開封第一講書人閱讀 157,285評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵调鲸，是天一觀的道長。經(jīng)常有香客問我挽荡，道長藐石，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 56,485評論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任定拟，我火速辦了婚禮于微，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己株依，他們只是感情好驱证，可當(dāng)我...
茶點故事閱讀 65,581評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著恋腕，像睡著了一般抹锄。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上荠藤，一...
開封第一講書人閱讀 49,821評論 1贊 290
城市分裂傳說
那天祈远，我揣著相機與錄音，去河邊找鬼商源。笑死，一個胖子當(dāng)著我的面吹牛谋减，可吹牛的內(nèi)容都是我干的牡彻。我是一名探鬼主播，決...
沈念sama閱讀 38,960評論 3贊 408
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼出爹，長吁一口氣：“原來是場噩夢啊……” “哼庄吼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起严就，我...
開封第一講書人閱讀 37,719評論 0贊 266
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤总寻，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后梢为，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體渐行，經(jīng)...
沈念sama閱讀 44,186評論 1贊 303
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,516評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年铸董，在試婚紗的時候發(fā)現(xiàn)自己被綠了祟印。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,650評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡粟害，死狀恐怖蕴忆，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情悲幅，我是刑警寧澤套鹅，帶...
沈念sama閱讀 34,329評論 4贊 330
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站汰具，受9級特大地震影響卓鹿，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜留荔，卻給世界環(huán)境...
茶點故事閱讀 39,936評論 3贊 313
男人毒藥：我在死后第九天來索命
文/蒙蒙一减牺、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦拔疚、人聲如沸肥隆。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,757評論 0贊 21
一樁弒父案稚失，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽栋艳。三九已至，卻和暖如春句各，著一層夾襖步出監(jiān)牢的瞬間吸占，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,991評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工凿宾，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留矾屯，地道東北人。一個月前我還...
沈念sama閱讀 46,370評論 2贊 360
代替公主和親
正文我出身青樓初厚，卻偏偏與公主長得像件蚕，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子产禾，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 43,527評論 2贊 349

領(lǐng)域自適應(yīng)閱讀筆記2

Progressive Feature Alignment for Unsupervised Domain Adaptation

摘要部分

Introduction

推薦閱讀更多精彩內(nèi)容