領(lǐng)域自適應(yīng)閱讀筆記2

Progressive Feature Alignment for Unsupervised Domain Adaptation

來源:CVPR 2019,廈門大學(xué)信息科學(xué)與工程學(xué)院,騰訊AI實驗室斩狱。

作者:Chaoqi Chen, Weiping Xie等

數(shù)據(jù)集:Office-31(31類樣本涵卵,三個域,A,W,D泉唁,本文適配6次),ImageCLEF-DA(12類樣本,三個域,I,P,C妓忍,本文適配6次),MNIST,SVHN,USPS(這三個數(shù)據(jù)集甲喝,MNIST的圖片size是28*28尝苇,SVHN的圖片size是16*16,USPS的圖片size是32*32埠胖,并且一張圖片上通常有多個數(shù)字糠溜,文中沿襲之前的工作,進(jìn)行MNIST到SVHN的雙向適配直撤,MNIST到USPS的單向適配)

實現(xiàn)框架:Caffe

實驗的backbone:AlexNet

損失函數(shù):

整體的優(yōu)化目標(biāo)


對齊整體分布的損失函數(shù)


對齊原域和目標(biāo)域每一類樣本的損失函數(shù)

筆記里我記得比較雜非竿,可能突出不了本文的重點。目前正在探索中谋竖,目標(biāo)是红柱,既突出重點,又能把從該篇論文中得到的關(guān)于已學(xué)知識的進(jìn)一步認(rèn)識給記錄下來蓖乘。

摘要部分

之前有人提出用加入偽標(biāo)簽的方法來進(jìn)行原域和目標(biāo)域的類分布(class-level distribution)的對齊锤悄,但是這種方法對錯誤累積(error calculation)非常敏感,因而不能保留跨域的種類一致性(cross-domain category consistency)嘉抒。

本文提出用PFAN通過探索目標(biāo)域的類內(nèi)的多樣性來對齊原域和目標(biāo)域的有辨別力的特征零聚。

?We propose the Progressive Feature Alignment Network (PFAN) to align the discriminative features across domains progressively and effectively, via exploiting the intra-class variation in the target domain.

特別地,本文用特別提出用Easy to-Hard Transfer Strategy (EHTS) 和 Adaptive Prototype Alignment (APA) 來訓(xùn)練模型众眨。

?同時握牧,為了減慢原域分類損失的收斂速度,本文把在softmax函數(shù)中加入了一個temperature variate娩梨。

Introduction




本文方法的動機

圓圈代表原域樣本沿腰,三角代表目標(biāo)域樣本,綠色代表數(shù)字9狈定,橘色代表數(shù)字7颂龙,藍(lán)色代表數(shù)字1.

用原域樣本訓(xùn)練出分類器,對目標(biāo)域樣本進(jìn)行分類纽什,可以看到措嵌,目標(biāo)域樣本(三角形)可分成三種情況:

第一種,作者稱為easy samples芦缰。

這類目標(biāo)域樣本企巢,由于和原域非常接近,被分類器分對的可能性很大让蕾,不需要適配就能給它們分配偽標(biāo)簽浪规。

第二種稱為hard samples或听。圖中紫色圓圈圈住的樣本。

它們是那些離原域很遠(yuǎn)的目標(biāo)域樣本笋婿,,它們位于分類邊界附近誉裆,分類器不知道把它們分成哪一類。

第三種稱為叫做false-easy samples缸濒。圖中紅色圓圈圈住的樣本足丢。

它們屬于easy samples,但是分類器給它們分配的偽標(biāo)簽是錯誤的庇配。雖然分類器把這類樣本分錯了斩跌,但是分類器對自己

迷之自信,認(rèn)為自己分得是非常正確的讨永,換句話說滔驶,分類器對自己的分類結(jié)果有很高的confidence。

作者認(rèn)為卿闹,這些false-easy samples會給種類對齊(catagory alignment)帶來錯誤信息揭糕,可能會造成錯誤累積。

作者提出的PFAN網(wǎng)絡(luò)锻霎,主要采取EHTS和APA著角。EHTS的作用是漸進(jìn)式地選擇那些值得信賴的目標(biāo)域樣本(已經(jīng)被分配了偽標(biāo)簽),APA的作用是對于原域和目標(biāo)域中的每一類旋恼,對齊它們的原型(prototype).

EHTS和APA是相互作用的吏口,EHTS可以促進(jìn)APA,APA又可以反過來促進(jìn)EHTS冰更。

In this paper, we propose a Progressive Feature AlignmentNetwork (PFAN), which largely extends the abilityof prior discriminative representations-based approaches byexplicitly enforcing the category alignment in a progressivemanner. Firstly, an Easy-to-Hard Transfer Strategy(EHTS) progressively selects reliable pseudo-labeled targetsamples with cross-domain similarity measurements. However,the selected samples may include some misclassifiedtarget samples with high confidence. Then, to suppressthe negative influence of falsely-labeled samples, we proposean Adaptive Prototype Alignment (APA) to align thesource and target prototypes for each category. Rather thanbackpropagating the category loss for target samples basedon pseudo-labeled samples, our work statistically align thecross-domain class distributions based on the source samplesand the selected pseudo-labeled target samples产徊。



PFAN的整體結(jié)構(gòu)


接下來是過于詳細(xì)的解說:

??????? 每一個原域樣本通過嵌入函數(shù)G(即圖2中的特征提取器)后,會得到一個D維的特征向量蜀细,本文假定原域和目標(biāo)域中的樣本均有C類舟铜,對原域中的每一類樣本,計算其經(jīng)過潛入函數(shù)后得到向量的均值奠衔,該均值就是文中提到的source prototype谆刨,這個均值也是一個D維的向量。故原域中共有C個prototype.归斤。


source prototype的計算公式

對于一個不帶標(biāo)簽的目標(biāo)域樣本痊夭,文中通過以下方式為其分配偽標(biāo)簽。

????????? 首先脏里,文中定義一個相似性度量函數(shù)psi她我,該函數(shù)是一個cosine相似度函數(shù),用于衡量經(jīng)過特征提取器提取后的目標(biāo)域向量和原域的某一類prototype之間相似性,原域有C類番舆,共有C個prototype,這樣根吁,就計算出了C個結(jié)果,最后合蔽,在這C個結(jié)果中選取psi最大的值對應(yīng)的類別數(shù)作為該目標(biāo)域樣本的標(biāo)簽。


相似性度量函數(shù)


?????? 接下來開始選擇目標(biāo)域樣本的easy samples介返,選擇的標(biāo)準(zhǔn)是設(shè)置一個閾值tau拴事,剛才,我們?yōu)槊恳粋€目標(biāo)域樣本都計算出了C個psi值圣蝎,選擇最大的psi值和tau比較刃宵,若大于tau,則該目標(biāo)域樣本被選中成easy samples徘公。

??? 由于隨著訓(xùn)練的進(jìn)行牲证,psi的值是逐漸增大的,所以為了控制easy samples的生成速率关面,文中對于tau值的設(shè)定是隨著訓(xùn)練的進(jìn)行而不斷變化的坦袍,文中給出了tau的計算公式。


tau的計算公式


目標(biāo)域的easy samples的選擇方式

APA通過對齊原域的prototype和被選擇出來的目標(biāo)域樣本的prototype來減弱false-easy samples的負(fù)面影響以及促進(jìn)原域和目標(biāo)域的種類一致性等太。對齊是通過最小化原域和目標(biāo)域的prototype之間的歐氏距離來實現(xiàn)的捂齐。


原域和目標(biāo)域的prototype的度量

等式5里面提到的prototype是全局的,也就是說要找出原域中某一類的全部樣本缩抡,然后再計算prototype奠宜,但是實際訓(xùn)練中,是用mini-batch方法訓(xùn)練的瞻想,每次只處理batchsize個樣本压真,因而,可以用原域樣本中batchsize個樣本去算出原域的一個local prototype蘑险,再用目標(biāo)域里通過EHTS選取出的樣本來算出目標(biāo)域的local prototype滴肿,然后去對齊這兩個prototype。

但是這種方法有缺點漠其,那就是當(dāng)每一個mini-batch中包含的樣本類別不到C時嘴高,目標(biāo)域里的一個false-sample樣本就會讓計算出的prototype和真實的prototype之間產(chǎn)生很大的差異。

基于上面的問題和屎,本文采用如下方式解決:首先APA根據(jù)最初選取的目標(biāo)域的easy-samples計算出目標(biāo)域的一個global prototype拴驮,然后,在每次迭代過程中柴信,都要去計算C個目標(biāo)域的local prototype套啤,迭代到當(dāng)前,總共迭代了I次,一共計算出了I*C個目標(biāo)域的local prototype潜沦,那么每一種類的樣本都計算出了I個local prototype萄涯,把這I個local prototype取平均值,然后利用這個平均值唆鸡,通過公式8所表達(dá)的那樣來得到當(dāng)前迭代次數(shù)下的某一類的global prototype涝影。公式8里首先用前面提到的psi函數(shù)來度量當(dāng)前上一迭代步的global prototype和本次迭代步計算出的平均值之間的相似度,然后利用這個相似度的平方和1減去這個相似度的平方分別做系數(shù)争占,根據(jù)這個平均數(shù)以及上一迭代步的global prototype來計算新的global prototype燃逻。原域樣本某一類的global prototype也通過這種方式來計算。


平均值計算公式


第I次迭代時臂痕,global prototype的計算方式



整體的算法流程


在這篇論文里伯襟,提到了其他運用偽標(biāo)簽的論文,我讀過的有Learning Semantic Representations for Unsupervised Domain Adaptation以及Collaborative and Adversarial Network for Unsupervised domain adaptation握童。這兩篇都是用對抗方法的姆怪。







關(guān)于對之前方法的總結(jié),我認(rèn)為作者總結(jié)得不錯的部分澡绩,摘抄下來:

Many approaches utilize a distance metric to measurethe domain discrepancy between the source and target domains,such as maximum mean discrepancy (MMD), KLdivergenceor Wasserstein distance [12, 22, 37, 24, 42, 6].Most prior efforts intend to achieve domain alignment bymatching P(Xs) and P(Xt). However, an exact domainlevelalignment does not imply a fine-grained class-to-classoverlap.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末稽揭,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子肥卡,更是在濱河造成了極大的恐慌淀衣,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件召调,死亡現(xiàn)場離奇詭異膨桥,居然都是意外死亡,警方通過查閱死者的電腦和手機唠叛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進(jìn)店門只嚣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人艺沼,你說我怎么就攤上這事册舞。” “怎么了障般?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵调鲸,是天一觀的道長。 經(jīng)常有香客問我挽荡,道長藐石,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任定拟,我火速辦了婚禮于微,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己株依,他們只是感情好驱证,可當(dāng)我...
    茶點故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著恋腕,像睡著了一般抹锄。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上荠藤,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天祈远,我揣著相機與錄音,去河邊找鬼商源。 笑死,一個胖子當(dāng)著我的面吹牛谋减,可吹牛的內(nèi)容都是我干的牡彻。 我是一名探鬼主播,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼出爹,長吁一口氣:“原來是場噩夢啊……” “哼庄吼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起严就,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤总寻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后梢为,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體渐行,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年铸董,在試婚紗的時候發(fā)現(xiàn)自己被綠了祟印。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,650評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡粟害,死狀恐怖蕴忆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情悲幅,我是刑警寧澤套鹅,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站汰具,受9級特大地震影響卓鹿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜留荔,卻給世界環(huán)境...
    茶點故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一减牺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦拔疚、人聲如沸肥隆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽栋艳。三九已至,卻和暖如春句各,著一層夾襖步出監(jiān)牢的瞬間吸占,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工凿宾, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留矾屯,地道東北人。 一個月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓初厚,卻偏偏與公主長得像件蚕,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子产禾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,527評論 2 349

推薦閱讀更多精彩內(nèi)容