前言
本文旨在學(xué)習(xí)和記錄斟薇,如需轉(zhuǎn)載,請(qǐng)附出處http://www.reibang.com/p/f1995148800e
遷移學(xué)習(xí)問(wèn)題
我們都知道,在深度判別模型中计盒,如果訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是獨(dú)立同分布的,在訓(xùn)練集上訓(xùn)練的深度模型會(huì)在測(cè)試集上表現(xiàn)的比較好芽丹。但是北启,現(xiàn)實(shí)生活中的數(shù)據(jù)并不一定是獨(dú)立同分布的,所以,如何在源域上訓(xùn)練的模型能在目標(biāo)域上泛化的很好是一個(gè)新興的問(wèn)題咕村,另外场钉,在何種條件下,在什么時(shí)候源域上訓(xùn)練的模型能夠在目標(biāo)域上泛化的很好懈涛。直觀的逛万,在特征層面上進(jìn)行對(duì)齊遷移(采用某種度量標(biāo)準(zhǔn))已經(jīng)促進(jìn)了domain adaptation的發(fā)展。在2006年批钠,Ben-David就遷移學(xué)習(xí)的理論進(jìn)行證明宇植,并提出了domain adaptation的泛化邊界,并指出了在DA問(wèn)題上設(shè)計(jì)一個(gè)特征表示平衡訓(xùn)練源域分類(lèi)誤差和減小源域目標(biāo)域的差異的理論可行性埋心。
參數(shù)介紹
:數(shù)據(jù)集
:源域數(shù)據(jù)集(原始分布)
:目標(biāo)域數(shù)據(jù)集(原始分布)
:源域特征分布
:目標(biāo)域特征分布
:真實(shí)標(biāo)簽函數(shù){0,1}二分類(lèi)指郁,我們訓(xùn)練得到
。
,原始數(shù)據(jù)分布映射到標(biāo)簽分布拷呆。
:自己設(shè)計(jì)的預(yù)測(cè)函數(shù)闲坎,給定特征
,得到對(duì)應(yīng)的標(biāo)簽洋腮。
箫柳,特征分布映射到標(biāo)簽分布。
:
啥供。原始數(shù)據(jù)映射到特征分布悯恍。
定義特征到標(biāo)簽的真實(shí)映射函數(shù)
因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Ctilde%7Bf%7D" alt="\tilde{f}" mathimg="1">是隨機(jī)的。即使數(shù)據(jù)到標(biāo)簽的分布是已知確定的伙狐,在給定特征z的情況下涮毫,z可能來(lái)源于不同的x。
源域錯(cuò)誤率
相似的贷屎,目標(biāo)域的錯(cuò)誤率也可能寫(xiě)成這個(gè)樣子罢防,但是前提是目標(biāo)域標(biāo)簽已知。
域距離度量標(biāo)準(zhǔn)
作者提出來(lái)一個(gè)距離唉侄,是計(jì)算兩個(gè)概率分布的距離咒吐。其定義為:
其中是整個(gè)的集合,A是其中一個(gè)子集属划。意思就是取所有的
子集恬叹,找出
和
的概率差的最大值。
為了使用距離同眯,限制了真實(shí)
函數(shù)的復(fù)雜度绽昼。將源域和目標(biāo)域的錯(cuò)誤率固定在一個(gè)小范圍內(nèi)。
針對(duì)二分類(lèi)問(wèn)題须蜗,我們可以將A具體化:
上式可以理解為對(duì)特征到標(biāo)簽的映射上硅确,源域特征和目標(biāo)域特征分類(lèi)為1的概率差目溉。
則此時(shí)的距離具體化為
:
定義對(duì)稱(chēng)假設(shè)空間
代表異或。
where
則我們可以進(jìn)而進(jìn)行具體化:
通過(guò)上式推導(dǎo)缭付,只要我們?cè)O(shè)置函數(shù)集合比
復(fù)雜就可。這個(gè)在神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中是簡(jiǎn)易的大莫。
目標(biāo)域的誤差邊界
condition:
說(shuō)明:目標(biāo)域的誤差邊界有三項(xiàng)。第一項(xiàng)為源域誤差邊界只厘,第二項(xiàng)為源域和目標(biāo)域映射在特征層面上的距離度量烙丛,第三項(xiàng)為,是個(gè)常數(shù)可以不管羔味。
證明:
解釋?zhuān)?/strong>
證明推導(dǎo)第一個(gè)公式代表的是特征被判別為1的概率河咽,
第一個(gè)不等式第一項(xiàng)代表情況下的誤差,第二項(xiàng)代表的是對(duì)目標(biāo)域
和
不同的情況下的距離度量赋元,這是顯而易見(jiàn)的忘蟹。
第二個(gè)不等式推導(dǎo)將目標(biāo)域的不同的誤差轉(zhuǎn)換成源域的和兩個(gè)域之差進(jìn)行度量,這樣這個(gè)距離就可以采用距離來(lái)度量搁凸。
進(jìn)而媚值,我們可以將泛化誤差轉(zhuǎn)化成經(jīng)驗(yàn)誤差的形式,一般經(jīng)驗(yàn)誤差可以理解為我們的訓(xùn)練誤差护糖。
則最后的公式可以寫(xiě)成
其中代表源域和目標(biāo)域的個(gè)數(shù)褥芒。
結(jié)論
可以自己構(gòu)造函數(shù)來(lái)對(duì)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)進(jìn)行域判別,然后約束其損失進(jìn)而轉(zhuǎn)換成域距離嫡良。這樣有了理論保證锰扶。
參考文獻(xiàn)
- 《遷移學(xué)習(xí)》: 領(lǐng)域自適應(yīng)(Domain Adaptation)的理論分析
- Analysis of Representations for Domain Adaptation
- DANN
說(shuō)明
如有錯(cuò)誤,歡迎指正寝受!