FedReID: 聯(lián)邦學(xué)習(xí)在行人重識(shí)別上的首次深入實(shí)踐

行人重識(shí)別的訓(xùn)練需要收集大量的人體數(shù)據(jù)到一個(gè)中心服務(wù)器上夕膀,這些數(shù)據(jù)包含了個(gè)人敏感信息箫章,因此會(huì)造成隱私泄露問題都办。聯(lián)邦學(xué)習(xí)是一種保護(hù)隱私的分布式訓(xùn)練方法嫡锌,可以應(yīng)用到行人重識(shí)別上,以解決這個(gè)問題琳钉。但是在現(xiàn)實(shí)場景中势木,將聯(lián)邦學(xué)習(xí)應(yīng)用到行人重識(shí)別上因?yàn)閿?shù)據(jù)異構(gòu)性,會(huì)導(dǎo)致精度下降和收斂的問題歌懒。

數(shù)據(jù)異構(gòu)性:數(shù)據(jù)非獨(dú)立分布 (non-IID) 和 各端數(shù)據(jù)量不同啦桌。

這是篇來自 ACMMM20 Oral 的論文,主要通過構(gòu)建一個(gè) benchmark及皂,并基于 benchmark 結(jié)果的深入分析甫男,提出兩個(gè)優(yōu)化方法,提升現(xiàn)實(shí)場景下聯(lián)邦學(xué)習(xí)在行人重識(shí)別上碰到的數(shù)據(jù)異構(gòu)性問題验烧。

論文地址:Performance Optimization for Federated Person Re-identification via Benchmark Analysis
開源代碼:https://github.com/cap-ntu/FedReID

本文主要對(duì)這篇文章的這三個(gè)方面內(nèi)容做簡要介紹:

  1. Benchmark: 包括數(shù)據(jù)集板驳、新的算法、場景等
  2. Benchmark 的結(jié)果分析
  3. 優(yōu)化方法:知識(shí)蒸餾碍拆、權(quán)重重分配

Benchmark

數(shù)據(jù)集

數(shù)據(jù)集由9個(gè)最常用的 行人重識(shí)別 數(shù)據(jù)集構(gòu)成若治,具體的信息如下:

Datasets

這些數(shù)據(jù)集的數(shù)據(jù)量、ID數(shù)量感混、領(lǐng)域都不同直砂,能夠有效的模擬現(xiàn)實(shí)情況下的數(shù)據(jù)異構(gòu)性問題。

算法

傳統(tǒng)聯(lián)邦學(xué)習(xí)算法 Federated Averaging (FedAvg) 要求端邊全模型同步浩习,但是 ReID 的分類層的維度由 ID數(shù)量決定,很可能是不同的济丘。所以這篇論文提出了只同步部分的模型 Federated Partial Averaging (FedPav).

Federated Partial Averaging

FedPav 的每一輪訓(xùn)練可以通過4個(gè)步驟完成:

  1. Server 下發(fā)一個(gè)全局模型到每個(gè) Client
  2. 每個(gè) Client 收到全局模型后谱秽,將全局模型加上本地的分類器,用本地?cái)?shù)據(jù)進(jìn)行訓(xùn)練摹迷,每個(gè) Client 得到一個(gè) local model
  3. Client 將 local model 的 backbone 上傳到 Server
  4. Server 對(duì)所有 client 收到的 model 進(jìn)行加權(quán)平均疟赊。

完整的算法可以參考下圖:

Benchmark 結(jié)果

通過 Benchmark 的實(shí)驗(yàn),論文里描述了不少聯(lián)邦學(xué)習(xí)和行人重識(shí)別結(jié)合的洞見峡碉。這邊著重提出兩點(diǎn)因數(shù)據(jù)異構(gòu)性導(dǎo)致的問題近哟。

1. 大數(shù)據(jù)集在聯(lián)邦學(xué)習(xí)中的精度低于單個(gè)數(shù)據(jù)集訓(xùn)練的精度

  • FedPav: 聯(lián)邦學(xué)習(xí)總模型的精度
  • FedPav Local Model: 聯(lián)邦學(xué)習(xí)各邊端模型模型上傳前在各自邊端測試的精度
  • Local Training: 基準(zhǔn),每個(gè)數(shù)據(jù)集單獨(dú)訓(xùn)練和測試的精度

Local Training 效果比聯(lián)邦學(xué)習(xí)的效果好鲫寄,說明這些大數(shù)據(jù)集沒法在聯(lián)邦學(xué)習(xí)中受益吉执。需要有更好的算法來提高精度疯淫。

2. 聯(lián)邦學(xué)習(xí)訓(xùn)練不收斂

通過這兩個(gè)數(shù)據(jù)集測試曲線可以看出,因?yàn)閿?shù)據(jù)異構(gòu)性的影響戳玫,精度波動(dòng)較大熙掺,收斂性差。

優(yōu)化方法

采用知識(shí)蒸餾咕宿,提高收斂

因?yàn)閿?shù)據(jù)的異構(gòu)性的原因币绩,導(dǎo)致參與聯(lián)邦學(xué)習(xí)多方上傳前的本地模型的性能優(yōu)于云端服務(wù)器進(jìn)行模型融合后的模型性能,另外數(shù)據(jù)異構(gòu)性還導(dǎo)致了訓(xùn)練的不穩(wěn)定性和難收斂的問題府阀。針對(duì)這個(gè)問題缆镣,本方案提出使用知識(shí)蒸餾的方法,將參與聯(lián)邦學(xué)習(xí)的多方的本地模型當(dāng)成教師模型试浙,云端服務(wù)器的模型作為學(xué)生模型董瞻,用知識(shí)蒸餾的方法更好的將教師模型的知識(shí)傳遞到學(xué)生模型,以此提高了模型訓(xùn)練的穩(wěn)定性和收斂性川队。完整算法可以參考下圖:

Knowledge Distillation
image-20201016033811427.png

下面的實(shí)驗(yàn)結(jié)果顯示力细,采用知識(shí)蒸餾(橙線)的訓(xùn)練收斂效果能夠得到有效提高。

提出權(quán)重重分配固额,提高精度

原算法在 Server 上做模型整合眠蚂,采用的是加權(quán)平均的方法,用每個(gè) Client 的數(shù)據(jù)量作為權(quán)重斗躏,進(jìn)行加權(quán)平均逝慧。每個(gè) Client 的數(shù)據(jù)量差距可能非常大,有的占比 40%啄糙,有的占比不到 1%笛臣,所以該論文提出了進(jìn)行權(quán)重分配。調(diào)整聯(lián)邦學(xué)習(xí)模型融合時(shí)各方模型更新的權(quán)重:給訓(xùn)練效果越好的邊端隧饼,分配更大的權(quán)重沈堡,在模型融合時(shí)產(chǎn)生更大的影響。訓(xùn)練效果的衡量是通過比較每一方本地訓(xùn)練前后模型用一批數(shù)據(jù)做推理產(chǎn)生的特征的余弦距離燕雁,余弦距離越大诞丽,該訓(xùn)練產(chǎn)生的變化越大,該分配的權(quán)重越大拐格。完整算法可以參考下圖:

Cosine Distance Weight

下表格的實(shí)驗(yàn)結(jié)果顯示僧免,權(quán)重重分配使所有邊端模型的性能都超過 Local Training,帶來普遍的性能提升捏浊。

總結(jié)

針對(duì)數(shù)據(jù)隱私問題懂衩,這篇論文將聯(lián)邦學(xué)習(xí)應(yīng)用到行人重識(shí)別,并做了深入的研究分析。構(gòu)建了一個(gè) Benchmark浊洞,并基于實(shí)驗(yàn)結(jié)果帶來的洞見牵敷,提出了使用<u>知識(shí)蒸餾</u>和<u>權(quán)重重分配</u>的方法來解決數(shù)據(jù)異構(gòu)性帶來的性能問題。

算法細(xì)節(jié)和更多實(shí)驗(yàn)結(jié)果沛申,推薦閱讀原論文和開源代碼劣领。

資源

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市铁材,隨后出現(xiàn)的幾起案子尖淘,更是在濱河造成了極大的恐慌,老刑警劉巖著觉,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件村生,死亡現(xiàn)場離奇詭異,居然都是意外死亡饼丘,警方通過查閱死者的電腦和手機(jī)趁桃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來肄鸽,“玉大人卫病,你說我怎么就攤上這事〉渑牵” “怎么了蟀苛?”我有些...
    開封第一講書人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵雁歌,是天一觀的道長赞草。 經(jīng)常有香客問我井濒,道長鉴逞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任梗肝,我火速辦了婚禮之斯,結(jié)果婚禮上潘悼,老公的妹妹穿的比我還像新娘齐唆。我一直安慰自己嗤栓,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開白布箍邮。 她就那樣靜靜地躺著茉帅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪媒殉。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評(píng)論 1 285
  • 那天摔敛,我揣著相機(jī)與錄音廷蓉,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛桃犬,可吹牛的內(nèi)容都是我干的刹悴。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼攒暇,長吁一口氣:“原來是場噩夢啊……” “哼土匀!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起形用,我...
    開封第一講書人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬榮一對(duì)情侶失蹤就轧,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后田度,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體妒御,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年镇饺,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了乎莉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡奸笤,死狀恐怖惋啃,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情监右,我是刑警寧澤边灭,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站秸侣,受9級(jí)特大地震影響存筏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜味榛,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一椭坚、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧搏色,春花似錦善茎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至航邢,卻和暖如春耕赘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背膳殷。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來泰國打工操骡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓册招,卻偏偏與公主長得像岔激,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子是掰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345