Federal Learning中的隱私問題

Part2：Privacy of Federal Learning:FL中的隱私保護問題

1.Secure Multi-party Computation

簡稱SMC钩骇，安全多方計算搀罢。

圖片.png

大致模型如上圖所示蟹瘾，含義為：由多方提供的數據在加密的條件下經過網絡訓練時吠架，既不影響結果也能保證數據安全。
在這里我們看一個經典的SMC模型：

姚式混淆電路

圖片.png

上圖為姚式混淆電路的經典分析圖波俄，但我在初學的時候理解這張圖卻不是很透徹侥加，所以我找到了下圖：

圖片.png

首先，Alice和Bob都持有數據集弃锐，分別為x,y袄友。這兩個數據集需要共同輸入進函數f(x,y)，以達到訓練參數的目的霹菊。
姚氏混淆模型的思路為：
1.Alice把函數f轉換為等價的電路C剧蚣；
2.Alice選擇Lable加密C得到GC電路，在這里我們對GC電路和C電路進行解釋：GC可以理解為一個新的函數f'旋廷，它是由函數f得來的鸠按，相當于f' = g(f(x,y))。
3.將GC以及x對應的Label發(fā)送給Bob：在我看來饶碘，這就相當于把一個二元函數的一個函數自變量帶入之后目尖，再將這個模型發(fā)給Bob。由于這個二元函數f'和f的操作是不可逆的扎运，所以Bob并不能通過得到的模型推測出Alice具有的數據集x瑟曲。此時，Bob需要操作的函數為f'(a,y)豪治，其中a是一個常數（Alice已經帶入了）
4.運行OT洞拨，獲取和y相關的Label：我們知道，Alice在帶入參數的時候负拟，參數已經經過加密扣甲。那Bob在帶入的時候自然也需要加密，這一步就是獲取Bob即將對他的data加密所用的密鑰。OT琉挖，全稱為Oblivious transfer不經意傳輸启泣，就是Alice將很多滿足要求的Label同時傳輸，在經過OT之后示辈，會得出一個Label*傳給Bob寥茫，而Alice并不知道Bob使用的是哪個Label，這樣就避免了在Bob帶入數據之后矾麻，Alice從結果反推Bob的數據纱耻。
獲取Label之后，Bob利用Label將y進行加密y'险耀。
5.解密GC電路弄喘，得到輸出結果；
6.返回結果給Alice甩牺。
綜上所述蘑志，A不能通過中間步驟對B的數據有了解，B也相同贬派，這就是SMC需要實現的關鍵急但。

2.Differential Privacy

差分隱私，其中比較經典的是k-anonymity（k-匿名）搞乏。

圖片.png

差分隱私波桩，又可理解為泛化布朦，就是將數據泛化欠动，使得攻擊者即使獲得信息，也無法精確定位到某一個用戶岖常，間接或直接地保護了用戶隱私侍筛。k-anonymity指的是匀油，對于任意一行記錄，其所屬的相等集內記錄數據的數量 > k勾笆，也就是說敌蚜，攻擊者攻擊時至少面對k條類似（類）數據。

3.Homomorphic Encryption

同態(tài)加密

圖片.png

上圖是云計算的一張很常見也很好理解的圖窝爪，我希望得到我想要的結果但是我不想云知道我的信息弛车，于是我采用加密的形式傳輸。其實在之前我們提到的SMC中姚式混淆模型蒲每，也使用了同臺加密纷跛。

圖片.png

相信有這兩張圖，同態(tài)加密的原理就很清晰了邀杏。

目前在ML中使用較成熟的是加法同態(tài)贫奠，而我們常見的公鑰密碼算法RSA則具有乘法同態(tài)的特點唬血。

4.Indirect information leakage

最后一方面，講的是惡意參與者的問題唤崭。試想一下拷恨，如果網絡的參與者之一是惡意用戶，SMC的簡單加密并不能攔住他獲取其他用戶的數據谢肾，又有什么方法可以防御呢腕侄？
這部分筆者學習較少，只能提幾篇類似主題的論文供大家參考芦疏，希望之后有時間我也能去看看：

<1>Privacy-Preserving Deep Learning via Additively Homomorphic Encryption.

SGD等常見方法沒有安全保證

<2>How To Backdoor Federated Learnng.

插入后門是有可能的

<3>Inference Attacks Against Collaborative Learning.

可能的潛在漏洞

<4>Securing Distributed Machine Learning in High Dimensions.

對不同參與者的梯度交換所帶來的安全問題

<5>On-Device Federated Learning via Blockchain and its Latency Analysis.

區(qū)塊鏈：塊鏈式聯(lián)邦學習BlockFL的體系結構冕杠。其中移動終端設備的本地學習模型更新通過利用區(qū)塊鏈進行交換和驗證

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市酸茴，隨后出現的幾起案子分预，更是在濱河造成了極大的恐慌，老刑警劉巖薪捍，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件笼痹，死亡現場離奇詭異，居然都是意外死亡飘诗，警方通過查閱死者的電腦和手機与倡，發(fā)現死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門界逛，熙熙樓的掌柜王于貴愁眉苦臉地迎上來昆稿，“玉大人，你說我怎么就攤上這事息拜「忍叮” “怎么了？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵少欺，是天一觀的道長喳瓣。經常有香客問我，道長赞别，這世上最難降的妖魔是什么畏陕？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮仿滔，結果婚禮上惠毁，老公的妹妹穿的比我還像新娘。我一直安慰自己崎页，他們只是感情好鞠绰，可當我...
茶點故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著飒焦，像睡著了一般蜈膨。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天翁巍，我揣著相機與錄音驴一，去河邊找鬼。笑死曙咽，一個胖子當著我的面吹牛蛔趴，可吹牛的內容都是我干的。我是一名探鬼主播例朱，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼孝情，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了洒嗤？” 一聲冷哼從身側響起箫荡，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎渔隶，沒想到半個月后羔挡，有當地人在樹林里發(fā)現了一具尸體，經...
沈念sama閱讀 45,310評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡间唉，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年绞灼，在試婚紗的時候發(fā)現自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片呈野。...
茶點故事閱讀 39,690評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡低矮，死狀恐怖，靈堂內的尸體忽然破棺而出被冒，到底是詐尸還是另有隱情军掂，我是刑警寧澤，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布昨悼，位于F島的核電站蝗锥，受9級特大地震影響，放射性物質發(fā)生泄漏率触。R本人自食惡果不足惜终议，卻給世界環(huán)境...
茶點故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望葱蝗。院中可真熱鬧穴张，春花似錦、人聲如沸垒玲。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽合愈。三九已至叮贩，卻和暖如春击狮，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背益老。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工彪蓬，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人捺萌。一個月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓档冬，卻偏偏與公主長得像，于是被迫代替她去往敵國和親桃纯。傳聞我的和親對象是個殘疾皇子酷誓，可洞房花燭夜當晚...
茶點故事閱讀 44,577評論 2贊 353

Federal Learning中的隱私問題

Part2：Privacy of Federal Learning:FL中的隱私保護問題

1.Secure Multi-party Computation

姚式混淆電路

2.Differential Privacy

3.Homomorphic Encryption

4.Indirect information leakage

<1>Privacy-Preserving Deep Learning via Additively Homomorphic Encryption.

<2>How To Backdoor Federated Learnng.

<3>Inference Attacks Against Collaborative Learning.

<4>Securing Distributed Machine Learning in High Dimensions.

<5>On-Device Federated Learning via Blockchain and its Latency Analysis.

推薦閱讀更多精彩內容