PSI(Private Set Intersection)隱私求交是指兩個(gè)或多個(gè)參與方在不泄露各自輸入數(shù)據(jù)的情況下质和,安全計(jì)算出它們集合的交集。
一棱诱、隱私計(jì)算的合規(guī)依據(jù)
實(shí)際上還是在個(gè)保法和數(shù)據(jù)安全法兩者之間泼橘,在“取得用戶授權(quán)同意即可使用”與“原始數(shù)據(jù)不能出域、斷直連”之間進(jìn)行折中和博弈迈勋。隱私計(jì)算特別是多方安全炬灭,沒有raw data給到對端,但最終計(jì)算結(jié)果實(shí)際上是把infomation或knowledge給到了對端粪躬,使得最終對數(shù)據(jù)主體的了解變多了担败。這其實(shí)是個(gè)模糊地帶,目前是按照上述做法滿足了“用戶知情授權(quán)”(在用戶隱私協(xié)議里寫與合作伙伴做用戶畫像之類)镰官,以及“沒有傳輸出原始數(shù)據(jù)”這兩個(gè)規(guī)則來作為合規(guī)依據(jù)的提前。
某種草平臺用戶隱私政策 第三方信息共享清單 ** 里邊有提到通過多方聯(lián)合隱私計(jì)算手段做的間接用戶畫像**
二、常用的 PSI 協(xié)議:ECDH泳唠、KKRT狈网、RR22 的含義及原理。
1. ECDH(基于橢圓曲線的 Diffie-Hellman 協(xié)議)
基于橢圓曲線 Diffie-Hellman (Elliptic Curve Diffie-Hellman) 密鑰交換的 PSI 協(xié)議笨腥,利用公私鑰對和橢圓曲線離散對數(shù)難題確保計(jì)算安全拓哺。
原理:
- 每方持有一個(gè)集合(如 A 和 B),然后對集合中的元素做hash_to_point()脖母,這樣每個(gè)元素都成為了EC曲線上的點(diǎn)士鸥。比如兩個(gè)點(diǎn)集合是P、Q
- 每方對集合元素用私鑰(假設(shè)為m, n)做點(diǎn)乘谆级,然后彼此交換這倆點(diǎn)乘集合烤礁。(點(diǎn)乘的結(jié)果仍然是EC point)這時(shí)兩方手里的分別是nQ和mP
- 雙方對交換來的點(diǎn)乘集合,用私鑰再做點(diǎn)乘,這時(shí)雙方手里的是mnQ, nmP肥照。然后一方按照約定把結(jié)果發(fā)送給另一方脚仔。(這里以第一方為例,知道P和m但因?yàn)椴恢纍所以構(gòu)造不出nmP舆绎,所以這里需要一方按照計(jì)算結(jié)果歸屬的約定把mnQ或nmP發(fā)給另一方)
- 收到兩個(gè)做了兩次點(diǎn)乘集合的一方鲤脏,對兩個(gè)集合mnQ和nmP做交集比對,得到結(jié)果。(Q和P里邊相同的元素做出來的mn點(diǎn)乘結(jié)果一定一樣猎醇,所以這里可以求出交集)
優(yōu)點(diǎn):
- 簡單直接窥突,基于橢圓曲線的計(jì)算效率較高。
- 不需要額外的復(fù)雜計(jì)算和存儲姑食。
缺點(diǎn):
- 計(jì)算復(fù)雜度隨集合大小線性增長波岛。
- 沒有充分利用現(xiàn)代 PSI 協(xié)議的優(yōu)化特性茅坛,在大規(guī)模數(shù)據(jù)時(shí)效率較低音半。
2. KKRT(Kolesnikov-Kumar-Rosulek-Tan PSI 協(xié)議)
KKRT 是一種基于 OT(Oblivious Transfer,盲傳輸)優(yōu)化的 PSI 協(xié)議贡蓖,特別適合于大規(guī)模集合交集計(jì)算曹鸠。
原理:
- OT 擴(kuò)展:KKRT 協(xié)議利用擴(kuò)展的盲傳輸來實(shí)現(xiàn)批量化數(shù)據(jù)處理,通過少量的基本操作擴(kuò)展為大規(guī)模傳輸斥铺。
- 數(shù)據(jù)編碼:每方將其集合元素編碼為固定長度的比特字符串彻桃,并通過 OT 發(fā)送給對方。
- 匹配計(jì)算:通過協(xié)議晾蜘,接收方可以高效地對比元素是否匹配邻眷,而不暴露非交集的元素。
優(yōu)點(diǎn):
- 在網(wǎng)絡(luò) IO 和計(jì)算性能之間取得了良好平衡剔交,適合大規(guī)模集合肆饶。
- 提供了較高的效率,是現(xiàn)代 PSI 協(xié)議的代表之一岖常。
缺點(diǎn):
- 對盲傳輸?shù)膶?shí)現(xiàn)依賴較重驯镊,協(xié)議實(shí)現(xiàn)稍微復(fù)雜。
- 在非常小的數(shù)據(jù)集上效率不如簡單協(xié)議(如 ECDH)竭鞍。
3. RR22(Rosulek-Rosulek PSI 協(xié)議板惑,2022 年改進(jìn)版)
RR22 是一種新型 PSI 協(xié)議,針對計(jì)算效率進(jìn)行了優(yōu)化偎快。它在通信和計(jì)算復(fù)雜度上優(yōu)于 KKRT冯乘,特別是在更大的集合中表現(xiàn)出色。
原理:
- 批處理加速:RR22 采用了基于批量處理的優(yōu)化方式晒夹,能夠?qū)Υ笠?guī)模數(shù)據(jù)進(jìn)行快速計(jì)算裆馒。
- 高效通信協(xié)議:通過減少協(xié)議交互步驟和傳輸數(shù)據(jù)量,RR22 減少了網(wǎng)絡(luò)通信成本惋戏。
- 適應(yīng)多方 PSI:RR22 還可以適配多方參與的 PSI 場景领追。
優(yōu)點(diǎn):
- 提供了更高效的計(jì)算和通信性能。
- 能夠擴(kuò)展到多方 PSI 場景响逢。
缺點(diǎn):
- 較新的協(xié)議實(shí)現(xiàn)可能還在逐步優(yōu)化和完善中绒窑。
- 實(shí)現(xiàn)復(fù)雜度高于 ECDH 和 KKRT。
對比上述3種PSI協(xié)議:
協(xié)議 | 特點(diǎn) | 優(yōu)點(diǎn) | 缺點(diǎn) |
---|---|---|---|
ECDH | 基于橢圓曲線 Diffie-Hellman | 簡單直接舔亭,適合小規(guī)模集合 | 大規(guī)模數(shù)據(jù)效率低些膨,計(jì)算復(fù)雜度高 |
KKRT | 基于 OT 優(yōu)化 | 高效蟀俊,適合大規(guī)模集合 | 實(shí)現(xiàn)復(fù)雜度較高,依賴 OT 機(jī)制 |
RR22 | 新型 PSI 優(yōu)化協(xié)議 | 性能優(yōu)秀订雾,適合大規(guī)模和多方場景 | 實(shí)現(xiàn)復(fù)雜肢预,適應(yīng)性仍在優(yōu)化中 |
可以根據(jù)數(shù)據(jù)規(guī)模、場景需求和硬件性能選擇合適的 PSI 協(xié)議來實(shí)現(xiàn)隱私求交的功能洼哎。
三烫映、基于ECDH協(xié)議的PSI的Java實(shí)現(xiàn)
to be continue ...
參考
隱私計(jì)算 跨平臺互聯(lián)互通 開放協(xié)議 第1部分:ECDH-PSI
螞蟻集團(tuán)異構(gòu)平臺開放算法協(xié)議與開源實(shí)踐 - AIQ
隱私計(jì)算實(shí)訓(xùn)營第5講-------隱私求交和隱語PSI介紹以及開發(fā)實(shí)踐-阿里云開發(fā)者社區(qū)
https://bbs.huaweicloud.com/blogs/266527
https://c.biancheng.net/view/zqzhic.html
https://zhuanlan.zhihu.com/p/478706071
https://zhuanlan.zhihu.com/p/367477035