本期 Eotalk 我們來聊聊安全绿贞。最近網(wǎng)絡安全事故頻發(fā),比如前段時間的公民數(shù)據(jù)泄露橘原、美的受到攻擊勒索千萬等事件籍铁。我們邀請到 奇安信 負責數(shù)據(jù)安全的子公司技術負責人---簡川力,一起來聊聊怎么安全地開放數(shù)據(jù)趾断、使用數(shù)據(jù)拒名、使用接口等等。????
劉昊臻:?我們 Eolink 在跟用戶溝通時發(fā)現(xiàn)芋酌, API 開放數(shù)據(jù)的需求是非常旺盛的增显。從企業(yè)希望搭建數(shù)字中臺快速通過內部 API 搭建應用,到銀行和政府希望通過開放 API 促進企業(yè)間合作的效率脐帝,如今 API 開放無處不在同云。
川力,你所了解到 API 開放的場景有哪些呢堵腹?
簡川力:?政府單位可能會跟銀行合作梢杭,銀行就會用到政府的數(shù)據(jù)。以前可能直接去采或者直接去拿秸滴,這種方式都是不規(guī)范或違規(guī)的武契,現(xiàn)在基本上是不允許了。所以,一般中間會做一些服務咒唆,通過模型届垫、通過 API、或者通過一些其他的方式給銀行開放全释,銀行就可以拿到這些數(shù)據(jù)装处,比如咱們貸款相關的、你的征信數(shù)據(jù)或者你的社保數(shù)據(jù)之類的浸船,這是一類場景妄迁。
還有一類,在公安里面其實也會有類似的情況李命。公安跟公安內部登淘,其中有一些部門,比如說像刑偵部門或者網(wǎng)安部門封字,數(shù)據(jù)是非常保密的黔州,不能因為你也是公安內部其他部門的人,就讓你直接來去訪問阔籽,因此要留痕流妻、審計之類,就需要用 API 去做開放笆制。
劉昊臻:?你講的兩個場景绅这,其實我們都有遇到過。數(shù)據(jù)開放它經(jīng)過了好幾個階段在辆,以前最早的時候君躺,我們可能直接連數(shù)據(jù)庫,給你一個相對安全的賬號开缎,或者很多年前會要求必須帶 U 盤或者是硬盤棕叫,去現(xiàn)場拷數(shù)據(jù)才能帶走。這種方式效率是很低的奕删,同時它其實并不安全俺泣。
第二個,后期出現(xiàn)了遠程調用完残,它其實也是在數(shù)據(jù)庫的基礎上做的遠程調用伏钠。就安全性而言,很多鑒權和操作過程的監(jiān)控等方面都做得不是很好〗魃瑁現(xiàn)在比較常見的做法熟掂,其實是通過 API 的方式去開放接口。像銀行跟政府之間扎拣、一些企業(yè)跟供應商之間赴肚、企業(yè)與合作企業(yè)之間素跺,有些時候是企業(yè)內部的敏感數(shù)據(jù),不好直接開放誉券,就可以通過接口來控制哪些供應商或哪些合作方指厌,它能夠各自用哪些數(shù)據(jù)、用哪些字段踊跟、用什么訪問方式踩验、有效期等等。
包括像剛剛聊到的公安部門商玫,我們也有一些類似的客戶箕憾。因為公安內部很多部門之間,它會通過一個類似于叫 API 的開放平臺拳昌,或叫能力開放平臺袭异,所有系統(tǒng)的東西都在上面。如果要用的話需要先申請地回,審批通過之后才能調用扁远。其實 API 的開放和調用已經(jīng)是非常普及的場景了俊鱼。
現(xiàn)在我們再去看所謂的 API 開放刻像,怎么樣去把接口開放出來,它可能不是一個很難的事情并闲。最簡單的就是后面是一些微服務细睡,前面搭一個網(wǎng)關。但即使如此還是會有很多數(shù)據(jù)泄露的問題帝火。像銀行或政府溜徙,他們其實還是會對于數(shù)據(jù)開放上有很多深度的要求的。
川力犀填,在你們所接觸到的場景里面蠢壹,大家會在 API 開放過程中面臨什么樣的挑戰(zhàn)呢?
簡川力:?現(xiàn)在大家可能說的比較多的是九巡,API 服務申請個權限图贸、限制一下時間段,或者限制一些字段數(shù)據(jù)冕广。但是像國家的數(shù)據(jù)疏日,安全保護好以后還要分類分級,有數(shù)據(jù)安全的治理規(guī)范撒汉。而且有些數(shù)據(jù)跟國家機密還有關系沟优,不只是影響社會關系這么簡單,所以他們的要求就更高了睬辐。
用戶通過 API 訪問了數(shù)據(jù)挠阁,雖然通過了鑒權宾肺,但是沒有辦法限制二次分發(fā),或者再去做一次倒賣鹃唯。他們更希望數(shù)據(jù)不出去爱榕,并且還能夠給別人提供 API 的服務或者是數(shù)據(jù)的服務,所以現(xiàn)在多了一些隱私計算等新的解決方案坡慌。
很多時候不管是銀行黔酥、企業(yè),還是政府單位洪橘,他們更多想的是在我的可控環(huán)境里面用數(shù)據(jù)跪者,用完了只是把結果拿走,而不是把我的數(shù)據(jù)拿到你那去做計算熄求。
劉昊臻:?就是你可以拿結果渣玲,或者在不拿數(shù)據(jù)的情況下,去把你想要的結果給算出來弟晚。
簡川力:?沒錯忘衍。其實開放 API 給別人,他真正去用 API 無非也就是要在它的應用上去用你的數(shù)據(jù)卿城。不管是做機器學習枚钓、深度學習,或者是去做一些加減乘除瑟押、規(guī)則匹配搀捷,實際上它的過程也是這樣子的。只不過現(xiàn)在可能更多的希望可以把這個過程再提前多望,能夠在小范圍將數(shù)據(jù)保存起來嫩舟,這是最好的。
劉昊臻:?剛剛聊到隱私計算怀偷,對于一般開發(fā)者的應用場景下家厌,大家可能比較少接觸這個概念或者沒有聽過這個詞,能否把隱私計算再展開講講椎工?什么場景下面會用的比較多饭于?
簡川力:?其實這個概念很早就有了,但是在這個過程之中可能有很多不同的實現(xiàn)方式晋渺。比如我可以通過加密算法镰绎,把數(shù)據(jù)加密然后再做加密計算,這是其中一種方式木西。
還有就是我可以用差分隱私算法把數(shù)據(jù)查出來畴栖,可能它中間插入的一些值,讓數(shù)據(jù)跟原來的不一樣八千,但是讓它跟我的原始數(shù)據(jù)的分布保持一致吗讶。https://www.xiaohongshu.com/discovery/item/6310bd780000000008021382
https://www.xiaohongshu.com/discovery/item/6310b1ae00000000080211d1
https://www.xiaohongshu.com/discovery/item/630e0962000000001203a7d3
https://www.xiaohongshu.com/discovery/item/6310afd8000000001203a758
還有就是我們知道的聯(lián)邦學習燎猛,比如在 2018 年以前,上海有很多的黑產專賣數(shù)據(jù)照皆,銀行什么的都去買這些數(shù)據(jù)重绷,拿著這些個人數(shù)據(jù)去做風控的提升,或者貸款信用的提升膜毁,一些保險行業(yè)可能也會去買這些數(shù)據(jù)昭卓。
但是現(xiàn)在不可以這樣做了。這些數(shù)據(jù)被歸還到了上海大數(shù)據(jù)局瘟滨,上海大數(shù)據(jù)是事業(yè)單位候醒,是不可能賣數(shù)據(jù)的。這個時候杂瘸,如果銀行要用這些數(shù)據(jù)倒淫,又不能直接給,你單獨運用他的數(shù)據(jù)是不行的败玉,你還得結合自己的數(shù)據(jù)去做敌土,兩個還不能夠數(shù)據(jù)交互,只能去做計算的交互运翼。
目前比較多的使用方式是用同態(tài)加密做安全多方計算返干,還有就是聯(lián)邦學習,我們只是交互中間的一些參數(shù)去優(yōu)化我的算法南蹂,不要去交互真實的數(shù)據(jù)犬金。