Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

Athalye A, Carlini N, Wagner D, et al. Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples[J]. arXiv: Learning, 2018.

@article{athalye2018obfuscated,
title={Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples},
author={Athalye, Anish and Carlini, Nicholas and Wagner, David},
journal={arXiv: Learning},
year={2018}}

由于有很多defense方法都是基于破壞梯度(不能有效計算梯度, 梯度爆炸, 消失), 但是作者提出一種算法能夠攻破這一類方法, 并提議以后的defense方法不要以破壞梯度為前提.

主要內(nèi)容

f(\cdot): 模型;
f(x)_i: 樣本x為類別i的概率;
f^j(\cdot): 第j層;
f^{1..j}(\cdot): 第1j層;
c(x): \arg \max_i f(x)_i;
c^*(x): 真實標簽.

Obfuscated Gradients

  • Shattered Gradients: 一些不可微的defense, 或者一些令導(dǎo)數(shù)不存在的defense造成;
  • Stochastic Gradients: 一些隨機化的defense造成;
  • Exploding & Vanishing Gradients: 通常由一些包括多次評估的defense造成.

BPDA

特例

有很多方法, 會構(gòu)建一個不可微(或者其導(dǎo)數(shù)"不好用")的函數(shù)g, 然后用模型f(g(x))替代f(x), 從而防御一些基于梯度的攻擊方法, 而且這類方法往往要求g(x) \approx x.

這類防御方法, 可以很簡單地用
\nabla_x f(g(x))|_{x=\hat{x}} \leftarrow \nabla_x f(x)|_{x=g(\hat{x})},
替代, 從而被攻破(如果我們把g(x)視為模型的第1層, 那我們實際上就是攻擊第二層).

一般情形

假設(shè)f^i(x)(即第i層)是不可微, 或者導(dǎo)數(shù)“不好用", 則我們首先構(gòu)造一個可微函數(shù)g(x), 使得g(x) \approx f^i(x), 在反向傳遞導(dǎo)數(shù)的時候(注意只在反向用到g), 用\nabla_x g替代\nabla f^i(x).

注: 作者說在前向也用g(x)是低效的.

EOT

這類方法使用于攻破那些隨機化的defense的, 這類方法往往會從一個變換集合T中采樣t, 并建立模型f(t(x)), 如果單純用\nabla f(t(x)) 來攻擊效果不好, 可以轉(zhuǎn)而用\nabla \mathbb{E}_{t \sim T} f(t(x)) = \mathbb{E}_{t \sim T} \nabla f(t(x))替代.

Reparameterization

重參用于針對梯度爆炸或者消失的情況, 因為這種情況往往出現(xiàn)于f(g(x)), 而g(x)是對x的一個多次評估(所以f(g(x))可以理解為一個很深的網(wǎng)絡(luò)).

策略是利用構(gòu)建x=h(z), 并且滿足g(h(z))=h(z) (咋看起來很奇怪, 看了下面的DefenseGAN就明白了).

利用f(h(z)), 我們找到對應(yīng)的對抗樣本h(z_{adv}).

具體的案例

Thermometer encoding

這里的\tau是針對樣本每一個元素x_{i,j,c}的, \tau:x_{i,j,c} \rightarrow \mathbb{R}^l:
\tau(x_{i, j, c})_k= \left \{ \begin{array}{ll} 1 & x_{i,j,c}>k/l \\ 0 & else. \end{array} \right.

只需令
g(x_{i,j,c})_k= \min (\max (x_{i, j, c} - k/l, 0),1).

Input transformations

包括:
image cropping, rescaling, bit-depth reduction, JPEG compression, image quilting

既包括隨機化又包括了不可微, 所以既要用EPDA, 也要用EOT.

LID

LID能夠防御
\min \quad \| x-x'\|_2^2 + \alpha(\ell(x')+\mathrm{LID_{loss}} (x')),
的攻擊的主要原因是由于該函數(shù)陷入了局部最優(yōu). 因為LID高的樣本不都是對抗樣本, 也有很多普通樣本.
忽視LID, 用原始的L2attack就能夠有效攻破LID.

Stochastic Activation Pruning

SAP實際上是dropout的一個變種, SAP會隨機將某層的f^i的某些元素突變?yōu)?(其概率正比于元素的絕對值大小).

這個方法可以用EOT攻破, 即用\sum_{i=1}^k \nabla_xf(x)來代替\nabla_x f(x).

Mitigating through randomization

這個方法的輸入是229\times 229的圖片, 他會被隨機變換到r\times r大小, r\in[229, 331), 并隨機補零使得其大小為331\times 331.

同樣, 用EOT可以攻破.

PixelDefend

pass

DenfenseGAN

對于每一個樣本, 首先初始化R個隨機種子z_0^{(1)}, \ldots, z_0^{(R)}, 對每一個種子, 利用梯度下降(L步)以求最小化
\tag{DGAN} \min \quad \|G(z)-x\|_2^2,
其中G(z)為利用訓(xùn)練樣本訓(xùn)練的生成器.

得到R個點z_*^{(1)},\ldots, z_*^{(R)}, 設(shè)使得(DGAN)最小的為z^*, 以及\hat{x} = G(z^*), 則\hat{x}就是我們要的, 樣本x在普通樣本數(shù)據(jù)中的投影. 將\hat{x}喂入網(wǎng)絡(luò), 判斷其類別.

在這里插入圖片描述

這個方法, 利用梯度方法更新的難處在于, x \rightarrow \hat{x}這一過程, 包含了L步的內(nèi)循環(huán), 如果直接反向傳梯度會造成梯度爆炸或者消失.

所以攻擊的策略是:

\min \quad \|G(z)-x\|_2^2 + c \cdot \ell (G(z))
找到z_{adv}, 于是x_{adv}=G(z_{adv}).

注意, 通過這個式子能找到對抗樣本說明, 由訓(xùn)練樣本訓(xùn)練生成器, 生成器的分布p_G, 實際上并不能能夠撇去對抗樣本.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末恃泪,一起剝皮案震驚了整個濱河市眶俩,隨后出現(xiàn)的幾起案子齿风,更是在濱河造成了極大的恐慌,老刑警劉巖公荧,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡敏弃,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門噪馏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來麦到,“玉大人,你說我怎么就攤上這事欠肾∑康撸” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵刺桃,是天一觀的道長粹淋。 經(jīng)常有香客問我,道長瑟慈,這世上最難降的妖魔是什么桃移? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮葛碧,結(jié)果婚禮上借杰,老公的妹妹穿的比我還像新娘。我一直安慰自己进泼,他們只是感情好蔗衡,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著乳绕,像睡著了一般绞惦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上洋措,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天济蝉,我揣著相機與錄音,去河邊找鬼。 笑死堆生,一個胖子當(dāng)著我的面吹牛专缠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播淑仆,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼涝婉,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蔗怠?” 一聲冷哼從身側(cè)響起墩弯,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寞射,沒想到半個月后渔工,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡桥温,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年引矩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片侵浸。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡旺韭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出掏觉,到底是詐尸還是另有隱情区端,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布澳腹,位于F島的核電站织盼,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏酱塔。R本人自食惡果不足惜沥邻,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望延旧。 院中可真熱鬧谋国,春花似錦槽地、人聲如沸迁沫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽集畅。三九已至,卻和暖如春缅糟,著一層夾襖步出監(jiān)牢的瞬間挺智,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工窗宦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留赦颇,地道東北人二鳄。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像媒怯,于是被迫代替她去往敵國和親订讼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345