黑盒攻擊深度學(xué)習(xí)模型paper5篇總結(jié)


layout: post
title: 黑盒攻擊深度學(xué)習(xí)模型paper5篇總結(jié)
categories: [deep learning]
description: 截止201804幾種黑盒攻擊方法
keywords: deeplearning, , black box attack, model


Transferability in ML: 需要少量input 和 label(例如預(yù)測(cè)數(shù)字為label=2)

  1. 模型的訓(xùn)練
Traning of the substitute model
  • 初始化收集:收集少量的數(shù)據(jù)集,如手mnist赠堵,收集0~9的10張

  • 替代模型的結(jié)構(gòu),尋找合適的替代模型結(jié)構(gòu),如針對(duì)圖片采用卷積層針對(duì)文本采用RNN位仁, 而且他們證明層的類型携悯,數(shù)量和大小僅有些相對(duì)較小的影響。

  • submodel的訓(xùn)練:將初始inputs送入原model進(jìn)行查詢獲取label涨岁,獲得一個(gè)完成的數(shù)據(jù)集(input,label)之后進(jìn)行submodel的訓(xùn)練

  • 數(shù)據(jù)集的擴(kuò)增吉嚣,jacobian-based with reservoir sampling

  1. 對(duì)抗樣本的生成(利用白盒攻擊的方法)

GENERATING NATURAL ADVERSARIAL EXAMPLES: 需要input 和 label(例如預(yù)測(cè)數(shù)字為label=2)

1.模型的訓(xùn)練(獲得generator和inverter):

Traning Architecture with a GAN and an Inverter

和普通GAN的學(xué)習(xí)基本一致梢薪,只不過(guò)多了一個(gè)反向轉(zhuǎn)換器inverter

損失函數(shù)如上,實(shí)現(xiàn)的效果是:

  • 輸入高斯分布z尝哆,G輸出真實(shí)圖片x'

  • 夠輸入x秉撇,inverter輸出符合高斯分布的z’

以上保證了輸入z或者對(duì)z的輕微修改,G依舊能夠生成真實(shí)圖片

2.對(duì)抗樣本的生成

Natural Adversary Generation

迭代隨機(jī)尋找秋泄,對(duì)z=z’+θ琐馆,其中θ是對(duì)z的修改,是循環(huán)嘗試恒序、隨機(jī)生成瘦麸、符合一定分布的,所以說(shuō)盡可能嘗試歧胁。

ZOO: Zeroth Order Optimization Based Black-box Attacks:需要input+每一個(gè)類別的概率

1.模型的訓(xùn)練

optimization problem

損失函數(shù)如上滋饲,左邊保證對(duì)抗樣本與真實(shí)input的相似,右邊保證對(duì)抗樣本能導(dǎo)致目標(biāo)模型出錯(cuò)喊巍,具體如下:

target attack
untargeted attack
  • DNN model屠缭,如果目標(biāo)model的數(shù)據(jù)集類似mnist,圖片較小,就不會(huì)使用到attack-space hierarchical attack importance sampling

    • attack-space :計(jì)算梯度時(shí)的坐標(biāo)選取范圍變小 (299x299x3->32x32x3)

    • hierarchical attack:與上面的相反崭参,小范圍的坐標(biāo)選取可能會(huì)沒(méi) 有效果(32x32x3->64x64x3)

    • importance sampling:有時(shí)經(jīng)過(guò)了attack-space呵曹,坐標(biāo)范圍還是非 常的大,此時(shí)就需要根據(jù)坐標(biāo)的重要性進(jìn)行 選取(一般認(rèn)為奄喂,圖片中間位置的像素較邊 角的重要)

  • 隨機(jī)選取一個(gè)坐標(biāo)

  • 估計(jì)梯度之剧,h非常小,ei是一個(gè)只有i-th元素等于1的偏置向量砍聊。第二個(gè)只在牛頓法中才會(huì)使用背稼。

loss functions
loss function
  • 獲得了上面的近似梯度后,利用一階或二階方法(如下紅框內(nèi)的adam方法和newton method)來(lái)獲取best梯度
ZOO-ADAM
ZOO-Newton
  • 獲得了best梯度玻蝌,對(duì)x進(jìn)行修改蟹肘,輸入目標(biāo)model,如果出錯(cuò)則保留修改后的x俯树,否則帘腹,循環(huán)②③④直到產(chǎn)生best梯度

DECISION-BASED ADVERSARIAL ATTACKS:需要input和 label(例如預(yù)測(cè)數(shù)字為label=2)

  1. 模型的訓(xùn)練

① 初始化一張對(duì)抗input’ ~ U(0,1)

② 獲取擾動(dòng)

,之后對(duì)其進(jìn)行修剪符合下列:


③ 對(duì)擾動(dòng)修剪后许饿,會(huì)符合

阳欲,也就是如下圖的箭頭←(#1),在與原input中心的等距線上

④ 修改ε陋率,滿足下列損失函數(shù)

此損失函數(shù)會(huì)導(dǎo)致上圖的箭頭↓(#2)球化,即與等距線垂直的方向,靠近原input

⑤重復(fù)②③④瓦糟,即重復(fù)←↓(#1 #2)筒愚,越貼近原input時(shí),會(huì)修改ε變小菩浙。

⑤ 當(dāng)ε非常小的時(shí)候(收斂至0巢掺,如0.001),則保存此input’

說(shuō)明:上述②③④一直循環(huán)時(shí)劲蜻,input’是一致導(dǎo)致目標(biāo)model出錯(cuò)的陆淀,只不過(guò)是越來(lái)越接近原input,即圖片越來(lái)越真實(shí)先嬉。當(dāng)ε非常小的時(shí)候轧苫,則表明此時(shí)input’已經(jīng)很貼切原input,同時(shí)已經(jīng)保持著讓目標(biāo)model出錯(cuò)的性質(zhì)坝初。

Machine Learning as an Adversarial Service: Learning Black-Box Adversarial Examples:需要input和每一個(gè)類別的概率

  1. 模型的訓(xùn)練
    OverView of the attack
Attack model Architecture
Loss function
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末浸剩,一起剝皮案震驚了整個(gè)濱河市钾军,隨后出現(xiàn)的幾起案子鳄袍,更是在濱河造成了極大的恐慌,老刑警劉巖吏恭,帶你破解...
    沈念sama閱讀 211,194評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拗小,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡樱哼,警方通過(guò)查閱死者的電腦和手機(jī)哀九,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門剿配,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人阅束,你說(shuō)我怎么就攤上這事呼胚。” “怎么了息裸?”我有些...
    開封第一講書人閱讀 156,780評(píng)論 0 346
  • 文/不壞的土叔 我叫張陵蝇更,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我呼盆,道長(zhǎng)年扩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,388評(píng)論 1 283
  • 正文 為了忘掉前任访圃,我火速辦了婚禮厨幻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘腿时。我一直安慰自己况脆,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評(píng)論 5 384
  • 文/花漫 我一把揭開白布批糟。 她就那樣靜靜地躺著漠另,像睡著了一般。 火紅的嫁衣襯著肌膚如雪跃赚。 梳的紋絲不亂的頭發(fā)上笆搓,一...
    開封第一講書人閱讀 49,764評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音纬傲,去河邊找鬼满败。 笑死,一個(gè)胖子當(dāng)著我的面吹牛叹括,可吹牛的內(nèi)容都是我干的算墨。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼汁雷,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼净嘀!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起侠讯,我...
    開封第一講書人閱讀 37,679評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤挖藏,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后厢漩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體膜眠,經(jīng)...
    沈念sama閱讀 44,122評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了宵膨。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片架谎。...
    茶點(diǎn)故事閱讀 38,605評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖辟躏,靈堂內(nèi)的尸體忽然破棺而出谷扣,到底是詐尸還是另有隱情,我是刑警寧澤捎琐,帶...
    沈念sama閱讀 34,270評(píng)論 4 329
  • 正文 年R本政府宣布抑钟,位于F島的核電站,受9級(jí)特大地震影響野哭,放射性物質(zhì)發(fā)生泄漏在塔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評(píng)論 3 312
  • 文/蒙蒙 一拨黔、第九天 我趴在偏房一處隱蔽的房頂上張望蛔溃。 院中可真熱鬧,春花似錦篱蝇、人聲如沸贺待。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)麸塞。三九已至,卻和暖如春涧衙,著一層夾襖步出監(jiān)牢的瞬間哪工,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工弧哎, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留雁比,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,297評(píng)論 2 360
  • 正文 我出身青樓撤嫩,卻偏偏與公主長(zhǎng)得像偎捎,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子序攘,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容