姓名:謝雨杉? 學號:22011210940? 通信工程學院
對抗樣本的概念
對抗樣本是指在數(shù)據(jù)集中通過故意添加細微的干擾所形成的輸入樣本蝙斜,導(dǎo)致模型以高置信度給出一個錯誤的輸出肴沫。即只需要在一張圖片上做微小的擾動,分類器以很高的置信度將圖片錯誤分類,甚至被分類成一個指定的標簽(不是圖片所屬的正確標簽)剥啤。
具體來說,有一個深度學習系統(tǒng)M及干凈的輸入樣本(沒有添加噪聲的樣本)C,我們假設(shè)樣本C被深度學習系統(tǒng)M正確地分類,即否过,建立一個幾乎與樣本C相同但是卻被錯誤分類的樣本D﹐使,這樣的樣本D我們稱之為對抗樣本驮履。