本文想解決是單分類問題躲株,通過對正常樣本的學(xué)習(xí),檢測出未知類型的異常镣衡,更傾向于缺陷檢測霜定。方法整體流程分為兩步,首先基于自監(jiān)督學(xué)習(xí)方法學(xué)習(xí)樣本表征廊鸥,繼而通過一個單分類器對表征進行分類望浩。通過文中提出的CutPaste實現(xiàn)對于正常樣本的表征學(xué)習(xí)及分類。CutPaste是一種數(shù)據(jù)增強方法惰说,從圖像中裁剪出一塊矩形區(qū)域粘貼到任意位置磨德。cutpaste 的目的是產(chǎn)生空間上的不規(guī)則性,作為不參與訓(xùn)練的真實缺陷的近似值∵菏樱現(xiàn)有的一些很受歡迎的方法將旋轉(zhuǎn)和對比學(xué)習(xí)應(yīng)用于單分類剖张,但是本文實驗證明切诀,對于檢測缺陷,單純使用旋轉(zhuǎn)或者對比學(xué)習(xí)不是最優(yōu)的搔弄。作者猜想幾何變換例如旋轉(zhuǎn)和移位幅虑,在學(xué)習(xí)語義概念的表征中是有效的(如學(xué)習(xí)對象),但
較少對規(guī)律性的學(xué)習(xí)(例如顾犹,連續(xù)性倒庵、重復(fù)性)。對于缺陷檢測炫刷,本文希望提出一種數(shù)據(jù)增強的方法模擬局部不規(guī)則模式擎宝。
目前單分類異常檢測算法主要思路是訓(xùn)練一個能表征正常樣本的模型,并且假設(shè)這個模型不能很好的表征異常樣本浑玛。但是基于像素級的重建損失一般無法獲得高級語義信息绍申。
本文采用了一種自監(jiān)督學(xué)習(xí)中pretext task的思路,在(a)自監(jiān)督學(xué)習(xí)表征階段,對正樣本采用cutpaste生成圖像顾彰,訓(xùn)練一個二分類CNN极阅,識別正常樣本,及添加cutpaste后的圖像涨享。在(b)異常檢測及定位階段筋搏,CNN用來提取特征,參數(shù)高斯概率密度估計(GDE)使用CNN提取的特征計算異常分數(shù)厕隧,圖像級別的異常檢測可以使用GradCAM大致定位異常區(qū)域奔脐,patch級別的異常定位,對原圖分割成若干patch,分別送到CNN--GDE計算異常分數(shù)吁讨,得出更細粒度異常熱力圖髓迎。
(第二階段應(yīng)該是沒訓(xùn)練,直接用輸出的表征計算出來的異常分數(shù))
發(fā)現(xiàn)到一個現(xiàn)象建丧。
使用對比式自監(jiān)督學(xué)習(xí)做異常檢測的(simclr等)排龄,基本需要在第二階段進行finetune。
使用其他自監(jiān)督學(xué)習(xí)做異常檢測的(體現(xiàn)在pretext task沒用對比學(xué)習(xí)茶鹃,而是識別圖象旋轉(zhuǎn),是否進行增強的)艰亮,一在第二階段可以不進行finetune.
文章中使用的數(shù)據(jù)增強方法cutpaste和cutpaste(scar)試有cutout和scar啟發(fā)而來闭翩,scar是添加舉行細長線。實際自監(jiān)督學(xué)習(xí)實驗看作三分類問題迄埃,正常樣本疗韵,添加cutpaste的樣本,添加cutpaste(scar)的樣本侄非。
對于MVTec AD dataset蕉汪,或者實際的缺陷檢測任務(wù)流译,缺陷一般含有拉伸變形,特殊的紋理構(gòu)造者疤。作者對正常樣本使用cutpaste的目的是希望在正常樣本的表征學(xué)習(xí)中福澡,能夠通過cutpaste模擬異常樣本,作者使用可視化技術(shù)發(fā)現(xiàn),添加cutpaste后的正樣本與原始正樣本距離較大驹马,但是與真實的異常樣本接近度較小革砸,說明仍需要更好的數(shù)據(jù)增強方法。
實驗對比糯累,AUC
實驗對比算利,缺陷定位
不同數(shù)據(jù)增強方法的消融實驗
在語義異常檢測數(shù)據(jù)集上的實驗
作者將cifar10數(shù)據(jù)集的異常檢測定義為Semantic Outlier Detection,其需要識別車與狗這種語義級別的差異泳姐,而MVTec AD dataset代表的缺陷異常檢測識別的是細微處的差異效拭。在cifar10上取得69.4 的AUC,高于 Cutout (60:2).但是低于使用旋轉(zhuǎn)預(yù)測方法 (91:3 AUC)
(Learning and evaluating representations fordeep one-class classification.自監(jiān)督學(xué)習(xí)階段,對圖像旋轉(zhuǎn)不同角度當(dāng)作不同類別胖秒,)
作者認為缎患,對于不同類型的數(shù)據(jù)集,結(jié)合不同數(shù)據(jù)增強方法的pretext task影響是很大的扒怖。對于語義級的數(shù)據(jù)集较锡,旋轉(zhuǎn)更優(yōu),對于細節(jié)缺陷檢測盗痒,本文cutpaste性能更優(yōu)蚂蕴。需要根據(jù)異常的特點,針對性的設(shè)計數(shù)據(jù)增強方法俯邓,以在正樣本中豐富出與正樣本差異較大的樣本骡楼,最好是能夠表現(xiàn)出異常樣本的特點。