最近在學(xué)習(xí)YOLO系列的相關(guān)知識鲁豪,YOLOV1-YOLOV3之前已經(jīng)熟讀過了,這幾天在看YOLOV4律秃,總結(jié)一下該檢測方法主要改進點:
-
CSPDarknet53主干網(wǎng)絡(luò):
- YOLOv4采用了CSPDarknet53作為其主干網(wǎng)絡(luò)爬橡,這是一種Cross Stage Partial Network的變體,用于特征提取棒动。CSPDarknet53通過減少卷積層之間的連接來降低計算復(fù)雜度糙申,同時保持特征提取的能力。
-
SPPF模塊:
- 空間金字塔池化模塊(Spatial Pyramid Pooling Form)用于進一步提取多尺度的特征船惨,有助于檢測不同大小的目標柜裸。
-
PANet改進:
- YOLOv4中使用的PANet進行了改進缕陕,通過在網(wǎng)絡(luò)中增加額外的路徑來加強特征融合,特別是對于小目標的檢測疙挺。
-
損失函數(shù):
- YOLOv4采用了CIoU損失函數(shù)來優(yōu)化邊界框的回歸扛邑,CIoU損失考慮了重疊區(qū)域、中心點距離和寬高比铐然,有助于提高定位精度蔬崩。
- 同時,YOLOv4還使用了DIoU損失來減少邊界框的定位誤差搀暑。
-
數(shù)據(jù)增強:
- YOLOv4使用了包括MixUp沥阳、Mosaic等在內(nèi)的多種數(shù)據(jù)增強技術(shù),這些技術(shù)提高了模型對不同環(huán)境和變化的魯棒性自点。
-
自動錨框尺寸:
- YOLOv4通過k-means聚類自動確定錨框的尺寸桐罕,而不是手動設(shè)置,這使得模型能夠自動適應(yīng)訓(xùn)練數(shù)據(jù)中的不同目標尺寸桂敛。這個方法最早在YOLOV2中使用功炮。
-
訓(xùn)練策略:
- YOLOv4采用了包括大批量訓(xùn)練(Large Batch Training)和學(xué)習(xí)率預(yù)熱(Learning Rate Warmup)在內(nèi)的訓(xùn)練策略,這些策略有助于模型更快收斂并獲得更好的性能术唬。
-
模型優(yōu)化:
- 論文中還提到了模型的優(yōu)化死宣,例如使用Mish激活函數(shù)代替?zhèn)鹘y(tǒng)的ReLU激活函數(shù),以及使用DropBlock正則化減少過擬合碴开。個人感覺這個方法其實和cutout數(shù)據(jù)增強方法很相似毅该,本質(zhì)上就是遮住圖像的一大塊,