2018安全帽檢測的深度學(xué)習(xí)新模型
去年年初的時(shí)候,因?yàn)轫?xiàng)目需要,采用了深度學(xué)習(xí)的方法,做了一套安全帽檢測的模型,并投入到企業(yè)的生產(chǎn)車間現(xiàn)場,起到了很好的效果.
這個(gè)項(xiàng)目在運(yùn)行過程中感到有如下不足:
現(xiàn)場端設(shè)備需要過高的運(yùn)算能力(i5處理器),部署和維護(hù)起來也比較復(fù)雜,整體成本偏高.
深度學(xué)習(xí)的模型現(xiàn)在看來偏簡單,識別精度不到90%,誤報(bào)較多.
-
模型訓(xùn)練非常費(fèi)事費(fèi)力,訓(xùn)練集的采集和現(xiàn)場相關(guān)性太強(qiáng),模型適應(yīng)性偏弱.不同場景識別產(chǎn)生較大偏差.需要手工調(diào)參,費(fèi)時(shí)費(fèi)力.
Gif-2018-37-06-00-37-42.gif
經(jīng)過一年多發(fā)展,尤其是深度學(xué)習(xí)的新的模型的不斷出現(xiàn),無論是運(yùn)算速度,識別精度上都有了很大進(jìn)步,經(jīng)過一定的積累,決定重新做一套新的模型和更加適應(yīng)企業(yè)現(xiàn)場應(yīng)用場景的平臺,達(dá)到如下目標(biāo):
- 項(xiàng)目訓(xùn)練可以實(shí)現(xiàn)現(xiàn)場采集,及時(shí)訓(xùn)練,快速部署,實(shí)情實(shí)景,增加模型對現(xiàn)場的適應(yīng)性,達(dá)到商業(yè)化的識別標(biāo)準(zhǔn).
- 模型足夠小,既可以部署到嵌入式設(shè)備中,也可以大規(guī)模在后臺并發(fā)運(yùn)算,大大降低整個(gè)項(xiàng)目的運(yùn)行成本.
- 達(dá)到足夠高的識別精度和盡快短的響應(yīng)時(shí)間.
- 模型適應(yīng)性強(qiáng),部署簡單,大幅降低工程項(xiàng)目的難度,適合推廣和大規(guī)模部署.
- 實(shí)現(xiàn)云平臺,AI入云,現(xiàn)場只需一個(gè)普通的網(wǎng)絡(luò)攝像頭即可使用.
1. 安全帽檢測新模型
谷歌2018年發(fā)布了MobileNetV2的深度學(xué)習(xí)模型,經(jīng)過仔細(xì)的研究和測試,發(fā)現(xiàn)這個(gè)模型的優(yōu)點(diǎn):輕巧,速度快,兼顧識別精度高等特點(diǎn),決定參考MobileNetV2
模型,搭建一套全新的安全帽識別模型.
谷歌論文中的MobileNetV2模型是以imagenet數(shù)據(jù)集為基礎(chǔ)的,Input size為224*224,考慮到安全帽識別的場景,我決定縮減input size,并適當(dāng)減少模型中的殘差網(wǎng)絡(luò)的層數(shù),進(jìn)一步縮減模型.
搭建好模型之后,數(shù)據(jù)集的問題,考慮到實(shí)現(xiàn)現(xiàn)場數(shù)據(jù)采集和分割識別,并分類訓(xùn)練,就設(shè)計(jì)了一套現(xiàn)場采集的系統(tǒng),大概思路和去年的差不多,就是實(shí)現(xiàn)了在云端訓(xùn)練,快速現(xiàn)場部署的要求.
2. 測試模型
一般經(jīng)過半個(gè)小時(shí)的數(shù)據(jù)采集,就可以達(dá)到訓(xùn)練的數(shù)據(jù)量了,在云端訓(xùn)練完成后測試數(shù)據(jù)集的正確率在96%以上,完全達(dá)到商用標(biāo)準(zhǔn)了.
在我的老款mac air上跑起來非常流暢,試著把模型部署到樹莓派3上,竟然可以達(dá)到每秒3幀的識別水平.