樹莓派上實(shí)現(xiàn)深度學(xué)習(xí)目標(biāo)檢測的實(shí)踐(1/3)
這個(gè)現(xiàn)實(shí)世界造成了很多挑戰(zhàn),比如數(shù)據(jù)有限轮纫、只有微型的計(jì)算機(jī)硬件(像手機(jī)、樹莓派)所造成的無法運(yùn)行復(fù)雜深度學(xué)習(xí)模型等。這篇文章演示了如何使用樹莓派來進(jìn)行目標(biāo)檢測表箭。就像路上行駛的汽車,冰箱里的橘子争占,文件上的簽名和太空中的特斯拉燃逻。
image
01.為什么是目標(biāo)檢測?為什么是樹莓派臂痕?
樹莓派是一款靈活的計(jì)算機(jī)硬件伯襟,它以1500萬臺(tái)的銷量已經(jīng)吸引了一代消費(fèi)者的心,并且黑客們也在樹莓派上構(gòu)建了很多很酷的項(xiàng)目握童∧饭郑考慮到深度學(xué)習(xí)和樹莓派相機(jī)的的流行,我們認(rèn)為如果能在樹莓派上使用深度學(xué)習(xí)來檢測任意的物體那就非常棒了澡绩。
02.什么是目標(biāo)檢測稽揭?
2000萬年的進(jìn)化使得人類的視覺系統(tǒng)有了相當(dāng)高的進(jìn)化。人腦有30%的神經(jīng)元負(fù)責(zé)處理視覺信息(相對比只有8%處理觸覺和3%處理聽覺)肥卡。與機(jī)器相比溪掀,人類有兩個(gè)主要的優(yōu)勢。一是立體視覺步鉴,二是訓(xùn)練數(shù)據(jù)集的供應(yīng)幾乎是無限的(一個(gè)五歲的嬰兒可以大約在30fps的采樣間隔獲得2.7B的圖像數(shù)據(jù))揪胃。
為了模仿人類水平的表現(xiàn),科學(xué)家將視覺感知任務(wù)分解為四個(gè)不同的類別氛琢。
分類喊递,為圖像指定一個(gè)標(biāo)簽。
定位阳似,對特定的標(biāo)簽指定一個(gè)邊框骚勘。
物體檢測,在圖像中繪制多個(gè)邊框撮奏。
圖像分割俏讹,得到物體在圖像中的精確位置區(qū)域。
物體檢測對于很多應(yīng)用已經(jīng)足夠好(圖像分割是更精確的結(jié)果畜吊,它受到了創(chuàng)建訓(xùn)練數(shù)據(jù)復(fù)雜性的影響藐石。相比于畫邊框它通常花費(fèi)人類標(biāo)注者12倍的時(shí)間去分割圖像定拟。)此外于微,在檢測物體之后逗嫡,可以將物體在邊框中單獨(dú)分割出來。
目標(biāo)檢測具有重要的現(xiàn)實(shí)意義株依,已經(jīng)在各行各業(yè)得到了廣泛應(yīng)用驱证。下面列舉了一些例子:
03.怎樣使用物體檢測解決自己的問題?
物體檢測可以用于解決各種各樣的問題恋腕。這些是一個(gè)概括的分類:
物體是不是出現(xiàn)在我的圖像中抹锄?比如在我的房子有一個(gè)入侵者。
在圖像中的一個(gè)物體在哪個(gè)位置荠藤?比如一個(gè)汽車試圖在世界各地導(dǎo)航時(shí)伙单,知道物體的位置就很重要。
圖像中有多少個(gè)物體哈肖?物體檢測是計(jì)算物體數(shù)目最有效的方法之一吻育。比如倉庫的貨架上有多少個(gè)盒子。
圖像中有哪些不同類型的物體淤井?比如動(dòng)物園的哪些區(qū)域有哪些動(dòng)物布疼?
物體的尺寸有多大?特別是使用靜態(tài)的相機(jī)币狠,很容易計(jì)算出物體的大小游两。比如芒果的大小是多少。
物體之間是如何相互作用的漩绵?比如在足球場上的隊(duì)形是如何影響比賽結(jié)果的贱案?
物體在不同時(shí)間的位置(跟蹤一個(gè)物體)?比如跟蹤一個(gè)像火車一樣的物體并且計(jì)算它的速度止吐。