使用GluonCV+OpenCV+YoloV3調(diào)用攝像頭實(shí)現(xiàn)實(shí)時(shí)人臉檢測(cè)

1.寫(xiě)在前面

最近組里有個(gè)項(xiàng)目與目標(biāo)識(shí)別有關(guān)侨嘀，去網(wǎng)上找了一下妨猩，發(fā)現(xiàn)目前SOTA的目標(biāo)識(shí)別算法基本都是one-stage的燕差，比如SSD遭笋、DSSD、RetinaNet徒探、YOLO等瓦呼，但是速度上YOLO是最快的。而且看了下YOLO主頁(yè)测暗，作者的風(fēng)格我很喜歡央串。所以仔細(xì)研究了一下。本文的內(nèi)容基于GluonCV碗啄、OpenCV和YoloV3质和，運(yùn)行平臺(tái)為Ubuntu16.04版本。ps：因?yàn)榻M里采購(gòu)的服務(wù)器還沒(méi)到挫掏，目前只能在我自己筆記本的虛擬機(jī)上跑侦另，而虛擬機(jī)的顯卡是模擬出來(lái)的，無(wú)法安裝CUDA和CUDNN（這個(gè)坑也是我安裝CUDA遇到了各種坑后發(fā)現(xiàn)的），各位有條件的還是使用CUDA+CUDNN環(huán)境褒傅，速度會(huì)快不少弃锐。

2.環(huán)境搭建

2.1 GluonCV

GuonCV是一個(gè)計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)的工具箱，功能非常強(qiáng)大殿托，包含了圖像分類(lèi)霹菊，目標(biāo)識(shí)別，語(yǔ)義分割支竹，實(shí)例分割等旋廷。GluonCV的安裝在他們主頁(yè)上面有介紹，安裝很簡(jiǎn)單礼搁，python2和python3都可以饶碘，但是你的pip版本要大于9.0，同時(shí)還要安裝一個(gè)mxnet框架馒吴。同時(shí)他們主頁(yè)還提供了一些簡(jiǎn)單的demo教你使用扎运，還可以查詢(xún)API的源代碼。

2.2 OpenCV

OpenCV是一個(gè)用于圖像處理饮戳、分析豪治、機(jī)器視覺(jué)方面的開(kāi)源函數(shù)庫(kù). 無(wú)論你是做科學(xué)研究，還是商業(yè)應(yīng)用扯罐，OpenCV都可以作為你理想的工具庫(kù)负拟，因?yàn)椋瑢?duì)于這兩者歹河，它完全是免費(fèi)的掩浙。該庫(kù)采用C及C++語(yǔ)言編寫(xiě)，可以在windows, linux, mac OSX系統(tǒng)上面運(yùn)行秸歧。該庫(kù)的所有代碼都經(jīng)過(guò)優(yōu)化涣脚，計(jì)算效率很高，因?yàn)榱让＃鼘?zhuān)注于設(shè)計(jì)成為一種用于實(shí)時(shí)系統(tǒng)的開(kāi)源庫(kù)。opencv采用C語(yǔ)言進(jìn)行優(yōu)化矾麻，而且纱耻，在多核機(jī)器上面，其運(yùn)行速度會(huì)更快险耀。它的一個(gè)目標(biāo)是提供友好的機(jī)器視覺(jué)接口函數(shù)弄喘，從而使得復(fù)雜的機(jī)器視覺(jué)產(chǎn)品可以加速面世。該庫(kù)包含了橫跨工業(yè)產(chǎn)品檢測(cè)甩牺、醫(yī)學(xué)圖像處理蘑志、安防、用戶(hù)界面、攝像頭標(biāo)定急但、三維成像澎媒、機(jī)器視覺(jué)等領(lǐng)域的超過(guò)500個(gè)接口函數(shù)。

OpenCV安裝很簡(jiǎn)單波桩，直接pip install opencv-python即可戒努。你也可以使用源代碼安裝，官網(wǎng)的下載速度很痛苦镐躲，我給個(gè)OpenCV3.4.7版本的鏈接,需要的朋友可以自却⒚怠：
https://pan.baidu.com/s/1Zts9WR7VtH-2L0e9fIaNHw
提取碼：498k
源碼的安裝教程網(wǎng)上很多，我貼一個(gè)別人https://jingyan.baidu.com/article/a3761b2be162951576f9aace.html萤皂，需要安裝cmake工具撒穷，沒(méi)有安裝的直接apt install cmake就可以了。

2.3 YoloV3

YoloV3在他們主頁(yè)有很詳細(xì)的教程（基于darknet）裆熙，有興趣可以去看下他們的論文端礼，寫(xiě)的很有趣，傳統(tǒng)的識(shí)別方法是當(dāng)做一個(gè)分類(lèi)問(wèn)題弛车，而作者當(dāng)做一個(gè)回歸問(wèn)題來(lái)處理齐媒，同時(shí)并不像傳統(tǒng)算法那樣需要很多滑動(dòng)窗口，他是end to end直接輸出結(jié)果纷跛，這也是他們的名字YOLO（you only look once）的由來(lái)喻括。同時(shí)推薦新手使用darknet，他是一個(gè)很輕量級(jí)的框架贫奠，但是內(nèi)容很多唬血，且易于上手。

3.代碼

代碼主要分為三個(gè)模塊唤崭，utils模塊拷恨，detection模塊和main模塊。

3.1 utils模塊

utils模塊包括data_preset.py谢肾，yolov3.py腕侄，bbox.py等文件
[圖片上傳失敗...(image-4f99d3-1569487002238)]

3.2 detection模塊

detection模塊包括model，mobilefacedetnet.py等文件
[圖片上傳失敗...(image-7077ae-1569487002238)]

3.3 main模塊

main模塊包括cap.py函數(shù)芦疏，其實(shí)就是執(zhí)行函數(shù)冕杠。使用python3 cap.py執(zhí)行就行。ps：我設(shè)置了一些命令行參數(shù)酸茴，比如--video選擇本地視頻分预，--camera選擇攝像頭，--gpu選擇是否使用GPU薪捍。大家可以使用python3 cap.py -h查看使用方法,比如
[圖片上傳失敗...(image-4ec4d7-1569487002238)]
cap.py代碼如下：

from mxnet import nd
import gluoncv as gcv
from mxnet.gluon.nn import BatchNorm
from gluoncv.data.transforms import presets
from matplotlib import pyplot as plt
sys.path.append(os.path.abspath(os.path.dirname(__file__)) + os.sep + '../MobileFace_Detection/utils/')
from data_presets import data_trans
sys.path.append(os.path.abspath(os.path.dirname(__file__)) + os.sep + '../MobileFace_Detection/')
from mobilefacedetnet import mobilefacedetnet_v2
sys.path.append(os.path.abspath(os.path.dirname(__file__)) + os.sep + '../MobileFace_Tracking/')
from mobileface_sort_v1 import Sort


def parse_args():
    parser = argparse.ArgumentParser(description='Test with YOLO networks.')
    parser.add_argument('--model', type=str, 
                        default='../MobileFace_Detection/model/mobilefacedet_v2_gluoncv.params',
                        help='Pretrained model path.')
    parser.add_argument('--video', type=str, default='friends1.mp4',
                        help='Test video path.')
    parser.add_argument('--camera', type=int, default=None,
                        help='Camera select')
    parser.add_argument('--gpus', type=str, default='',
                        help='Default is cpu , you can specify 1,3 for example with GPUs.')
    parser.add_argument('--pretrained', type=str, default='True',
                        help='Load weights from previously saved parameters.')
    parser.add_argument('--thresh', type=float, default=0.5,
                        help='Threshold of object score when visualize the bboxes.')
    parser.add_argument('--sort_max_age', type=int, default=10,
                        help='Threshold of object score when visualize the bboxes.')
    parser.add_argument('--sort_min_hits', type=int, default=3,
                        help='Threshold of object score when visualize the bboxes.')
    parser.add_argument('--output', type=str, 
                        default='./tracking_result/result_friends1_tracking.avi',
                        help='Output video path and name.')
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    # context list
    ctx = [mx.gpu(int(i)) for i in args.gpus.split(',') if i.strip()]
    ctx = [mx.cpu()] if not ctx else ctx

    net = mobilefacedetnet_v2(args.model)
    net.set_nms(0.45, 200)
    net.collect_params().reset_ctx(ctx = ctx)

    mot_tracker = Sort(args.sort_max_age, args.sort_min_hits) 

    img_short = 256   
    colors = np.random.rand(32, 3) * 255

    winName = 'MobileFace for face detection and tracking'
    cv2.namedWindow(winName, cv2.WINDOW_NORMAL)
    if args.camera == None:
        cap = cv2.VideoCapture(args.video)
    else:
        cap = cv2.VideoCapture(args.camera)
    output_video = args.output
    # video_writer = cv2.VideoWriter(output_video, cv2.VideoWriter_fourcc('M','J','P','G'), 30, (round(cap.get(cv2.CAP_PROP_FRAME_WIDTH)),round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))))
    video_writer = cv2.VideoWriter(output_video, cv2.VideoWriter_fourcc('M','J','P','G'), 30, (int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))))
    # while(cap.isOpened()):
    while cv2.waitKey(1) < 0:
        ret, frame = cap.read()
        if not ret:
            print("Done processing !!!")
            print("Output file is stored as ", output_video)
            cv2.waitKey(3000)
            break
        
        dets = []
        frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        frame_nd = nd.array(frame_rgb)
        x, img = data_trans(frame_nd, short=img_short)
        x = x.as_in_context(ctx[0])
        # ids, scores, bboxes = [xx[0].asnumpy() for xx in net(x)]
        tic = time.time()
        result = net(x)
        toc = time.time() - tic
        #print('Detection inference time:%fms' % (toc*1000))
        ids, scores, bboxes = [xx[0].asnumpy() for xx in result]

        h, w, c = frame.shape
        scale = float(img_short) / float(min(h, w))
        for i, bbox in enumerate(bboxes):
            if scores[i]< args.thresh:
                continue
            xmin, ymin, xmax, ymax = [int(x/scale) for x in bbox]
            # result = [xmin, ymin, xmax, ymax, ids[i], scores[i]]
            result = [xmin, ymin, xmax, ymax, ids[i]]
            dets.append(result)

        dets = np.array(dets)    
        tic = time.time()
        trackers = mot_tracker.update(dets)
        toc = time.time() - tic
        #print('Tracking time:%fms' % (toc*1000))

        for d in trackers:
            color = (int(colors[int(d[4]) % 32, 0]), int(colors[int(d[4]) % 32,1]), int(colors[int(d[4]) % 32, 2]))
            cv2.rectangle(frame, (int(d[0]), int(d[1])), (int(d[2]), int(d[3])), color, 3)
            # cv2.putText(frame, str('%s%0.2f' % (net.classes[int(d[4])], d[5])), 
            #            (d[0], d[1] - 5), cv2.FONT_HERSHEY_COMPLEX , 0.8, color, 2)
            cv2.putText(frame, str('%s%d' % ('face', d[4])), 
                       (int(d[0]), int(d[1]) - 5), cv2.FONT_HERSHEY_COMPLEX , 0.8, color, 2)

        video_writer.write(frame.astype(np.uint8))  
        cv2.imshow(winName, frame)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    warnings.filterwarnings("ignore")
    main()

4.后續(xù)

項(xiàng)目我會(huì)放到我的GitHub上笼痹，更新了會(huì)告訴大家配喳，如果有想要的可以聯(lián)系我maplect@sina.com，我看到會(huì)發(fā)給你凳干。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末晴裹，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子纺座，更是在濱河造成了極大的恐慌息拜，老刑警劉巖，帶你破解...
沈念sama閱讀 223,126評(píng)論 6贊 520
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件净响，死亡現(xiàn)場(chǎng)離奇詭異少欺，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)馋贤，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,421評(píng)論 3贊 400
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)赞别，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人配乓，你說(shuō)我怎么就攤上這事仿滔。” “怎么了犹芹？”我有些...
開(kāi)封第一講書(shū)人閱讀 169,941評(píng)論 0贊 366
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵崎页，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我腰埂，道長(zhǎng)飒焦，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 60,294評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任屿笼，我火速辦了婚禮牺荠，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘驴一。我一直安慰自己休雌，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 69,295評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布肝断。她就那樣靜靜地躺著杈曲，像睡著了一般。火紅的嫁衣襯著肌膚如雪胸懈。梳的紋絲不亂的頭發(fā)上鱼蝉，一...
開(kāi)封第一講書(shū)人閱讀 52,874評(píng)論 1贊 314
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音箫荡，去河邊找鬼。笑死渔隶，一個(gè)胖子當(dāng)著我的面吹牛羔挡，可吹牛的內(nèi)容都是我干的洁奈。我是一名探鬼主播，決...
沈念sama閱讀 41,285評(píng)論 3贊 424
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼绞灼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼利术！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起低矮，我...
開(kāi)封第一講書(shū)人閱讀 40,249評(píng)論 0贊 277
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤印叁，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后军掂，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體轮蜕，經(jīng)...
沈念sama閱讀 46,760評(píng)論 1贊 321
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,840評(píng)論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年蝗锥，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了跃洛。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,973評(píng)論 1贊 354
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡终议，死狀恐怖汇竭，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情穴张，我是刑警寧澤细燎，帶...
沈念sama閱讀 36,631評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站皂甘，受9級(jí)特大地震影響玻驻，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜叮贩，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,315評(píng)論 3贊 336
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一击狮、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧益老，春花似錦彪蓬、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,797評(píng)論 0贊 25
一樁弒父案档冬，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至桃纯，卻和暖如春酷誓，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背态坦。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,926評(píng)論 1贊 275
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工盐数，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人伞梯。一個(gè)月前我還...
沈念sama閱讀 49,431評(píng)論 3贊 379
代替公主和親
正文我出身青樓玫氢，卻偏偏與公主長(zhǎng)得像帚屉，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子漾峡，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,982評(píng)論 2贊 361