BAT人臉識(shí)別產(chǎn)品分析
目錄
1.人臉識(shí)別產(chǎn)品分析
2.BAT人臉功能對(duì)比
3.活體檢測(cè)
4.人臉識(shí)別SDK
5.人臉識(shí)別應(yīng)用漫談
前言
人臉識(shí)別屬于智能圖像下的一個(gè)分支,這可能是迄今為止中文互聯(lián)網(wǎng)上講人臉識(shí)別最全的一篇文章。這可能是互聯(lián)網(wǎng)上最適合產(chǎn)品經(jīng)理了解人臉識(shí)別產(chǎn)品的一篇文章。
1.產(chǎn)品分析的維度選擇:算法和工程化
產(chǎn)品分析的價(jià)值是幫助自己開展工作。have a skin in the game倡勇,很有利益攸關(guān)。
通過官網(wǎng)和試用去了解一個(gè)產(chǎn)品還不夠,你需要更加關(guān)注細(xì)節(jié)诀艰。網(wǎng)上搜索到別人的觀點(diǎn),同樣也不是你的分析產(chǎn)出。官網(wǎng)的產(chǎn)品功能其垄,案例和使用場(chǎng)景介紹...是給老板看的苛蒲,他看完之后決定要不要掏錢購(gòu)買。而所謂人工智能的產(chǎn)品分析绿满,需要站在算法和工程化的角度臂外,甚至硬件也要涉及。接口文檔能幫助你清楚了解每一個(gè)功能是什么喇颁,性能怎么樣漏健,以及背后的產(chǎn)品設(shè)計(jì)邏輯。
于是我把百度无牵、騰訊和阿里人臉識(shí)別平臺(tái)所有的接口文檔和SDK文檔刷了一遍漾肮。
2.人臉識(shí)別功能對(duì)比
本次產(chǎn)品分析選取了阿里和騰訊的人工智能平臺(tái)的人臉識(shí)別產(chǎn)品作為參照物。
百度門戶宣傳了人臉檢測(cè)茎毁,對(duì)比克懊,查找和采集四個(gè)功能。
騰訊宣傳了人臉檢測(cè)與分析七蜘,人臉比對(duì)與驗(yàn)證谭溉,人臉檢索和多臉檢索,五官定位和靜態(tài)活體檢測(cè)橡卤。
阿里是人臉檢測(cè)扮念,比對(duì),人臉查找1:N碧库,人臉屬性柜与,人臉特征點(diǎn)定位。
經(jīng)過閱讀和調(diào)研接口文檔嵌灰,可以得出以下結(jié)論:
人臉檢測(cè)功能
-百度包含了人臉特征點(diǎn)定位和人臉屬性弄匕;
-騰訊的人臉檢測(cè)功能包含了人臉屬性識(shí)別;
-阿里的人臉檢測(cè)包含了人臉關(guān)鍵點(diǎn)定位沽瞭。
人臉對(duì)比——1:1比對(duì)
百度可以選擇圖片質(zhì)量控制和活體檢測(cè)控制迁匠。阿里和騰訊都沒有在人臉比對(duì)中集成這兩個(gè)功能。其中驹溃,百度支持圖片以face_token的形式上傳城丧,官方宣稱是人臉圖片的唯一性標(biāo)識(shí),問過算法小伙伴豌鹤,可能是人臉特征值的唯一性標(biāo)識(shí)亡哄。
這里單獨(dú)說一下圖片質(zhì)量檢測(cè),它保證了采集人臉照片質(zhì)量傍药,從而可以保證識(shí)別磺平、對(duì)比結(jié)果的準(zhǔn)確性魂仍,因而在人臉檢測(cè)拐辽、比對(duì)拣挪、采集、搜索中廣泛被使用俱诸〔と埃活體檢測(cè)比較復(fù)雜,下文有詳述睁搭。
人臉查找也即1:N比對(duì)
三家都沒有明說支持在多大的范圍內(nèi)進(jìn)行查找比對(duì)赶诊,可見大家都半斤八兩不好意思講。上次聽百度的分享說在內(nèi)部測(cè)過园骆,N到兩萬就有錯(cuò)誤了舔痪。
阿里聲稱“提供sdk調(diào)用方式,支持無交互式或動(dòng)作活體檢測(cè)锌唾,支持多平臺(tái)锄码,CPU、GPU計(jì)算模式”晌涕,但并未見SDK相關(guān)信息滋捶。
人臉采集功能
騰訊和阿里均未見相關(guān)介紹。
百度提供SDK采集和H5采集兩種方式余黎。百度聲稱:
“SDK采集內(nèi)部支持高度可定制化參數(shù)重窟,對(duì)人臉檢測(cè)、追蹤惧财、采集巡扇、質(zhì)量模塊進(jìn)行個(gè)性化調(diào)整、SDK內(nèi)部所有UI層代碼垮衷、音頻文件全部開源厅翔,可根據(jù)實(shí)際業(yè)務(wù)需求任意調(diào)整、提供多端覆蓋帘靡,適應(yīng)各種應(yīng)用場(chǎng)景及設(shè)備類型需求知给。”
可見開放平臺(tái)的出現(xiàn)描姚,大大降低了應(yīng)用開發(fā)門檻涩赢。
H5采集,主要是通過拍照轩勘,可以快速驗(yàn)證業(yè)務(wù)流程筒扒,或者進(jìn)行線上人臉數(shù)據(jù)冷啟動(dòng),能力單一绊寻,因此需要通過一系列的接口驗(yàn)證來完成各種采集條件的校驗(yàn)花墩。
其它功能
五官定位功能悬秉,也即關(guān)鍵點(diǎn)定位,百度提供72個(gè)關(guān)鍵點(diǎn)冰蘑,騰訊提供88個(gè)和泌,阿里是105個(gè)。所以他們用的標(biāo)注數(shù)據(jù)都不一樣祠肥,能不能開源一下武氓?
人臉屬性都差不多,無外乎性別仇箱、年齡县恕、表情、眼鏡剂桥、三維空間的姿態(tài)忠烛,除了這些,從人臉上也讀不出更多信息权逗。
騰訊單獨(dú)把多臉檢索拉出來介紹美尸,其實(shí)就是一張照片或視頻流包含多張臉的識(shí)別,也即檢測(cè)出多張臉旬迹,采集火惊,同時(shí)進(jìn)行多次的1:N識(shí)別。
3.各種活體檢測(cè)
活體檢測(cè)就是判斷識(shí)別對(duì)象是不是活的人奔垦,其實(shí)非常有意思屹耐,這個(gè)功能百度提供了大量接口功能說明。
首先看分類和是什么:
在線圖片活體檢測(cè)椿猎,通過API實(shí)現(xiàn)活體判斷惶岭,原理是基于圖片中人像的破綻(摩爾紋、成像畸形等)來判斷目標(biāo)對(duì)象是否為活體犯眠,可有效防止屏幕二次翻拍等作弊攻擊按灶,可使用單張或多張判斷邏輯。
動(dòng)作配合式活體檢測(cè)筐咧,一般集成在人臉采集SDK里鸯旁,你用支付寶、易付寶和滴滴時(shí)彈出的人臉識(shí)別校驗(yàn)量蕊,就包含這種檢測(cè)铺罢。SDK實(shí)現(xiàn)活體判斷的方式是,它給出指定動(dòng)作要求残炮,用戶需配合完成韭赘,通過實(shí)時(shí)檢測(cè)用戶眼睛,嘴巴势就,頭部姿態(tài)的狀態(tài)泉瞻,來判斷是否是活體脉漏。支持7種預(yù)設(shè)動(dòng)作,可自定義哪些生效以及檢測(cè)順序袖牙。
視頻活體檢測(cè)侧巨,用戶通過API接口上傳一個(gè)現(xiàn)場(chǎng)錄制的視頻,錄制時(shí)讀出隨機(jī)分配的語(yǔ)音校驗(yàn)碼贼陶。然后通過分析這個(gè)視頻的人臉信息以及語(yǔ)音校驗(yàn)碼是否匹配刃泡,完成活體檢測(cè)判斷巧娱。
最后一大類是集成在人臉離線識(shí)別SDK中的活體檢測(cè)碉怔,有離線RGB活體檢測(cè)、離線近紅外活體檢測(cè)禁添、離線3D結(jié)構(gòu)光活體檢測(cè)撮胧,看名字就知道這種活體檢測(cè)對(duì)硬件設(shè)備要求較高。iPhone X的前置攝像頭就能投射出點(diǎn)陣紅外光老翘,能夠采集到你面部的深度信息芹啥。
再看優(yōu)缺點(diǎn):
靜態(tài)活體檢測(cè)
是接入成本最低的使用方式,只需提交一張人臉圖片即可铺峭。
但是它的活體檢測(cè)的果不是十分理想墓怀,主要是由于:拍照時(shí)攻擊者可以設(shè)法減少后端算法判斷的線索,并且在拍照時(shí)調(diào)用后置攝像頭進(jìn)行拍照卫键,由于焦距不同傀履,會(huì)使后置攝像頭拍攝的攻擊圖片更難分辨真假。
另外拍照只上傳一張圖片莉炉,增加了誤判的可能性钓账。
動(dòng)態(tài)活體檢測(cè)
要求用戶配合做出一些面部動(dòng)作,而隨機(jī)動(dòng)作增加了攻擊的成本絮宁,大大降低打印照片等攻擊通過的概率梆暮,而這些正好對(duì)于后端檢測(cè)算法來說屬于較難案例。
動(dòng)態(tài)活體檢測(cè)策略下绍昂,前端僅僅檢測(cè)動(dòng)作的通過情況啦粹,并不對(duì)視頻和真人做出區(qū)分,所以需要進(jìn)一步的活體判斷窘游,這時(shí)可以在前端完成動(dòng)作過程中隨機(jī)抓取多張圖片唠椭,因此加大了攻擊暴露出破綻的可能性。
多張圖片可以提高采集到高質(zhì)量真人活體圖片的概率张峰,因而可以采用一個(gè)更高的采信閾值泪蔫,而該閾值對(duì)應(yīng)的活體分?jǐn)?shù)攻擊圖片則很難達(dá)到。
不推薦單獨(dú)使用動(dòng)態(tài)活體檢測(cè)喘批,最好結(jié)合靜默圖片活體檢測(cè)一起使用撩荣。
視頻活體檢測(cè)
上傳一段視頻并對(duì)其隨機(jī)抽幀分析铣揉,對(duì)隨機(jī)圖片進(jìn)行靜默圖片活體檢測(cè),得出綜合攻擊情況分析結(jié)果餐曹。
為確保視頻唯一性逛拱,可以結(jié)合語(yǔ)音校驗(yàn)碼接口使用,這樣更嚴(yán)謹(jǐn)台猴。
基于多幀進(jìn)行綜合的判斷朽合,可以采用更高的采信閾值,大大增加了作弊成本饱狂,也增加了暴露破綻的可能性曹步。
通過語(yǔ)音校驗(yàn)碼驗(yàn)證視頻為非偽造。
交互體驗(yàn)方面休讳,也較能為用戶所接受讲婚,因?yàn)椴挥脧?qiáng)制用戶動(dòng)來動(dòng)去的。
該方案劣勢(shì)在于:視頻上傳文件較大俊柔,整體驗(yàn)證時(shí)間較長(zhǎng)筹麸。
離線活體檢測(cè)
離線RGB活體檢測(cè)、離線近紅外活體檢測(cè)雏婶、離線3D結(jié)構(gòu)光活體檢測(cè)就不說了物赶,硬件要求較貴。一般人臉識(shí)別應(yīng)用的硬件基礎(chǔ)都是手機(jī)或iPad留晚,因而這一塊很少會(huì)應(yīng)用到酵紫。
還有一種離線活體檢測(cè)是離線的靜默活體,采用靜默活體的方式本地進(jìn)行活體判斷倔丈,不需要聯(lián)網(wǎng)所以速度快憨闰,但包太大,而且準(zhǔn)確性不能保證需五,產(chǎn)品規(guī)劃時(shí)都排在后端功能里鹉动,以接口形式提供服務(wù)。
4.人臉識(shí)別SDK
SDK是“速度快”的首字母縮寫:)可以快速幫助應(yīng)用開發(fā)者上手調(diào)用人臉識(shí)別平臺(tái)的各種服務(wù)宏邮。
按前后臺(tái)分類可以分為服務(wù)端SDK泽示,客戶端SDK。前者的定位是便于用戶快速上手調(diào)用API蜜氨,封裝了人臉識(shí)別所有API服務(wù)械筛,用于更快捷地調(diào)用API接口。后者將人臉采集這個(gè)步驟放到前端解決飒炎,封裝了離線人臉檢測(cè)埋哟、采集、動(dòng)作活體檢測(cè)等功能。
按語(yǔ)言版本分類可以分為Java SDK赤赊,安卓SDK等等闯狱。
按功能分類有人臉采集的SDK,人臉識(shí)別的SDK...
按使用場(chǎng)景可以分為離線和在線的SDK抛计,在線的需要調(diào)后臺(tái)接口服務(wù)完成業(yè)務(wù)目標(biāo)哄孤,離線SDK自己就一條龍完成上籃,所以包也會(huì)比較大吹截,而且后者應(yīng)用在CPU計(jì)算平臺(tái)上瘦陈,響應(yīng)速度、處理性能也會(huì)遜色于GPU計(jì)算平臺(tái)波俄。
SDK其實(shí)是軟件開發(fā)工具包的縮寫晨逝,Software Development Kit.
人臉識(shí)別SDK包含了眾多接口能力,這些能力在上文人臉識(shí)別功能對(duì)比模塊介紹了弟断。
百度提供了服務(wù)端和客戶端的SDK咏花,騰訊僅提供服務(wù)端SDK,阿里說提供但不見相關(guān)介紹阀趴。
百度客戶端SDK默認(rèn)配備4個(gè)產(chǎn)品線授權(quán),3-6個(gè)月免費(fèi)測(cè)試期苍匆。學(xué)有余力的同學(xué)刘急,可以去創(chuàng)建幾個(gè)應(yīng)用玩一玩。
實(shí)際業(yè)務(wù)使用中浸踩,按照業(yè)務(wù)需要叔汁,客戶端SDK需要在線API配合完成全流程的業(yè)務(wù)集成,例如检碗,1:1据块、1:N識(shí)別需調(diào)用在線API接口。
百度僅一個(gè)人臉采集SDK折剃,就提供了五種版本另假,這些版本不是按照終端類型劃分,而是通過適用場(chǎng)景和功能點(diǎn)進(jìn)行劃分:
通用版本怕犁”呃海可做一定上層業(yè)務(wù)開發(fā),用于所有場(chǎng)景奏甫。支持離線人臉檢測(cè)戈轿、跟蹤、關(guān)鍵點(diǎn)阵子、質(zhì)量校驗(yàn)思杯、人臉捕獲、UI層可定制挠进、采集參數(shù)可調(diào)色乾。核身版本腾么。適用于身份驗(yàn)證等場(chǎng)景¤就澹基于通用版解虱,支持有動(dòng)作活體檢測(cè)、支持帶UI層的人臉采集漆撞。閘機(jī)版本殴泰。適用于閘機(jī)、門禁浮驳、考勤悍汛、簽到等快速通行的場(chǎng)景≈粱幔基于通用版离咐,優(yōu)化了質(zhì)量檢測(cè)模塊,檢測(cè)速度更快奉件。登錄版本宵蛀。適用于APP人臉登錄、柜臺(tái)識(shí)別等場(chǎng)景县貌∈跆眨基于通用版,UI層做了一定優(yōu)化煤痕,包括光線自動(dòng)調(diào)節(jié)梧宫,人臉采集策略優(yōu)化等。多人臉版本摆碉。適用于小型的人臉抓拍場(chǎng)景塘匣,如考勤、零售分析等巷帝〖陕保基于通用版,支持多人臉檢測(cè)锅睛,自定義設(shè)置人臉檢測(cè)最大數(shù)量埠巨。
人臉識(shí)別SDK整體的流程是,對(duì)圖像或視頻流進(jìn)行處理现拒,通過檢測(cè)人臉辣垒,在檢測(cè)的過程中判斷人臉是否滿足算法預(yù)設(shè)要求,例如臉的完整度印蔬、三維空間的角度勋桶、模糊程度、臉部遮擋情況、照片亮度等的校驗(yàn)例驹,滿足要求則進(jìn)行扣臉截取捐韩,對(duì)照片進(jìn)行活體校驗(yàn),或離線或在線進(jìn)行1:1或者1:N識(shí)別鹃锈。
5.人臉識(shí)別應(yīng)用漫談
實(shí)際應(yīng)用中比較好落地的是1:1識(shí)別荤胁,準(zhǔn)確率高,可以做身份校驗(yàn)屎债,這個(gè)目前應(yīng)用的最廣泛仅政。幾乎所有的金融APP,例如支付寶盆驹,易付寶都接入這個(gè)功能圆丹。1:1身份校驗(yàn)?zāi)軌蛴行ё柚寡蛎h來薅羊毛。在其它金融風(fēng)控場(chǎng)景躯喇,例如銀行大廳辦理服務(wù)時(shí)辫封,也會(huì)用到。
1:N的算法準(zhǔn)確率廉丽,目前在N超過2萬的時(shí)候倦微,就不太靠譜了。那些聲稱自己在百萬級(jí)別公開數(shù)據(jù)集上跑出90%+準(zhǔn)確率的雅倒,數(shù)據(jù)可能是對(duì)的璃诀,但一落地到實(shí)際應(yīng)用場(chǎng)景,就歇菜了蔑匣。為什么?因?yàn)閷?shí)際場(chǎng)景光線環(huán)境復(fù)雜多變棕诵,識(shí)別對(duì)象戴著眼鏡裁良、化妝、動(dòng)來動(dòng)去都會(huì)影響校套。
可以期待一下未來1:N有所突破价脾,采完一張臉之后能輕易從一百萬張人臉照片里找出你,到時(shí)候你去商場(chǎng)笛匙,每個(gè)方向都裝了攝像頭侨把,商家能采集到你的人臉,知道你的軌跡動(dòng)線妹孙,知道你在哪個(gè)商品前駐留秋柄,知道你拿起了哪些商品又放下,回去給你家電視推相應(yīng)的廣告蠢正。這樣一個(gè)沒有隱私的人工智能時(shí)代骇笔,是不是挺期待的?
好消息是智能圖像這個(gè)領(lǐng)域,短期內(nèi)1:N笨触,N突破10萬級(jí)別還不是很容易懦傍。
剛看到一個(gè)新聞?wù)fDeepMind推出AI可檢測(cè)超50種眼疾,診斷準(zhǔn)確率94%(知乎文章)芦劣,其實(shí)智能圖像還有更多的應(yīng)用粗俱,不局限在人臉的識(shí)別上。我了解過一個(gè)動(dòng)物保護(hù)者做的野生動(dòng)物識(shí)別的應(yīng)用虚吟,還是非常有意義的寸认。
人臉識(shí)別屬于智能圖像下的一個(gè)分支,還有人體識(shí)別稍味、車輛識(shí)別废麻、OCR識(shí)別等等,很慚愧模庐,在這個(gè)領(lǐng)域里做了一點(diǎn)微小的工作烛愧。做了一點(diǎn)羅胖口中的“知識(shí)的關(guān)聯(lián)方式的剝離工作”。如果你喜歡的話掂碱,請(qǐng)讓我知道怜姿。我準(zhǔn)備寫一些更多有意思的智能圖像應(yīng)用。
請(qǐng)不要轉(zhuǎn)載疼燥,或者經(jīng)過我的同意標(biāo)明來源再轉(zhuǎn)載沧卢。
參考:
人臉識(shí)別-百度AI-百度AI-AI開放平臺(tái)
【主頁(yè)更多產(chǎn)品精品文章,歡迎關(guān)注醉者,點(diǎn)贊】