圖像識別主要用到了兩個第三方的框架:OpenCV和TesseractOCR,OpenCV用來做圖像處理,定位到身份證號碼的區(qū)域,TesseractOCR則是對定位到的區(qū)域內(nèi)的內(nèi)容進行識別。
國內(nèi)國外的人臉識別技術(shù)大多數(shù)在開源OPENCV等開源庫上進行新規(guī)則添加懊纳,公司之間的識別正確率差異僅僅在小數(shù)點上,提升意義不大亡容,最關(guān)鍵的強化方向是商業(yè)適用性嗤疯,使用表現(xiàn)的準確率和高可用性。人臉識別技術(shù)的比較維度很多闺兢,比如圖像比對級的1:1茂缚,1:N,N:N;衡量的標準和維度都不同屋谭。
OpenCV 是一個開源的計算機視覺和機器學(xué)習(xí)庫脚囊。它包含成千上萬優(yōu)化過的算法,為各種計算機視覺應(yīng)用提供了一個通用工具包桐磁。根據(jù)這個項目的關(guān)于頁面悔耘,OpenCV 已被廣泛運用在各種項目上,從谷歌街景的圖片拼接我擂,到交互藝術(shù)展覽的技術(shù)實現(xiàn)中衬以,都有 OpenCV 的身影,它已支持如 OpenCL 和 OpenGL 等現(xiàn)代技術(shù)校摩,也支持如 iOS 和 Android 等平臺看峻。
OpenCV 是輕量級而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python衙吩、Ruby互妓、MATLAB等語言的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法。 OpenCV用C++語言編寫冯勉,它的主要接口也是C++語言澈蚌,但是依然保留了大量的C語言接口。該庫也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口珠闰。
OpenCV自帶例子中惜浅,提供了boost瘫辩,mlp伏嗜,knearest,nbayes伐厌,svm承绸,rtrees這些機器學(xué)習(xí)方法,進行訓(xùn)練和識別挣轨。
而新興公司如雨后春筍军熏,2011年到2016年成立的人臉識別公司超過30家,其中大部分集中在2012到2015年卷扮,這只是人臉識別熱潮的一個縮影荡澎。其背后原因是計算機視覺技術(shù)背后的通用性,做人臉識別的公司往往也可以做圖像識別晤锹,反過來也是一樣的道理摩幔。
2014年后人臉識別才開始爆發(fā),都是成立5年的企業(yè)鞭铆。人臉識別在此前或衡,精準率太低,低于人眼车遂,很難應(yīng)用到現(xiàn)實領(lǐng)域封断。
從2014年起,香港中文大學(xué)教授湯曉鷗以及其學(xué)生陸超超舶担、孫祎坡疼,連續(xù)開發(fā)了“高斯臉”,以及基于深度學(xué)習(xí)的DeepID人臉算法衣陶,識別率首次突破人眼極限柄瑰,成為行業(yè)分水嶺。
2016年祖搓,中國市場的人臉識別團隊暴增狱意,全國新成立近70家人臉識別公司。在這樣的環(huán)境之下拯欧,即便你有好的技術(shù)详囤,好的產(chǎn)品,還得有辦法脫穎而出。
2017往后的兩年將進入洗牌期藏姐,如今項目中POC測試常見的只有區(qū)區(qū)十幾家隆箩,而第一梯隊只有四家。那些消失的團隊羔杨,誰說一定沒有技術(shù)好的呢捌臊?現(xiàn)在,李飛飛兜材、孫劍理澎、吳恩達,大牛們浩浩蕩蕩的一頭扎進計算機視覺業(yè)界曙寡, 前有飛瑞斯糠爬、瑞為、科葩等老牌公司举庶,后有云天勵飛执隧、中科視拓等新星。這個行業(yè)户侥,正在以正在用這種瘋狂的站隊方式镀琉,在中國猛烈生長。
人臉識別行業(yè)在國內(nèi)發(fā)展迅速蕊唐,漢王屋摔、中控等老牌廠商掌控著傳統(tǒng)的靜態(tài)人臉識別加指紋考勤機,依靠價格固守著商用市場刃泌。如今不論是創(chuàng)業(yè)者還是投資人凡壤,都開始頓悟,計算機視覺是一個“很難不掙錢”的生意耙替,區(qū)別只在于落地時間早晚亚侠。
目前人臉識別設(shè)備技術(shù)含量很低,產(chǎn)品簡單俗扇,但人臉識別算法本身比較有技術(shù)含量硝烂。不管是做2B還是主打2C,每家公司都有自己的一套“核心算法”铜幽,像現(xiàn)在許多小型集成商滞谢,可以山寨一些產(chǎn)品外觀和結(jié)構(gòu),但產(chǎn)品核心算法卻無法山寨除抛,只能加入國內(nèi)外其它企業(yè)的人臉識別技術(shù)狮杨。
現(xiàn)在市場很混亂,不過小型廠商主要還是山寨移動端設(shè)備到忽,如平板橄教、移動考勤等清寇,想做動態(tài)識別還很困難。國內(nèi)人臉識別廠商在核心算法上擁有自主知識產(chǎn)權(quán)的極少护蝶,大部分都是使用第三方技術(shù)华烟,如OpenCV、其它公司的收費SDK持灰;從國內(nèi)看的話盔夜,這樣的小型廠家有一兩百家,但擁有核心技術(shù)的廠商在國內(nèi)不到10家堤魁,能大規(guī)模進行系統(tǒng)集成定制的也就只有四家左右喂链。
在目前人臉識別技術(shù)不夠完全成熟的情況下,其應(yīng)用領(lǐng)域卻已非常廣泛姨涡,涉及到刑偵衩藤、安保、電子信息安全涛漂、互聯(lián)網(wǎng)金融、智能硬件等在內(nèi)的多個領(lǐng)域检诗,按其功能來分的話匈仗,我們可以大概把它們分為如下幾類:
電子身份證:將所有人的面部信息掃描歸檔,建立電子信息身份檔案庫逢慌,這個身份證將是你在網(wǎng)絡(luò)世界通行的憑證悠轩,雖然此項應(yīng)用目前還未達到應(yīng)用實施階段,但這也是人臉識別技術(shù)最大的潛力所在攻泼。
電子密碼:手機火架、電腦、網(wǎng)站忙菠、app或者其他一切需要密碼來識別或者保護你的身份的地方何鸡,人臉識別都可以作為一種更安全和更簡便的方式來應(yīng)用,比如現(xiàn)在已經(jīng)有電腦采用人臉識別開機功能牛欢。
考勤:上班不再是“打卡”骡男,而是“刷臉”,想代同事打個卡就變成了不可能傍睹。如果這樣的考勤系統(tǒng)真的普及開來隔盛,上班族恐怕高興不起來了啊拾稳!
門禁:住宅區(qū)吮炕、寫字樓、政府访得、企業(yè)龙亲、或其他非閑雜人等不得進入的區(qū)域嘁灯,人臉識別可以作為一種更精確,也更快速的方式來保障安全覆醇,原來的密碼門或者刷卡初入就顯得特別繁瑣而笨重了妆够!
支付:這個就是與互聯(lián)網(wǎng)金融行業(yè)的結(jié)合了,目前這一領(lǐng)域也是非常的熱火迎膜,馬云已經(jīng)在螞蟻花唄上推出了“掃臉支付”泥技,京東錢包也是“掃臉”解鎖。相比密碼或者掃碼支付磕仅,安全性上顯然更勝一籌珊豹。
拍照:現(xiàn)在相機已經(jīng)具有的自動對焦和識別人臉功能,就是人臉識別技術(shù)的一種應(yīng)用榕订,當然照相時的對準人臉功能店茶,對識別復(fù)雜性的要求非常低,只需要知道哪是“人臉”就行劫恒,至于是誰的臉則不需要判斷贩幻。還有美顏相機等也是一些應(yīng)用舉例,精確的人臉識別在查找某人或者定制妝容方面都還是大有可為两嘴。
刑偵:公安系統(tǒng)追捕罪犯的應(yīng)用丛楚,科幻片內(nèi),某個人的照片被放在海量的信息庫里對比憔辫,瞬間找出身份信息的場景趣些,將不再是想象。
目前國內(nèi)外各大互聯(lián)網(wǎng)科技公司在人臉是被這一塊領(lǐng)域均有涉獵贰您,且各自探索程度深淺不一坏平。無論是從國外的Google、微軟锦亦、Facebook舶替,還是國內(nèi)的百度、騰訊孽亲,都各自有各自的人臉識別團隊坎穿。?
?Google:2011年07月 谷歌收購人臉識別軟件公司PittPatt?
?Facebook:2012年6月 Facebook收購以色列臉部識別公司Face.com?
?微軟:2012年6月 微軟亞洲研究院發(fā)布人臉檢測算法,面部識別系統(tǒng)?
?網(wǎng)易:2012年5月返劲,網(wǎng)易人臉識別系統(tǒng)全國公測玲昧,用于郵箱登陸?
騰訊:2012年下半年,優(yōu)圖項目組組建 篮绿,騰訊優(yōu)圖團隊隸屬于騰訊社交網(wǎng)絡(luò)事業(yè)群孵延,基于整個騰訊的社交網(wǎng)絡(luò)平臺,為 QQ 空間亲配、騰訊地圖尘应、騰訊游戲惶凝、等 50 多款產(chǎn)品提供圖像技術(shù)支持。每天 QQ 空間有 2 億上傳圖片的活躍用戶犬钢,團隊單日最多處理照片達 6 億張苍鲜,累計已經(jīng)分析處理了超過 300 億張照片。
百度:2012年12月 百度推出人臉識別玷犹,基于圖像的全網(wǎng)人臉搜索?
目前混滔,國內(nèi)市場上公司有幾十家,技術(shù)領(lǐng)先者有SenseTime(商湯科技)歹颓、Face++ (曠視科技)坯屿、Linkface 、依圖科技巍扛、格靈深瞳领跛、云從科技等,這些公司對外都稱識別準確率高達99.5%以上撤奸;
Face++, 2014年吠昭,獲阿里巴巴旗下螞蟻金服投資,主攻金融和監(jiān)控兩大行業(yè)寂呛,有子公司曠視智安怎诫;團隊成員除了幾名來自清華校友外,還有來自美國哥倫比亞大學(xué)贷痪、英國牛津大學(xué)和美國南加州大學(xué)的科研及開發(fā)人員,截至目前員工僅有100余人蹦误。
并且在金融劫拢、安防、零售領(lǐng)域分別開始了商業(yè)化探索成功發(fā)育出Face++Financial强胰,F(xiàn)ace++Security舱沧,F(xiàn)ace++BI等垂直人臉驗證解決方案,主要將人臉識別應(yīng)用在互聯(lián)網(wǎng)產(chǎn)品上偶洋,自己做研發(fā)熟吏,在美圖秀秀、淘寶等互聯(lián)網(wǎng)領(lǐng)域得到良好的應(yīng)用玄窝,在金融領(lǐng)域的市場一直占據(jù)沙發(fā)前排陣營牵寺;他們一直關(guān)心的4個計算機視覺核心問題(圖像分類、物體檢測恩脂、語義分割和序列學(xué)習(xí))帽氓,還有核心網(wǎng)絡(luò)訓(xùn)練問題、底層架構(gòu)問題俩块、深度學(xué)習(xí)平臺問題黎休,也是一直處于研究ing中浓领。
曾經(jīng)被聯(lián)想、阿里投資势腮,在2013年拿到百萬元A輪投資联贩,2014年獲得2200萬元B輪融資,2016年獲得上億元C輪融資捎拯,最后選擇通過計算機視覺技術(shù)與NLP技術(shù)的結(jié)合泪幌,制造出能“識別萬物”的智能機器人,提供硬件模組玄渗,里面內(nèi)置他們家的算法座菠。目前正在準備啟動IPO的步伐,VIE架構(gòu)讓他們得以繞過A股藤树,不用達到連續(xù)三年盈利的標準實現(xiàn)快速上市浴滴。
SenseTime(商湯科技),獲IDG資本投資岁钓,主攻金融升略、移動互聯(lián)網(wǎng)、安防監(jiān)控三大行業(yè)屡限;由香港中文大學(xué)的湯曉歐創(chuàng)建品嚣,“商湯”中的湯指的就是湯曉歐本人,湯曉鷗及其研究團隊所開發(fā)的DeepID算法率先將深度學(xué)習(xí)應(yīng)用到人臉識別上钧大,在技術(shù)指標上實現(xiàn)了新的突破翰撑。主要案例是圍繞各個美化軟件與直播平臺制作人臉貼圖,重點強化了人臉識別的關(guān)鍵點檢測及跟蹤技術(shù)啊央。
團隊有300多號眶诈,也從當當初toC轉(zhuǎn)向toB領(lǐng)域;成立于2014年的商湯科技選擇另辟蹊徑瓜饥,選擇用“四大美女”這個話題讓人們躁動起來逝撬,到最后四大美女走了三個;商湯的網(wǎng)絡(luò)都是自己設(shè)計的乓土,這樣對于深度學(xué)習(xí)網(wǎng)絡(luò)的掌控力就會更強宪潮,提供SaaS服務(wù)的同時,可以通過SaaS把背后的數(shù)據(jù)拿到趣苏,再進行更多更細致的分析再次提升服務(wù)質(zhì)量狡相。
Linkface,由四位高顏值的女性創(chuàng)立拦键。據(jù)人臉檢測評測平臺 FDDB 數(shù)據(jù)谣光,Linkface 的人臉檢測算法擊敗百度、騰訊芬为,位列第一萄金;
依圖科技蟀悦,最早獲得真格基金100萬美元天使投資,2014年完成紅杉資本和高榕資本的A輪融資氧敢。2012年日戈,朱瓏創(chuàng)辦了依圖科技,在全國多地公安系統(tǒng)耕耘頗深孙乖,主攻公安領(lǐng)域浙炼,2015年后轉(zhuǎn)型智能醫(yī)療領(lǐng)域;
云從科技:2015年4月唯袄,周曦拿到戰(zhàn)略投資成立云從科技弯屈,同年針對金融和銀行業(yè)推出了40多種解決方案,包含從算法恋拷、產(chǎn)品资厉、銷售、售后的全產(chǎn)業(yè)鏈打造蔬顾,針對農(nóng)行宴偿、建行、交行诀豁、中行及多地公安提供定制化服務(wù)窄刘。團隊成員除了來自中科大的校友外,還來自中國科學(xué)院各大研究所舷胜、UIUC娩践、IBM、NEC烹骨、MicroSoft等全球頂尖學(xué)府及研究機構(gòu)欺矫;
截止2016年11月,成立一年半展氓,研發(fā)團隊擴展為200余名,為全國最大的人臉識別研發(fā)團隊脸爱;核心產(chǎn)品是人臉識別系統(tǒng)及IBIS集成生物識別平臺遇汞,還具備3D模型、紅外活體簿废、靜默活體等技術(shù)空入,可根據(jù)場景需求自由調(diào)節(jié)。選擇連接硬件族檬、開發(fā)與技術(shù)歪赢,屬于全產(chǎn)業(yè)鏈模式,因為人臉識別系統(tǒng)多數(shù)情況下需要深度定制单料,只有這樣埋凯,才能在客戶提出需求的情況下迅速反饋点楼,修改,統(tǒng)一用戶體驗白对。先后由完成了天使輪和A輪融資掠廓,其中天使輪融資由佳都集團與杰翱資本聯(lián)合注資6000萬元。
格靈深瞳:推出來Foveacam深瞳人眼攝像機甩恼,主要應(yīng)用場景是高速路口的車輛蟀瞧、行人抓拍,當然人臉識別也是格林深瞳沒放松的安防領(lǐng)域条摸,號稱是98%的識別準確率悦污。這家公司不差錢,深耕技術(shù)執(zhí)著于安防領(lǐng)域钉蒲;雖然人事上變動(2017年年前原來的CEO何搏飛離職切端,但還將繼續(xù)擔(dān)任格靈深瞳的高級顧問,他本人想趕一趕消費升級的末班車子巾。CEO一職由聯(lián)合創(chuàng)始人趙勇?lián)畏俣壬疃葘W(xué)習(xí)研究院的資深科學(xué)家鄧亞峰先生擔(dān)任CTO,同時引入國內(nèi)安防圈一位重量級的人物擔(dān)任公司總裁线梗。)
值得注意的是椰于,F(xiàn)ace++, SenseTime, Linkface的首席科學(xué)家,都來自于香港中文大學(xué)湯曉鷗教授的多媒體實驗室仪搔,儼然已成為人臉識別技術(shù)的“黃埔軍旭觯”。大部分人臉識別公司關(guān)注都在應(yīng)用層烤咧,而商湯還關(guān)注到算法層面偏陪。如果你對商湯不熟悉,小咖秀煮嫌、Faceu笛谦、熊貓直播這些APP里提供的各種面部AR特效,就是商湯提供的技術(shù)支持昌阿,只是這些商湯在宣傳上很少提到饥脑。
國內(nèi)的人臉識別企業(yè):
佳都科技、科大訊飛懦冰、鉑亞信息灶轰、中科奧森、 安捷天盾科技刷钢、 銀晨科技笋颤、 駿聿科技、 飛瑞斯科技内地、 科葩信息技術(shù)伴澄、灝瀧科技(上海)赋除、 賽為智能、 智慧眼科技秉版、 像素數(shù)據(jù)技術(shù)贤重、清大維森科技、 瑞為信息技術(shù)清焕、蘇慧信息技獅并蝗、眾智益華科技、 瑞奧風(fēng)軟件科技秸妥、千搜科技滚停、威富安防、可信網(wǎng)絡(luò)科技粥惧、一登科技键畴。
國外的人臉識別企業(yè):
1 美國Identix公司、2 美國Bioscrypt公司突雪、3 德國Cognitec Systems公司起惕、4 西班牙Herta Security公司、5 日本NEC公司咏删、6 日本Softwise公司
人臉識別的技術(shù)發(fā)展方向:
結(jié)合三維信息:二維和三維信息融合使特征更加魯棒
多特征融合:單一特征難以應(yīng)對復(fù)雜的光照和姿態(tài)變化
大規(guī)模人臉比對:面向海量數(shù)據(jù)的人臉比對與搜索
深度學(xué)習(xí):在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡(luò)強大的學(xué)習(xí)能力
人臉識別的算法能力:拒識率惹想、誤識率、通過率督函,準確率
銀行業(yè)務(wù)體系模式:
要想攻破銀行體系就得知道銀行規(guī)則:銀行有一套2小時嘀粱、4小時、8小時原則辰狡,即系統(tǒng)宕機2小時锋叨,該行就要到當?shù)厝嗣胥y行喝茶;4小時沒解決宛篇,就得交報告娃磺;8小時還沒解決,銀行的評級就會下降叫倍,甚至關(guān)門豌鸡。出于金融安全與穩(wěn)定的考慮,銀行一般不會輕易把技術(shù)業(yè)務(wù)交給第三方公司段标,而一旦確認合作方,便不會輕易改變炉奴。所以逼庞,銀行在選擇第三方公司時,會讓具備相關(guān)資質(zhì)的公司聚集在一起競標瞻赶,以選取最佳合作者赛糟。
安防業(yè)務(wù)運營體系:
盡管并不否認人工智能技術(shù)對安防效果的顯著提升派任,但安防市場一直是以銷售為強導(dǎo)向的線下市場,國內(nèi)長期被鸿的希康威視掌逛、大華股份、東方網(wǎng)力三家整體方案和硬件商壟斷司倚,創(chuàng)業(yè)企業(yè)很難顛覆豆混。
顧澤安防在人臉識別技術(shù)上有更多需要克服的問題。公安調(diào)取的圖像和視頻动知,一般是閉路電視這種畫面清晰度不高的器材監(jiān)控拍攝的皿伺,而影響人臉識別正確率的因素非常多,比如行人戴墨鏡盒粮、口罩鸵鸥,或者抽煙時被煙霧遮擋,光線較暗或光照過度等丹皱,另外妒穴,對人臉的年月變化識別最困難。將一個人現(xiàn)在的外貌摊崭,與多年前拍的身份證照片做對比讼油,難度很大∷遥“身份證照片是5年前拍的還好汁讼,雖然有些人外貌變化也比較大,要對比10年阔墩、20年前的身份證照片就更難了嘿架。
這就要基于大數(shù)據(jù),開發(fā)出“雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)”這一針對性技術(shù)啸箫,經(jīng)過大量的深度學(xué)習(xí)耸彪、總結(jié)與分析;目前絕大部分公安機關(guān)實際上還沒有參與采購人臉識別技術(shù)忘苛,市場算是剛起來蝉娜,場景很復(fù)雜,想要一時半會拿下市場很難扎唾。比如在交通道路管理和犯罪追蹤的應(yīng)用場景下召川,我們在看很多法制節(jié)目中都能看到,偵查人員在查案時要反復(fù)查看上千卷影像資料胸遇。這就是問題所在荧呐,鏡頭拍下了車輛信息,但沒有機器學(xué)習(xí)和深度學(xué)習(xí)的情況下依然要動用大量人力,還沒法保證準確率倍阐。
人臉識別商業(yè)模式:
從盈利模式上看概疆,提供人臉識別技術(shù)的公司,主要是兩種收費方式峰搪,一種是收取一次性技術(shù)岔冀、軟件購買費,一種是按技術(shù)使用次數(shù)收費概耻。因為B端市場來說使套,客戶的核心要求是,產(chǎn)品性能咐蚯、服務(wù)好童漩,對價格相對不敏感。 但C端市場春锋,因為目前產(chǎn)品需要定制化矫膨,所以談不上方便,而且成本必然下不去期奔,性價比不可能高侧馅。
列舉人臉識別在手機APP上的一些應(yīng)用
1.美圖秀秀邪惡大測試:識別面部表情,給出分數(shù)和評價
2.百度圖片識圖功能
3.百度魔圖APP推出了“PK大咖”功能,用戶只需要選取一張自己的大頭照呐萌,就可以通過人臉識別技術(shù)跟明星進行PK馁痴,找到與你面部形象最為相似的明星大咖
4.百度錢包APP拍照付只是說當你想買一款商品,卻不知道商品的具體信息肺孤,這時候就可以用到百度錢包的拍照付罗晕,拍一下就能搜索到商品,選擇購買
5.支付寶APP人臉識別登錄
6.iPhoto 在蘋果的iPhoto中赠堵,同樣提供了人臉識別功能小渊,用戶可以將圖片中的人臉和人名相匹配,該功能通過臉部檢測辨別照片中的人物茫叭,再通過臉部識別找到與之特征相符的拍攝對象酬屉,幫你找到想找的人,甚至是海量的照片庫也不費吹灰之力
7.圖圖搜是先找到淘寶上的同款揍愁,然后拿到產(chǎn)品tag呐萨,接著根據(jù)tag、主顏色等信息進行二次查找莽囤。最基本的技術(shù)還是相同圖像查找谬擦,當然也包含了商品主體識別。
人臉識別主要測屬性對比:
在人臉識別屬性返回功能以范圍方面朽缎,較突出的是百度人臉識別與Face++,其次是云飛科技怯屉、科大訊飛蔚舀、FaceCore。
人臉識別SDK
Face++ 致力于研發(fā)世界最好的人臉技術(shù)锨络,提供免費的API和SDK供企業(yè)和開發(fā)者調(diào)用,更有靈活的定制化服務(wù)滿足不同需求狼牺。已有多家公司使用Face++技術(shù)服務(wù)羡儿,完成包括人臉搜索、定位是钥、識別掠归、智能美化等功能。我們旨在為合作者提供完善的技術(shù)與維護服務(wù)悄泥。
百度媒體云人臉識別服務(wù)虏冻,依托百度業(yè)界領(lǐng)先的人臉識別算法,提供了人臉檢測弹囚、五官定位厨相、人臉屬性檢測等功能。媒體云人臉識別服務(wù)通過提供一系列HTTP Restful API及跨終端平臺SDK鸥鹉,實現(xiàn)人臉檢測蛮穿、人臉識別等的諸項功能。
利用ReKognition提供的云端人臉識別API實現(xiàn)的一個簡單人臉識別Demo毁渗,能夠識別人臉的五官践磅、人臉的大概年齡、是否戴眼鏡灸异、是否閉眼府适、性別等等功能。
暫不提供新用戶注冊
RecoFace人臉識別SDK是瑞為自主研發(fā)的人臉識別核心算法肺樟,包括人臉檢測檐春、人臉跟蹤、人臉確認與人臉識別四大核心功能儡嘶,無論是識別準確度還是識別速度均處于全球領(lǐng)先水平喇聊。
漢王科技憑借十幾年扎根模式識別領(lǐng)域的底蘊,早在2003年蹦狂,就瞄準人臉識別技術(shù)的國際前沿誓篱,積極開展人臉識別技術(shù)的潛心研究。目前已經(jīng)擁有完全自主知識產(chǎn)權(quán)的“雙目立體”人臉識別算法(Dual Sensor)凯楔。漢王云提供免費的人臉識別API和SDK供企業(yè)和開發(fā)者調(diào)用窜骄,漢王人臉識別技術(shù)廣泛應(yīng)用于智能安全、身份驗證等領(lǐng)域摆屯,還可識別表情年齡性別邻遏,應(yīng)用開發(fā)最具潛力糠亩。
科大訊飛聯(lián)合香港中文大學(xué)湯曉鷗教授團隊,共同推出世界領(lǐng)先的人臉識別技術(shù)准验,提供人臉驗證赎线、人臉檢測、人臉關(guān)鍵點檢測等功能糊饱,識別率高達99%垂寥。核心技術(shù)源自于學(xué)術(shù)界最新的深度學(xué)習(xí)方法及其相關(guān)研究,結(jié)合大量公開和獨有的訓(xùn)練數(shù)據(jù)集另锋,在超級計算機上學(xué)習(xí)并提取照片特征滞项,實現(xiàn)高效準確的標定和識別,致力于提供便捷準確的人臉識別技術(shù)夭坪,為移動設(shè)備交互文判、攝像頭應(yīng)用等不同場景提供強有力的技術(shù)支持。
比對人臉特征每百萬張照片人臉特征平均速度100毫秒以內(nèi)室梅,識別人臉特征速度在幾十毫秒內(nèi)戏仓。
人臉識別的安全性:
一、目前人臉識別常見攻擊手段有什么竞惋?
1 柜去、紙片翻拍,通過打印用戶的照片進行攻擊拆宛;
2嗓奢、 屏幕翻拍,一些3D建模技術(shù)可以驅(qū)動用戶的單張照片或視頻做出系統(tǒng)要求的搖頭浑厚、張嘴股耽、眨眼等動作;
3钳幅、 用戶戴面具物蝙;
二、如何應(yīng)對人臉識別漏洞敢艰?
要更有效地應(yīng)對上述的人臉識別漏洞诬乞,我們不妨采用騰訊優(yōu)圖多維活體監(jiān)測模式。
騰訊優(yōu)圖的多維活體監(jiān)測是什么钠导?
即通過更加復(fù)雜的多數(shù)字隨機唇語震嫉,捕捉人在說話過程中嘴部的細微變化,使得視頻合成造假的難度很大牡属;并加上語音圖像同步檢測票堵、人臉紋理分析、面具檢測逮栅、視頻防翻拍等多維度防護手段悴势;最后將所有這些手段進行交叉融合窗宇,實現(xiàn)移動端+后臺的強力防護體系。
具體來說:
1特纤、對于紙片翻拍军俊,由于紙片上的人臉是靜態(tài)的,利用隨機數(shù)字唇語捧存,讓用戶讀數(shù)字蝇完,就可以很好的攔截;
2矗蕊、對于屏幕翻拍,具有成本低氢架,可以通過軟件批量執(zhí)行的特點傻咖,對于活體的挑戰(zhàn)最大,這種攻擊岖研,仍然有很多線索可以利用:
a. 翻拍的視頻一定會通過顯示設(shè)備播放出來卿操,顯示設(shè)備存在一些和真人不同的圖像特征
b.合成的視頻與真人相比,會存在一些瑕疵
c.如果是直接拿到了用戶的一段視頻孙援,其嘴型變化完全符合給定的隨機數(shù)字的概率很低
以上這些害淤,用大量數(shù)據(jù)就可以學(xué)習(xí)到偽造視頻和真人視頻之間的區(qū)別,加上各種方法的融合拓售,就能將攔截成功率提高到非常高的水平窥摄。
3、對于用戶戴面具础淤,由于其攻破成本較高崭放,現(xiàn)在還未出現(xiàn)實際case,我們也提前進行了研發(fā)布防鸽凶,主要利用人說話時币砂,面部會存在比較自然的微動,而面具則沒有這樣的規(guī)律來防范玻侥。
另外决摧,在實際業(yè)務(wù)中,人臉識別只是作為其中一個環(huán)節(jié)凑兰,需要與賬號掌桩、密碼保護、基于大數(shù)據(jù)的風(fēng)控等其他綜合手段一起票摇,保證流程的高度安全拘鞋。
人臉識別技術(shù)正在快速發(fā)展之中,新技術(shù)的出現(xiàn)總可能會被不法分子所利用矢门。騰訊優(yōu)圖也在關(guān)注技術(shù)對抗盆色,通過業(yè)務(wù)持續(xù)積累的活體攻防實戰(zhàn)經(jīng)驗灰蛙,構(gòu)筑活體檢測的堅實壁壘,同時不斷創(chuàng)新研發(fā)新的活體檢測技術(shù)隔躲,為人臉識別保駕護航摩梧。
騰訊優(yōu)圖產(chǎn)品特征:
1. 產(chǎn)品優(yōu)勢
強大的人臉訓(xùn)練模型:立足于騰訊社交數(shù)據(jù)大平臺收集的海量人臉訓(xùn)練集,成功標注的千萬人臉數(shù)據(jù)宣旱。
方法最全:高維LBP仅父、PCA、LDA 聯(lián)合貝葉斯浑吟、度量學(xué)習(xí)笙纤、遷移學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)
技術(shù)最好: 優(yōu)圖獨創(chuàng)Uface深度人臉模型组力,LFW評測以99.65%目前世界領(lǐng)先省容。
2. 人臉驗證技術(shù)(1:1識別)
人臉識別技術(shù)可以計算出兩張人臉照片的相似度,從而判斷是否為同一人燎字,即1:1身份驗證腥椒。優(yōu)圖人臉識別通過傳統(tǒng)方法和深度學(xué)習(xí)技術(shù)結(jié)合,以微眾銀行遠程核身為基礎(chǔ)候衍,實際業(yè)務(wù)中笼蛛,萬分之一錯誤率下,通過率達到95%蛉鹿。
3. 人臉檢索技術(shù)(1:N識別)
給定一張照片滨砍,和數(shù)據(jù)庫中N個人臉進行對比,給出是否為其中某一個人榨为,或者給出排序結(jié)果惨好,即人臉檢索。1:N用于用戶不需要聲明身份的場景随闺。
4.技術(shù)指標
? FAR:False Accept Rate日川,錯誤接受率,指將身份不同的兩張照片矩乐,判別為相同身份龄句,越低越好
? FRR:False Reject Rate,錯誤拒絕率散罕,指將身份相同的兩張照片分歇,判別為不同身份,越低越好
這兩個指標有明確的物理意義欧漱,F(xiàn)AR決定了系統(tǒng)的安全性职抡,F(xiàn)RR決定了系統(tǒng)的易用程度,在實際中误甚,F(xiàn)AR對應(yīng)的風(fēng)險遠遠高于FRR缚甩,因此谱净,生物識別系統(tǒng)中,會將FAR設(shè)置為一個非常低的范圍擅威,如萬分之一甚至百萬分之一壕探,在FAR固定的條件下,F(xiàn)RR低于5%郊丛,這樣的系統(tǒng)才有實用價值李请。
? 支持最小人臉尺寸64x64
? 人臉特征尺寸1-2KB
? 1:1人臉對比500ms
現(xiàn)在的人臉識別大數(shù)據(jù)作戰(zhàn)平臺,主要涉及到人臉識別技術(shù)厉熟、大數(shù)據(jù)导盅、云計算等技術(shù)的應(yīng)用。在未來揍瑟,逐步加入成熟的圖像識別(步態(tài)认轨、服飾、動作月培、發(fā)型、車輛等)恩急、聲紋識別技術(shù)杉畜,并且隨著攝像機硬件的功能越來越強,所謂的《激情速度七》中的“天眼”系統(tǒng)會越來越完善衷恭。
完善的“天眼”還需要強大的后臺系統(tǒng)此叠,這個系統(tǒng)可以控制包括公共交通、城市電力随珠、電子監(jiān)控灭袁、銀行系統(tǒng)、警察系統(tǒng)等各方面窗看,同時將所有聯(lián)網(wǎng)信息進行收集和整合茸歧,記錄下公民的醫(yī)保號、醫(yī)療記錄显沈、犯罪記錄软瞎、甚至上網(wǎng)閱覽內(nèi)容、輸入習(xí)慣等拉讯,結(jié)合以大數(shù)據(jù)分析時時更新后臺資料涤浇。
最后,“天眼”成功運行的關(guān)鍵在于整合物理空間(線下)和網(wǎng)絡(luò)空間(線上)的多源多類型大規(guī)模數(shù)據(jù)魔慷,然而目前這些數(shù)據(jù)相對獨立只锭,形成所謂的“數(shù)據(jù)孤島”,給技術(shù)的發(fā)展帶來很大不便院尔,可以考慮從國家層面上對各種數(shù)據(jù)資源統(tǒng)一管理和協(xié)調(diào)蜻展,為國家安全提供更強有力的保障喉誊。