復(fù)旦大學(xué)王龑團(tuán)隊發(fā)布《靜態(tài)與動態(tài)情感的面部表情識別》綜述

file

論文鏈接:https://arxiv.org/pdf/2408.15777

復(fù)旦大學(xué)鱼的,王龑博士后領(lǐng)銜,發(fā)布《靜態(tài)與動態(tài)情感的面部表情識別》(A Survey on Facial Expression Recognition of Static and Dynamic Emotions)綜述鸳吸,對基于圖像的靜態(tài)面部表情識別(SFER)和基于視頻的動態(tài)面部表情識別(DFER)方法進(jìn)行了全面綜述速勇,從模型導(dǎo)向的發(fā)展到挑戰(zhàn)聚焦的分類進(jìn)行了系統(tǒng)分析。

論文首先對近期的綜述進(jìn)行批判性比較养匈,介紹了常用的數(shù)據(jù)集和評估標(biāo)準(zhǔn),并深入探討了FER的工作流程呕乎,以建立堅實的研究基礎(chǔ)。接著猬仁,系統(tǒng)性地回顧了應(yīng)對SFER的八大主要挑戰(zhàn)(如表情干擾、不確定性湿刽、復(fù)合情緒和跨域不一致性)以及應(yīng)對DFER的七大主要挑戰(zhàn)(如關(guān)鍵幀采樣褐耳、表情強(qiáng)度變化和跨模態(tài)對齊)的代表性方法。此外铃芦,分析了近期的進(jìn)展、基準(zhǔn)表現(xiàn)刃滓、主要應(yīng)用及倫理考量。最后咧虎,提出了五個有前景的未來研究方向和發(fā)展趨勢,以指導(dǎo)后續(xù)研究僚饭。本論文的項目頁面可訪問:https://github.com/wangyanckxx/SurveyFER

研究背景

情感計算在關(guān)鍵國家領(lǐng)域具有深遠(yuǎn)的影響和重要性鳍鸵。英國創(chuàng)新署(Innovate UK)將“人工智能(AI)情感和表情識別”列為2024年對英國經(jīng)濟(jì)和社會產(chǎn)生深刻影響的50項新興技術(shù)之首。中國科學(xué)技術(shù)協(xié)會也隆重發(fā)布了2024年的重大科學(xué)問題偿乖,其中,具有情感和情感智能的數(shù)字人和機(jī)器人研究被選為十大前沿科學(xué)問題之一贪薪。顯然,AI情感和表情識別技術(shù)的發(fā)展已成為通用人工智能竣稽、數(shù)字計算和多學(xué)科研究的必然要求。

面部表情是人類情感表達(dá)的主要和直接手段毫别,在人際互動中頻繁使用,且具有極其重要的意義岛宦。面部表情通過非語言的方式傳達(dá)比聲音、手勢和身體姿勢更豐富的情感信息砾肺。面部情感的概念最早由達(dá)爾文在其著作《人類與動物的表情》中提出防嗡,表情被認(rèn)為是天生的,是動物和人類在進(jìn)化和生存過程中適應(yīng)性動作的遺留物本鸣。Ekman和Friesen提出了六種基本情感:快樂、憤怒荣德、悲傷、驚訝涮瞻、恐懼和厭惡,并發(fā)現(xiàn)了特定面部肌肉模式與情感類型之間的普遍關(guān)聯(lián)署咽,這在跨文化中是一致的生音。

近年來窒升,隨著AI技術(shù)的進(jìn)步,面部情感識別(FER)方法迅速發(fā)展域醇,并在心理研究、醫(yī)學(xué)診斷和智能人機(jī)交互等領(lǐng)域廣泛應(yīng)用譬挚。FER旨在通過分析面部表情來識別個體的情感狀態(tài)。根據(jù)用于捕捉表情的數(shù)據(jù)類型减宣,F(xiàn)ER可以分為基于圖像的靜態(tài)FER(SFER)和基于視頻的動態(tài)FER(DFER)玩荠。SFER主要解決姿態(tài)遮擋、跨域不一致性姨蟋、標(biāo)簽不確定性立帖、數(shù)據(jù)量不足和跨模態(tài)等挑戰(zhàn)。研究人員還通過各種數(shù)據(jù)增強(qiáng)技術(shù)和正則化方法來緩解數(shù)據(jù)量不足和標(biāo)簽不確定性的問題晓勇。此外,通過跨模態(tài)信息融合绰筛,提高了表情識別的魯棒性和準(zhǔn)確性。

SFER關(guān)注瞬時表情铝噩,而DFER則關(guān)注面部表情的時間變化,以準(zhǔn)確描述和理解情感轉(zhuǎn)變的全過程骏庸。處理視頻序列中的表情識別,DFER面臨關(guān)鍵幀提取具被、時空特征提取只损、表情強(qiáng)度變化和跨模態(tài)融合的主要挑戰(zhàn)。為捕捉動態(tài)表情信息,DFER模型不僅關(guān)注單幀中的靜態(tài)特征艾栋,還結(jié)合了連續(xù)幀之間的時間關(guān)系。

面部表情研究分類

本文系統(tǒng)總結(jié)了面部表情識別(FER)研究的現(xiàn)狀裹粤,并通過層次化分類體系,將現(xiàn)有的FER研究按輸入類型(基于圖像的SFER和基于視頻的DFER)遥诉、任務(wù)挑戰(zhàn)和網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行組織噪叙,如圖1所示。對于SFER睁蕾,我們識別了八個關(guān)鍵挑戰(zhàn),如干擾子眶、不確定性、復(fù)合標(biāo)簽臭杰、跨域適應(yīng)性和跨模態(tài)問題,并總結(jié)了現(xiàn)有方法中常用的應(yīng)對這些挑戰(zhàn)的模型結(jié)構(gòu)渴杆。對于DFER,我們還結(jié)合了七個額外的考慮因素磁奖,如關(guān)鍵幀提取、表情強(qiáng)度變化冠跷、靜態(tài)與動態(tài)一致性、半監(jiān)督學(xué)習(xí)和跨域?qū)R蔽莱,并總結(jié)了當(dāng)前方法的解決方案。

我們進(jìn)一步分析并討論了典型方法在基準(zhǔn)數(shù)據(jù)集上的最新進(jìn)展盗冷。此外,我們還在GitHub倉庫中總結(jié)了基準(zhǔn)數(shù)據(jù)集仪糖、評估指標(biāo)柑司、文獻(xiàn)攒驰、代碼、工作流程和相關(guān)討論玻粪。為了構(gòu)建這一分類體系,我們廣泛回顧了2016年至2024年間的大量研究論文劲室。圖2展示了2016年至2024年間與基于圖像的SFER和基于視頻的DFER相關(guān)的出版物和引用趨勢。從2019年開始结窘,出版物和引用量顯著增加,并持續(xù)增長到2023年喉磁,并預(yù)計在2024年繼續(xù)上升。這反映了對SFER和DFER領(lǐng)域的興趣和進(jìn)展的日益增長协怒。

file

圖1:靜態(tài)和動態(tài)情感的面部表情識別(FER)分類體系卑笨。我們提出了一個層次化分類體系孕暇,在系統(tǒng)框架內(nèi)根據(jù)輸入類型芭商、任務(wù)挑戰(zhàn)和網(wǎng)絡(luò)結(jié)構(gòu)對現(xiàn)有的FER模型進(jìn)行分類派草,旨在提供當(dāng)前FER研究全貌的全面概述。首先近迁,我們將數(shù)據(jù)集、評估指標(biāo)和工作流程(包括文獻(xiàn)和代碼)引入了一個公共的GitHub倉庫中(第1歧譬、2和3節(jié))。接著瑰步,基于圖像的SFER(第4節(jié))和基于視頻的DFER(第5節(jié))通過不同的學(xué)習(xí)策略和模型設(shè)計來克服不同的任務(wù)挑戰(zhàn)。隨后璧眠,我們分析了FER在基準(zhǔn)數(shù)據(jù)集上的最新進(jìn)展(第6節(jié))读虏。最后袁滥,我們討論并總結(jié)了FER中的一些重要問題和潛在趨勢,并強(qiáng)調(diào)了未來發(fā)展的方向(第7揩徊、8和9節(jié))。

綜述優(yōu)勢

file

S塑荒、D 和 WF 分別表示靜態(tài)、動態(tài)和工作流程袜炕。
DI、3D偎窘、UA、CP陌知、CD、LS 和 CM 分別表示靜態(tài)仆葡、動態(tài)和工作流程志笼。
SL、EI纫溃、MM腰涧、SD窖铡、SS 和 VL 分別表示采樣、表情強(qiáng)度费彼、多模態(tài)口芍、靜態(tài)到動態(tài)、半監(jiān)督和視覺-語言鬓椭。
HPC聋庵、PE 和 HCI 分別表示健康與心理咨詢、個性化教育和人機(jī)交互祭玉。

貢獻(xiàn)點

為了闡明面部表情識別(FER)的發(fā)展并激發(fā)未來研究,本綜述涵蓋了研究背景脱货、數(shù)據(jù)集律姨、通用工作流程、任務(wù)挑戰(zhàn)择份、方法、性能評估荣赶、應(yīng)用、倫理問題以及發(fā)展趨勢拔创。總的來說剩燥,本工作的主要貢獻(xiàn)如下:

  1. 據(jù)我們所知,這是第一個將FER研究分為基于圖像的靜態(tài)FER(SFER)和基于視頻的動態(tài)FER(DFER)的綜合性綜述灭红,從模型導(dǎo)向的發(fā)展擴(kuò)展到挑戰(zhàn)導(dǎo)向的分類,并深入分析了實際環(huán)境中的挑戰(zhàn)與解決方案君珠。

  2. 我們系統(tǒng)回顧了SFER中涉及的八大主要挑戰(zhàn)(如表情干擾、不確定性赁项、跨域不一致性)和DFER中涉及的七大主要挑戰(zhàn)(如關(guān)鍵幀提取澈段、表情強(qiáng)度變化、跨模態(tài)對齊)的最新代表性方法败富。

  3. 我們總結(jié)、分析并討論了FER在不同基準(zhǔn)數(shù)據(jù)集上的最新進(jìn)展和技術(shù)挑戰(zhàn)兽叮,涵蓋了實驗室內(nèi)FER猾愿、自然環(huán)境中的SFER和自然環(huán)境中的DFER的設(shè)置账阻。

  4. 本綜述總結(jié)了三個領(lǐng)域的應(yīng)用和倫理問題蒂秘,并討論了發(fā)展趨勢(如零樣本FER和具身面部表情生成)姻僧,旨在為FER系統(tǒng)提供新的視角和指導(dǎo)。

數(shù)據(jù)集

file

表情識別標(biāo)準(zhǔn)流程

file

深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)

基于圖像的靜態(tài)面部表情識別(SFER)涉及從單張圖像中提取特征撇贺,這些特征捕捉了與面部表情相關(guān)的復(fù)雜空間信息冰抢,如面部標(biāo)志點及其幾何結(jié)構(gòu)和關(guān)系。接下來挎扰,我們將首先介紹SFER的一般架構(gòu),然后從挑戰(zhàn)解決的角度詳細(xì)說明SFER方法的具體設(shè)計遵倦,包括抗干擾的SFER、3D SFER橙弱、考慮不確定性的SFER、復(fù)合SFER燥狰、跨域SFER、弱監(jiān)督SFER和跨模態(tài)SFER蛀缝。

file

更多類型網(wǎng)絡(luò)架構(gòu)圖參考論文 https://arxiv.org/pdf/2408.15777

通用的動態(tài)面部表情識別(DFER)方法主要通過提取時空特征來分析表情的動態(tài)變化目代。基于CNN-RNN的模型通常結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)榛了,而基于Transformer的方法則利用深度注意力機(jī)制來處理更復(fù)雜的動態(tài)關(guān)系。

file

更多類型網(wǎng)絡(luò)架構(gòu)圖參考論文 https://arxiv.org/pdf/2408.15777

發(fā)展趨勢

面部動作單元(AUs)輔助的FER通過捕捉細(xì)微的肌肉動作霜大,提升了表情識別的準(zhǔn)確性和跨文化適應(yīng)性,并增強(qiáng)了模型的可解釋性和透明度曙强。
零樣本FER旨在識別未見過的情感類別,解決傳統(tǒng)FER模型難以擴(kuò)展到新情感類別的局限碟嘴,利用視覺語言模型實現(xiàn)廣泛的情感識別。
多模態(tài)情感識別通過整合面部表情眠菇、聲音、手勢等多種渠道袱衷,提供更全面的情感理解,減少單一模態(tài)系統(tǒng)的局限性登疗,展現(xiàn)出更強(qiáng)的魯棒性和準(zhǔn)確性。
具身FER系統(tǒng)結(jié)合互動技術(shù)辐益,實現(xiàn)對多視角和動態(tài)環(huán)境的實時情感檢測和響應(yīng)脱吱,增強(qiáng)了用戶體驗,并在復(fù)雜環(huán)境中展現(xiàn)出更高的適應(yīng)性箱蝠。
具身面部表情生成通過AIGC和馬達(dá)驅(qū)動兩種方式,使機(jī)器人能夠更逼真地模仿人類表情牙瓢,未來研究將專注于提升其真實性和表現(xiàn)力。

結(jié)論

面部表情識別(FER)在AI領(lǐng)域受到廣泛關(guān)注间校,并在人與機(jī)器協(xié)作和具身智能方面展現(xiàn)出廣闊的應(yīng)用前景。本綜述從多個角度對FER進(jìn)行了深入審視憔足,包括背景胁附、數(shù)據(jù)集滓彰、通用工作流程、挑戰(zhàn)導(dǎo)向的最新方法分類找蜜、近期進(jìn)展稳析、應(yīng)用弓叛、倫理問題和新興趨勢诚纸。我們通過表格和圖表系統(tǒng)地比較和總結(jié)了FER的數(shù)據(jù)集撰筷、任務(wù)挑戰(zhàn)畦徘、方法和性能評估,提供了該領(lǐng)域最新進(jìn)展的清晰概覽关筒。這一全面分析為不同學(xué)科的研究人員提供了重要參考杯缺,幫助他們快速理解該領(lǐng)域的挑戰(zhàn)和進(jìn)展蒸播,進(jìn)而促進(jìn)在通用FER系統(tǒng)開發(fā)方面的合作袍榆。

本文由博客一文多發(fā)平臺 OpenWrite 發(fā)布塘揣!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市才写,隨后出現(xiàn)的幾起案子奖蔓,更是在濱河造成了極大的恐慌琅摩,老刑警劉巖房资,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件檀头,死亡現(xiàn)場離奇詭異,居然都是意外死亡暑始,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門廊镜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事配椭〕媪铮” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵股缸,是天一觀的道長衡楞。 經(jīng)常有香客問我,道長敦姻,這世上最難降的妖魔是什么瘾境? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮镰惦,結(jié)果婚禮上迷守,老公的妹妹穿的比我還像新娘。我一直安慰自己旺入,他們只是感情好盒犹,可當(dāng)我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著眨业,像睡著了一般急膀。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上龄捡,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天卓嫂,我揣著相機(jī)與錄音,去河邊找鬼聘殖。 笑死晨雳,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的餐禁。 我是一名探鬼主播帮非,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼末盔,長吁一口氣:“原來是場噩夢啊……” “哼陨舱!你這毒婦竟也來了游盲?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎链峭,沒想到半個月后弊仪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體杖刷,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡役听,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了瘤袖。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捂敌。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡占婉,死狀恐怖逆济,靈堂內(nèi)的尸體忽然破棺而出纹腌,到底是詐尸還是另有隱情滞磺,我是刑警寧澤涎劈,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布蛛枚,位于F島的核電站蹦浦,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏侥袜。R本人自食惡果不足惜枫吧,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望例隆。 院中可真熱鬧抢蚀,春花似錦、人聲如沸鹿响。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽听怕。三九已至虑绵,卻和暖如春翅睛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背疏旨。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工遏匆, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留谁榜,地道東北人惰爬。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像丛版,于是被迫代替她去往敵國和親页畦。 傳聞我的和親對象是個殘疾皇子研儒,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容