數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)

以下文章來源于騰訊研究院 妈踊,作者騰訊研究院

全真互聯(lián)時代正在悄然到來矾削,加速線上線下的跨時空融合碗殷,作為全真互聯(lián)的重要入口肩刃,數(shù)字人可以推動線上和線下更加全面地一體化祟霍,打造出沉浸式的“全真”體驗與可操作的“互聯(lián)”交互。

進入2022年以來盈包,數(shù)字人在諸多應(yīng)用場景大放光彩沸呐,特別是在北京冬奧會的開幕式表演、氣象播報呢燥、手語解說中頻頻現(xiàn)身崭添,使其用戶基礎(chǔ)不斷擴大。爆點事件推動數(shù)字人產(chǎn)業(yè)被用戶不斷加深認知疮茄,數(shù)字人形態(tài)滥朱、技術(shù)及應(yīng)用受到大量關(guān)注,而支持產(chǎn)業(yè)快速發(fā)展的底層元素則包括技術(shù)的發(fā)展力试、用戶新需求徙邻、生態(tài)完善和標(biāo)準(zhǔn)的支持等。


伴隨著全真互聯(lián)的到來畸裳,未來數(shù)字人應(yīng)用還將具有哪些可能性缰犁,技術(shù)路線會產(chǎn)生哪些變化? 騰訊研究院、騰訊云智能創(chuàng)業(yè)黑馬合作怖糊,先后對數(shù)十家從事數(shù)字人的企業(yè)進行深度調(diào)研與跟蹤訪談 帅容,分析產(chǎn)業(yè)發(fā)展現(xiàn)狀,底層驅(qū)動力、未來方向和挑戰(zhàn)等麦乞。形成****《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)》****(文末附下載二維碼)。從數(shù)字人的價值定位姐直、核心技術(shù)倦淀、行業(yè)應(yīng)用、C端發(fā)展声畏、產(chǎn)業(yè)聚集 等十個不同維度進行剖析撞叽,挖掘出產(chǎn)業(yè)發(fā)展的十大趨勢。

趨勢1:數(shù)字人制造和運營服務(wù)的B端市場不斷擴大插龄,將面向更廣大的C端用戶提供服務(wù)愿棋,各類數(shù)字人價值定位和商業(yè)模式有差異初斑。

數(shù)字人的最終服務(wù)對象為C端用戶,在B端的應(yīng)用領(lǐng)域從電影動畫向廣告營銷膨处、電商直播见秤、虛擬偶像等領(lǐng)域不斷擴展。未來突硝,以虛擬分身為代表的應(yīng)用潛力巨大测摔。從需求角度,數(shù)字人制造和運營服務(wù)在B端市場不斷擴大領(lǐng)域和規(guī)模解恰,面向更廣大的C端用戶提供服務(wù)锋八,而制作方式也從PGC向UGC發(fā)展。

在20世紀80年代電影护盈、動畫等領(lǐng)域早期的手繪數(shù)字人最先出現(xiàn)挟纱,伴隨著21世紀初計算機動畫和動捕技術(shù)的成熟,內(nèi)容/IP型數(shù)字人大量應(yīng)用在影視行業(yè)中腐宋,主要是增強影視中觀眾的體驗效果紊服,隨后逐漸在文娛、市場營銷胸竞、文旅欺嗤、虛擬偶像等場景推廣應(yīng)用。近年卫枝,伴隨AI驅(qū)動技術(shù)的成熟煎饼,功能服務(wù)型數(shù)字人陸續(xù)出現(xiàn),主要應(yīng)用于行業(yè)服務(wù)場景校赤,如金融數(shù)字人客服吆玖、傳媒數(shù)字人口播等淤袜。在虛擬空間中的虛擬分身數(shù)字人大范圍出現(xiàn)相對較晚,虛擬空間的技術(shù)和產(chǎn)品還在發(fā)展中衰伯,待產(chǎn)業(yè)進一步完善,此類應(yīng)用潛力巨大积蔚,是數(shù)字人市場的增量空間意鲸。


趨勢2:技術(shù)集綜合迭代驅(qū)動數(shù)字人形似人,制作效能將繼續(xù)提升尽爆。

多元技術(shù)推動數(shù)字人外形更像真人:建模技術(shù)發(fā)展推動超寫實數(shù)字人制作門檻怎顾、成本和周期進一步下降;物理仿真算法迭代推動服裝動態(tài)展示趨向真實漱贱;渲染引擎迭代和GPU算力提升推動數(shù)字人畫面更加精細和實時化槐雾;算法的優(yōu)化推動專業(yè)動捕設(shè)備趨向便捷化,視覺動捕在C端應(yīng)用潛力更大幅狮;面部捕捉技術(shù)向更簡單的硬件募强、更細膩的表情、更自動化的流程方向發(fā)展崇摄。


趨勢3:AI技術(shù)驅(qū)動數(shù)字人多模態(tài)交互更神似人擎值,并逐步覆蓋數(shù)字人全流程。

當(dāng)前數(shù)字人對語言理解還是以文本為主逐抑,動作合成上聲唇同步較為完善:

(1)AI驅(qū)動數(shù)字人是指數(shù)字人等語音表達鸠儿、面部表情和動作形態(tài)等通過深度學(xué)習(xí)模型進行運算,并將其結(jié)果實時或者離線驅(qū)動厕氨,并進行渲染进每。目前主流的 方式是圍繞NLP能力通過文本驅(qū)動,本質(zhì)是通過ASR-NLP-TTS等AI技術(shù)進行感知-決策-表達的閉環(huán)來驅(qū)動數(shù)字人交互命斧,同時需要預(yù)先設(shè)置相關(guān)的知 識圖譜或問答庫等田晚,與數(shù)字人的對話系統(tǒng)對接,但目前NLP在通用性場景的能力還需要進一步完善国葬。

(2)計算機視覺(CV)目前數(shù)字人聲唇同步技術(shù)相對完善肉瓦,在游戲中已經(jīng)大量應(yīng)用;而其他表情和動作還需要描述性的數(shù)據(jù)或者標(biāo)簽驅(qū)動,尚未智能合成胃惜, 表情動作也是是AI驅(qū)動未來發(fā)展的重點方向泞莉。

未來AI技術(shù)的重點方向是在輸入端實現(xiàn)多模態(tài)感知輸入,在輸出端提升多模態(tài)交互能力船殉,綜合提升數(shù)字人的表現(xiàn)力鲫趁,從目前的基于文本的交互,轉(zhuǎn)化為基 于語義的交互利虫,特別是需要強化對人情緒的感知和表達挨厚。此外除了利用ASR-NLP-TTS等技術(shù)驅(qū)動數(shù)字人交互外堡僻,AI技術(shù)也應(yīng)用在2D數(shù)字人的視頻生成、3D數(shù)字人的建模疫剃、視頻驅(qū)動钉疫、物理仿真等多個環(huán)節(jié)。


趨勢4:數(shù)字人技術(shù)與SLAM巢价、3D交互牲阁、體積視頻、空間音頻等技術(shù)深度融合壤躲,渲染將從本地到云端城菊。

數(shù)字人作為3D呈現(xiàn)的一種方式,未來將與其他3D技術(shù)如SLAM(即時定位與地圖構(gòu)建)碉克、體積視頻凌唬、空間音頻等融合,進一步完善數(shù)字人和真實空間的交互漏麦。例如在直播場景中虛擬/真實空間中真人和數(shù)字人的交互客税,數(shù)字人對真實空間的感知等。同時由于數(shù)字人對渲染能力要求較高撕贞,未來云端渲染是重要的方向霎挟,將推動云服務(wù)商從算力(CPU)云服務(wù),到渲染力(GPU)的云服務(wù)麻掸。但成本仍是云渲染普及的關(guān)鍵阻礙酥夭,需要突破。

趨勢5:千行千面的數(shù)字人將成為人機交互新入口脊奋,但深度上仍需挖掘熬北。

AI驅(qū)動的數(shù)字人通過AI能力建立人與大數(shù)據(jù)的連接,提高效率并滿足人情感交流需求诚隙,提升用戶體驗讶隐,將成為人機交互新入口:應(yīng)用廣度上:目前使用文字或語音交互的場景都可用AI數(shù)字人軟著陸的方式替代,不需要改變原有的業(yè)務(wù)邏輯和商業(yè)模式久又,大眾接受成本較低巫延,并提供更好的用戶體驗,未來應(yīng)用場景非常廣泛地消,可以與各種領(lǐng)域相結(jié)合炉峰,服務(wù)規(guī)模化和標(biāo)準(zhǔn)化脉执。應(yīng)用深度上:數(shù)字人作為企業(yè)的數(shù)字資產(chǎn)疼阔,是對員工工作的增強,具有生產(chǎn)力的屬性,可以進一步釋放生產(chǎn)力婆廊,同時降本增效迅细。未來數(shù)字人將根據(jù)不同行業(yè)的業(yè)務(wù)特點和應(yīng)用場景進行更深度結(jié)合,孵化千行千面的數(shù)字員工淘邻,提供差異化服務(wù)茵典。

趨勢6:UGC數(shù)字人將加速出現(xiàn),成為未來產(chǎn)業(yè)的增量空間宾舅。

未來1-2年技術(shù)門檻和成本將快速下降统阿,會出現(xiàn)更開放的創(chuàng)作者生態(tài)、更豐富的UGC內(nèi)容和商業(yè)模式贴浙,UGC將成為數(shù)字人的增量空間,同時也是數(shù)字人在C端應(yīng)用的主要生產(chǎn)方式


趨勢7:數(shù)字人仍以2D顯示設(shè)備為主署恍,3D顯示設(shè)備成為特定領(lǐng)域的新解法崎溃。

數(shù)字人的顯示載體包括手機、平板電腦盯质、AR/VR眼鏡袁串、智慧大屏或線下一體機等多種終端設(shè)備。PC呼巷、手機囱修、智慧大屏、銀行VTM機等2D主流顯示設(shè)備仍是數(shù)字人顯示的主要載體王悍。數(shù)字人和3D的數(shù)字內(nèi)容破镰,對于裸眼3D、VR压储、AR等3D顯示設(shè)備的普及具有推動重要鲜漩。特別在VR/AR設(shè)備中,6dof交互更突出數(shù)字人特點集惋,因此會在特定領(lǐng)域成為新解法孕似,如在XR設(shè)備中的線上演唱會、展會和會議等應(yīng)用場景刮刑。


趨勢8:在場是數(shù)字人發(fā)展的高級階段喉祭,將與應(yīng)用場景深度耦合。

離線階段--目前數(shù)字人產(chǎn)業(yè)正處于快速發(fā)展期間:離線渲染雷绢、非交互類型的數(shù)字人仍是主流泛烙,在數(shù)字化營銷、文娛等領(lǐng)域應(yīng)用廣泛翘紊;AI驅(qū)動的數(shù)字人在行業(yè)服務(wù)中胶惰,虛擬分身數(shù)字人在虛擬空間中處于爆發(fā)前期。在線階段--伴隨數(shù)字人快速發(fā)展和大量使用霞溪,用戶將很快進入體驗突破階段孵滞,在此階段利用AI驅(qū)動提供初級的實時交互和實時渲染技術(shù)不斷突破在場階段--實時交互中捆,更加智能的數(shù)字人,并結(jié)合更深的行業(yè)理解坊饶,帶來更真實的沉浸感和更大的價值泄伪。


趨勢9:藝術(shù)和技術(shù)雙輪驅(qū)動,北京有望成為產(chǎn)業(yè)新高地匿级。

作為科技產(chǎn)品蟋滴,數(shù)字人需要技術(shù)研發(fā)、人工智能痘绎、產(chǎn)品設(shè)計津函、運營、融資環(huán)境等多方面人才孤页,因此互聯(lián)網(wǎng)發(fā)展較好的區(qū)域尔苦,如北京、杭州行施、上海允坚、深圳等互聯(lián)網(wǎng)和數(shù)字內(nèi)容高地,將成為數(shù)字人產(chǎn)業(yè)的重要聚居地蛾号。在眾多因素中稠项,藝術(shù)和科技是最強驅(qū)動力,北京藝術(shù)資源相對集中鲜结,擁有中國傳媒大學(xué)展运、中央美術(shù)學(xué)院頭部藝術(shù)類院校和專家資源;科技產(chǎn)業(yè)優(yōu)勢突出精刷,互聯(lián)網(wǎng)企業(yè)數(shù)量較多乐疆,聚集了大量技術(shù)研發(fā)、AI算法等方面的人才贬养;同時政府高度重視數(shù)字人產(chǎn)業(yè)挤土,第一個發(fā)布數(shù)字人發(fā)展政策。在產(chǎn)業(yè)和政策的推動下误算,有望成為數(shù)字人產(chǎn)業(yè)聚焦的新高地仰美。


趨勢10.:數(shù)字人版權(quán)保護及行業(yè)合規(guī)體系需同步建設(shè),推動實現(xiàn)可用儿礼、可靠咖杂、可知、可控蚊夫。

數(shù)字人行業(yè)總體還在快速發(fā)展階段诉字,發(fā)展和生存是企業(yè)的重點和方向,數(shù)字人著作權(quán)、外觀設(shè)計專利壤圃、商標(biāo)等知識產(chǎn)權(quán)保護體系亟待完善陵霉。

面向未來,數(shù)字人會正朝幾個方向加速迭代:一是外貌更加精致伍绳,形象更加逼真踊挠,動作更加自然,即“皮囊更好看”冲杀,跨越恐怖谷效應(yīng)后效床,會使人覺得數(shù)字人和真人無異,有利于建立良好的心理連接权谁;二是隨著AI技術(shù)的不斷完善剩檀,數(shù)字人多模態(tài)感知和交互的能力會得到顯著提升,數(shù)字人未來有可能具備記憶力和判斷力旺芽,從而更加智能沪猴,行為和思想上更趨于接近人,擁有“有趣的靈魂”甥绿。此外字币,數(shù)字人產(chǎn)業(yè)的加速發(fā)展则披,也需要渲染共缕、動捕等行業(yè)開發(fā)工具、云渲染等技術(shù)支持體系的進一步完善士复,從而大幅提升制作效能图谷,有效降低制作時間和成本。目前阱洪,很多技術(shù)已經(jīng)接近商業(yè)化大規(guī)模推廣的臨界點便贵,數(shù)字人產(chǎn)業(yè)有望進入全真互聯(lián)的新階段:將可能作為我們的分身,成為數(shù)字世界的交互入口冗荸,為我們帶來更智能承璃、更沉浸的“在場”體驗。


image.png

報告目錄如下:

(一) 發(fā)展現(xiàn)狀

1. 網(wǎng)紅數(shù)字人推動C端直觀認知和概念普及

2. 融資事件頻繁及專項政策的出臺進一步加深對產(chǎn)業(yè)的認知

3. 技術(shù)發(fā)展是數(shù)字人第一推動力

4. Z世代用戶崛起蚌本,數(shù)字人和虛擬空間為互聯(lián)網(wǎng)原生一代提供新體驗

5. 頭部企業(yè)從工具盔粹、平臺和應(yīng)用多維度入局,引領(lǐng)數(shù)字人產(chǎn)業(yè)發(fā)展

6. 標(biāo)準(zhǔn)制定引導(dǎo)產(chǎn)業(yè)規(guī)范發(fā)展

(二) 產(chǎn)業(yè)趨勢

1. 價值定位:

數(shù)字人制造和運營服務(wù)的B端市場不斷擴大程癌,將面向更廣大的C端用戶提供服務(wù)舷嗡,各類數(shù)字人價值定位和商業(yè)模式有差異。

2. 技術(shù)迭代:

技術(shù)集綜合迭代驅(qū)動數(shù)字人形似人嵌莉,制作效能將繼續(xù)提升进萄。

3. AI賦能:

AI技術(shù)驅(qū)動數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程。

4. 融合發(fā)展:

數(shù)字人技術(shù)與SLAM中鼠、3D交互可婶、體積視頻、空間音頻等技術(shù)深度融合兜蠕,渲染將從本地到云端扰肌。

5. 行業(yè)應(yīng)用:

千行千面的數(shù)字人將成為人機交互新入口,但深度上仍需挖掘熊杨。

6. C端模式:

UGC數(shù)字人將加速出現(xiàn)曙旭,成為未來產(chǎn)業(yè)的增量空間。

7. 硬件載體:

數(shù)字人仍以2D顯示設(shè)備為主晶府,3D顯示設(shè)備成為特定領(lǐng)域的新解法桂躏。

8. 發(fā)展路徑:

在場是數(shù)字人發(fā)展的高級階段,將與應(yīng)用場景深度耦合川陆。

9. 產(chǎn)業(yè)集聚:

藝術(shù)和技術(shù)雙輪驅(qū)動剂习,北京有望成為產(chǎn)業(yè)新高地。

10. 合規(guī)前置:

數(shù)字人版權(quán)保護及行業(yè)合規(guī)體系需同步建設(shè)较沪,推動實現(xiàn)可用鳞绕、可靠、可知尸曼、可控们何。

(三) 應(yīng)用案例

1. 典型產(chǎn)品:

數(shù)字人播報SaaS工具、數(shù)字人UGC制作工具控轿、數(shù)字人生產(chǎn)工具冤竹、快速數(shù)字分身生成工具、C端數(shù)字人直播工具茬射、布料實時仿真工具鹦蠕、AI驅(qū)動數(shù)字人直播工具、視頻實時驅(qū)動產(chǎn)品在抛、 AI 驅(qū)動業(yè)務(wù)中臺钟病、虛擬空間產(chǎn)品

2. 新型顯示:

AR眼鏡、裸眼3D屏幕刚梭、沉浸式裸眼3D交互

3. 解決方案:

騰訊云數(shù)字人整體解決方案肠阱、中之人驅(qū)動直播方案、超寫實數(shù)字人制作方案望浩、高品質(zhì)數(shù)字人制作和直播方案

4. 行業(yè)應(yīng)用:

金融辖所、傳媒、文旅磨德、云展廳缘回、科教吆视、泛娛、影視酥宴、市場營銷啦吧、公益

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市拙寡,隨后出現(xiàn)的幾起案子授滓,更是在濱河造成了極大的恐慌,老刑警劉巖肆糕,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件般堆,死亡現(xiàn)場離奇詭異,居然都是意外死亡诚啃,警方通過查閱死者的電腦和手機淮摔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門地技,熙熙樓的掌柜王于貴愁眉苦臉地迎上來畅形,“玉大人汁讼,你說我怎么就攤上這事毡鉴。” “怎么了限番?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵肌索,是天一觀的道長嵌溢。 經(jīng)常有香客問我五辽,道長办斑,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任奔脐,我火速辦了婚禮俄周,結(jié)果婚禮上吁讨,老公的妹妹穿的比我還像新娘髓迎。我一直安慰自己,他們只是感情好建丧,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布排龄。 她就那樣靜靜地躺著,像睡著了一般翎朱。 火紅的嫁衣襯著肌膚如雪橄维。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天拴曲,我揣著相機與錄音争舞,去河邊找鬼。 笑死澈灼,一個胖子當(dāng)著我的面吹牛竞川,可吹牛的內(nèi)容都是我干的店溢。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼委乌,長吁一口氣:“原來是場噩夢啊……” “哼床牧!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起遭贸,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤戈咳,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后壕吹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體著蛙,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年耳贬,在試婚紗的時候發(fā)現(xiàn)自己被綠了册踩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡效拭,死狀恐怖暂吉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情缎患,我是刑警寧澤慕的,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站挤渔,受9級特大地震影響肮街,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜判导,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一嫉父、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧眼刃,春花似錦绕辖、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至昵骤,卻和暖如春树碱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背变秦。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工成榜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蹦玫。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓赎婚,卻偏偏與公主長得像雨饺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子惑淳,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容