科技云報到原創(chuàng)萨脑。
歷經(jīng)兩年的持續(xù)進化,AI大模型進入產(chǎn)業(yè)落地階段饺饭。其中渤早,泛娛樂作為大模型應用的重要領域,備受行業(yè)關注瘫俊。大模型將重構這些領域的效率提升鹊杖、體驗優(yōu)化悴灵、模式創(chuàng)新等,已經(jīng)成為業(yè)內(nèi)的共識骂蓖。
但AI大模型開發(fā)成本积瞒、精準度以及模型效率等是限制其落地的重要制約因素。大量的游戲登下、影視茫孔、AR/VR、3D生成等公司仍在探索被芳,大模型應該以什么方式融入業(yè)務場景缰贝,才能帶來真正意義上的降本增效,以及全新的科技新體驗筐钟?
目前,這條落地路徑率先被百度智能云找到了赋朦。11月22日篓冲,百度智能云在業(yè)內(nèi)首次發(fā)布了“空間智能解決方案”,從底層的AI基礎架構宠哄,到大模型應用開發(fā)層壹将,再到上層的大模型AI應用,給予泛娛樂行業(yè)用戶全面的業(yè)務支撐毛嫉。
這套方案不僅吸引了Unity诽俯、米哈游、上影集團等游戲影視巨頭前來合作承粤,也吸引了哇嘶嗒(VAST)暴区、智能AR眼鏡Rokid、生數(shù)科技等不少明星初創(chuàng)公司的深度共創(chuàng)辛臊,發(fā)布會現(xiàn)場更是擠滿了想要面對面交流的業(yè)內(nèi)人仙粱。
在游戲、影視彻舰、3D生成等行業(yè)伐割,百度智能云徹底破圈了。
何為空間智能
此次百度智能云的發(fā)布中刃唤,有一個概念備受關注:空間智能隔心。
作為人工智能的下一個方向,空間智能既讓人充滿無限想象尚胞,也處于混沌之中硬霍。空間智能到底是什么笼裳,整個業(yè)界還未達成共識须尚。
百度智能云泛科技業(yè)務部總經(jīng)理張瑋認為崖堤,空間智能是步入智能進化征程的起點,能夠賦予AGI在多維空間中感知耐床、理解密幔、交互虛擬與現(xiàn)實互相映射的能力。
百度智能云泛科技業(yè)務部總經(jīng)理 張瑋
不僅如此撩轰,張瑋認為空間智能不局限于2D胯甩、3D,而是從2D到5D的全面智能化堪嫂。
“2D和3D比較好理解偎箫,4D是在3D空間的基礎上加上了時間,空間智能可以隨著時間的變化皆串,使空間的邏輯淹办、物體的特征都隨之變化,5D是把空間里的物理感知恶复,如:觸覺怜森、嗅覺等,以及物理的反饋都加入進來了”谤牡,張瑋表示副硅。
大模型的快速發(fā)展為空間智能應用落地打開了新的大門。
大模型特有的推理和生成能力翅萤,能夠很好地增強空間智能系統(tǒng)的環(huán)境感知能力恐疲,理解復雜的場景結(jié)構,如:室內(nèi)布局套么、物體位置關系等培己,這對于實現(xiàn)精確的物體追蹤和場景重建至關重要。同時胚泌,大模型也可以用來生成高質(zhì)量的3D模型漱凝、紋理、動畫等诸迟,從而豐富虛擬世界的細節(jié)茸炒。
結(jié)合空間智能,大模型還可以使虛擬角色或?qū)ο缶邆涓呒墑e的交互能力阵苇。例如壁公,通過訓練大模型來理解用戶的語音指令或手勢,虛擬助手可以在AR環(huán)境中提供個性化的服務绅项;或者在VR游戲中紊册,NPC可以根據(jù)玩家的行為做出更加自然的反應等。
簡單來說,現(xiàn)階段大模型的出現(xiàn)囊陡,使得空間智能實現(xiàn)的可能性大大增強芳绩。不僅提升了虛擬內(nèi)容的創(chuàng)造性和互動性,也為用戶帶來了更加豐富和沉浸式的體驗撞反。
正如張瑋所說妥色,大模型對于2D到5D全面理解之后,將為用戶帶來更多的消費內(nèi)容和原先不可能達到的交互體驗遏片,并且基于這些新的交互體驗衍生出新的硬件嘹害,從而提供新的娛樂方式。
對于游戲吮便、影視笔呀、動畫、AR/VR等泛娛樂行業(yè)來說髓需,這無疑意味著全新的许师、廣闊的市場空間。
空間智能落地充滿挑戰(zhàn)
空間智能的前景固然激動人心僚匆,但對于具體的行業(yè)來說微渠,它到底意味著什么,該如何落地白热,能做到什么程度敛助,所有人都在摸著石頭過河粗卜。
哇嘶嗒(VAST)是一家致力于通用3D基礎模型研發(fā)的明星初創(chuàng)企業(yè)屋确,它在2023年底面世的一款3D生成工具——Tripo,成為全球3D-AIGC領域最具競爭力的產(chǎn)品之一续扔。今年3月攻臀,VAST和Stablity AI聯(lián)合推出的3D生成模型TripoSR,0.5秒就能通過單張圖片生成3D模型纱昧,一上線就引爆了全球的游戲開發(fā)者刨啸。
事實上,3D動畫识脆、游戲设联、AR/VR蘊藏著千億級市場勢能,目前卻受限于生成效率和成本灼捂,但VAST這種大模型技術公司的出現(xiàn)离例,無疑大幅提升了游戲、動畫悉稠、影視等空間智能行業(yè)的創(chuàng)作效率宫蛆,降低了內(nèi)容制作的門檻,甚至可能創(chuàng)造出新一代的互聯(lián)網(wǎng)應用的猛。
與之類似的大模型技術公司耀盗,還有生數(shù)科技想虎。作為國內(nèi)最早布局多模態(tài)通用大模型的團隊之一,今年4月叛拷,生數(shù)科技聯(lián)合清華大學發(fā)布了國內(nèi)首款全面對標Sora的視頻大模型Vidu舌厨。市面上的主流AI視頻工具在生成4秒左右的視頻片段時,用戶通常需要等待1到5分鐘胡诗,而Vidu只需30秒邓线。
這意味著在游戲制作、影視后期煌恢、動畫設計骇陈、內(nèi)容社交等空間智能場景中,用戶可以在極短的時間內(nèi)生成大量視頻素材瑰抵,將大大降低生產(chǎn)成本你雌、提升效率。
這些豐富的行業(yè)大模型應用二汛,正在一步步完善空間智能的版圖婿崭。然而,技術和應用之間肴颊,始終隔著一道鴻溝氓栈,在技術向應用轉(zhuǎn)化時充滿荊棘。
首先婿着,對于大模型技術本身來說授瘦,其生產(chǎn)效率還不夠高,成本沒有做到極致竟宋,對于人類意圖的理解也還不夠精準提完,轉(zhuǎn)化成行業(yè)應用時就存在大量的優(yōu)化空間。
例如丘侠,在VAST對3D大規(guī)模模型的訓練過程中徒欣,就面臨著訓練周期冗長與成本高昂的雙重挑戰(zhàn)。
其次蜗字,游戲打肝、影視等行業(yè)用戶對大模型技術不了解,在使用過程中難以真正發(fā)揮大模型優(yōu)勢挪捕。同樣粗梭,IT技術人員對于行業(yè)也不了解,雙方需要長時間的去碰撞担神,才能打磨出適合行業(yè)的垂類大模型和相關應用楼吃。
事實上,技術和應用之間的鴻溝,誰能夠先越過去孩锡,誰就能先抵達成功的彼岸酷宵。
百度智能云推出“空間智能解決方案”
對于這道難題递礼,百度智能云已率先上馬存谎,迎難而上啡专。
在百度智能云泛科技業(yè)務部總經(jīng)理張瑋看來硫戈,空間智能相關場景在使用大模型技術時,往往會遇到幾大挑戰(zhàn):
首先埃元,空間智能企業(yè)在落地大模型時氢哮,從集群創(chuàng)建葛圃、開發(fā)實驗默垄,到模型訓練此虑、推理的全旅程算力需求,需要應對超大規(guī)模GPU集群高成本口锭、難運營的問題朦前。
因此,百度智能云在AI基礎架構層推出了【百度百舸AI異構計算平臺】鹃操,包括:中心云服務韭寸、邊緣云服務、實時互動RTC荆隘、AI數(shù)據(jù)服務等多種基礎服務恩伺,提供面向萬卡、十萬卡集群的算力管理能力椰拒。
一方面晶渠,百舸預置了主流的大模型訓練工具,能夠?qū)崿F(xiàn)工具層面的秒級部署耸三,并將萬卡集群運行準備時間從幾周縮減至1小時乱陡,極大地提升部署效率浇揩,縮短業(yè)務上線周期仪壮。
另一方面,百舸提供可觀測大盤胳徽,能夠?qū)Χ嘈具m配积锅、集群效能、任務自動容錯等方面進行全方位監(jiān)測养盗,提供直觀決策依據(jù)缚陷,幫助用戶更好地把控整體項目。
在萬卡任務上往核,百舸4.0可以保障有效訓練時長占比達到99.5%箫爷。針對目前國內(nèi)芯片供應緊張的問題,為了保證企業(yè)供應鏈的安全和彈性,一云多芯是必然選擇虎锚,目前在萬卡規(guī)模上硫痰,百舸4.0將兩種芯片混合訓練下的效率折損控制在5%以內(nèi)。同時窜护,在跨地域的機房部署上效斑,百舸4.0通過提供高效的拓撲結(jié)構、跨地域無擁塞高性能網(wǎng)絡和高效的模型并行訓練等方案柱徙,在橫跨幾十公里的多機房組成的萬卡規(guī)模的集群上缓屠,把單一訓練任務的性能折損控制在4%以內(nèi),保持業(yè)界領先护侮。
目前敌完,VAST、生數(shù)科技羊初、Liblib蠢挡、光魔科技等空間智能賽道的大模型公司,都選擇了百舸作為其底層的AI計算平臺凳忙。
例如业踏,VAST基于百舸,解決了高性能計算涧卵、存儲網(wǎng)絡等基礎設施的使用和運維勤家。同時,基于百舸的AI加速套件柳恐,使用了大模型訓練和推理場景的IO預處理優(yōu)化伐脖、通信效率優(yōu)化、顯存利用優(yōu)化和模型算法優(yōu)化等功能乐设,極大提升了分布式訓練讼庇、推理的性能和效率。
再比如近尚,光魔科技推出的AIGC創(chuàng)作平臺“白日夢”蠕啄,需要依托各種視頻、圖片的剪輯能力以及大模型的生成效果戈锻〖吒基于百舸,光魔科技搭建了整套邊緣算力節(jié)點格遭,大幅降低了敏感算力的成本哈街,并基于跨境專線CDN服務實現(xiàn)了海外加速。同時拒迅,基于百舸視頻云骚秦,光魔科技將多張生成的圖片她倘,利用百度MCP產(chǎn)品的拼接能力,將無序的圖片變換成一個連環(huán)短片作箍。在大模型應用上帝牡,基于百度千帆大模型平臺,實現(xiàn)了更加便利的生成劇本內(nèi)容蒙揣,以及對劇本內(nèi)容進行理解并實現(xiàn)?設靶溜、分鏡等功能。
其次懒震,空間智能的業(yè)務場景相當復雜罩息,需要高效的大模型工具鏈去滿足復雜多樣的需求。
對此个扰,百度智能云推出了【千帆大模型平臺】瓷炮,它分為應用開發(fā)、模型服務递宅、模型開發(fā)三層娘香,為企業(yè)提供最易用的應用開發(fā)工具、最豐富的大模型和最全面的模型開發(fā)工具鏈办龄,幫助企業(yè)將大模型深入到自己的生產(chǎn)力場景烘绽。
在應用開發(fā)層,針對空間智能落地大模型的高頻應用場景俐填,提供企業(yè)級RAG安接、企業(yè)級Agent、一句話創(chuàng)建企業(yè)應用等關鍵能力英融,賦能企業(yè)高效開發(fā)企業(yè)級大模型應用盏檐。
在模型服務層,除了支持文心大模型外驶悟,也支持語音識別胡野、物體檢測等傳統(tǒng)模型,企業(yè)可以根據(jù)場景痕鳍,合理搭配大小模型硫豆,通過直接調(diào)用大幅提高自己的業(yè)務效率。
在模型開發(fā)層额获,千帆大模型平臺提供了完整的工具鏈够庙,上線了DPO恭应、KTO等模型訓練算法和PTQ等模型量化算法抄邀,能夠更高效地支持超大參數(shù)模型的微調(diào)和定制。不僅是大模型開發(fā)昼榛,升級后的千帆大模型平臺3.0還支持CV境肾、NLP剔难、語音等傳統(tǒng)模型的開發(fā),并實現(xiàn)數(shù)據(jù)奥喻、模型偶宫、算力資源的統(tǒng)一納管和調(diào)度,為企業(yè)提供一站式的大环鲤、小模型開發(fā)體驗纯趋。
最后,不同的空間智能企業(yè)冷离,在數(shù)據(jù)吵冒、場景和業(yè)務邏輯上呈現(xiàn)出行業(yè)差異,需要在通用大模型和行業(yè)大模型的能力基礎上西剥,進一步增強行業(yè)能力痹栖,讓行業(yè)AI應用的開發(fā)事半功倍。
對此瞭空,百度智能云推出了完全適用于空間智能的AI應用及開發(fā)平臺揪阿。
例如,在空間內(nèi)容創(chuàng)造方面咆畏,圍繞“人南捂、場、物”多維互動打造空間智能新陣地旧找。其中黑毅,空間智能Avatar能夠制作虛擬分身,空間智能平臺能夠生成虛擬空間場景钦讳,數(shù)字創(chuàng)作中心能夠?qū)崿F(xiàn)多維數(shù)字的生成矿瘦、分發(fā)、管理愿卒。
在空間智能交互方面缚去,百度智能云提供從2D到5D的多維多模態(tài)實踐平臺,為打造全方位的空間構建提供了一站式的AI解決方案琼开。
總的來說易结,百度智能云“空間智能解決方案”通過大模型+行業(yè)增強的能力,為空間智能的AI應用落地提供了真實的生產(chǎn)力——提高開發(fā)效率柜候、降低開發(fā)門檻搞动、實現(xiàn)快速創(chuàng)新,為空間智能領域多樣化的場景需求提供了強大的技術支撐渣刷。
百度智能云“破圈”
百度智能云為何在泛娛樂行業(yè)里破了圈鹦肿?
尤其是空間智能是一個全新的領域,所有人都還在摸黑前行辅柴,百度智能云卻率先找到了一條切實可行的落地路徑箩溃,這是為什么瞭吃?
顯然,這和百度一直以來對AI的追求息息相關涣旨。
憑借在人工智能領域長期的技術積累和高壓強式歪架、馬拉松式研發(fā)投入,百度是國內(nèi)最早推出AI大語言模型的企業(yè)霹陡,也是國內(nèi)少有的能夠早早預判AI發(fā)展大趨勢的科技企業(yè)和蚪,這使得百度在AI領域總有“領先半步”的前瞻性。
過去2年烹棉,百度創(chuàng)始人李彥宏時不時因為“清醒發(fā)言”出圈惠呼,比如當國內(nèi)還在聚焦百模大戰(zhàn)時,李彥宏就說“不要卷模型峦耘,要卷應用”剔蹋。百度對于大模型落地以及AI原生應用的深刻理解,使其在技術辅髓、產(chǎn)品乃至組織上都是AI原生的泣崩,為行業(yè)落地AI做好了準備。
比如洛口,在AI基礎設施上矫付,百度智能云的算力、算法第焰、數(shù)據(jù)是業(yè)界最全面的买优;在AI應用上,百度至今已推出100+AI原生應用挺举,展示了其難以超越的AI產(chǎn)品開發(fā)能力杀赢。數(shù)據(jù)顯示,已有超過60%的央企和大量的民營企業(yè)湘纵,在聯(lián)合百度智能云進行AI創(chuàng)新脂崔,通過百度智能云千帆大模型平臺,累計精調(diào)了3.3萬個大模型梧喷,開發(fā)出了77萬個企業(yè)級應用砌左。
實實在在的數(shù)據(jù),展示了百度智能云在幫助各行各業(yè)落地AI铺敌、打破大模型技術障礙的超強執(zhí)行力汇歹。這也就不難理解,為什么百度智能云能夠最先看到空間智能的市場潛力偿凭,找到和AI大模型結(jié)合的落地路徑产弹,并且能夠快速地將相關的技術和解決方案推向市場。
不僅如此笔喉,面對空間智能這一新領域取视,百度智能云更是拿出了深耕的決心硝皂,愿意和行業(yè)客戶一起去探索落地——研究業(yè)務場景常挚,理解業(yè)務需求作谭,將需求轉(zhuǎn)化為技術進行落地,同時也愿意投入商業(yè)化資源去推廣行業(yè)應用奄毡,與客戶折欠、生態(tài)伙伴一起將空間智能產(chǎn)業(yè)做大。
在百度智能云的商業(yè)生態(tài)版圖中吼过,未來的空間智能將涵蓋游戲锐秦、電商、體育盗忱、智能設備酱床、具身智能、教育趟佃、AI科技與影視動漫等多個行業(yè)扇谣,這將帶來千億級乃至萬億級別的產(chǎn)業(yè)規(guī)模。
隨著大模型技術的成熟闲昭,空間智能應用進一步落地罐寨,必然會為企業(yè)降本增效、打開新的可能性序矩,帶來深遠影響鸯绿。
這一過程顯然漫長而艱難,但對于百度智能云這樣的“長期主義者”來說簸淀,這本身就是一種修行瓶蝴,能夠沉下心去面對一切市場的喧囂,撇去技術的泡沫租幕。
正如百度智能云泛科技業(yè)務部總經(jīng)理張瑋所說囊蓝,空間智能從概念到落地具體應用還有很長的路要走,希望能把產(chǎn)業(yè)聯(lián)盟做得更完善令蛉,有更多的生態(tài)廠商一起來探索落地聚霜,“落地到有邊界的場景、可以服務的客戶珠叔、具象化的行業(yè)產(chǎn)品和功能蝎宇,逐步去滿足空間智能大部分的需求”。
或許在某個時刻祷安,空間智能產(chǎn)業(yè)會臨近奇點姥芥、迎來爆發(fā),但技術帶來的產(chǎn)業(yè)革命總是靜默而深刻汇鞭。當我們在未來回頭望去凉唐,才會意識到庸追,這場變革早已開始。
【關于科技云報到】
企業(yè)級IT領域Top10新媒體台囱。聚焦云計算淡溯、人工智能、大模型簿训、網(wǎng)絡安全咱娶、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級科技領域强品。原創(chuàng)文章和視頻獲工信部權威認可膘侮,是世界人工智能大會、數(shù)博會的榛、國家網(wǎng)安周琼了、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。