【EMNLP2024】阿里云人工智能平臺(tái) PAI 多篇論文入選 EMNLP2024

近期朽合，阿里云人工智能平臺(tái) PAI 的多篇論文在 EMNLP2024 上入選做入。論文成果是阿里云與華南理工大學(xué)金連文教授團(tuán)隊(duì)缭嫡、復(fù)旦大學(xué)王鵬教授團(tuán)隊(duì)共同研發(fā)喂很。EMNLP 是人工智能自然語(yǔ)言處理領(lǐng)域的頂級(jí)國(guó)際會(huì)議惜颇，聚焦于自然語(yǔ)言處理技術(shù)在各個(gè)應(yīng)用場(chǎng)景的學(xué)術(shù)研究，尤其重視自然語(yǔ)言處理的實(shí)證研究少辣。該會(huì)議曾推動(dòng)了預(yù)訓(xùn)練語(yǔ)言模型凌摄、文本挖掘、對(duì)話系統(tǒng)漓帅、機(jī)器翻譯等自然語(yǔ)言處理領(lǐng)域的核心創(chuàng)新锨亏，在學(xué)術(shù)和工業(yè)界都有巨大的影響力。此次入選標(biāo)志著阿里云人工智能平臺(tái) PAI 在自然語(yǔ)言處理和多模態(tài)算法能力方面研究獲得了學(xué)術(shù)界認(rèn)可忙干。

論文簡(jiǎn)述

面向長(zhǎng)文本的文視頻表征學(xué)習(xí)與檢索模型 VideoCLIP-XL

CLIP 模型在視覺-語(yǔ)言預(yù)訓(xùn)練領(lǐng)域已經(jīng)取得了重要進(jìn)展器予。然而，原始 CLIP 模型的一個(gè)顯著局限性是處理長(zhǎng)文本描述的能力受限捐迫。原始 CLIP 模型的訓(xùn)練過程中對(duì)簡(jiǎn)短的摘要性文本的強(qiáng)調(diào)迫使文本/視覺編碼器主要關(guān)注文本/視覺輸入中的主要特征乾翔，常常忽視一些較小但潛在關(guān)鍵的細(xì)節(jié)。為了解決這些限制施戴，該工作提出了一個(gè)名為 VideoCLIP-XL 的視頻 CLIP 模型反浓，旨在提升對(duì)視頻的長(zhǎng)文本描述的理解能力萌丈。其首先構(gòu)建了一個(gè)大規(guī)模的視頻-長(zhǎng)描述配對(duì)數(shù)據(jù)集 VILD，并在預(yù)訓(xùn)練階段提出了一種文本相似度引導(dǎo)的主成分匹配方法（TPCM）來(lái)優(yōu)化高維特征空間的學(xué)習(xí)雷则。

此外浓瞪，該工作提出能夠理解長(zhǎng)描述的視頻 CLIP 模型應(yīng)當(dāng)體現(xiàn)兩個(gè)特征：給定一個(gè)視頻及其相關(guān)描述，CLIP 類模型應(yīng)該對(duì)（1）具有更豐富和更精確細(xì)節(jié)的描述以及（2）在相同細(xì)節(jié)水平下更準(zhǔn)確即幻覺更少的描述賦予更高的分?jǐn)?shù)巧婶。為此，其提出兩個(gè)新的預(yù)訓(xùn)練任務(wù)：細(xì)節(jié)描述排序（DDR）和幻覺描述排序（HDR）涂乌。此外艺栈，該工作也建立了一個(gè)新的視頻長(zhǎng)描述排序基準(zhǔn)測(cè)評(píng)集（LVDR），來(lái)更全面地評(píng)估視頻 CLIP 模型的性能湾盒。

基于多任務(wù)課程規(guī)劃的大語(yǔ)言模型蒸餾算法

大語(yǔ)言模型在回答開放領(lǐng)域通用任務(wù)的指令上取得了很大地進(jìn)步湿右。指令微調(diào)是微調(diào)預(yù)訓(xùn)練模型，使其從文本補(bǔ)全模型成為強(qiáng)大的對(duì)話模型的關(guān)鍵罚勾。盡管已有研究探索了使用強(qiáng)大的黑盒教師模型（如GPT-4毅人， Qwen-max）來(lái)自動(dòng)蒸餾和標(biāo)注指令的方法，但這些研究往往忽視了微調(diào)訓(xùn)練集中任務(wù)的多樣性分布尖殃，以及訓(xùn)練集中指令難度的差異丈莺，這可能導(dǎo)致學(xué)生 LLMs 知識(shí)能力的不平衡和解決復(fù)雜任務(wù)的能力的不足。為了解決這些挑戰(zhàn)送丰，這篇文章介紹了一個(gè)名為 TAPIR 的知識(shí)蒸餾框架缔俄，它通過多任務(wù)課程規(guī)劃來(lái)蒸餾黑盒大語(yǔ)言模型的指令回答能力，在蒸餾和多輪迭代過程中器躏，使用教師 LLM 做為裁判找出對(duì)于學(xué)生 LLM 來(lái)說難以回答的指令俐载，進(jìn)行難度重采樣。并調(diào)整多任務(wù)配比進(jìn)行訓(xùn)練集中的任務(wù)多樣性分布的重采樣登失，并根據(jù)相應(yīng)多任務(wù)特點(diǎn)自動(dòng)優(yōu)化教師模型的回答風(fēng)格遏佣。

該工作創(chuàng)新性地用顯式的任務(wù)標(biāo)簽配比代替隱式的句向量多樣性。在任務(wù)重采樣的過程中揽浙，大大增加數(shù)學(xué)推理代碼類任務(wù)的數(shù)據(jù)比例状婶。首次提出了模型擬合難度 (MFD) 指標(biāo)，來(lái)表示數(shù)據(jù)難度大小馅巷，并在多輪迭代優(yōu)化的過程中提升困難數(shù)據(jù)占比太抓。提升模型從弱到強(qiáng)的泛化速度。在 AlpacaEval 排行榜上令杈，我們微調(diào)后的 LLaMA2-7B 底座獲得了7.8的相對(duì)分?jǐn)?shù)走敌，超過了參數(shù)量、數(shù)據(jù)量都遠(yuǎn)大于我們的知名開源模型模型（LLaMA2-Chat-13B逗噩，Vicuna 13B）掉丽。我們持續(xù)優(yōu)化了 Qwen 系列模型的指令回答能力跌榔，優(yōu)化 Qwen1.5系列模型在 AlpacaEval 榜單上提升3-8個(gè)百分點(diǎn)。

產(chǎn)品化服務(wù)

上述科研成果也在人工智能平臺(tái)PAI的各個(gè)模塊進(jìn)行了深度的集成和整合捶障，持續(xù)為PAI客戶提供AI模型訓(xùn)練和推理相關(guān)服務(wù)僧须。其中，VideoCLIP-XL作為文視頻質(zhì)量評(píng)估模塊项炼，與EasyAnimate視頻生成解決方案無(wú)縫融合担平，支持用戶輕松實(shí)現(xiàn)文視頻語(yǔ)義一致性計(jì)算和數(shù)據(jù)過濾，從而訓(xùn)練AIGC視頻生成大模型锭部。在智碼實(shí)驗(yàn)室暂论，我們也上架了“VideoCLIP-XL：面向超長(zhǎng)文本的文視頻跨模態(tài)特征抽取”的notebook。

用于數(shù)據(jù)增強(qiáng)和改寫的蒸餾模型也已經(jīng)上架PAI平臺(tái)拌禾，為用戶提供簡(jiǎn)單易用的大模型蒸餾解決方案取胎。基于Qwen2的開源模型湃窍，PAI也在開源了DistilQwen2蒸餾小模型系列闻蛀，進(jìn)一步提升了模型的指令跟隨能力，在HuggingFace和ModelScope開源社區(qū)開放下載您市。

此外觉痛，PAI-QuickStart集成了超過50個(gè)熱門大語(yǔ)言模型，及其多種訓(xùn)練和推理方式茵休，使客戶更加簡(jiǎn)單地微調(diào)和部署大語(yǔ)言模型秧饮。在未來(lái)，我們也將在PAI平臺(tái)上持續(xù)提供業(yè)界領(lǐng)先的算法和模型能力給廣大客戶泽篮。

資源鏈接

文-視頻多模態(tài)

EasyAnimate開源項(xiàng)目：https://github.com/aigc-apps/EasyAnimate
VideoCLIP-XL：https://huggingface.co/alibaba-pai/VideoCLIP-XL
VideoCLIP-XL-v2：https://huggingface.co/alibaba-pai/VideoCLIP-XL-v2
LVDR數(shù)據(jù)集：https://huggingface.co/alibaba-pai/LVDR
VILD數(shù)據(jù)集：https://huggingface.co/alibaba-pai/VILD
VideoCLIP-XL：面向超長(zhǎng)文本的文視頻跨模態(tài)特征抽鹊潦：https://gallery.pai-ml.com/#/preview/deepLearning/cv/videoclipxl

大模型蒸餾

大語(yǔ)言模型數(shù)據(jù)增強(qiáng)與模型蒸餾解決方案：https://help.aliyun.com/zh/pai/use-cases/llm-data-enhancement-and-model-distillation-solution
DistilQwen2蒸餾小模型系列

alibaba-pai/DistilQwen2-7B-Instruct：
- https://huggingface.co/alibaba-pai/DistilQwen2-7B-Instruct
- https://modelscope.cn/models/PAI/DistilQwen2-7B-Instruct
alibaba-pai/DistilQwen2-1.5B-Instruct：
- https://huggingface.co/alibaba-pai/DistilQwen2-1.5B-Instruct
- https://modelscope.cn/models/PAI/DistilQwen2-1.5B-Instruct

論文匯總

論文名字： VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models
論文作者： 汪嘉鵬、汪誠(chéng)愚帽撑、黃坤哲泼各、黃俊、金連文
論文pdf鏈接： https://arxiv.org/abs/2410.00741

論文名字： Distilling Instruction-following Abilities of Large Language Models with Task-aware Curriculum Planning
論文作者： 岳元浩亏拉、汪誠(chéng)愚扣蜻、黃俊、王鵬
論文pdf鏈接： https://arxiv.org/abs/2405.13448

阿里云人工智能平臺(tái) PAI 長(zhǎng)期招聘研究實(shí)習(xí)生及塘。團(tuán)隊(duì)專注于深度學(xué)習(xí)算法研究與應(yīng)用莽使，重點(diǎn)聚焦大語(yǔ)言模型和多模態(tài) AIGC 大模型的應(yīng)用算法研究和應(yīng)用。簡(jiǎn)歷投遞和咨詢：chengyu.wcy@alibaba-inc.com笙僚。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末芳肌，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌亿笤，老刑警劉巖翎迁，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異净薛，居然都是意外死亡汪榔，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門肃拜，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)痴腌，“玉大人，你說我怎么就攤上這事燃领∈看希” “怎么了？”我有些...
開封第一講書人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵柿菩，是天一觀的道長(zhǎng)。經(jīng)常有香客問我雨涛，道長(zhǎng)枢舶，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任替久，我火速辦了婚禮凉泄，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘蚯根。我一直安慰自己后众，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布颅拦。她就那樣靜靜地躺著蒂誉，像睡著了一般。火紅的嫁衣襯著肌膚如雪距帅。梳的紋絲不亂的頭發(fā)上右锨，一...
開封第一講書人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說
那天，我揣著相機(jī)與錄音碌秸，去河邊找鬼绍移。笑死，一個(gè)胖子當(dāng)著我的面吹牛讥电，可吹牛的內(nèi)容都是我干的蹂窖。我是一名探鬼主播，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼恩敌，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼瞬测！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤涣楷，失蹤者是張志新（化名）和其女友劉穎分唾，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體狮斗，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡绽乔，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了碳褒。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片折砸。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖沙峻，靈堂內(nèi)的尸體忽然破棺而出睦授，到底是詐尸還是另有隱情，我是刑警寧澤摔寨，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布去枷，位于F島的核電站，受9級(jí)特大地震影響是复，放射性物質(zhì)發(fā)生泄漏删顶。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一淑廊、第九天我趴在偏房一處隱蔽的房頂上張望逗余。院中可真熱鬧，春花似錦季惩、人聲如沸录粱。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評(píng)論 0贊 19
一樁弒父案画拾，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)啥繁。三九已至，卻和暖如春青抛，著一層夾襖步出監(jiān)牢的瞬間输虱，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工脂凶，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留宪睹，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓蚕钦，卻偏偏與公主長(zhǎng)得像亭病，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子嘶居，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345