NeurIPS’23 Paper Digest | 如何把 LLM 的推理能力應(yīng)用于事件序列預(yù)測托酸?

為期一周的人工智能和機器學(xué)習(xí)領(lǐng)域頂級會議 NeurlPS 正在美國路易斯安那州新奧爾良市舉辦中统倒。螞蟻集團(tuán)有 20 篇論文被本屆會議收錄,其中《Language

Models Can Improve Event Prediction by Few-Shot Abductive Reasoning》是由螞蟻基礎(chǔ)智能技術(shù)部爷贫、消費金融技術(shù)部與芝加哥豐田工業(yè)大學(xué)、芝加哥大學(xué)合作完成补憾。

論文作者簡介:薛思喬是這篇論文的主要作者漫萄,也是螞蟻集團(tuán)高級算法專家,主要研究方向是生成式序列模型 (sequential modeling)余蟹,他的研究成果曾多次發(fā)表于主流機器學(xué)習(xí)相關(guān)會議 (NeurIPS/ICML/AAAI)卷胯。最近一年團(tuán)隊的主要工作聚焦于大語言模型與時間序列的交叉方向,在 NeurIPS'23 發(fā)表了事件序列預(yù)測模型的持續(xù)學(xué)習(xí)方法 "PromptTPP" 以及利用大語言模型支持事件序列預(yù)測的方法 "LAMP" 兩篇論文威酒。

論文通訊作者介紹:梅洪源,美國豐田工業(yè)大學(xué)芝加哥分校 (Toyota Technological Institute at Chicago) 研究助理教授挺峡,2021 年獲得約翰霍普金斯大學(xué)計算機系博士學(xué)位葵孤。主要研究方向包括大規(guī)模概率空間序列模型、機器人智能橱赠、自然語言處理等尤仍。至今已在 ICML,NeuIPS狭姨,NAACL 和 AAAI 等頂級國際會議發(fā)表論學(xué)術(shù)論文近 20 篇宰啦,其中部分論文有極高的引用率苏遥,得到了美國財富雜志 (Fortune Magazine) 和彭博科技 (TechAtBloomberg) 的報道。由于杰出的研究貢獻(xiàn)赡模,他獲得了彭博數(shù)據(jù)科學(xué)博士獎學(xué)金田炭、Jelinke 獎學(xué)金以及 Adobe Faculty Award 等項目的資助。

本文中漓柑,薛思喬會帶大家了解論文《Language Models Can Improve Event Prediction by Few-Shot Abductive Reasoning》的背景和主要研究成果教硫,完整論文可點擊閱讀原文查看。

背景和動機

商業(yè)場景的事件序列(時間序列)辆布,通常帶有一些文字信息瞬矩,如圖一所示,比如用戶購買商品會伴隨著文字點評記錄锋玲,用戶申贖基金后也可能會參與社區(qū)討論景用。

以往我們通常的做法是對這些文字做編碼到高緯度空間,然后通過某些方式并入主模型的架構(gòu)中惭蹂,然后再輸出預(yù)測值丛肢。有了大語言模型(LLM) 后,我們希望可以直接利用其強大的文字理解和推理能力剿干,來支持序列預(yù)測蜂怎。這個方法更直接,隨著LLM 理解能力的突飛猛進(jìn)置尔,這個方法很可能也更有效杠步。我們在一篇被 NeurIPS'23 接收的文章 Language Model Can Improve Event Prediction by Few-shot Abductive Reasoning 中提出了新的架構(gòu) LAMP,實現(xiàn)了這個目標(biāo)榜轿。


圖1:用戶購買商品的點評序列示意圖

方法

01 整體思路

LLM 的引入類似于推薦里面的檢索和精排機制幽歼。在 Base model 的預(yù)測值基礎(chǔ)上,利用 LLM 推理并且從歷史序列中檢索出 cause events谬盐,根據(jù)這些事件序列甸私,重新再做一次精排,最終輸出預(yù)測值飞傀。


圖2:整體思路示意圖

02 模型架構(gòu)

LAMP 架構(gòu)可以分成三個部分:

Event Sequence Model:經(jīng)典的序列模型皇型,比如點過程模型、時序圖譜模型等砸烦,對所有預(yù)測集合中的預(yù)測值(下文中的effect event)做一個打分弃鸦。

LLM: 給一個 effect event, 推導(dǎo)出他的 cause event幢痘。因為LLM 生成的是虛擬的事件唬格,所以要做一個模式匹配(text matching), 然后從真實的數(shù)據(jù)上找到真實的事件,重新拼成一個序列。

對上一步拼成的序列重新再做一次打分购岗。

03 Prompt 模版

04 訓(xùn)練與預(yù)測

Event Sequence Model 和 Ranking Model 都是用經(jīng)典方法單獨訓(xùn)練的汰聋, LLM 直接調(diào)用接口,不做微調(diào)喊积。訓(xùn)練與預(yù)測的細(xì)節(jié)見論文烹困。論文原文:https://arxiv.org/abs/2305.16646

05 實驗

我們在三個開源數(shù)據(jù)集,兩個是時序圖譜數(shù)據(jù)集 GDELT 和 ICEWS注服,一個是 推薦系統(tǒng)常用的 Amazon Review 序列數(shù)據(jù)韭邓。我們用Mean Rank 作為指標(biāo)來衡量模型的性能。從 Base Model 的預(yù)測值中取出分?jǐn)?shù)最高的M個溶弟,然后對這M個進(jìn)行重排(第二步和第三步)女淑,我們看 ground truth event 的排名會不會更好 (Rank 數(shù)值會更低,比如從排名第8 到 排名第 2)辜御。

LLM 我們測試了 GPT-3.0 和 GPT-3.5 兩個選擇鸭你。在消融實驗的時候我們也測試了 Llama2,詳見文章的實驗部分擒权。

從結(jié)果來看袱巨,不同的 Base Model 和 Ranking Model 組合下,GPT-3.5 都能提升最終的預(yù)測性能碳抄,GPT-3.0 效果相對一般愉老。開源的 LLM 中 Llama2 也表現(xiàn)較好。

更多細(xì)節(jié)見論文的 section4 以及附錄部分剖效。論文原文: https://arxiv.org/abs/2305.16646

結(jié)論

我們完成了首個把 LLM 推理能力引入事件序列領(lǐng)域的工作嫉入。代碼、數(shù)據(jù)均已經(jīng)開源璧尸,并將集成進(jìn)開源庫 EasyTPP咒林。

EasyTPP GitHub:

https://github.com/ant-research/EasyTemporalPointProcess

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市爷光,隨后出現(xiàn)的幾起案子垫竞,更是在濱河造成了極大的恐慌,老刑警劉巖蛀序,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件欢瞪,死亡現(xiàn)場離奇詭異,居然都是意外死亡哼拔,警方通過查閱死者的電腦和手機引有,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來倦逐,“玉大人,你說我怎么就攤上這事∶世眩” “怎么了曾我?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長健民。 經(jīng)常有香客問我抒巢,道長,這世上最難降的妖魔是什么秉犹? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任蛉谜,我火速辦了婚禮,結(jié)果婚禮上崇堵,老公的妹妹穿的比我還像新娘型诚。我一直安慰自己,他們只是感情好鸳劳,可當(dāng)我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布狰贯。 她就那樣靜靜地躺著,像睡著了一般赏廓。 火紅的嫁衣襯著肌膚如雪涵紊。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天幔摸,我揣著相機與錄音摸柄,去河邊找鬼。 笑死既忆,一個胖子當(dāng)著我的面吹牛驱负,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播尿贫,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼电媳,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了庆亡?” 一聲冷哼從身側(cè)響起匾乓,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎又谋,沒想到半個月后拼缝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡彰亥,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年咧七,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片任斋。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡继阻,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瘟檩,我是刑警寧澤抹缕,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站墨辛,受9級特大地震影響卓研,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜睹簇,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一奏赘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧太惠,春花似錦磨淌、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至嗽元,卻和暖如春敛纲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背剂癌。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工淤翔, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人佩谷。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓旁壮,卻偏偏與公主長得像,于是被迫代替她去往敵國和親谐檀。 傳聞我的和親對象是個殘疾皇子抡谐,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容